Почти все подробности нового поколения GeForce на основе архитектуры Turing стали известны в последние дни, но сегодня NVIDIA официально представила новые видеокарты в рамках мероприятия Gaming Celebration. В начале презентации NVIDIA напоминала шаги разработки за последние десятилетия - от двух пикселей, которые соединяет линия, до современных графических движков.
Основатель компании Дженсен Хуанг особо подчеркнул трассировку лучей, которая стала одним из наиболее важных шагов за последние годы. "Краеугольный камень" графической технологии позволит поднять качество освещения объектов на принципиально иной уровень. Трассировка лучей позволяет симулировать поведение как можно большего количества лучей на сцене. Отражение, рассеивание, поглощение света, тень, полупрозрачные материалы - все это можно просчитать методом трассировки лучей.
20 лет назад для расчета картинки 512 x 512 пикселей с помощью трассировки лучей потребовался бы суперкомпьютер. Сегодня для расчета трассировки лучей на всей сцене требуются многие петафлопы производительности. И при сохранении нынешних темпов пройдет еще десять лет разработки, прежде чем мы получим такую вычислительную мощность. Именно по этой причине NVIDIA разработала RTX - программный интерфейс, сочетающий классическую растеризацию и трассировку лучей.
NVIDIA называет RTX "гибридным рендерингом", сочетающей классическую растеризацию для отображения объектов и глобальное освещение - метод на основе разных алгоритмов, позволяющий добиться максимально реалистичной картинки.
Трассировка лучей позволяет вычислять только те лучи, которые попадают в глаза пользователя. NVIDIA опирается на глубокое обучение и тренирует драйвер и программный интерфейс, используя данные в облаке. Поэтому трассировка лучей уже может выполняться на имеющихся сегодня ресурсах.
Архитектура Turing и видеокарты
Тысячи инженеров потратили сотни человеко-часов на разработку архитектуру Turing. NVIDIA говорит о десяти человеко-лет. Если верить NVIDIA, архитектура стала самым крупным техническим прорывом после представления ядер CUDA, которые мы называем сегодня потоковыми процессорами.
Наиболее важные технические спецификации трассировки лучей можно сформулировать следующим образом:
14 TFLOPS (расчеты с плавающей запятой)
14 TIPS (целочисленные расчеты)
Ядра RT с производительностью 10 гигалучей в секунду (1080 Ti дает только 1,21 гигалучей/с)
Что характеризует вычислительную производительность, на которую опирается NVIDIA. С графическими процессорами на архитектурах Pascal и Volta подобные расчеты не представляются возможными. NVIDIA привела информацию о расчете показанной ранее демонстрации "Звездных войн":
С архитектурой Turing NVIDIA изменила поведение GPU во время построения и расчета кадра. Кроме классического затенения INT32 и FP32, используются вычисления трассировки лучей и DNN (Deep Neural Network). Для GeForce RTX 2080 Ti NVIDIA указывает комбинированную вычислительную мощность 78 TRTX OPS (операций тера-RTX), причем у NVIDIA Titan X число мы получаем всего 12 TRTX OPS.
NVIDIA наверняка использует разные диспетчеры для разных расчетов в пределах GPU. Будет интересно более глубоко взглянуть на архитектуру Turing, чтобы найти ответы на некоторые вопросы.
Второй компонент - тензорные ядра, тоже известные по архитектуре Volta. Они также вносят свой вклад в трассировку лучей, поскольку высокая производительность выполнения запросов в сеть глубокого обучения помогает в алгоритмах устранения шума. Расчет нескольких тысяч или даже миллионов световых лучей требует определенного времени даже на современном "железе". И области, в которых расчет еще не произведен, представлены шумом. Поскольку рендер не знает, какие объекты на сцене более важны, он рассчитывает лучи в логическом порядке. Чтобы уменьшить время подготовки финального изображения и быстрее устранить шумы, алгоритм глубокого обучения выделяет важные области кадра, рассчитывая их в первую очередь.
Третий компонент - новые ядра RT. Они отвечают за расчет пересечения лучей с треугольниками (Ray Triangle Intersection) и BVH (Bounding Volume Hierarchy). BVH представляет собой дерево, в котором располагаются геометрические объекты. Данные алгоритмы помогают в определении пересечений/наложений и трассировке лучей. 576 ядер RT в архитектуре Turing обеспечивают скорость расчет до 10 гигалучей в секунду.
Вычисления частично выполняются в облаке
Несмотря на все потоковые процессоры, тензорные ядра и ядра RT, NVIDIA пока не может выполнить полные расчеты трассировки лучей даже на GPU Turing. Мы уже упомянули устранение шума с помощью тензорных ядер, но здесь необходимы облачные ресурсы Neural Graphics Framework. NVIDIA NGX обращается к сети глубокого обучения для обработки изображений, а результат уже отсылается видеокарте.
Среди всего прочего NVIDIA говорит и о новых режимах сглаживания. Вместо TAA на разрешении 4K теперь может использоваться DLSS (Deep Learning Super Sampling). Для тренировки сети NVIDIA опирается на собственные аппаратные ресурсы в виде серверов DGX на нескольких сотнях или даже тысячах Tesla V100. Запросы в такую сеть выполняются на игровом компьютере с видеокартой Turing, их как раз обрабатывают тензорные ядра.
Но аппаратное обеспечение новых видеокарт вряд ли будет востребовано, если в ближайшие недели и месяцы не выйдут игры, поддерживающие новые функции. Трассировка лучей в реальном времени будет поддерживаться в следующих играх:
Assetto Corsa Competizione
Atomic Heart
Battlefield V
Control
Enlisted
Justice
JX3
MechWarrior 5: Mercenaries
Metro Exodus
ProjectDH
Shadow of the Tomb Raider
Deep Learning Super Sampling будет поддерживаться в следующих играх:
GeForce RTX 2080 Ti в чем-то можно назвать моделью Titan в линейке GeForce RTX 20. GPU содержит 4.352 потоковых процессора, базовая частота составляет 1.350 МГц, в режиме Boost минимальная планка увеличивается до 1.635 МГц. 11 Гбайт памяти идентичны GeForce GTX 1080 Ti, но NVIDIA использует для линейки GeForce RTX 20 память GDDR6. NVIDIA указывает пропускную способность памяти 616 Гбайт/с через 352-битный интерфейс. Названа цена €1.259, которая тоже знакома по видеокартам Titan.
Средний сегмент линейки GeForce RTX 2080 будет представлен видеокартой GeForce RTX 2080, чьи 2.944 потоковых процессора будут работать на частоте от 1.800 МГц. Объем встроенной памяти составляет 8 Гбайт, пропускная способность 448 Гбайт/с. Цена GeForce RTX 2080 Founders Edition составляет €849.
Пока что линейка GeForce RTX 20 начинается с видеокарты GeForce RTX 2070, оснащенной 2.304 потоковыми процессорами. Базовая частота составляет 1.410 МГц, в режиме Boost гарантируется частота от 1.710 МГц. Объем видеопамяти тоже составляет 8 Гбайт, как и 256-битный интерфейс памяти. То есть пропускная способность памяти идентична. Цена составляет €639, то есть данную видеокарту сложно назвать бюджетной.
Видеокарты предлагают три порта DisplayPort 1.4, один HDMI 2.0a и один VirtualLink.
Цены и доступность
Видеокарты Founders Edition GeForce RTX 2080 Ti, RTX 2080 и RTX 2070 можно будет приобрести напрямую у NVIDIA. Предзаказы принимаются с сегодняшнего дня, отгрузка начнется 20 сентября. GeForce RTX 2070 будет доступна чуть позже. Цена составляет €1.259 за GeForce RTX 2080 Ti, €849 за GeForce RTX 2080 и €639 за GeForce RTX 2070. Рекомендованные цены FE в России: GeForce RTX 2080 Ti - 95.990 рублей, GeForce RTX 2080 - 63.990 рублей, 47.990 рублей.
NVIDIA ни словом не обмолвилась о видеокартах партнеров с альтернативным дизайном.
Программное обеспечение тоже вносит свой вклад
Несколько дней назад мы разъяснили нынешнюю ориентацию NVIDIA на трассировку лучей. В принципе, направления развития нынешней архитектуры Turing видеокарт GeForce было понятно еще с представления интерфейса NVIDIA RTX, совместимого с Microsoft DXR API для трассировки лучей.
С линейкой карт Quadro RTX для рабочих станций и новой архитектурой NVIDIA проложила соответствующий курс и по аппаратному обеспечению. Линейка GeForce 20 обеспечивает доступ к новым технологиям обычным потребителям. Теперь разве что осталось дождаться совместимых игр.
NVIDIA на мероприятии представила несколько совместимых игр. А именно Shadow of the Tomb Raider, Metro Exodus, Assetto Corsa и Battlefield V.