Hardwareluxx > Новости > Железо > Видеокарты > NVIDIA представила первые видеокарты GeForce RTX 40 (обновление 2)

NVIDIA представила первые видеокарты GeForce RTX 40 (обновление 2)

Опубликовано: 22.09.2022 в 09:30 Андрей Шиллинг

geforce-rtx-4090 Осень обещает быть жаркой на новинки, помимо процессоров AMD Ryzen 7000 и Intel Raptor Lake, NVIDIA представила первые подробности видеокарт GeForce RTX 40. Анонс оказался необычным, поскольку конференция GPU Technologies Conference или GTC посвящена профессиональным и серверным решением. Но в этом году она стала площадкой для представления игровых новинок.

По предыдущим утечкам название архитектуры и модельные номера были известны, позднее они были подтверждены маркетинговой кампанией. Видеокарты GeForce RTX 40 базируются на архитектуре Lovelace, названной в честь Ады Лавлейс, британского математика.

Перейдем сразу к наиболее важным фактам. Сегодня представлены две видеокарты GeForce RTX 4080 и GeForce RTX 4090, причем GeForce RTX 4080 будет доступна в двух вариантах, которые отличаются конфигурацией памяти и числом функциональных блоков, несмотря на одинаковое название. Ниже представлены технические спецификации, а «белые пятна» мы планируем закрыть в ближайшие часы.

Сравнение видеокарт
	GeForce RTX 4080 12 GB	GeForce RTX 4080 16 GB	GeForce RTX 4090
GPU	AD104	AD103	AD102
Число транзисторов	-	-	76 млрд.
Техпроцесс	4 нм	4 нм	4 нм
Площадь кристалла	-	-	608,3 мм²
Число FP32 ALU	7.680	9.728	16.384
Число INT32 ALU	-	-	-
Число SM	60	76	128
Ядра Tensor	240	304	512
Ядра RT	60	76	128
Базовая частота	2.310 МГц	2.210 МГц	2.230 МГц
Частота Boost	2.610 МГц	2.505 МГц	2.520 МГц
Емкость памяти	12 GB	16 GB	24 GB
Тип памяти	GDDR6X	GDDR6X	GDDR6X
Ширина шины памяти	192 бит	256 бит	384 бит
Частота памяти	-	-	-
Пропускная способность памяти	504 Гбайт/с	720 Гбайт/с	1.008 Гбайт/с
TDP	285 Вт	325 Вт	450 Вт
Макс. TDP	366 Вт	516 Вт	660 Вт
Цена	1.099 евро	1.469 евро	1.949 евро

Флагманская видеокарта GeForce RTX 4090 использует GPU AD102 со 128 блоками SM, что эквивалентно 16.384 блокам FP32. Пока неизвестно, какое именно число блоков INT32, ядер RT и Tensor присутствует в каждом SM. В любом случае, ядра RT и Tensor перешли на новые версии, поэтому эффективность должна быть намного выше предшественников.

Видеокарта GeForce RTX 4090 оснащается 24 Гбайт видеопамяти GDDR6X с подключением по 384-битной шине. Пропускная способность памяти – около 1 Тбайт/с. Тепловой пакет видеокарты TGP (Total Graphics Power) увеличился до 450 Вт, причем в пике он может достигать 660 Вт. Видеокарты GeForce RTX 4090 поступят в продажу уже 12 октября по цене 1.940 евро.

Сравнение поколений GeForce RTX
	Потоковые процессоры	VRAM	Цена
GeForce RTX 3070	5.888	8 Гбайт 256 бит / 448 Гбайт/с	от 42.000 ₽
GeForce RTX 4080 12 Гбайт	7.680	12 Гбайт 192 бит / 504 Гбайт/с	1.099 евро
GeForce RTX 3080	8.704	10 Гбайт 320 бит / 760 Гбайт/с	от 69.500 ₽
GeForce RTX 4080 16 Гбайт	9.728	16 Гбайт 256 бит / 720 Гбайт/с	1.469 евро
GeForce RTX 3090	10.496	24 Гбайт 384 бит / 936 Гбайт/с	от 112.000 ₽
GeForce RTX 4090	16.384	24 Гбайт 384 бит / 1.008 Гбайт/с	1.949 евро

Выше мы сравнили GeForce RTX 4090 с предшественницей GeForce RTX 3090. Конечно, следует учитывать цену. Видеокарта GeForce RTX 3090 стартовала с €1.499, сегодня ее можно приобрести от 112.000 ₽. Прирост производительности RTX 4090 вполне может компенсировать увеличение цены до €1.949, хотя планка почти €2.000 остается довольно высокой для видеокарты.

GeForce RTX 4080 16 GB можно рассматривать как преемницу GeForce RTX 3080. Но и здесь NVIDIA удваивает цену до €1.469. GeForce RTX 3080 можно приобрести от 69.500 ₽. Покупатель получит на 12% больше функциональных блоков, но также и на 6 Гбайт больше видеопамяти, хотя и с менее скоростным подключением.

Видеокарту GeForce RTX 4080 на 12 Гбайт можно назвать преемницей GeForce RTX 3070, которая сегодня продается в рознице от 42.000 ₽. Доплата и здесь весьма существенная. По приросту производительности что-либо сказать сложно. Интерфейс памяти здесь уже, но объем на 50% больше. А из-за более высокой тактовой частоты и пропускная способность выше.

GeForce RTX 4080 в двух вариантах

А вот в случае видеокарты GeForce RTX 4080 следует быть внимательным. Представлены две модели, которые отличаются по числу функциональных блоков. У более мощной GeForce RTX 4080 их на 25% больше. Кроме того, емкость памяти достигает 16 Гбайт вместо 12 Гбайт. Последняя подключена по более широкому интерфейсу, поэтому и пропускная способность выше: 720 Гбайт/с у 16-Гбайт варианта и 504 Гбайт/с у младшей версии с 12 Гбайт. Энергопотребление составляет 285 или 325 Вт, цена - €1.469 или €1.099. Обе видеокарты GeForce RTX 4080 будут продаваться с ноября.

Общая черта всех представленных сегодня видеокарт GeForce RTX 40 – подключение через PCI Express 4.0. На видеокартах Founders Edition всегда используется разъем дополнительного питания 12VHPWR. Пока можно сказать одно: видеокарты Founders Edition очень похожи на нынешнюю линейку GeForce RTX 30. Дизайн системы охлаждения и внешний вид были почти полностью унаследованы. Что касается видеовыходов, доступны 3x DisplayPort 1.4 и 1x HDMI 2.1. Для всех представленных видеокарт следует отметить поддержку двойного кодировщика AV1. Напомним, что кодирование AV1 до сих пор было козырем Intel с поколением Alchemist, но теперь предложение перестало быть уникальным – еще до выхода самих видеокарт.

Не совсем понятно решение NVIDIA по анонсу двух видеокарт GeForce RTX 4080. Возможно, NVIDIA пытается сократить ассортимент продуктов, но видеокарты существенно различаются. Все три новых модели GeForce RTX 40 превосходят нынешнюю линейку по производительности. Но в ближайшие месяцы NVIDIA наверняка представит и «младшие» видеокарты.

Первые тесты

Конечно, NVIDIA предоставила первые тесты, в которых сравнила новые видеокарты с предшественницами.

Видеокарты GeForce RTX 4080 с 16 и 12 Гбайт видеопамяти быстрее GeForce RTX 3080 Ti в два-четыре раза, в зависимости от теста. GeForce RTX 4090 будет работать в два раза быстрее GeForce RTX 3090 Ti, если верить NVIDIA. Кроме того, новые видеокарты работают в два раза эффективнее.

Впрочем, в приведенных тестах используется не чистая растеризация, а DLSS, что сказывается на производительности. У новых видеокарт производительность DLSS намного выше.

Вкратце об архитектуре Ada Lovelace

NVIDIA привела не так много подробностей, лишь вкратце упомянув архитектуру Ada Lovelace. GPU производятся на мощностях TSMC по 4-нм техпроцессу. В самой крупной конфигурации (AD102) GPU оснащается 76 млрд. транзисторов.

По сравнению с предшественниками, чипы GeForce RTX 40 иначе располагаются по кривой производительности на ватт. NVIDIA заявляет о фактическом удвоении производительности при прежнем энергопотреблении. График справа показывает, что NVIDIA с архитектурой Ampere не собиралась преодолевать планку энергопотребления 350 Вт. Но с видеокартой GeForce RTX 3090 Ti данный уровень был преодолен, затем уже начинается GeForce RTX 4090. Как можно видеть по кривой, чипы Ada Lovelace могут очень эффективно работать на уровнях от 150 до 250 Вт. Но соответствующие бюджетные видеокарты сегодня представлены не были.

С новой архитектурой NVIDIA оптимизировала вычисления, которые теперь выполняются более эффективно.

Технология Shader Execution Reordering (SER) позволяет объединять вычисления в конвейере, чтобы вычислительные блоки были всегда максимально нагружены. Производительность потоковых процессоров при этом увеличивается до двух раз, что приводит к повышению fps в играх до 25%.

Ядра RT третьего поколения

Третье поколение ядер RT в архитектуре Ada получило в два раза более высокую пропускную способность вычислительных блоков по сравнению с предшественниками, что увеличивает производительность по расчетам трассировки лучей в 2,8x. В случае GeForce RTX 4090 теоретическая производительность увеличилась до 191 RT TFLOPS по сравнению с 78 RT TFLOPS для GeForce RTX 3090 Ti.

Кроме того, третье поколение ядер RT получило такие функции, как Opacity Micro-Map Engines и Micro-Mesh Engines. Они представляют собой новые выделенные аппаратные блоки для ускорения особо требовательных вычислений трассировки лучей.

Здесь мы бы хотели более подробно остановиться на Opacity Micro-Maps и Displaced Micro-Meshes.

Opacity Micro-Maps представляют собой оптимизацию расчета трассировки лучей. Трассировка лучей не очень хорошо справляется с некоторыми объектами, например, листвой и растительностью. Лучи могут отражаться в бессчетных направлениях между листьями и ветвями, поэтому подобные объекты значительно осложняют трассировку. Третье поколение ядер RT может использовать Opacity Micro-Maps для присвоения статуса прозрачности подобным элементам, которые могут быть непрозрачными, прозрачными или неизвестными.

Для сложных объектов ранее трассировка лучей не использовалась или применялась в облегченном виде. Opacity Micro-Maps должны учитывать подобные объекты в будущем.

Ядра RT третьего поколения генерируют Displaced Micro-Meshes (DMM). Дерево BVH (bounding volume hierarchies), которое используется для трассировки лучей, будет строиться до 10 раз быстрее и потреблять в 20 раз меньше видеопамяти. NVIDIA описывает DMM следующим образом: «DMM – это новые примитивы, которые представляют собой структурированную сетку микро-треугольников, и ядра RT третьего поколения могут обрабатывать их в родном режиме. Что уменьшает требования к объему памяти при рендеринге сложной геометрии, которая использует только простые треугольники».

Четвертое поколение ядер Tensor и DLSS 3

Технология Deep Learning Super Sampling тоже получила обновление до третьей версией. Здесь используется 4-е поколение ядер Tensor, которое получило различные оптимизации. Например, новые ядра Tensor обеспечивают в пять раз более высокую пропускную способность вычислений FP8.

Для DLSS 3 используются так называемые ускорители Optical Flow. Они вычисляют пиксельные данные движения из последовательных кадров, используя нейросеть DLSS.

Альтернативные дизайны дополняют Founders Edition

NVIDIA выпустит видеокарты Founders Edition только на GeForce RTX 4090 и GeForce RTX 3080 16 GB. Видеокарты GeForce RTX 4080 12 GB выйдут только в альтернативных дизайнах от партнеров.

Все партнеры NVIDIA уже представили свои дизайны видеокарт, в том числе ASUS, Colorful, Gainward, Galaxy, Gigabyte, Inno3D, MSI, Palit, PNY и Zotac. Мы рассмотрим эти видеокарты в отдельной новости. Цены пока неизвестны.

Обновление: информация с Editors Day

NVIDIA на виртуальном мероприятии Editors Day опубликовала много дополнительной информации о новых видеокартах. Конечно, мы подготовили довольно детальную новость к анонсу GeForce RTX 4090, но в ней недоставало некоторых подробностей, что мы исправляем.

NVIDIA опубликовала диаграмму AD102 GPU и упомянула максимальный уровень расширения. Полная конфигурация AD102 GPU будет содержать до 18.432 вычислительных блоков FP32, 144 ядра RT и 576 ядер Tensor. Но NVIDIA пока не реализовала полный вариант ни на одной видеокарте, будь то GeForce RTX 4090 или RTX 6000 Ada Generation или L40.

Как и предполагалось, удвоения ROP не произошло. С архитектурой Ampere они мигрировали в Raster Engine, там и продолжают оставаться. У каждого Raster Engine имеются два раздела ROP, содержащие по восемь ROP. Остальная структура во многом идентична Ampere – за исключением числа SM и наличия ядер Tensor четвертого поколения и ядер RT третьего поколения.

Каждый SM содержит 64 вычислительных блоков FP32 и еще 64, способных выполнять вычисления FP32 или INT32. Кэш L1 по-прежнему составляет 128 кбайт.

Между тем NVIDIA раскрыла размер кэша L2. На полном AD102 GPU кэш L2 имеет емкость 98.304 кбайт, то есть почти 100 Мбайт. В степени расширения GeForce RTX 4090 GPU оснащен кэшем L2 емкостью 73.728 кбайт. Информации о чипе AD103 на видеокарте GeForce RTX 4080 с 16 GB или AD104 на GeForce RTX 4080 с 12 GB пока нет.

В другой презентации NVIDIA показала PCB видеокарты GeForce RTX 4090, которая оснащена системой питания с 23 фазами. 20 фаз отвечают за питание GPU, еще три – памяти. Управление системой питания было оптимизировано, чтобы избежать сильных пиков тока и напряжения. Хотя спецификация ATX 3.0 предусматривает большие пики, чем раньше.

Кулер видеокарт Founders Edition тоже был пересмотрен, теперь в него устанавливаются более крупные вентиляторы. Они увеличивают воздушный поток на 20% и улучшают охлаждение. Использованная память GDDR6X от Micron более экономична из-за нового техпроцесса, что позволило уменьшить температуры памяти на 10 °C.

В ближайшие дни мы подробно рассмотрим все инновации и подготовим обзорный материал к выходу GeForce RTX 4090.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).

Мы рекомендуем ознакомиться с нашим руководством по выбору видеокарты для разных бюджетов.