Страница 1: Тест и обзор: NVIDIA GeForce RTX 4090 Founders Edition
Видеокарта GeForce RTX 4090 знаменует вторую волну горячих новинок осени 2022. Первая началась с процессоров Ryzen 7000, затем последовали видеокарты Intel Arc. Теперь NVIDIA представляет новое поколение видеокарт, далее нас ждут процессоры Intel Raptor Lake и видеокарты AMD RDNA 3. NVIDIA решила начать с high-end видеокарты GeForce RTX 4090, хотя в случае предшествующего поколения первой вышла RTX 3080. Новые видеокарты обеспечат более высокий уровень производительности благодаря нескольким факторам. Мы протестируем новинку, рассмотрим инновации трассировки лучей, DLSS и многие другие.
NVIDIA выбрала несколько иную стратегию при выходе видеокарт GeForce RTX 40. Линейка стартует со старшей модели GeForce RTX 4090, которая основана почти на полной версии AD102 GPU. Видеокарта оснащена 24 Гбайт видеопамяти и работает с тепловым пакетом 450 Вт, так что и здесь характеристики топовые. Вероятно, такой шаг даст партнерам дополнительное время, чтобы распродать имеющиеся на складах видеокарты GeForce RTX 30.
Оставшиеся две модели появятся в ноябре. А именно GeForce RTX 4080 16 GB и GeForce RTX 4080 12 GB, которую было бы честнее назвать GeForce RTX 4070. Но мы вернемся к этому вопросу позже.
Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).
Мы рекомендуем ознакомиться с нашим руководством по выбору видеокарты для разных бюджетов.
Ниже приведены технические спецификации
GeForce RTX 4080 12 GB | GeForce RTX 4080 16 GB | GeForce RTX 4090 | |
GPU | AD104 |
AD103 | AD102 |
Число транзисторов | - | - | 76 млрд. |
Техпроцесс | 4 нм | 4 нм | 4 нм |
Площадь кристалла | - | - | 608,3 мм² |
Число FP32 ALU | 7.680 | 9.728 | 16.384 |
Число INT32 ALU | - | - | - |
Число SM | 60 | 76 | 128 |
Ядра Tensor | 240 | 304 | 512 |
Ядра RT | 60 | 76 | 128 |
Базовая частота | 2.310 МГц | 2.210 МГц | 2.230 МГц |
Частота Boost | 2.610 МГц | 2.505 МГц | 2.520 МГц |
Емкость памяти | 12 GB | 16 GB | 24 GB |
Тип памяти | GDDR6X | GDDR6X | GDDR6X |
Ширина шины памяти | 192 бит | 256 бит | 384 бит |
Частота памяти | - | - | - |
Пропускная способность памяти | 504 Гбайт/с | 720 Гбайт/с | 1.008 Гбайт/с |
TDP | 285 Вт | 325 Вт | 450 Вт |
Цена | 1.099 евро | 1.469 евро | 1.949 евро |
В фокусе данного обзора флагманская видеокарта GeForce RTX 4090. Она базируется на Ada102 GPU, который содержит 128 SM, что эквивалентно 16.384 потоковым процессорам FP32. Также на GPU работают 512 ядер Tensor 4-го поколения и 128 ядер RT 3-го поколения. Ядра Tensor и RT были существенно улучшены, они работают быстрее и эффективнее.
NVIDIA указывает базовую частоту GeForce RTX 4090 на 2.230 МГц. В Boost видеокарта будет работать на минимальной частоте 2.520 МГц, но на практике она наверняка будет выше. 24 Гбайт видеопамяти GDDR6X подключены по 384-битному интерфейсу с пропускной способностью 1.000 Гбайт/с. TDP заявлен на уровне 450 Вт. NVIDIA выставила за Founders Edition ценник €1.949.
Сегодня мы не рассмотрим две видеокарты GeForce RTX 4080, к ним мы вернемся в ноябре.
GeForce Titan RTX | GeForce RTX 3090 | GeForce RTX 4090 | |
GPU | TU102 | GA102 | AD102 |
Число транзисторов | 18,6 млрд. | 28,3 млрд. | 76 млрд. |
Техпроцесс | 12 нм | 8 нм | 4 нм |
Площадь кристалла | 754 мм² | 628 мм² | 608,3 мм² |
Число FP32 ALU | 4.608 | 10.496 | 16.384 |
Число INT32 ALU | - | 5.248 | - |
Число SM | 72 | 82 | 128 |
Ядра Tensor | 576 | 328 | 512 |
Ядра RT | 72 | 82 | 128 |
Базовая частота | 1.350 МГц | 1.410 МГц | 2.230 МГц |
Частота Boost | 1.770 МГц | 1.695 МГц | 2.520 МГц |
Емкость памяти | 24 GB | 24 GB | 24 GB |
Тип памяти | GDDR6 | GDDR6X | GDDR6X |
Ширина шины памяти | 384 бит | 384 бит | 384 бит |
Частота памяти | 1.750 МГц | 1.219 МГц | 1.313 МГц |
Пропускная способность памяти | 672 Гбайт/с | 936 Гбайт/с | 1.008 Гбайт/с |
TDP | 280 Вт | 350 Вт | 450 Вт |
Цена | 2.699 евро | от 107.300 ₽ | 1.949 евро |
Прямое сравнение показывает прогресс, которого удалось добиться при разработке серии XX90. Для сравнения мы взяли Titan RTX, который стал представителем видеокарты поколения Turing выше RTX 2080 Ti. Конфигурация памяти всех трех видеокарт идентична – 24 Гбайт, но пропускная способность существенно увеличилась. Число вычислительных блоков утроилось, хотя в случае Ampere и Ada Lovelace конфигурация отличается – 128 вычислительных блоков FP32 на SM.
Если сравнивать с GeForce RTX 3090, видеокарта GeForce RTX 4090 дает дальнейшее увеличение числа вычислительных блоков. А именно на 60% больше вычислительных блоков FP32 и INT32. Кроме того, число блоков RT и Tensor тоже увеличилось в такой же пропорции. NVIDIA выбрала для Ada Lovelace 5-нм техпроцесс TSMC под названием 4N. На площади 608,3 мм² расположены 76 млрд. транзисторов. Новый техпроцесс позволил NVIDIA преодолеть порог частоты 2.500 МГц, на практике она даже выше.
Если вам интересны подробности техпроцесса и другие характеристики новых GPU, мы свели их в таблицу:
AD102 | AD103 | AD104 | |
Площадь кристалла | 608,3 мм² | 378,6 мм² | 294,5 мм² |
Количество транзисторов | 76 млрд. | 45,9 млрд. | 35,8 млрд. |
Плотность транзисторов | 124,9 MTr/mm² | 121,2 MTr/mm² | 121,6 MTr/mm² |
Число SM | 144 | 80 | 60 |
Число блоков FP32 | 18.432 | 10.240 | 7.680 |
Ядра RT | 144 | 80 | 60 |
Ядра Tensor | 576 | 320 | 240 |
Кэш L2 | 96 MB | 64 MB | 48 MB |
ROPs | 192 | 112 | 80 |
Ширина шины памяти | 384 бит | 256 бит | 192 бит |
Как видим, уровни конфигурации Ada Lovelace GPU масштабируются полни линейно. В данном случае мы привели полные конфигурации чипов, хотя на видеокартах GeForce они встречаются редко. Полная версия GPU AD104 используется только на GeForce RTX 4080 12 GB. Похоже, что у маленького чипа доля выхода годных кристаллов довольно высока. Плотность расположения транзисторов превышает 120 млн. на квадратный миллиметр.