Тест и обзор: NVIDIA GeForce RTX 4090 Founders Edition

Опубликовано:

hardwareluxx news newВидеокарта GeForce RTX 4090 знаменует вторую волну горячих новинок осени 2022. Первая началась с процессоров Ryzen 7000, затем последовали видеокарты Intel Arc. Теперь NVIDIA представляет новое поколение видеокарт, далее нас ждут процессоры Intel Raptor Lake и видеокарты AMD RDNA 3. NVIDIA решила начать с high-end видеокарты GeForce RTX 4090, хотя в случае предшествующего поколения первой вышла RTX 3080. Новые видеокарты обеспечат более высокий уровень производительности благодаря нескольким факторам. Мы протестируем новинку, рассмотрим инновации трассировки лучей, DLSS и многие другие.

NVIDIA выбрала несколько иную стратегию при выходе видеокарт GeForce RTX 40. Линейка стартует со старшей модели GeForce RTX 4090, которая основана почти на полной версии AD102 GPU. Видеокарта оснащена 24 Гбайт видеопамяти и работает с тепловым пакетом 450 Вт, так что и здесь характеристики топовые. Вероятно, такой шаг даст партнерам дополнительное время, чтобы распродать имеющиеся на складах видеокарты GeForce RTX 30.

Оставшиеся две модели появятся в ноябре. А именно GeForce RTX 4080 16 GB и GeForce RTX 4080 12 GB, которую было бы честнее назвать GeForce RTX 4070. Но мы вернемся к этому вопросу позже.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).

Мы рекомендуем ознакомиться с нашим руководством по выбору видеокарты для разных бюджетов.

Ниже приведены технические спецификации

Сравнение видеокарт
  GeForce RTX 4080 12 GB GeForce RTX 4080 16 GBGeForce RTX 4090
GPU AD104
AD103AD102
Число транзисторов - -76 млрд.
Техпроцесс 4 нм 4 нм4 нм
Площадь кристалла - -608,3 мм²
Число FP32 ALU 7.680 9.72816.384
Число INT32 ALU - --
Число SM 60 76128
Ядра Tensor 240 304512
Ядра RT 60 76128
Базовая частота 2.310 МГц 2.210 МГц2.230 МГц
Частота Boost 2.610 МГц 2.505 МГц2.520 МГц
Емкость памяти 12 GB 16 GB24 GB
Тип памяти GDDR6X GDDR6XGDDR6X
Ширина шины памяти 192 бит 256 бит384 бит
Частота памяти - --
Пропускная способность памяти 504 Гбайт/с 720 Гбайт/с1.008 Гбайт/с
TDP 285 Вт 325 Вт450 Вт
Цена 1.099 евро 1.469 евро1.949 евро

В фокусе данного обзора флагманская видеокарта GeForce RTX 4090. Она базируется на Ada102 GPU, который содержит 128 SM, что эквивалентно 16.384 потоковым процессорам FP32. Также на GPU работают 512 ядер Tensor 4-го поколения и 128 ядер RT 3-го поколения. Ядра Tensor и RT были существенно улучшены, они работают быстрее и эффективнее.

NVIDIA указывает базовую частоту GeForce RTX 4090 на 2.230 МГц. В Boost видеокарта будет работать на минимальной частоте 2.520 МГц, но на практике она наверняка будет выше. 24 Гбайт видеопамяти GDDR6X подключены по 384-битному интерфейсу с пропускной способностью 1.000 Гбайт/с. TDP заявлен на уровне 450 Вт. NVIDIA выставила за Founders Edition ценник €1.949.

Сегодня мы не рассмотрим две видеокарты GeForce RTX 4080, к ним мы вернемся в ноябре.

Сравнение видеокарт
  GeForce Titan RTXGeForce RTX 3090GeForce RTX 4090
GPU TU102GA102AD102
Число транзисторов 18,6 млрд.28,3 млрд.76 млрд.
Техпроцесс 12 нм8 нм4 нм
Площадь кристалла 754 мм²628 мм²608,3 мм²
Число FP32 ALU 4.60810.49616.384
Число INT32 ALU -5.248-
Число SM 7282128
Ядра Tensor 576328512
Ядра RT 7282128
Базовая частота 1.350 МГц1.410 МГц2.230 МГц
Частота Boost 1.770 МГц1.695 МГц2.520 МГц
Емкость памяти 24 GB24 GB24 GB
Тип памяти GDDR6GDDR6XGDDR6X
Ширина шины памяти 384 бит384 бит384 бит
Частота памяти 1.750 МГц1.219 МГц1.313 МГц
Пропускная способность памяти 672 Гбайт/с936 Гбайт/с1.008 Гбайт/с
TDP 280 Вт350 Вт450 Вт
Цена 2.699 евроот 107.300 ₽ 1.949 евро

Прямое сравнение показывает прогресс, которого удалось добиться при разработке серии XX90. Для сравнения мы взяли Titan RTX, который стал представителем видеокарты поколения Turing выше RTX 2080 Ti. Конфигурация памяти всех трех видеокарт идентична – 24 Гбайт, но пропускная способность существенно увеличилась. Число вычислительных блоков утроилось, хотя в случае Ampere и Ada Lovelace конфигурация отличается – 128 вычислительных блоков FP32 на SM.

Если сравнивать с GeForce RTX 3090, видеокарта GeForce RTX 4090 дает дальнейшее увеличение числа вычислительных блоков. А именно на 60% больше вычислительных блоков FP32 и INT32. Кроме того, число блоков RT и Tensor тоже увеличилось в такой же пропорции. NVIDIA выбрала для Ada Lovelace 5-нм техпроцесс TSMC под названием 4N. На площади 608,3 мм² расположены 76 млрд. транзисторов. Новый техпроцесс позволил NVIDIA преодолеть порог частоты 2.500 МГц, на практике она даже выше.

Если вам интересны подробности техпроцесса и другие характеристики новых GPU, мы свели их в таблицу:

Сравнение Ada Lovelace GPU

AD102 AD103AD104
Площадь кристалла 608,3 мм² 378,6 мм²294,5 мм²
Количество транзисторов 76 млрд. 45,9 млрд.35,8 млрд.
Плотность транзисторов 124,9 MTr/mm² 121,2 MTr/mm²121,6 MTr/mm²
Число SM 144 8060
Число блоков FP32 18.432 10.2407.680
Ядра RT 144 8060
Ядра Tensor 576 320240
Кэш L2 96 MB 64 MB48 MB
ROPs 192 11280
Ширина шины памяти 384 бит 256 бит192 бит

Как видим, уровни конфигурации Ada Lovelace GPU масштабируются полни линейно. В данном случае мы привели полные конфигурации чипов, хотя на видеокартах GeForce они встречаются редко. Полная версия GPU AD104 используется только на GeForce RTX 4080 12 GB. Похоже, что у маленького чипа доля выхода годных кристаллов довольно высока. Плотность расположения транзисторов превышает 120 млн. на квадратный миллиметр.


NVIDIA внесла некоторые изменения в архитектуру Ada Lovelace по сравнению с предыдущей Ampere. В том числе используются новые ядра RT и Tensor, на которых мы остановимся чуть ниже. В структуре самих SM изменений мало. Имеются 64 выделенных блока FP32 и 64 совмещенных FP32/INT32.

NVIDIA опубликовала диаграмму AD102 GPU и упомянула максимальный уровень расширения. Полная конфигурация AD102 GPU будет содержать до 18.432 вычислительных блоков FP32, 144 ядра RT и 576 ядер Tensor. Но NVIDIA пока не реализовала полный вариант ни на одной видеокарте, будь то GeForce RTX 4090, RTX 6000 Ada Generation или L40.

Как и предполагалось, удвоения ROP не произошло. С архитектурой Ampere они мигрировали в Raster Engine, там и продолжают оставаться. У каждого Raster Engine имеются два раздела ROP, содержащие по восемь ROP. Остальная структура во многом идентична Ampere – за исключением числа SM и наличия ядер Tensor четвертого поколения и ядер RT третьего поколения.

Кэш L1 по-прежнему имеет размер 128 кбайт. Но кэш L2 стал существенно крупнее. На полном AD102 GPU кэш L2 имеет емкость 98.304 кбайт, то есть почти 100 Мбайт. В степени расширения GeForce RTX 4090 GPU оснащен кэшем L2 емкостью 73.728 кбайт. У GA102 GPU кэш L2 был всего 6.144 кбайт L2. NVIDIA увеличила кэш L2 в 12 раз, что должно уменьшить «узкие места» по доступу к видеопамяти.

Ядра RT третьего поколения

Третье поколение ядер RT в архитектуре Ada получило в два раза более высокую пропускную способность вычислительных блоков по сравнению с предшественниками, что увеличивает производительность по расчетам трассировки лучей в 2,8x. В случае GeForce RTX 4090 теоретическая производительность увеличилась до 191 RT TFLOPS по сравнению с 78 RT TFLOPS для GeForce RTX 3090 Ti.

Кроме того, третье поколение ядер RT получило такие функции, как Opacity Micro-Map Engines и Micro-Mesh Engines. Они представляют собой новые выделенные аппаратные блоки для ускорения особо требовательных вычислений трассировки лучей.

Здесь мы бы хотели более подробно остановиться на Opacity Micro-Maps и Displaced Micro-Meshes.

Opacity Micro-Maps представляют собой оптимизацию расчета трассировки лучей. Трассировка лучей не очень хорошо справляется с некоторыми объектами, например, листвой и растительностью. Лучи могут отражаться в бессчетных направлениях между листьями и ветвями, поэтому подобные объекты значительно осложняют трассировку. Третье поколение ядер RT может использовать Opacity Micro-Maps для присвоения статуса прозрачности подобным элементам, которые могут быть непрозрачными, прозрачными или неизвестными.

Для сложных объектов ранее трассировка лучей не использовалась или применялась в облегченном виде. Opacity Micro-Maps должны учитывать подобные объекты в будущем.

Ядра RT третьего поколения генерируют Displaced Micro-Meshes (DMM). Дерево BVH (bounding volume hierarchies), которое используется для трассировки лучей, будет строиться до 10 раз быстрее и потреблять в 20 раз меньше видеопамяти. NVIDIA описывает DMM следующим образом: «DMM – это новые примитивы, которые представляют собой структурированную сетку микро-треугольников, и ядра RT третьего поколения могут обрабатывать их в родном режиме. Что уменьшает требования к объему памяти при рендеринге сложной геометрии, которая использует только простые треугольники».

Shader Execution Reordering

Технология Shader Execution Reordering (SER) позволяет объединять вычисления в конвейере, чтобы вычислительные блоки были всегда максимально нагружены. Производительность потоковых процессоров при этом увеличивается до двух раз, что приводит к повышению fps в играх до 25%.

Четвертое поколение ядер Tensor и DLSS 3

Технология Deep Learning Super Sampling тоже получила обновление до третьей версией. Она работает на 4-м поколении ядер Tensor, которое получило различные оптимизации. Например, новые ядра Tensor обеспечивают в пять раз более высокую пропускную способность вычислений FP8.

Для DLSS 3 используются так называемые ускорители Optical Flow. Они вычисляют пиксельные данные движения из последовательных кадров, используя нейросеть DLSS.


С технологией DLSS 3 NVIDIA представила полностью новый метод, который является логической эволюцией Deep Learning Super Sampling (DLSS).

Вместо рендеринга кадра в низком разрешении и дальнейшего масштабирования до разрешения дисплея (включая реконструкцию потерянных деталей через ИИ), DLSS 3 создает полные кадры через технологию Optical Multi Frame Generation. Конечно, здесь требуется аппаратное ускорение вычислений. Используются ядра Tensor и ускорители Optical Flow ядер RT.

Для создания кадра необходимы следующие составляющие: предыдущий кадр, так называемое поле Optical Flow, создаваемое ускорителями в ядрах RT, и некоторые сведения от игрового движка, такие как векторы движения и информация глубины.

Ускорители Optical Flow анализируют два последовательных кадра и создают из них поле Optical Flow. Поле Optical Flow содержит информацию о направлении и скорости движения пикселей при переходе с первого кадра на второй. Ускоритель Optical Flow захватывает информацию на пиксельном уровне, такую как частицы, отражения, тени и освещение, которая отсутствует в векторной информации игрового движка.

И если ускоритель Optical Flow отслеживает эффекты на пиксельном уровне, то на уровне геометрии DLSS 3 получает информацию о векторах движения (Motion Vectors) от игрового движка. На примере выше векторы движения показывают, как перемещается дорожное покрытие по отношению к мотоциклисту, но не учитывают его тень. Если создавать кадр на основе только векторов движения, то будут ошибки рендеринга, например, в виде некорректной тени. Поэтому необходим дополнительный анализ, который и выполняют ускорители Optical Flow.

Для каждого пикселя сеть DLSS Frame Generation на основе искусственного интеллекта определяет, как использовать информацию векторов движения игры, поля Optical Flow и выводимые игрой кадры. Благодаря векторам движения игры и полю Optical Flow сеть Frame Generation может точно отслеживать движение объектов, восстанавливать геометрию и эффекты.

DLSS 3 – многослойная реализация DLSS. Сначала с помощью DLSS Super Resolution создается кадр в четверти от разрешения монитора (например, 1.920 x 1.080 вместо 3.840 x 2.160 пикселей). Второй кадр создается уже через DLSS Frame Generation. Для третьего кадра вновь используется DLSS Super Resolution, а для четвертого - DLSS Frame Generation. Таким образом, только 1/8 пикселей, которые будут выведены на дисплей, проходят непосредственно через классический рендеринг и потоковые процессоры.

DLSS 3 будет работать вместе с NVIDIA Reflex. GPU и CPU синхронизируются, чтобы обеспечить минимальные системные задержки. Таким образом, DLSS 3 обещает уполовинить задержки в два раза.

DLSS 3 также дает преимущество в играх, которые упираются в ограничения СPU или GPU, не способных выдавать высокую частоту кадров. В данном случае меняется классическая зависимость от CPU или GPU. В подобных ситуациях NVIDIA ожидает, как минимум, двукратный прирост частоты кадров, поскольку каждый второй кадр создает видеокарта. В тестах мы оценим, какое преимущество обеспечивает DLSS 3.

DLSS работает только на видеокартах GeForce RTX 40, поскольку зависит от ускорителей Optical Flow архитектуры Ada Lovelace. DLSS Super Resolution, с другой стороны, будет работать и на видеокартах GeForce RTX 30 и GeForce RTX 20. Технология Reflex поддерживается и на предыдущих поколениях видеокарт, NVIDIA здесь спускается вплоть до линейки GeForce GTX 900.

Поддержка DLSS добавится в ближайшие месяцы в десятках игр.


Все больше игр разрабатываются с эффектами трассировки лучей и другими новыми технологиями, но что делать со старыми играми? Чаще всего, разработчики не спешат добавлять что-то новое. NVIDIA прекрасно понимает, что добавление новых технологий требует от разработчиков определенных усилий.

Поэтому была разработана RTX Remix. Она представляет собой платформу моддинга на основе технологии NVIDIA Omniverse. Суть платформы в том, что она может менять путь рендеринга игр на DirectX 8 и 9. Для этого используются три компонента. Экстрактор USD (Universal Scene Description) преобразует данные (Assets) старой игры таким образом, чтобы их можно было пропустить через платформу. RTX Remix Runtime преобразует существующий код x86 в 32-битный для 64-битного окружения. Что позволяет задействовать современные технологии, а также больше 3 Гбайт памяти – предел для 32-битного кода.

Приложения DirectX 8 и DirectX 9 работают через промежуточный уровень Vulkan. Scene Manager далее преобразует данные, такие как текстуры, геометрию и освещение в RTX Remix Runtime.

Классические игры, такие как Morrowind, используют DirectX 9 для отсылки вызовов Draw Calls (инструкций рендеринга) на GPU. RTX Remix Runtime перехватывает данные вызовы, распознает группы треугольников, связанные с одним объектом, а также векторы движения объекта, покадрово анализируя данные вершин. RTX Remix Runtime распознает данные Assets с уровнем детализации, выставленным для оригинальной игры, после чего пересобирает их в идентичную сцену, для которой GPU рассчитывает эффекты трассировки лучей. NVIDIA RTX Remix может работать вместе с существующими модами.

Если массивы данных Assets не в высоком разрешении, сеть искусственного интеллекта выполняет масштабирование 4x и переводит текстуры в разрешение 4K. Кроме того, AI PBR (Physics Based Rendering) Replacer сканирует окружение, идентифицирует материалы сцены и выполняет их рендеринг с современными физически корректными свойствами. Например, каменный пол из булыжников, который раньше выводился простой плоской текстурой, преобразуется в детализованную каменную поверхность с картами неровностей, реалистично реагирующую на освещение.

Одна из игр, успешно переработанных через RTX Remix - Portal с RTX:

Racer RTX был разработан полностью в NVIDIA Omniverse. Можно видеть реалистичные текстуры и поверхности, а также впечатляющее освещение.


На прошлой неделе мы опубликовали распаковку и поделились первыми фотографиями GeForce RTX 4090 Founders Edition. Сейчас мы можем раскрыть дополнительные подробности.

На первый взгляд, базовый дизайн не отличается от видеокарт Founders Edition в линейке GeForce RTX 30. Но в деталях есть отличия, на которых мы остановимся подробнее.

Габариты у high-end видеокарт играют важную роль. Поэтому приведем небольшое сравнение.

Размеры видеокарт

Длина ВысотаСлоты PCIe
NVIDIA GeForce RTX 4090 Founders Edition 304 мм 137 мм 3 (61 мм)
NVIDIA GeForce RTX 4080 Founders Edition 304 мм 137 мм 3 (61 мм)
NVIDIA GeForce RTX 3090 Ti Founders Edition 313 мм 138 мм 3 (51 мм)
NVIDIA GeForce RTX 3090 Founders Edition 313 мм 138 мм 3 (51 мм)
NVIDIA GeForce RTX 3080 Founders Edition 285 мм 112 мм 2 (40 мм)

Интересно, что видеокарты GeForce RTX 4090 и 4080 Founders Edition даже чуть короче high-end моделей предыдущего поколения. По высоте они тоже стали чуть меньше. Зато толщина значительно увеличилась. Теперь видеокарты занимают три слота PCI Express, толщина GeForce RTX 4090 Founders Edition достигла целых 61 мм.

Некоторые видеокарты с альтернативным дизайном даже длиннее. Длина может составлять до 350 мм, также и высота PCB может быть больше, поэтому при выборе видеокарты следует учитывать доступное место в корпусе ПК. Особенно с учетом того, что с торца необходимо подключать штекер питания или переходник.

На задней стороне видеокарты приведено название модели. NVIDIA не стала менять дизайн, как мы уже упоминали. У видеокарты вновь два осевых вентилятора, по одному с каждой стороны. С лицевой стороны вентилятор обдувает радиатор видеокарты и PCB, а с задней стороны вентилятор работает на вытяжку в направлении кулера CPU.

Подобное направление воздушного потока широко распространено и среди альтернативных дизайнов. Мы видели его на моделях RTX 30, то же самое касается и первых видеокарт GeForce RTX 4090.

Осевые вентиляторы GeForce RTX 4090 Founders Edition имеют диаметр 116 мм каждый, в случае GeForce RTX 3090 (Ti) они были чуть меньше – 110 мм. NVIDIA решила вновь увеличить вентиляторы, что наверняка приведет к увеличению продуваемого воздушного потока. Видеокарта работает в полупассивном режиме до температуры GPU 46 °C. При уменьшении нагрузки вентиляторы останавливаются при охлаждении до 34 °C.

Горячий воздух частично продувается лицевым вентилятором в направлении слотовой заглушки. Но большая часть воздуха остается внутри корпуса. Кулер Founders Edition также продувает часть воздуха в сторону слота PCI Express, то есть вбок от видеокарты.

С торца можно видеть разъем PCIe 5.0 (12VHPWR) для дополнительного питания. NVIDIA указывает подаваемую мощность до 450 Вт, хотя по спецификациям возможны 600 Вт. Вместе с Founders Edition прилагается переходник с 4x 8-конт. на 12VHPWR. Конечно, намного легче использовать комплектный кабель от блока питания, если он есть. Хотя бы из соображений прокладки кабелей.

В задней части видеокарты видна крышка, за которой скрываются отверстия с резьбой, позволяющие прикрутить видеокарту к креплению. Некоторые системные интеграторы устанавливают подобные крепления в свои корпуса. Производители видеокарт с альтернативным дизайном иногда прилагают балки поддержки, видеокарты у них тоже имеют отверстия крепления.

NVIDIA на слотовой заглушке GeForce RTX 4090 Founders Edition предлагает три порта DisplayPorts 1.4a и один HDMI 2.1a. NVIDIA посчитала DisplayPort 2.0 избыточным, поскольку DisplayPort 1.4a может передавать поток чистых данных 32,4 Гбит/с. Что позволяет обеспечить 120 Гц в разрешении UHD. DisplayPort 2.0 позволил бы передавать 16K на 60 Гц или два потока 8K на 120 Гц. Но на ближайшие годы возможностей DisplayPort 1.4a вполне достаточно. HDMI 2.1a теоретически может поддерживать дисплеи 10K на 120 Hz. 4K на 144 Гц можно передавать и без DSC (Display Stream Compression).

Здесь хорошо видны размеры видеокарты, часть горячего воздуха будет выбрасываться через слотовую заглушку.

Для сравнения мы расположили ниже видеокарту GeForce RTX 3090 Ti, а выше – GeForce RTX 4090 в варианте Founders Edition. С данного ракурса разница по размерам заметна не так хорошо. По дизайну или расцветке отличий вроде бы нет. Но рамка и крестовины GeForce RTX 4090 стали чуть толще.

С торца разница уже более ощутима. GeForce RTX 4090 FE (вверху) имеет толщину 61 мм, а видеокарта GeForce RTX 3090 Ti FE (внизу) – 51 мм. Кроме того, здесь заметна немного другая расцветка кожуха кулера. Разъем дополнительного питания 12VHPWR смещен немного назад.

NVIDIA сделала панели кожуха вогнутыми, то есть прямых линий, как у линейки GeForce RTX 30, больше нет. Скорее всего, решение просто визуальное без технической подоплеки. В целом, вся видеокарта характеризуется подобными вогнутыми формами.


Вместе с видеокартой прилагается переходник 12VHPWR, который вставляется в соответствующий разъем. С противоположной стороны у него имеются четыре 8-контактных гнезда. С технической точки зрения все линии 12 В просто подаются на шесть контактов 12 В разъема 12VHPWR.

Конечно, подобный переходник смотрится громоздким. И теряется преимущество одного кабеля, поскольку придется где-то прятать четыре. Длина 160 мм просто недостаточна, чтобы скрыть подводимые кабели питания.

NVIDIA не только прилагает переходник вместе со своими видеокартами Founders Edition, но и требует такого же подхода от партнеров. Поэтому переходник входит в комплект поставки всех альтернативных дизайнов.

Но что произойдет, если подключить не все четыре порта? Именно это мы и попробовали на практике, после чего с помощью PCAT фиксировали нагрузку на линии адаптера. У нас имеется оборудование PCAT в версии, которая позволяет подключать питание по трем 8-контактным интерфейсам, с которых считываются показания. Но теперь требуются четыре разъема. Впрочем, мы можем определить нагрузку по четвертому порту питания, исходя из трех имеющихся.

GeForce RTX 4090 успешно стартует с тремя подключенными разъемами к переходнику. Видеокарта потребляет около 400 Вт под игровой нагрузкой, 434 Вт в пике. Через три 8-конт. разъема подаются 120 Вт + 122 Вт + 138 Вт, еще 11 Вт дает слот PCIe.

Если подключены все четыре разъема питания, три из которых проходят через PCAT, подаваемая мощность составляет 70 Вт + 68 Вт + 78 Вт, вместе со слотом PCIe она составляет 225 Вт. Теперь достаточно учесть разницу с уровнем 400 Вт, которую обеспечивает четвертый разъем питания. Он дает около 173 Вт.

Мы запросили NVIDIA информацию по поводу того, почему нагрузка распределяется по четырем разъемам питания неравномерно.

В любом случае, интерфейс 12VHPWR кажется вполне перспективным. Видеокарты с энергопотреблением 300 Вт и выше сегодня подключаются двумя или большим числом разъемов питания, при этом усилий по прокладке кабелей приходится прикладывать больше, чем в случае с одним кабелем. С другой стороны, не каждый пользователь готов покупать новый блок питания. Хотя многие ждут моделей, совместимых со стандартом ATX 3.0. Но их на рынке еще нет, поэтому придется смириться с переходниками от производителей блоков питания или адаптером NVIDIA.


Мы не стали разбирать видеокарту GeForce RTX 4090 Founders Edition, а попросили производителя прислать фотографии. Вверху показана PCB видеокарты GeForce RTX 4090 Founders Edition, ниже - GeForce RTX 3090 Ti.

Обратите внимание, что на GeForce RTX 4090 отсутствуют порты NVLink. Для high-end видеокарт они уже не имеют смысла. Система питания NVIDIA представлена на GeForce RTX 3090 Ti 18 фазами. В случае GeForce RTX 4090 число фаз составляет 20 – то есть две были добавлены. Память GDDR6X питается тремя фазами.

NVIDIA выбрала MOSFET Monolithic Power Systems MP86957, которые подключены к VRM-контроллеру Monolithic Power Systems MP2891. На фотографиях видно, что GPU теперь расположен на PCB чуть ниже. Данный шаг улучшает подачу питания и дает лучший баланс импеданса. Также PCB получила два дополнительных слоя. Они улучшают качество передачи сигнала памяти GDDR6X, обеспечивая лучшую изоляцию от шумов системы питания. NVIDIA перешла на новый диэлектрик PCB – c IT150GS на NPG-170D, что тоже должно улучшить качество передачи сигнала.

NVIDIA внесла многочисленные изменения к кулеру. Тепло от GPU, чипов памяти и компонентов питания забирается испарительной камерой, которая крупнее, чем на GeForce RTX 3090 Ti. Толщина стенок испарительной камеры была уменьшена до 0,4 мм, чтобы улучшить передачу тепла. Также было увеличено число вертикальных колонн испарительной камеры, она может поглощать больше 650 Вт тепла благодаря снижению теплового сопротивления. Стенки испарительной камеры, контактирующие с радиатором, существенно толще – 1 мм. Также больший объем жидкости в испарительной камере должен увеличить производительность охлаждения или Qmax (максимальную рассеиваемую мощность).

Радиатор изготовлен из алюминия. Ребра теперь выше, но расстояние между ними больше. В результате воздушный поток и статическое давление остались на прежнем уровне. NVIDIA указывает расстояние 2 мм, раньше оно составляло 1,7 мм.

Дизайн кулера подразумевает оптимизированный контакт с чипами памяти, чтобы тепло от них отводилось более эффективно, как и от GPU в целом. Теплопередающие прокладки стали тоньше – 1,5 мм вместо 2 мм, что тоже улучшает отведение тепла.

Как мы упомянули выше, NVIDIA увеличила диаметр вентиляторов со 110 до 116 мм. В целом, воздушный поток увеличился на 20%. Более крупный диаметр сам по себе увеличивает площадь продува на 11%. Благодаря оптимизации дизайна лопастей и крыльчатки, NVIDIA обещает увеличение на 20%. Вместо шариковых подшипников NVIDIA перешла на гидродинамические, поэтому уровень шума будет ниже.

Что насчет слухов о 600 Вт TDP?

Первые слухи насчет видеокарт GeForce RTX 40 гласили, что NVIDIA увеличит TDP до 600 Вт. Однако флагманская видеокарта потребляет лишь 450 Вт, хотя и данный уровень весьма значительный. Но у GeForce RTX 3090 Ti тепловой пакет уже составлял 450 Вт, а у GeForce RTX 3090 – 350 Вт. Поэтому какое-то привыкание есть.

Но откуда взялось энергопотребление 600 Вт? Все довольно просто. В какой-то момент NVIDIA занялась разработкой кулера. Партнеры тоже должны были подготовиться, и им сообщили о планах отводить до 600 Вт. С помощью видеокарты GeForce RTX 3090 Ti уровень 600 Вт уже можно было «симулировать». Конечно, есть намного более простые способы симулировать тепловыделение 600 Вт, после чего разрабатывать соответствующий кулер.

Слухи о том, что NVIDIA сменила контрактного производителя Samsung на TSMC по причине того, что теперь можно вытянуть 600 Вт из-за лучшего техпроцесса, нам не кажутся правдоподобными. Решение о переходе на TSMC было принято много месяцев назад. Иначе NVIDIA не смогла бы разработать адаптированный техпроцесс 4N вместе с TSMC. И здесь мы не видим причины перехода с 600 на 450 Вт.

Скорее всего, NVIDIA оставила за собой возможность масштабирования чипов Ada Lovelace до 600 Вт. Кривая масштабирования, которая показана вверху справа, не заканчивается на 450 Вт, ее можно продолжить. Конечно, при этом чип работает уже не в окне с оптимальной эффективностью. Та же видеокарта GeForce RTX 3090 Ti выходила за рамки этого окна.

В итоге NVIDIA нацелилась на 600 Вт, но пока представила «только» 450 Вт. Кулер NVIDIA тоже подготовила, что дает свои преимущества и недостатки. Он кажется избыточным, поскольку ему приходится отводить 450 Вт тепла вместо 600 Вт, отсюда и низкие температуры. Но громадные размеры видеокарты впечатлили многих геймеров.


Для тестов новых видеокарт NVIDIA и AMD мы собрали новую тестовую систему. Она состоит из следующих компонентов:

Ниже приведены используемые бенчмарки:

Мы использовали следующие версии драйверов:


Уровень шума

Бездействие

в дБ(A)
Меньше - лучше

Все современные видеокарты останавливают вентиляторы в режиме бездействия, если механизмы энергосбережения работают должным образом. Как только нагрузка будет снята, а температуры и энергопотребления упадут ниже пороговых значений, вентиляторы остановятся.

Уровень шума

Нагрузка

в дБ(A)
Меньше - лучше

Учитывая высокое тепловыделение, уровень шума GeForce RTX 4090 Founders Edition можно назвать сравнительно низким. Видеокарта работает тише GeForce RTX 3090 Ti Founders Edition, но на рынке есть модели и с меньшим уровнем шума. Будет интересно посмотреть, покажут ли видеокарты с альтернативным дизайном меньший уровень шума, чем Founders Edition.

Температура GPU

Бездействие

в градусах Цельсия
Меньше - лучше

В режиме бездействия температура GeForce RTX 4090 Founders Edition очень хорошая - 33 °C, здесь поводов для критики мы не видим. Вентиляторы останавливаются при температуре 34 °C, они раскручиваются при нагреве до 46 °C.

Температура GPU

Нагрузка

в градусах Цельсия
Меньше - лучше

Под нагрузкой GPU на видеокарте GeForce RTX 4090 Founders Edition нагревается всего до 63,6 °C. Здесь хорошо виден потенциал кулера. С технической точки зрения кулеру не требуется охлаждать GPU так сильно, вполне допустимы и более высокие температуры.

Температура памяти

Нагрузка

в °C
Меньше - лучше

Насчет памяти нареканий нет. 12 чипов емкостью 2 Гбайт установлены с лицевой стороны PCB. И переживать по поводу охлаждения чипов памяти сзади не приходится Температура 76 °C – вполне хорошее значение для памяти GDDR6X.

Энергопотребление

Бездействие (на GPU)

в Вт
Меньше - лучше

В режиме бездействия энергопотребление GeForce RTX 4090 Founders Edition составляет 6,6 Вт. Вряд ли из видеокарты можно выжать еще меньший уровень.

Энергопотребление

Нагрузка (на GPU)

в Вт
Меньше - лучше

Но под нагрузкой GeForce RTX 4090 Founders Edition показала свою истинную личину. Энергопотребление увеличилось с 6,6 Вт до 437,6 Вт.

Производительность майнинга

Несмотря на прекращение майнинга Ethereum на GPU, остаются вопросы насчет производительности майнинга GeForce RTX 4090.

Быстрый тест показал, что эффективность GeForce RTX 4090 для майнинга не такая высокая. Заработать можно лишь 50 центов в день. Что вряд ли понравится майнерам.


Энергопотребление TBP (Total Board Power) 450 Вт поначалу пугает, но здесь следует учитывать обстоятельства, о которых мы говорили чуть раньше. NVIDIA намеренно выбрала рабочую точку на кривой напряжения/частота на уровне 450 Вт, поскольку она посчитала ее наилучшей для анонса первой high-end видеокарты. Но будет интересно посмотреть, как GeForce RTX 4090 Founders Edition покажет с более высоким, но особенно с меньшим уровнем Power Limit.

Теоретически у GeForce RTX 4090 Founders Edition можно выставить уровень Power Limit от 10 до 600 Вт. Но столь высокий уровень смысла не имеет.

3DMark

Time Spy Extreme

FPS
Больше - лучше

Control

3.840 x 2.160 пикселей (высокие)

FPS
Больше - лучше

Cyberpunk 2077

2.560 x 1.440 пикселей (Raytracing средние)

FPS
Больше - лучше

F1 22

3.840 x 2.160 пикселей (Ultra High)

FPS
Больше - лучше

Уже на 550 Вт становится понятно, что дальнейший прирост производительности невозможен. Пока что мы не добавляли ручной разгон, здесь мы просто оценивали, можно ли получить больше производительности, просто выставив более высокую планку Power Limit. Прирост есть, но он составляет единицы процентов.

Но как будет выглядеть ситуация, если уменьшить Power Limit? При 350 Вт, то есть сниженном на 30% энергопотреблении, видеокарта получает штраф производительности всего на 5-20%. То есть эффективность работы повышается. На уровне 250 Вт, который составляет 55% от полного уровня, производительность снижается всего до 30%.

Графики частоты GPU и энергопотребления

Приведенные выше данные не раскрывают всей картины, полезно смотреть графики на протяжении всего тестового прогона. Мы использовали встроенный тест Cyberpunk 2077 в UHD с трассировкой лучей.

Если выставить для GeForce RTX 4090 уровень Power Limit 550 Вт, то GPU упирается под нагрузкой в частоту 2.730 МГц без особых флуктуаций. В случае 450 Вт пиковый уровень тоже составлял 2.730 МГц, но иногда частота снижалась до 2.685 МГц. Стабильности частоты уже не было. На 350 Вт мы получили сильную флуктуацию на уровне около 2.200 МГц.

По энергопотреблению видно, что GeForce RTX 4090 не выбирает предельный уровень 450 Вт. Вместо него мы получили диапазон между 420 и 430 Вт. Если увеличить уровень до 550 Вт, то энергопотребление будет где-то на уровне 450 Вт. Как видим, более высокий уровень автоматически не используется, необходимо вручную выставить частоту и напряжение.

При выставлении 350 Вт энергопотребление находится на уровне 300 Вт с пиками чуть выше.


UL 3DMark

Time Spy - графика

Баллы
Больше - лучше

UL 3DMark

Port Royal - графика

Баллы
Больше - лучше


Assassins Creed Valhalla

1.920 x 1.080 пикселей - Very High

184.6 XX


102.8 XX
151.4 XX


92.5 XX
143.8 XX


89.4 XX
143.1 XX


78.6 XX
134.4 XX


71.5 XX
Кадры в секунду
Больше - лучше

Assassins Creed Valhalla

2.560 x 1.440 пикселей - Very High

173.8 XX


104.8 XX
125.9 XX


81.5 XX
119.8 XX


64.5 XX
117.5 XX


78.2 XX
114.6 XX


65.2 XX
Кадры в секунду
Больше - лучше

Assassins Creed Valhalla

3.840 x 2.160 пикселей - Very High

126.7 XX


83.4 XX
80.4 XX


54.7 XX
77.9 XX


54.8 XX
75.1 XX


44.9 XX
74.2 XX


50.9 XX
Кадры в секунду
Больше - лучше


Battlefield 2042

1.920 x 1.080 пикселей - High с трассировкой

194.5 XX


134.5 XX
168.2 XX


106.7 XX
158.8 XX


110.1 XX
158.7 XX


109 XX
153.6 XX


101.6 XX
150.3 XX


78.1 XX
144.9 XX


66.8 XX
Кадры в секунду
Больше - лучше

Battlefield 2042

2.560 x 1.440 пикселей - High с трассировкой

167 XX


115.5 XX
144.5 XX


105.2 XX
129.4 XX


84.9 XX
114.3 XX


66.6 XX
105.2 XX


62.4 XX
Кадры в секунду
Больше - лучше

Battlefield 2042

3.840 x 2.160 пикселей - High с трассировкой

Кадры в секунду
Больше - лучше


Call of Duty Vanguard

1.920 x 1.080 пикселей - High

248.9 XX


164.4 XX
243.8 XX


146.6 XX
238.8 XX


156.9 XX
235.5 XX


161.4 XX
235.4 XX


149.1 XX
226.4 XX


150.3 XX
180.5 XX


121.4 XX
Кадры в секунду
Больше - лучше

Call of Duty Vanguard

2.560 x 1.440 пикселей - High

249.1 XX


154.3 XX
193.1 XX


126.9 XX
187.3 XX


128.1 XX
175.7 XX


115.9 XX
175.6 XX


111.5 XX
172.6 XX


104.5 XX
Кадры в секунду
Больше - лучше

Call of Duty Vanguard

3.840 x 2.160 пикселей - High

196.8 XX


124.9 XX
103.9 XX


73.2 XX
99.9 XX


64.7 XX
95.6 XX


68.6 XX
87.5 XX


56.8 XX
Кадры в секунду
Больше - лучше


Cyberpunk 2077

1.920 x 1.080 пикселей - средняя трассировка

125.8 XX


76.6 XX
83.9 XX


52.3 XX
79.7 XX


63.9 XX
58.4 XX


38.8 XX
54.2 XX


36.1 XX
Кадры в секунду
Больше - лучше

Cyberpunk 2077

2.560 x 1.440 пикселей - средняя трассировка

97.3 XX


76.1 XX
53.7 XX


43.7 XX
50.4 XX


40.6 XX
35.9 XX


27.5 XX
33.5 XX


18.6 XX
Кадры в секунду
Больше - лучше

Cyberpunk 2077

3.840 x 2.160 пикселей - средняя трассировка

Кадры в секунду
Больше - лучше


DOOM Eternal

1.920 x 1.080 пикселей - Ultra Nightmare с трассировкой

431 XX


291.3 XX
285.3 XX


211.9 XX
284.7 XX


209.9 XX
270.1 XX


196.4 XX
193.7 XX


153.4 XX
192.2 XX


150.5 XX
180.8 XX


112.8 XX
Кадры в секунду
Больше - лучше

DOOM Eternal

2.560 x 1.440 пикселей - Ultra Nightmare с трассировкой

364.1 XX


268.4 XX
244.1 XX


186.3 XX
223.1 XX


174.1 XX
207.2 XX


158.7 XX
140.8 XX


112.5 XX
136.3 XX


105.1 XX
Кадры в секунду
Больше - лучше

DOOM Eternal

3.840 x 2.160 пикселей - Ultra Nightmare с трассировкой

237.4 XX


182.4 XX
146.2 XX


122.3 XX
129.2 XX


106.1 XX
128.1 XX


105.7 XX
79.6 XX


57.7 XX
74.9 XX


56.7 XX
Кадры в секунду
Больше - лучше


Dying Light 2: Stay Human

1.920 x 1.080 пикселей - High с трассировкой

Кадры в секунду
Больше - лучше

Dying Light 2: Stay Human

2.560 x 1.440 пикселей - High с трассировкой

Кадры в секунду
Больше - лучше

Dying Light 2: Stay Human

3.840 x 2.160 пикселей - High с трассировкой

Кадры в секунду
Больше - лучше


F1 2022

1.920 x 1.080 пикселей - Ultra High с трассировкой

200.2 XX


107.6 XX
152.2 XX


93.3 XX
138.8 XX


83.8 XX
118.8 XX


72.3 XX
110.2 XX


67.8 XX
Кадры в секунду
Больше - лучше

F1 2022

2.560 x 1.440 пикселей - Ultra High с трассировкой

168.5 XX


90.8 XX
105.3 XX


71.3 XX
96.2 XX


64.7 XX
77.9 XX


50.8 XX
72.4 XX


48.3 XX
Кадры в секунду
Больше - лучше

F1 2022

3.840 x 2.160 пикселей - Ultra High с трассировкой

Кадры в секунду
Больше - лучше


Far Cry 6

1.920 x 1.080 пикселей - High с HD-текстурами и трассировкой

160.9 XX


107 XX
144.8 XX


81.2 XX
139.7 XX


78.2 XX
122.7 XX


68.2 XX
122.1 XX


74.8 XX
Кадры в секунду
Больше - лучше

Far Cry 6

2.560 x 1.440 пикселей - High с HD-текстурами и трассировкой

153.3 XX


117.9 XX
131.3 XX


77.3 XX
124.9 XX


74.7 XX
118 XX


68.1 XX
116.7 XX


71.9 XX
Кадры в секунду
Больше - лучше

Far Cry 6

3.840 x 2.160 пикселей - High с HD-текстурами и трассировкой

138.8 XX


103.8 XX
85.2 XX


63.5 XX
81.9 XX


55.3 XX
77.1 XX


57.2 XX
Кадры в секунду
Больше - лучше


Marvels Guardians of the Galaxy

1.920 x 1.080 пикселей - Very High с трассировкой

151.2 XX


65.3 XX
150.4 XX


66.6 XX
108.9 XX


57.9 XX
102.9 XX


57.1 XX
Кадры в секунду
Больше - лучше

Marvels Guardians of the Galaxy

2.560 x 1.440 пикселей - Very High с трассировкой

152.2 XX


93.6 XX
150.9 XX


83.6 XX
114.1 XX


76.9 XX
88.9 XX


85.6 XX
84.3 XX


81.2 XX
Кадры в секунду
Больше - лучше

Marvels Guardians of the Galaxy

3.840 x 2.160 пикселей - Very High с трассировкой

151.5 XX


92.6 XX
120 XX


66.8 XX
69.1 XX


54.3 XX
52.1 XX


33.7 XX
49.4 XX


32.2 XX
Кадры в секунду
Больше - лучше


Resident Evil Village

1.920 x 1.080 пикселей - с трассировкой

257.4 XX


189.2 XX
214.7 XX


174.5 XX
194 XX


158 XX
190.8 XX


155.5 XX
175.4 XX


148 XX
156.9 XX


127.8 XX
144.6 XX


119.6 XX
Кадры в секунду
Больше - лучше

Resident Evil Village

2.560 x 1.440 пикселей - с трассировкой

255.9 XX


192.6 XX
181.6 XX


156.8 XX
159.7 XX


137.1 XX
155.3 XX


125.1 XX
145.1 XX


119.2 XX
136.4 XX


112.3 XX
122.8 XX


102.4 XX
Кадры в секунду
Больше - лучше

Resident Evil Village

3.840 x 2.160 пикселей - с трассировкой

216.5 XX


178.2 XX
123.5 XX


108.4 XX
107.8 XX


92.2 XX
98.3 XX


86.7 XX
95.4 XX


81.4 XX
90.1 XX


76.4 XX
Кадры в секунду
Больше - лучше


Shadow of the Tomb Raider

1.920 x 1.080 - Ultra High

281.3 XX


169.8 XX
232.1 XX


163.6 XX
224.3 XX


163 XX
221.4 XX


166.9 XX
206.9 XX


165.3 XX
204.5 XX


106.8 XX
196.6 XX


159.9 XX
162.2 XX


100.1 XX
Кадры в секунду
Больше - лучше

Shadow of the Tomb Raider

2.560 x 1.440 - Ultra High

256.2 XX


149.3 XX
177.8 XX


145.1 XX
164 XX


127.6 XX
160.7 XX


125.7 XX
149.1 XX


121 XX
147.9 XX


126.4 XX
138.8 XX


118.9 XX
Кадры в секунду
Больше - лучше

Shadow of the Tomb Raider

3.840 x 2.160 - Ultra High

Кадры в секунду
Больше - лучше


Marvels Spider-Man Remastered

1.920 x 1.080 пикселей - Very High с трассировкой

102.5 XX


70.5 XX
101.2 XX


75.3 XX
98.6 XX


74.1 XX
77.2 XX


64.3 XX
75.7 XX


61.6 XX
Кадры в секунду
Больше - лучше

Marvels Spider-Man Remastered

2.560 x 1.440 пикселей - Very High с трассировкой

95.1 XX


67.3 XX
90.9 XX


67.9 XX
67.4 XX


51.8 XX
65.7 XX


50.7 XX
Кадры в секунду
Больше - лучше

Marvels Spider-Man Remastered

3.840 x 2.160 пикселей - Very High с трассировкой

Кадры в секунду
Больше - лучше


The Riftbreaker

1.920 x 1.080 пикселей - Standard

1021.7 XX


621.5 XX
721.3 XX


399.7 XX
661.2 XX


454 XX
559.1 XX


386.5 XX
524.7 XX


334.3 XX
494.7 XX


279.2 XX
Кадры в секунду
Больше - лучше

The Riftbreaker

2.560 x 1.440 пикселей - Standard

850.9 XX


526.9 XX
522.6 XX


388.2 XX
470.9 XX


361.9 XX
470.4 XX


355.3 XX
419.5 XX


325.9 XX
393.7 XX


323.5 XX
360.3 XX


266.9 XX
312.7 XX


209.9 XX
Кадры в секунду
Больше - лучше

The Riftbreaker

3.840 x 2.160 пикселей - Standard

455.1 XX


344.2 XX
265.7 XX


202.9 XX
236.9 XX


194.5 XX
233.9 XX


194.1 XX
211.2 XX


167.4 XX
210.9 XX


178.2 XX
189.9 XX


148.9 XX
Кадры в секунду
Больше - лучше


Control

1.920 x 1.080 пикселей - High с трассировкой

Кадры в секунду
Больше - лучше

Control

2.560 x 1.440 пикселей - High с трассировкой

Кадры в секунду
Больше - лучше

Control

3.840 x 2.160 пикселей - High с трассировкой

Кадры в секунду
Больше - лучше


Чтобы оценить производительность растеризации видеокарт (без эффектов трассировки лучей) мы провели несколько бенчмарков без трассировки. Что позволяет оценить прирост производительности после отключения эффектов трассировки.

Cyberpunk 2077

2.560 x 1.440 пикселей - High

Кадры в секунду
Больше - лучше

Cyberpunk 2077

3.840 x 2.160 пикселей - High

Кадры в секунду
Больше - лучше


Dying Light 2: Stay Human

2.560 x 1.440 пикселей - High

Кадры в секунду
Больше - лучше

Dying Light 2: Stay Human

3.840 x 2.160 пикселей - High

Кадры в секунду
Больше - лучше


Marvels Spider-Man Remastered

2.560 x 1.440 пикселей - Very high

161.2 XX


106.2 XX
141.1 XX


94.5 XX
Кадры в секунду
Больше - лучше

Marvels Spider-Man Remastered

3.840 x 2.160 пикселей - Very high

Кадры в секунду
Больше - лучше

>

F1 2022

2.560 x 1.440 пикселей - Ultrahigh

262.2 XX


136.1 XX
241.3 XX


131.7 XX
225.5 XX


126.7 XX
204 XX


107.1 XX
Кадры в секунду
Больше - лучше

F1 2022

3.840 x 2.160 пикселей - Ultrahigh

255.1 XX


132.4 XX
144.3 XX


92.6 XX
132.9 XX


88.8 XX
Кадры в секунду
Больше - лучше


Рендерин Blender GPU: Scanlands

Blender

Scanlands Rendering - 50 семплов

Секунды
Меньше - лучше

DaVinci Resolve: кодирование H.265

DaVinci Resolve

H.265 кодирование - 4K экспорт

Секунды
Меньше - лучше

V-Ray Benchmark

V-Ray Benchmark

GPU CUDA

Миллионы путей за одну минуту
Больше - лучше

Luxmark: Food

Luxmark

Food Rendering

KSamples/s
Больше - лучше


Мы уже обсудили работу DLSS 3 и генерацию кадров в теории, теперь настала очередь практики. Ниже приведены результаты тестов. Среди прочего, мы протестировали Cyberpunk 2077 в бета-версии, последний Flight Simulator и A Plague Tale: Requiem.

Cyberpunk 2077

3.840 x 2.160 пикселей (трассировка средние)

FPS
Больше - лучше

Microsoft Flight Simulator

3.840 x 2.160 пикселей (Ultra)

FPS
Больше - лучше

A Plague Tale: Requiem

3.840 x 2.160 пикселей (Ultra)

FPS
Больше - лучше

F1 22

3.840 x 2.160 пикселей (Ultra High)

FPS
Больше - лучше

Картина повышения производительности после включения DLSS в разных профилях качества нам знакома. По сравнению с родным рендерингом FPS увеличивается в режимах Качество/Quality, Баланс/Balanced, Производительность/Performance и Ультра производительность/Ultra Performance. Хорошую масштабируемость мы получили и в игре A Plague Tale: Requiem. Но вот Microsoft Flight Simulator упирается в CPU даже в разрешении UHD с детализацией ультра. Поэтому с активной DLSS (без FG) мы не получили выше 80 fps. Технология Frame Generation позволила увеличить производительность до уровня 140 fps, то есть почти удвоила. DLSS затем добавляет еще 30 fps, но игра вновь упирается в CPU и не масштабируется на разных профилях. Вместе с тем, увеличение fps с 80 до 175 можно назвать весьма существенным.

Качество картинки

Конечно, прирост fps вряд ли можно приветствовать, если пострадает качество картинки. Поэтому мы решили его оценить. Из-за ограничений времени мы не стали описывать каждый скриншот. Но наша галерея позволяет напрямую сравнивать качество скриншотов с помощью слайдера. Нажмите на логотип Hardwareluxx по центру картинки и передвигайте его вправо или влево. Стрелки в правом верхнем углу позволяют развернуть картинку на весь экран.

A Plague Tale: Requiem: родное против DLSS: качество

Bildvergleich
A Plague Tale: Requiem - родное A Plague Tale: Requiem - DLSS: качество

A Plague Tale: Requiem: родное против DLSS: баланс

Bildvergleich
A Plague Tale: Requiem - родное A Plague Tale: Requiem - DLSS: баланс

A Plague Tale: Requiem: родное против DLSS: производительность

Bildvergleich
A Plague Tale: Requiem - родное A Plague Tale: Requiem - DLSS: производительность

A Plague Tale: Requiem: родное против DLSS: ультра-производительность

Bildvergleich
A Plague Tale: Requiem - родное A Plague Tale: Requiem - DLSS: ультра-производительность

Cyberpunk 2077: родное против DLSS: качество

Bildvergleich
Cyberpunk 2077 - родное Cyberpunk 2077 - DLSS: качество

Cyberpunk 2077: родное против DLSS: баланс

Bildvergleich
Cyberpunk 2077 - родное Cyberpunk 2077 - DLSS: баланс

Cyberpunk 2077: родное против DLSS: производительность

Bildvergleich
Cyberpunk 2077 - родное Cyberpunk 2077 - DLSS: производительность

Cyberpunk 2077: родное против DLSS: ультра-производительность

Bildvergleich
Cyberpunk 2077 - родное Cyberpunk 2077 - DLSS: ультра-производительность

В игре A Plague Tale: Requiem мы попытались провести анализ. На видео показана игра в разрешении UHD с Frame Generation, и в двух сценах мы замедлили поток, чтобы показать кадр за кадром. В первом замедлении на 15 секунде вокруг персонажа на каждом нечетном кадре появляются артефакты. На 44 секунде мы вновь замедлили поток, и в кадрах видны артефакты.

Но данные артефакты заметны только на статических кадрах. В динамике игры их не видно.

Первыми играми с поддержкой DLSS станут:

Кроме того, анонсированы еще 35 игр, которые будут работать с DLSS 3 после появления патча или выхода самой игры.


Intel сделала первый ход с видеокартами Arc первого поколения (см. тест Arc A750 и A770 Limited Edition), NVIDIA оказалась следующей. Скорее всего, AMD тоже добавит аппаратное кодирование AV1 к своим RDNA 3 GPU. Судя по всему, AV1 начнет доминировать на рынке потокового видео в ближайшие годы. H.264 сегодня считается стандартом де-факто, у H.265 перспективы не такие хорошие из-за лицензионных отчислений, хотя технически он превосходит H.264.

Поэтому будущее за AV1. YouTube уже поддерживает данный кодек, как и Netflix. Twitch, одна из крупнейших платформ стриминга, пока не перешла на AV1, но здесь все зависит от стримеров, которые должны обзавестись соответствующим железом. И здесь на сцену выходит GeForce RTX 4090.

Чтобы проверить работу с кодеком AV1, мы использовали бета-версии DaVinci Resolve и OBS Studio. В приложениях можно выставить кодер NVEC с поддержкой AV1 для экспорта, записи и стриминга.

Оценивать качество картинки не так просто. H.265 на 3.000 кбит/с превосходит H.264 по качеству при таком же потоке. Если взять одинаковое качество, то H.264 требуется поток 8.000 кбит/с, а для H.265 и AV1 достаточно 3.000 кбит/с. H.265 нельзя назвать полноценной альтернативой из-за высокой стоимости лицензирования, поэтому есть смысл проводить тесты только между H.264 и AV1.

На скриншоте выше показаны отличия между кодеками при разных битрейтах. Слева приведен H.264 с потоком 3.500 кбит/с. По центру – H.265, а справа – AV1, но с более высоким потоком 8.000 кбит/с.

На диске Google мы выложили для скачивания видео, которые позволят сравнить качество самостоятельно. Мы выложили следующие форматы:

Как мы уже отметили выше, AV1 с большой вероятностью увеличит свою долю в ближайшие месяцы. Декодирование для современных систем проблем не вызывает. Но если вы создаете контент и кодируете видео, то наверняка желаете получить хорошее качество и эффективность потока. И AV1 способен убить двух зайцев сразу.


Тактовые частоты 2700+ МГц и энергопотребление 450 Вт не остановили нас, мы все же решили разогнать GeForce RTX 4090. Через утилиты MSI Afterburner или ZOTAC Firestorm можно выставить частоты памяти, а также базовую частоту GPU и Boost. Планка Power Limit и напряжение GPU тоже здесь регулируются.

Мы просто выставили Power Limit на 131%. Затем мы увеличили напряжение GPU на доступные 100 мВ. Затем мы постепенно добавляли частоту GPU и памяти. В итоге нам удалось выставить +245 МГц для GPU и +536 МГц для памяти. В играх частота составила 3.060 МГц.

Мы получили следующие результаты производительности после разгона.

Cyberpunk 2077

3.840 x 2.160 пикселей (Raytracing: средние)

51.3 XX


40.2 XX
48.0 XX


37.8 XX
FPS
Больше - лучше

DOOM Eternal

3.840 x 2.160 пикселей (Ultra Nightmare)

251.9 XX


191.4 XX
237.4 XX


182.4 XX
FPS
Больше - лучше

F1 22

3.840 x 2.160 пикселей (Ultra High)

110.6 XX


71.2 XX
106.6 XX


68.3 XX
FPS
Больше - лучше

Shadow of the Tomb Raider

3.840 x 2.160 пикселей (Ultra High)

190.8 XX


156.6 XX
178.6 XX


136.3 XX
FPS
Больше - лучше

Уровень шума

Нагрузка

дБ(A)
Меньше - лучше

Температура GPU

Нагрузка

В°C
Меньше - лучше

Температура памяти

Нагрузка

В°C
Меньше - лучше

энергопотребление

Нагрузка

в Вт
Меньше - лучше

Как видим, производительность увеличилась на несколько процентов, но при этом придется мириться с энергопотреблением более 500 Вт, а также более высокими температурами и уровнем шума. Без адекватного охлаждения из видеокарты вряд ли можно выжать больше производительности.


Оценивать производительность GeForce RTX 4090 можно с разных ракурсов. Если смотреть на производительность растеризации, то NVIDIA смогла очень хорошо перенести увеличения числа функциональных блоков GPU на 50% (блоки FP32 и INT32) в прирост производительности более 50%, в ряде случаев до 70%. При переходе с поколения GeForce RTX 20 на GeForce RTX 30 подобного прироста не было. Конечно, переход с последнего поколения GTX на первое RTX тоже дал значительное увеличение производительности, но NVIDIA тогда фокусировалась на производительности трассировки лучей, поэтому производительность классического рендеринга отошла на второй план.

Но данный прирост производительности 50-70% получится раскрыть не всегда. Ниже разрешения UHD производительность high-end видеокарт часто упирается в ограничение CPU. Поэтому при покупке GeForce RTX 4090 следует учитывать и апгрейд процессора. Между тем добавление эффектов трассировки лучей больше не приводит к столь существенному снижению производительности, как раньше. Dying Light 2: Stay Human идет в UHD на GeForce RTX 3090 Ti с частотой кадров всего 35 fps, теперь же мы получаем 60 fps, а благодаря G-Sync эффекты разрыва кадра устраняются. Radeon RX 6900 XT остается позади, но с видеокартой GeForce RTX 3090 (Ti) она вполне может конкурировать благодаря хорошей разработке драйверов. Впрочем, проводить такое сравнение нечестно, поскольку AMD готовит новое поколение, с которым и будет конкурировать GeForce RTX 4090.

Улучшенные ядра RT приводят к увеличению производительности трассировки лучей. Видеокарты GeForce RTX 30 теряют больше производительности после включения эффектов трассировки лучей, чем GeForce RTX 4090. Если раньше падение производительности составляло до 50%, то теперь оно ограничено 35%, и то лишь в некоторых случаях. Конечно, NVIDIA могла многое "подкрутить", но мы все еще говорим о настоящем рендеринге, когда каждый пиксель проходит полностью через конвейер.

А вот к DLSS 3 стоит присмотреться. Приятно видеть, что NVIDIA последовательно дорабатывает технологию за последние годы. В самом начале реализация DLSS была неказистой, технология была призвана компенсировать падение частоты кадров после включения эффектов трассировки лучей. И первое время приходилось идти на компромиссы по качеству картинки. Со вторым поколением DLSS качество было значительно улучшено, вплоть до уровня, когда мы не ощущали разницы. Чтобы обнаружить отличия, приходилось сравнивать статические кадры с увеличением.

DLSS 3 теперь делает еще шаг вперед. Технология теперь генерирует полные кадры, и по играм даже не скажешь, что не все кадры проходят полный конвейер рендеринга. Такое ощущение уже было со второй версией DLSS, теперь оно только усилилось. Придется привыкать к тому, что включение DLSS 3 не дает недостатков. Или, по крайней мере, сводит их к минимуму. У нас нет технической возможности сравнить сгенерированные кадры с "настоящими", чтобы провести скрупулезное сравнение. Но мы захватили несколько сцен на видео с разными пресетами DLSS. Сама технология Frame Generation не привела к появлению каких-либо ошибок, которые мы смогли бы обнаружить. В случае же масштабирования (upsampling) приходилось искать компромисс между качеством и балансом, когда не хватало fps.

Высокая "чистая" производительность, новые технологии, хорошая система охлаждения Founders Edition – все это замечательно. Но все омрачает цена. Видеокарта GeForce RTX 4090 Founders Edition будет продаваться за €1.949, та же GeForce RTX 3090 стоила на момент выхода €1.649 (сегодня от 107.300 ₽), а вариант Ti - €1.899 (сегодня от 122.000 ₽). Впрочем, сегодня эти видеокарты стоят намного дешевле, чем раньше. Если вы приобрели GeForce RTX 3090 Ti весной задорого, то цена €1.949 у GeForce RTX 4090 покажется разумной. Разница по производительности вполне достаточная, чтобы оправдать высокую цену.

С другой стороны, если вы не выполняли апгрейд видеокарт несколько лет, то цена €1.949 все равно высокая. Позволить флагманскую видеокарту сможет далеко не каждый геймер.

Кроме высокой цены, многих обеспокоит высокое энергопотребление. Но по сравнению с 450 Вт у GeForce RTX 3090 Ti, видеокарта GeForce RTX 4090 обеспечивает намного более высокую производительность. Впрочем, мы все равно говорим о 450 Вт. Если посчитать все игровые часы на протяжении года, то сумма за электричество будет немаленькая. Конечно, не каждая игра приводит к максимальной нагрузке и энергопотреблению 450 Вт, но расходы на электричество учитывать стоит. И разговоры о том, что энергопотребление подобных устройств не должно превышать 300 Вт, имеют под собой почву. Иначе куда может завести дальнейшая разработка процессоров и видеокарт?

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).

Мы рекомендуем ознакомиться с нашим руководством по выбору видеокарты для разных бюджетов.

Преимущества NVIDIA GeForce RTX 4090 Founders Edition:

Недостатки NVIDIA GeForce RTX 4090 Founders Edition: