Тест и обзор: GeForce RTX 3080 Founders Edition - первая игровая видеокарта Ampere

Опубликовано:

geforce-rtx-3080Сегодня мы публикуем тест видеокарты GeForce RTX 3080 Founders Edition нового поколения Ampere. Ранее мы уже поделились всеми техническими подробностями новой архитектуры, а также представили фотографии GeForce RTX 3080 Founders Edition. Сегодня мы поговорим о производительности, энергопотреблении, системе охлаждения и других параметрах, таких как эффективность или улучшения производительности трассировки лучшей и DLSS.

Кроме новой линейки NVIDIA GeForce RTX 30, в ближайшие недели нас ждет и новое поколение Radeon RX с кодовым названием Big Navi. Мы полностью обновили нашу тестовую систему как по аппаратному обеспечению, так и по используемым играм. Но об этом мы поговорим позже.

Мы уже довольно подробно рассматривали видеокарту GeForce RTX 3080 Founders Edition и семейство GeForce RTX 30, но по некоторым важным деталям пройдемся еще раз.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).

Но сначала позвольте привести сравнение трех новых видеокарт:

Сравнение видеокарт
  GeForce RTX 3090 GeForce RTX 3080GeForce RTX 2080 GeForce RTX 3070
GPU Ampere (GA102) Ampere (GA102)Turing (TU104) Ampere (GA104)
Число транзисторов 28 млрд. 28 млрд.13,6 млрд. 17,4 млрд.
Техпроцесс 8 нм 8 нм12 нм 8 нм
Площадь кристалла 628,4 мм²
628,4 мм²
545 мм² 392,5 мм²
FP32 ALUs 10.496 8.7042.944 5.888
INT32 ALUs 5.248 4.3522.944 2.944
SMs 82 6846 46
Ядра Tensor 328 272368 184
Ядра RT 82 6846 46
Базовая частота 1.400 МГц 1.440 МГц1.515 МГц 1.500 МГц
Частота Boost 1.700 МГц 1.710 МГц1.800 МГц 1.730 МГц
Емкость памяти 24 GB 10 GB8 GB 8 GB
Тип памяти GDDR6X
19,5 Гбит/с
GDDR6X
19 Гбит/с
GDDR6 GDDR6
14 Гбит/с
Ширина шины памяти 384 бит 320 бит256 бит 256 бит
Пропускная способность памяти 936 Гбайт/с
760 Гбайт/с448 Гбайт/с 448 Гбайт/с
TDP 350 Вт 320 Вт225 Вт 220 Вт
Цена 136.990 ₽ 63.490 ₽- 45.490 ₽
Дата выхода 24 сентября 17 сентября- Октябрь

Видеокарты GeForce RTX 3080 и GeForce RTX 3090 базируются на GA102 GPU, но в разных вариантах расширения. GeForce RTX 3070 тоже будет использовать GA104 GPU. Подробности мы раскроем при публикации тестов данной модели. Все новые GPU производятся по 8-нм техпроцессу на заводах Samsung. Если верить NVIDIA, Samsung и NVIDIA разработали техпроцесс совместно, причем он оптимизирован под GPU. Площадь GA102 GPU составляет 628,4 мм², на чипе содержатся 28 млрд. транзисторов. В случае GA104 GPU мы получаем 17,4 млрд. транзисторов на площади 392,5 мм².

У видеокарты GeForce RTX 3080 число блоков FP32 увеличилось с 2.944 до 8.704 по сравнению с GeForce RTX 2080. Что касается вычислительных блоков INT32, то здесь прирост составляет с 2.944 до 4.352. Число ядер Tensor уменьшилось с 368 до 272, но тому есть причина, на чем мы остановимся ниже. Число ядер RT увеличилось с 46 до 68, что должно сказаться на производительности. По тактовым частотам изменений мало, причем Boost даже снизилась на 100 МГц.

Шина памяти увеличилась по ширине с 256 до 320 бит. Что вместе с быстрой памятью GDDR6X привело к увеличению пропускной способности с 448 до 760 Гбайт/с. Даже теоретически переход с GeForce RTX 2080 на GeForce RTX 3080 дает существенный прирост производительности.

Интересно сравнить 8-нм производство на заводах Samsung по сравнению с 12-нм производством на мощностях TSMC для поколения Turing.

Сравнение производства

GA102 TU102GA104TU104GA100
Число транзисторов 28 млрд. 18,6 млрд.17,4 млрд.13,6 млрд.54 млрд.
Площадь кристалла 628,4 мм² 754 мм²392,5 мм²545 мм²826 мм²
Техпроцесс Samsung 8 нм TSMC 12 нмSamsung 8 нмTSMC 12 нмTSMC 7 нм
Плотность транзисторов 44,56 MT/мм²
24,67 MT/мм²44,33 MT/мм²24,95 MT/мм²65,37 MT/мм²

Поскольку мы знаем площадь чипов и число транзисторов, можно рассчитать плотность расположения транзисторов. В случае GA102 GPU она составляет 44,6 MT/мм². Для GA104 GPU - 44,3 MT/мм². У Turing GPU значение было всего 25 MT/мм², то есть примерно наполовину меньше. С другой стороны, GA100 GPU в составе ускорителей A100 GPU производится NVIDIA на заводах TSMC по 7-нм техпроцессу. Плотность транзисторов здесь составляет уже 65,37 MT/мм².

По сравнению с Turing NVIDIA смогла существенно увеличить число транзисторов и упаковать их на меньшей площади. Площадь 630 мм² у GA102 GPU нельзя назвать маленькой, но она все же меньше предшественника. Повышение плотности расположения транзисторов позволило NVIDIA расширить архитектуру GPU. Мы получили существенно больше блоков FP32 в составе GPU, поэтому прирост производительности должен быть соответствующим.

На страницах обзора мы рассмотрим подробности архитектуры Ampere, новый дизайн системы охлаждения и новые аппаратные функции.

В рамках теста мы не будем рассматривать все программные функции. Но с той же технологией Reflex NVIDIA планирует предоставить геймеру инструмент для уменьшения задержек между движением мыши/нажатием клавиши и реакцией картинки на мониторе. Однако разработчики должны адаптировать свои игры соответствующим образом.

NVIDIA Broadcast ориентирована на стримеров. Здесь можно упомянуть автоматическое слежение камеры, виртуальный фон, повышение качества аудио через RTX Voice.


GA102 GPU на видеокарте GeForce RTX 3080 базируется на архитектуре Ampere, которая отличается от версии для дата-центров в GA100 GPU.

Streaming Multiprocessor (SM) в архитектуре Ampere почти полностью лишился вычислительных блоков FP64, которые в составе GA100 GPU весьма важны для высокопроизводительных вычислений HPC, чего нельзя сказать о потребительском сегменте. Вычисления с двойной точностью выполняются в 1/60 производительности от вычислений FP32.

Зато число вычислительных блоков FP32 было удвоено. Вместо 64 блоков FP32 на SM теперь доступны 128, а также 64 блока INT32. Параллельно поддерживается выполнение двух путей данных. Первый путь состоит из 16 блоков FP32. Так что здесь можно выполнять 16 вычислений FP32 за такт. Второй путь состоит из 16 блоков FP32 и 16 INT32. Каждая четверть SM может выполнять либо 32 операции FP32, либо 16 операций FP32 и 16 INT32 за такт. Для SM целиком это означает 128 операций FP32 или 64 операции FP32 и 64 INT32 за такт.

GA102 GPU содержит семь кластеров GPC (Graphics Processing Clusters) с 12 SM в каждом. Но вне все SM активны на GeForce RTX 3090 и GeForce RTX 3080. GA102 GPU теоретически может оснащаться 10.752 блоками FP32 (7 GPCs x 12 SMs x 128 блоков FP32). Но в случае GeForce RTX 3090 отключены два SM, поэтому придется довольствоваться "всего" 10.496 блоками FP32. Таким образом NVIDIA удерживает высокую долю выхода годных кристаллов.

В случае GeForce RTX 3080 полностью отключен один GPC, кроме того на GA102 GPU из оставшихся шести GPC только четыре содержат полные 12 SM. Два GPC ограничены десятью SM. Что дает 8.704 блоков FP32 на 68 SM.

NVIDIA называет блоки FP32 ядрами a CUDA, так что можно говорить о 8.704 ядрах CUDA в случае GeForce RTX 3080. Но по сути они равны числу блоков FP32 в SM. Кроме того, отметим 4.352 блока INT32.

Каждый SM содержит по четыре ядра Tensor третьего поколения. Число ядер Tensor на SM было уполовинено, но они должны быть, как минимум, в два раза более производительны. Ядер RT на SM по-прежнему по одному, но во втором поколении ядер RT произошли некоторые улучшения.

Кроме изменений SM произошли оптимизации в структуре конвейеров растровых операций (ROP) и связи между ROP и контроллерами памяти. Вплоть до поколения Turing ROP всегда подключались к интерфейсу памяти. Использовалось восемь ROP на каждый 32-битный контроллер памяти. И если число контроллеров памяти, соответственно, объем памяти менялись, то же самое было верно и для ROP. В случае архитектуры Ampere ROP расположены в GPC. В каждом GPC есть два раздела ROP, по восемь конвейеров растровых операций каждый.

В результате расчет числа ROP у видеокарты GeForce RTX 3080 отличается. Шесть GPC содержат 2x 8 ROP, что дает в сумме 96 ROP. У видеокарты GeForce RTX 3090 используются семь GPC с 2x 8 ROP каждый, что дает 112 ROP.

NVIDIA встроила ROP по-новому, чтобы конвейеры рендеринга меньше зависели от интерфейса памяти. У GeForce RTX 3080 320-битный интерфейс памяти, но доступны 96 ROP вместо всего 80.

Кэши L1 и L2

В зависимости от стадии расширения, размеры кэшей L2 меняются. В случае GeForce RTX 3080 они составляют 5.120 кбайт, для GeForce RTX 3070 - 4.096 кбайт, у GeForce RTX 3090 - 6.144 кбайт. Для сравнения, у TU102 GPU кэш составлял 6.144 кбайт.

NVIDIA увеличила кэш данных L1 с архитектурой Ampere с 96 кбайт до 128 кбайт. Пропускная способность кэша L1 была вновь удвоена. NVIDIA уже пошла на такой шаг при переходе с Pascal на Turing. Файл регистров остался прежним с 16.384 32-битными записями. То же самое касается блоков загрузки/выгрузки (Load/Store).

Наконец, мы можем привести полную диаграмму GA102 GPU, который используется на видеокарте GeForce RTX 3090.

Второе поколение ядер RT

Второе поколение ядер RT способно выполнять в два раза больше расчетов пересечений, чем первое. Поскольку NVIDIA не изменила число ядер RT на SM, теоретическое масштабирование производительности RT двукратное. Конечно, если у видеокарты будет больше SM, то и производительность будет выше.

Проблема с расчетом пересечений при трассировке лучей возникает в случае движущихся объектов, а также с наложенным эффектом размыванием движения Motion Blur. В случае Turing GPU или их ядер RT здесь могло возникнуть "узкое место" по производительности трассировки лучей. Второе поколение ядер RT имеет параллельные блоки, которые отвечают за интерполяцию с эффектом Motion Blur. Пересечения рассчитываются упреждающе на основе алгоритмов, в результате трассировка лучей выполняется только там, где нужно.

Третье поколение ядер Tensor

Как и предполагалось, NVIDIA продолжила усиливать ядра Tensor третьего поколения. Кроме вычислений INT16 и FP16 они теперь могут выполнять вычисления FP32 и FP64. Что важно, прежде всего, для сегмента HPC, где требуются вычисления с высокой точностью. В случае же GeForce GPU в приоритете остаются вычисления с меньшей точностью.

Ядра Tensor архитектуры Turing могут выполнять 64 операции FP16 Fused Multiply-Add (FMA) на ядро Tensor. В случае Ampere и полностью заполненных матриц (Dense) мы получаем 128 операций на GA102 GPU и даже 256 на GA100 GPU. В случае разреженных матриц (Sparse) производительность составляет 256 FP16 FMA для GA102 GPU и 512 для GA100 GPU. Ядра Tensor архитектуры Turing не поддерживают разреженные матрицы.

Что увеличивает вычислительную производительность ядер Tensor не менее чем в два раза. Сильнее всего здесь должна выиграть производительность DLSS, но теоретически получат прирост и приложения искусственного интеллекта.


С архитектурой Turing и возможностью трассировки лучей через ядра RT и масштабирования разрешения через DLSS и ядра Tensor NVIDIA впервые заговорила о гибридном конвейере рендеринга (Hybrid Rendering Pipeline). То есть помимо классического рендеринга через потоковые процессоры добавляется трассировка лучей и DLSS.

На GPU Turing кадр в игре Wolfenstein Youngblood просчитывается 51 мс. В данном случае трассировка лучей выполняется на потоковых процессорах. Если перенести ее на ядра RT, то время просчета кадра снижается до 19 мс. Если добавить масштабирование DLSS, то время можно снизить до 13 мс.

Для Ampere GPU с более высокой производительностью время рендеринга снижается с 13 мс до 7,5 мс. Основная причина - в приросте производительности потоковых процессоров. Но вычисления трассировки лучей и DLSS тоже выполняются быстрее, что приводит к снижению времени рендеринга. Для Ampere NVIDIA использует другой трюк, вычисления DLSS выполняются перед финальным рендерингом. Свою роль здесь играет временная обратная отдача (Temporal Feedback), благодаря которой учитываются результаты рендеринга предыдущих кадров. Собственно, этот шаг и позволил DLSS 2.0 увеличить качество картинки. С новыми чипами Ampere такой подход позволяет уменьшить время рендеринга кадра.

RTX IO

NVIDIA RTX IO работает с грядущим Microsoft DirectStorage API, который будет поддерживаться в играх с 2021 года. Здесь подразумевается архитектура хранения данных нового поколения, ориентированная на игровые ПК с NVMe SSD. DirectStorage API и RTX IO - оптимизированные и высокопараллельные API, разработанные специально для игр, которые значительно снижают избыточную нагрузку ввода/вывода.

Потребность в более скоростном интерфейсе ввода/вывода связана с тем, что игры занимают все больше места, игровые данные становятся более объемными и сложными.

В классических системах игровые данные считываются с SSD/HDD и передаются процессору через SATA или PCI Express. Скоростные PCIe 4.0 SSD могут обеспечивать пропускную способность до 7 Гбайт/с. Процессор располагает данные в оперативной памяти, откуда они затем передаются процессором через интерфейс PCI Express на GPU. Последний сохраняет данные в видеопамяти. В результате мы имеет промежуточный этап с лишней нагрузкой на процессор, да и выше 7 Гбайт/с не подняться.

Но есть возможность передавать процессору данные с накопителя в сжатом виде. Затем процессор их распаковывает в оперативной памяти, и они передаются в распакованном виде через PCI Express в память GPU. Хотя здесь можно получить уже до 14 Гбайт/с, ядра CPU будут заняты распаковкой данных.

RTX IO или DirectStorage позволяет передавать данные с быстрого SSD через интерфейс PCI Express напрямую GPU, который будет размещать их в видеопамяти. Этап процессора и оперативной памяти системы здесь уже отсутствует. Здесь тоже можно достигнуть до 14 Гбайт/с (с учетом расчетного коэффициента сжатия 2:1), но без нагрузки на процессор.

Причем распаковка данных на GPU не влияет на остальную производительность. Опасения насчет предела PCIe 4.0 современных SSD напрасны. Если игра оптимизирована под DirectStorage API, то с SSD считываются только необходимые данные. Что, кстати, уменьшит занятость видеопамяти.

NVIDIA также привела сведения производительности, используя собственную техническую демо Marbles. Демо считывает несжатые данные с жесткого диска более 60 с. В случае сжатых данных и распаковки их на CPU время снижается до 38 с. Если используется NVMe SSD, то время загрузки уменьшается всего до 5 с, но данные распаковываются на процессоре, загружая ядра. В случае RTX IO время загрузки составит всего 1,6 с.

DirectStorage API будет использоваться приставкой Microsoft Xbox Series X, в случае PlayStation 5 реализована схожая концепция. Через RTX IO скорость передачи данных с SSD в видеопамять составит до 14 Гбайт/с. Для сравнения, Sony PlayStation 5 дает 8-9 Гбайт/с, а Microsoft Xbox Series X - 4,8 Гбайт/с. Интересно посмотреть, будет ли AMD поддерживать DirectStorage с архитектурой Big Navi.


Теперь позвольте рассмотреть GeForce RTX 3080 Founders Edition.

Видеокарта показана задней стороной "вверх". Хотя осевой вентилятор справа обманывает восприятие. NVIDIA с видеокартами Founders Edition GeForce RTX 3080 и GeForce RTX 3090 изменила концепцию охлаждения. Новый кулер должен лучше вписываться в систему охлаждения корпуса и лучше задействовать имеющийся воздушный поток. Мы уже подробно останавливались на данном вопросе в обзоре линейки GeForce RTX 30.

Длина видеокарты составляет 285 мм, высота - 112 мм, ширина два слота. В серебристой рамке есть восемь маленьких крышек с обеих сторон. Под ними скрываются винты, которые прикручивают кулер к видеокарте, вернее, крепят две половинки кулера. По центру перекрестия есть еще одна крышка. NVIDIA выслала нам руководство по разборке видеокарты.

На левой части крышки можно видеть надпись "RTX 3080". В отличие от видеокарт GeForce RTX 20, NVIDIA развернула "8" на 180 градусов. Справа установлен один из двух осевых вентиляторов, который работает на вытяжку и имеет диаметр 85 мм. Он вытягивает воздух снизу видеокарты, который проходит через ребра радиатора и выбрасывается над видеокартой. Так что в данном случае тепло поступает в сторону кулера CPU. Башенный воздушный кулер будет продувать воздушный поток дальше в сторону задней панели корпуса. В случае водоблока СВО на CPU воздушный поток все равно будет направлен справа налево из-за заднего вентилятора корпуса.

Ниже мы оценим влияние подобного подхода на эффективность охлаждения процессора. Если верить NVIDIA, видеокарта не приведет к существенному нагреву других компонентов. Это касается процессора, памяти и теплообменника. В конце концов, раньше тепло от видеокарты все равно оставалось внутри корпуса компьютера. Независимо от стандартного кулера с осевыми вентиляторами предыдущего поколения или решения, выбранного NVIDIA.

С торца видеокарты можно видеть подсвеченную надпись "GeForce RTX" в задней трети. Во время работы она подсвечивается белым.

С торца между двумя вентиляторами можно видеть вытяжные вентиляционные отверстия, через которые выходит часть теплового воздуха. Как и новый 12-контактный разъем питания. Мы уже подробно рассматривали данный интерфейс в обзоре архитектуры Ampere. 12-контактный разъем установлен вертикально и наклонен назад на 45°. Что облегчает прокладку кабелей к задней части видеокарты.

С лицевой стороны видеокарты заметен второй осевой вентилятор, который нагнетает холодный воздух внутрь, после чего проталкивает его через радиатор. Диаметр тоже составляет 85 мм. Большая часть нагнетаемого воздуха выбрасывается через слотовую заглушку. Но остаток воздуха остается в кожухе видеокарты, он выбрасывается через центральные ребра охлаждения и соответствующие отверстия.

Второй осевой вентилятор нагнетает воздух через правую половину ребер, его мы показывали на фотографиях выше.

На видеокарте можно видеть большое количество ребер охлаждения, которые наклонены на 45 °C. Через отверстия между ребрами выбрасывается часть воздуха, нагнетаемого осевыми вентиляторами.

Приятная деталь в металлической рамке: гравировка "RTX 3080". NVIDIA повсеместно постаралась вписать свое имя в историю.

Сзади видеокарты кажется, что не хватает двух винтов. Или мы открутили их, чтобы снять кулер. На самом деле два отверстия с резьбой предназначены для системных интеграторов, поскольку длина видеокарты составляет точно 285 мм, в некоторых корпусах на таком расстоянии предусмотрен крепеж.

Наконец, позвольте рассмотреть слотовую заглушку. Две трети заглушки занимают отверстия для вытяжки горячего воздуха. Видеокарта GeForce RTX 3080 Founders Edition предлагает три видеовыхода DisplayPort 1.4 и один HDMI 2.1.


Хотя NVIDIA прилагает инструкции, как снять кулер с видеокарты, мы не выполняли данный процесс. Мы планируем провести дополнительные тесты в будущем, поэтому не хотели нарушать работу системы охлаждения. Но NVIDIA выслала нам снимки PCB, которые мы и будем использовать.

На первых трех снимках показана PCB видеокарты GeForce RTX 3080 Founders Edition. В таком виде PCB будет использоваться только на видеокартах NVIDIA FE. Но есть и эталонные PCB от NVIDIA, которые компания предлагает партнерам. В результате партнеры могут не разрабатывать PCB самостоятельно и сэкономить, используя эталонную PCB NVIDIA.

По центру PCB располагается упаковка GPU с чипом GA102 GPU. Со всех четырех сторон установлены чипы памяти GDDR6X от Micron в разном количестве. Поскольку перед нами видеокарта GeForce RTX 3080, два участка под чипы памяти остаются свободными. Но в случае GeForce RTX 3090 Founders Edition они уже будут заняты. Еще одно отличие - в левом верхнем углу, так как у GeForce RTX 3080 нет интерфейса NVLink, в отличие от GeForce RTX 3090.

Подсистема питания видеокарты опирается на 20 фаз. Но у GeForce RTX 3080 установлены только 18 фаз. Полный набор фаз мы, скорее всего, увидим у GeForce RTX 3090. Как и в случае предыдущего поколения, NVIDIA отказалась от удвоения фаз. Кроме того, видеокарты GeForce RTX 3080 Founders Edition могут динамически включать/выключать фазы, в зависимости от нагрузки на видеокарту. В результате система питания всегда будет работать в окне с оптимальной эффективностью.


Учитывая продолжающееся увеличение числа потоковых процессоров, требования к пропускной способности памяти тоже растут. Иерархия кэшей с каждым поколением ускоряется, то же самое требуется и от памяти. GDDR6 обеспечила бы увеличение пропускной способности только через рост тактовых частот. Либо можно расширить шину памяти. Та же HBM предлагает очень широкий интерфейс памяти, но она слишком сложная и дорогая в производстве. Поэтому для игровых видеокарт не подходит.

NVIDIA объединила усилия с Micron, в итоге была разработана GDDR6X. Память GDDR6X работает на тех же частотах, что и GDDR6, напряжение сравнимое.

У предыдущей памяти GDDR6 использовалась модуляция Non-Return-to-Zero (NRZ). Значения "0" и "1" соответствовали низкому и высокому напряжению. В случае GDDR6X используется уж амплитудно-импульсная модуляция PAM4, несущая разделяется на четыре уровня напряжения с каждым тактовым импульсом. Шаг между уровнями составляет 250 мВ. PAM4 все чаще используется в современных стандартах передачи. PCI Express 5.0 и DDR6 тоже будут опираться на PAM4.

NVIDIA и Micron реализовали ряд хитростей, чтобы гарантировать высокие скорости передачи при выставленных тактовых частотах. Max Transition Avoidance Coding (MTA) гарантирует, что сигнал меняется только до двух уровней напряжения. Если идет переход с самого низкого до самого высокого уровня, то различимость сигнала теряется. С помощью MTA NVIDIA кодирует сигнал нужным образом.

Наконец, NVIDIA дает некоторый динамический допуск, поскольку небольшие отличия по производству PCB и памяти могут привести к различиям по задержкам распространения сигнала. Поэтому алгоритмы дополнительно корректируют передачу сигнала.

Error Detection and Replay

В контролере памяти GDDR6(X) NVIDIA реализовала новую технологию Error Detection and Replay (EDR). Особенно полезна она будет при разгоне.

Память GDDR6X на видеокарте GeForce RTX 3080 Founders Edition работает на частоте 1.188 МГц. Но технология Error Detection and Replay облегчит разгон памяти, поскольку ошибки при передаче данных будут определяться (Error Detection), данные будут передаваться повторно (Replay). И вместо вывода артефактов, контроллер памяти попытается исправить появившиеся ошибки. Определение ошибок опирается на технологию контрольной суммы CRC (Cyclic Redundancy Check), которая гарантирует целостность данных. Если контрольная сумма не совпадает, во время передачи произошла ошибка.

На рисунке показано, как работает технология. Без CRC или Error Detection and Replay при повышении тактовой частоты возникают артефакты. Что приводит к риску краха или сброса драйвера.

С помощью Error Detection and Replay происходит исправление ошибок, но пропускная способность памяти перестает увеличиваться. Она превращается в плато, только после его прохождения увеличивается вероятность крахов и вылетов. Как только плато достигнуто, смысла в дальнейшем увеличении частоты уже нет. Впрочем, NVIDIA все же отмечает, что вылеты могут наблюдаться и с технологией Error Detection and Replay. Она не является панацеей, но позволяет минимизировать появление артефактов.

Технология Error Detection and Replay от NVIDIA реализована только в контроллере GDDR6X чипов GA10x GPU. Видеокарты GeForce RTX 3080 и GeForce RTX 3090 как раз используют память GDDR6X. Но GeForce RTX 3070 - уже нет, здесь используется GA104 GPU. Пока неизвестно, получит ли GeForce RTX 3070 поддержку EDR.


Новые видеокарты выделяют до 350 Вт тепла, поэтому NVIDIA пришлось продумывать новую систему охлаждения. Сначала позвольте рассмотреть типичный корпус, где свежий воздух поступает спереди, а горячий выбрасывается сзади или сверху.

Видеокарта с кулером-турбиной хорошо вписывается в подобную концепцию, поскольку она получает воздух внутри корпуса, после чего почти полностью выбрасывает его через слотовую заглушку. Но при использовании обычных осевых вентиляторов все уже обстоит иначе. Большая часть горячего воздуха остается внутри корпуса, а крупная PCB с металлической задней пластиной практически блокирует вертикальный воздушный поток. В итоге воздух в той или иной степени скапливается внутри корпуса.

Для новых видеокарт NVIDIA выбрала концепцию охлаждения, слухи о которой ходили довольно давно. Задний вентилятор видеокарты продувает воздух сквозь ребра, выбрасывая его над видеокартой. Второй вентилятор проталкивает часть воздуха в направлении слотовой заглушки и выбрасывает его наружу.

Чтобы PCB не блокировала воздушный поток заднего вентилятора, ее пришлось сделать намного короче. В результате мы получаем укороченную PCB с треугольным вырезом. На иллюстрации показана PCB GeForce RTX 2080, можно видеть довольно много свободного пространства между чипами памяти и корпусировкой GPU, между GPU и слотовой заглушкой, справа от подсистемы питания.

Расположить VRM, чипы памяти и GPU близко друг к другу - непростая техническая задача, особенно с учетом охлаждения. NVIDIA даже пришлось перейти на более компактный 12-контактный разъем питания и уменьшенный NV-Link (здесь на GeForce RTX 3080 PCB он отсутствует).

Изменения системы охлаждения

Изменения системы охлаждения видеокарты повлияли на общую концепцию охлаждения корпуса. И здесь мы как раз хотели бы оценить последствия.

На диаграмме справа показан воздушный поток, проходящий сквозь корпус. Справа в корпус нагнетается свежий воздух. Видеокарта GeForce RTX 3080 Founders Edition продувает воздух с помощью двух осевых вентиляторов. Со стороны блока питания снизу тоже есть воздушный поток в направлении видеокарты.

Правый вентилятор GeForce RTX 3080 нагнетает холодный воздух снизу, который продувается через радиатор. Левый вентилятор проталкивает часть воздуха за пределы корпуса через радиатор и слотовую заглушку. Но часть воздуха выходит через торец видеокарты и остается в корпусе системы.

В нашем случае горячий воздух выше видеокарты продувается вентиляторами кулера Noctua NH-U12A в направлении задней стенки корпуса. И второй вентилятор корпуса, установленный сзади, выдувает горячий воздух наружу. Вопрос в том, как горячий воздух, скапливающийся над видеокартой, будет влиять на охлаждение процессора и памяти? Кулеру CPU придется продувать больше горячего воздуха.

Слева показано изображение тепловизора GeForce RTX 3080 Founders Edition с тепловым пакетом 320 Вт под полной нагрузкой. Как можно видеть, сильнее всего нагревается видеокарта по центру. Память тоже нагревается заметно, как и VRM. Справа показана видеокарта GeForce RTX 2080 Ti Founders Edition. Задняя пластина видеокарты по центру нагревается так же сильно, что и у новой видеокарты. Так что, на первый взгляд, разницы по температурам нет.

Мы провели дальнейшие тесты, для которых выбрали следующую конфигурацию.

Видеокарты устанавливались в корпус по очереди. Вентиляторы корпуса работали сначала на 600 об/мин, потом на 1.300 об/мин.

Сравнение охлаждения
Температура 3080 @320 Вт 3080 @320 Вт3080 @260 Вт2080 @260 Вт2080 @260 Вт
Вентилятор корпуса 600 об/мин 1.300 об/мин600 об/мин600 об/мин1.300 об/мин
GPU 77 °C 76 °C74 °C84 °C83 °C
CPU 80 °C 73 °C75 °C77 °C70 °C
DIMM1 57,8 °C 53,0 °C56,3 °C55,5 °C49,3 °C
DIMM2 56,8 °C 52,3 °C55,0 °C54,3 °C48,5 °C
DIMM3 55,5 °C 51,8 °C53,8 °C53,5 °C48,0 °C
DIMM4 53,5 °C 50,3 °C51,8 °C51,8 °C46,0 °C

Что видно по приведенным измерениям? GeForce RTX 3080 с тепловым пакетом 320 Вт выделяет существенно больше тепла в корпус, чем GeForce RTX 2080 Ti с 260 Вт. В обоих случаях накопленное тепло остается в корпусе, его необходимо вывести наружу с помощью вентиляторов корпуса.

С видеокартой GeForce RTX 3080 процессор работает с температурой 80 °C под нагрузкой, в случае GeForce RTX 2080 Ti температура была 77 °C, ненамного холоднее. Подобная разница вполне может быть обусловлена отличием тепловых пакетов в 60 Вт. В случае GeForce RTX 3080 с выставленным Power Limit на 260 Вт мы получаем близкое значение температуры CPU 75 °C.

Сильнее влияет наилучшая вентиляция корпуса. Независимо от использования GeForce RTX 3080 на 320/260 Вт или GeForce RTX 2080 Ti на 260 Вт: если вентиляторы корпуса обеспечивают больший воздушный поток, то температура CPU снижается, а температура GPU от этого выигрывает слабо. Влияние лучшей вентиляции заметно и с видеокартой GeForce RTX 2080 Ti. Тепло следует как можно быстрее выводить из корпуса, сама по себе GeForce RTX 3080 мало влияет на увеличение температур CPU и памяти в нашем случае.

После 30 минут полной нагрузки мы вновь обратились к тепловизору, чтобы посмотреть самые горячие участки видеокарты. Как можно видеть, сильнее всего видеокарта нагревается между двумя вентиляторами. Температура составляет порядка 70 °C, то есть поверхность горячая. Если посмотреть снизу, то становится видна очень горячая базовая пластина, которая поглощает тепло от GPU, после чего передает его по тепловым трубкам на ребра радиатора. Здесь температура почти достигала 100 °C.

Процесс нагрева хорошо виден по съемке time lapse с восьмикратной скоростью.

Наконец, позвольте поговорить о 12-контактном переходнике, поскольку он добавляет сопротивление на контактах, поэтому нагревается. Если контакт плохой, то 270 Вт мощности, подаваемые по двум 8-контаткным штекерам, могут стать проблемой. Впрочем, мы не обнаружили температуры выше 35 °C.


Мы обновили программное обеспечение в виде игр и тестов, компоненты тестовой системы тоже подверглись модернизации. Чтобы наша тестовая система была максимально приближена к практическим условиям, мы проводили тесты в закрытом корпусе. Операционная система Windows 10 была установлена на PCI Express SSD, но для игр мы использовали жесткий диск. На результаты тестов это не влияет.

Тестовая конфигурация
Процессор Intel Core i9-10900K
Система охлаждения Noctua NH-U12A
Материнская плата MSI MAG Z490 Tomahawk
Оперативная память G.Skill Trident Z Royal DDR4-3600 CL16-19-19-39 (F4-3600C16D-32GTRSC), 2x 16 GB
SSD Samsung SSD 960 Pro 512GB
HDD Seagate BarraCuda Pro
Блок питания Seasonic Prime Titanium Series 850W
Операционная система Windows 10 64 бит
Корпус Fractal Design Define XL R2

Мы использовали следующие версии драйверов:

Мы использовали следующие игры и тесты:


Перейдем к первым тестам. Мы начнем с измерения энергопотребления, температуры и уровня шума GeForce RTX 3080 Founders Edition.

Энергопотребление

Бездействие (на GPU)

в Вт
Меньше - лучше

Для современной видеокарты энергопотребление в режиме бездействия больше не представляет каких-либо проблем. Здесь речь идет о нескольких ваттах, хотя открытый браузер или контент сказываются на энергопотреблении.

Энергопотребление

Нагрузка (на GPU)

в Вт
Меньше - лучше

GeForce RTX 3080 Founders Edition заменила Radeon RX Vega 64 в "лидерах" рейтинга энергопотребления. Видеокарта даже превзошла номинальный TDP 320 Вт. Посмотрим, отразится ли высокое энергопотребление соответствующим образом на производительности.

Температура GPU

Бездействие

в градусах Цельсия
Меньше - лучше

В режиме бездействия температура составила 32 °C. Вентиляторы полупассивного кулера как раз останавливались при данном уровне.

Температура GPU

Нагрузка

в градусах Цельсия
Меньше - лучше

Под нагрузкой GeForce RTX 3080 Founders Edition оставалась ниже планки 80°C, показав температуру 76°C на уровне предшественницы. Но весьма интересно, за счет какого уровня шума достигается подобная температура.

Уровень шума

Бездействие

в дБ(A)
Меньше - лучше

В режиме бездействия GeForce RTX 3080 Founders Edition выключает вентиляторы, поэтому работает полностью бесшумна. Перед нами первая видеокарта, разработанная NVIDIA, которая использует полупассивный кулер.

Уровень шума

Нагрузка

в дБ(A)
Меньше - лучше

Под нагрузкой GeForce RTX 3080 Founders Edition достигла уровень 40,3 дБ(A), то есть она действительно работала тише видеокарт предыдущего поколения. Будет интересно посмотреть, сохранит ли свое лидерство Founders Edition по сравнению с видеокартами на альтернативных дизайнах.

Есть еще один момент, который хотелось бы отметить в тестах. Наш образец GeForce RTX 3080 Founders Edition показал свист дросселей при fps 300 и выше, либо в меню игры без ограничения кадров. Что мы показали на видео. В более привычном диапазоне до 300 fps свиста дросселей не было.


UL 3DMark

Time Spy - графика

Баллы
Больше - лучше

UL 3DMark

Fire Strike Extreme - графика

Баллы
Больше - лучше

UL 3DMark

Port Royal

Баллы
Больше - лучше


Luxmark 3.1

Hotel Lobby

KSamples/s
Больше - лучше


AIDA64

Производительность FP32

TFLOPS
Больше - лучше

По вычислительной производительности FP32 видеокарта GeForce RTX 3080 останется непревзойденной до выхода GeForce RTX 3090 или моделей Quadro. Конечно, ускоритель A100 GPU даст здесь еще больший уровень производительности, но для игровой видеокарты результат более 30 TFLOPS уже впечатляет.

AIDA64

Производительность FP64

GFLOPS
Больше - лучше

NVIDIA срезала GA102 GPU по производительности FP64. Видеокарты Navi и Vega здесь тоже оказываются намного быстрее. Но в лидерах остается видеокарта Radeon VII, для которой AMD не стала приносить в жертву вычислительные блоки.

V-Ray

Рендеринг трассировкой лучей

миллионы Pfade
Больше - лучше

В тесте V-Ray, который использует рендеринг, GeForce RTX 3080 выигрывает от удвоенного числа блоков FP32, производительность в два раза выше.

OctaneRender

Havana

93.77 XX


38.17 XX
63.23 XX


28.59 XX
47.17 XX


21.05 XX
42.23 XX


18.23 XX
32.93 XX


14.21 XX
15.56 XX


15.56 XX
Миллион семплов в секунду
Больше - лучше

OctaneRender

GodRays

Миллион семплов в секунду
Больше - лучше

OctaneRender

Plants

Миллион семплов в секунду
Больше - лучше

В тесте OctaneRender каждая сцена сначала вычисляется без ядер RT, а потом с ними. Соответственно, вычислительная производительность вновь увеличивается, но GeForce RTX 3080 обеспечивает отличный уровень чистой производительности даже без трассировки лучей.


Anno 1800

1.920 x 1.080 - Ultra High

69.4 XX


53.3 XX
59.1 XX


52.5 XX
58.5 XX


49.7 XX
57.9 XX


50.1 XX
52.1 XX


44.3 XX
49.6 XX


43.8 XX
47.5 XX


41.5 XX
45.4 XX


39.4 XX
40.5 XX


34.9 XX
32.4 XX


27.1 XX
Кадры в секунду
Больше - лучше

Anno 1800

2.560 x 1.440 - Ultra High

74.2 XX


57.1 XX
54.8 XX


49.1 XX
48.9 XX


37.4 XX
43.7 XX


39.2 XX
42.9 XX


37.1 XX
37.5 XX


32.6 XX
32.1 XX


28.4 XX
28.4 XX


25.2 XX
22.6 XX


19.8 XX
Кадры в секунду
Больше - лучше

Anno 1800

3.840 x 2.160 - Ultra High

45.1 XX


41.7 XX
29.2 XX


26.1 XX
25.6 XX


23.1 XX
25.2 XX


22.7 XX
24.9 XX


22.6 XX
23.1 XX


20.5 XX
19.5 XX


17.8 XX
17.7 XX


16.2 XX
16.5 XX


15.1 XX
13.1 XX


12.1 XX
Кадры в секунду
Больше - лучше


Battlefield V

1.920 x 1.080 - High

199.4 XX


139.7 XX
193.5 XX


143.9 XX
161.5 XX


143.6 XX
150.7 XX


88.1 XX
147.7 XX


97.9 XX
135.4 XX


123.8 XX
131.8 XX


115.2 XX
127.5 XX


100.4 XX
117.9 XX


108.4 XX
112.2 XX


80.8 XX
105.9 XX


88.8 XX
81.8 XX


72.4 XX
Кадры в секунду
Больше - лучше

Battlefield V

2.560 x 1.440 - High

174.7 XX


153.7 XX
142.5 XX


130.1 XX
116.1 XX


89.5 XX
115.9 XX


107.1 XX
106.4 XX


99.3 XX
96.4 XX


87.2 XX
96.4 XX


91.1 XX
91.9 XX


77.1 XX
82.9 XX


72.8 XX
80.1 XX


67.2 XX
59.1 XX


55.1 XX
Кадры в секунду
Больше - лучше

Battlefield V

3.840 x 2.160 - High

64.5 XX


55.6 XX
63.4 XX


60.1 XX
55.6 XX


52.4 XX
53.6 XX


50.5 XX
50.3 XX


48 XX
46.6 XX


41.8 XX
44.4 XX


42.2 XX
42.9 XX


38.4 XX
39.6 XX


38.6 XX
30.8 XX


29.2 XX
Кадры в секунду
Больше - лучше


Control

1.920 x 1.080 - High

Кадры в секунду
Больше - лучше

Control

2.560 x 1.440 - High

Кадры в секунду
Больше - лучше

Control

3.840 x 2.160 - High

Кадры в секунду
Больше - лучше


Call of Duty Modern Warfare

1.920 x 1.080 - High

196.5 XX


157.6 XX
152.9 XX


125.4 XX
134.3 XX


113.8 XX
124.5 XX


102.6 XX
120.9 XX


100.6 XX
106.8 XX


92.1 XX
106.6 XX


87.3 XX
103.6 XX


86.2 XX
94.7 XX


82.9 XX
91.4 XX


76.7 XX
85.5 XX


73.1 XX
74.9 XX


64.2 XX
Кадры в секунду
Больше - лучше

Call of Duty Modern Warfare

2.560 x 1.440 - High

149.1 XX


129.9 XX
94.7 XX


83.8 XX
88.8 XX


77 XX
88.6 XX


76.4 XX
76.6 XX


66.2 XX
75.2 XX


65.6 XX
65.2 XX


56.4 XX
65.2 XX


59.2 XX
59.5 XX


52.8 XX
53.6 XX


47.2 XX
Кадры в секунду
Больше - лучше

Call of Duty Modern Warfare

3.840 x 2.160 - High

90.3 XX


81.5 XX
52.9 XX


47.3 XX
50.2 XX


46 XX
49.8 XX


43.8 XX
42.9 XX


39.6 XX
42.6 XX


37.4 XX
41.4 XX


36.4 XX
36.7 XX


33.1 XX
35.9 XX


33.1 XX
31.9 XX


28.7 XX
29.7 XX


26.7 XX
Кадры в секунду
Больше - лучше


Death Stranding

1.920 x 1.080 - High

218.1 XX


185.4 XX
180.4 XX


159.9 XX
154.7 XX


136.5 XX
148.5 XX


104.5 XX
146.1 XX


125.9 XX
137.9 XX


118 XX
128.1 XX


111.6 XX
122.6 XX


103.2 XX
117.7 XX


102.2 XX
113.8 XX


100.1 XX
111.6 XX


98.9 XX
103.5 XX


90.1 XX
98.9 XX


79.8 XX
80.5 XX


44.8 XX
Кадры в секунду
Больше - лучше

Death Stranding

2.560 x 1.440 - High

169.8 XX


150.5 XX
134.8 XX


121.2 XX
130 XX


91.3 XX
113.4 XX


102.5 XX
99.6 XX


87.8 XX
90 XX


57.7 XX
87.2 XX


75.9 XX
81.2 XX


47.2 XX
77.9 XX


70.1 XX
72.7 XX


59.8 XX
70.7 XX


41.6 XX
55.7 XX


37 XX
Кадры в секунду
Больше - лучше

Death Stranding

3.840 x 2.160 - High

100.2 XX


89.1 XX
55.8 XX


35.2 XX
55.6 XX


35.3 XX
49.6 XX


31.5 XX
49.5 XX


44.2 XX
43.5 XX


28.8 XX
41.6 XX


37.4 XX
40.6 XX


35.8 XX
37.8 XX


25.8 XX
28 XX


22.9 XX
Кадры в секунду
Больше - лучше


DOOM Eternal

1.920 x 1.080 - Ultra Nightmare

404.3 XX


280.7 XX
300.6 XX


228.9 XX
253.4 XX


194.7 XX
223.8 XX


153.1 XX
212.7 XX


149.6 XX
207.9 XX


159.4 XX
197.4 XX


124.2 XX
180.3 XX


129.3 XX
179.2 XX


127.1 XX
159.1 XX


115.5 XX
151.1 XX


98.9 XX
127.8 XX


92.5 XX
Кадры в секунду
Больше - лучше

DOOM Eternal

2.560 x 1.440 - Ultra Nightmare

315.9 XX


234.6 XX
221.7 XX


169.2 XX
181.8 XX


149.6 XX
171.8 XX


124.3 XX
165.5 XX


124.3 XX
150.8 XX


114.9 XX
141.2 XX


100.5 XX
138.3 XX


103.1 XX
134.4 XX


100.1 XX
121.6 XX


91.4 XX
107.6 XX


76.1 XX
95.6 XX


72.9 XX
Кадры в секунду
Больше - лучше

DOOM Eternal

3.840 x 2.160 - Ultra Nightmare

176.3 XX


142.4 XX
98.2 XX


81.1 XX
88.5 XX


72.1 XX
71.9 XX


59.2 XX
68.1 XX


52.2 XX
67.6 XX


54 XX
64.3 XX


45.8 XX
57.9 XX


45.3 XX
44.8 XX


31.7 XX
43.5 XX


32.8 XX
Кадры в секунду
Больше - лучше


F1 2020

1.920 x 1.080 - Ultra High

256.5 XX


194.3 XX
201.3 XX


161.8 XX
165.7 XX


135.2 XX
161.6 XX


122.5 XX
154.1 XX


117.9 XX
147.9 XX


111.7 XX
141.4 XX


140.4 XX
132.2 XX


106.7 XX
103.3 XX


84 XX
93.8 XX


70.3 XX
93.1 XX


72.5 XX
Кадры в секунду
Больше - лучше

F1 2020

2.560 x 1.440 - Ultra High

203.7 XX


156.3 XX
125.1 XX


108.9 XX
120.6 XX


89.7 XX
117.7 XX


81.8 XX
105.7 XX


78.8 XX
99.2 XX


82.1 XX
85.9 XX


60.5 XX
84.9 XX


69.2 XX
80.4 XX


60.3 XX
73.2 XX


54.7 XX
68.2 XX


51.4 XX
Кадры в секунду
Больше - лучше

F1 2020

3.840 x 2.160 - Ultra High

126.8 XX


98.8 XX
71.5 XX


63.8 XX
67.4 XX


52.2 XX
67.1 XX


51.5 XX
58.5 XX


45.5 XX
57.6 XX


46.1 XX
51.9 XX


39.5 XX
50.7 XX


39.2 XX
47.9 XX


40.3 XX
45.4 XX


36.5 XX
37.8 XX


31.1 XX
Кадры в секунду
Больше - лучше


Flight Simulator

1.920 x 1.080 - High

97.9 XX


64.4 XX
95.7 XX


62.3 XX
79.6 XX


54.9 XX
70.7 XX


45.1 XX
69.1 XX


48.6 XX
68.3 XX


43.9 XX
65.8 XX


43.6 XX
64.3 XX


41.8 XX
63.4 XX


45.7 XX
56.3 XX


36 XX
41.6 XX


28.8 XX
Кадры в секунду
Больше - лучше

Flight Simulator

2.560 x 1.440 - High

94.5 XX


57.5 XX
71.6 XX


48.2 XX
58.4 XX


41.3 XX
57.2 XX


38.3 XX
53 XX


34.6 XX
48.5 XX


31.9 XX
47.1 XX


32.5 XX
45.5 XX


31.9 XX
45.2 XX


30.7 XX
39.2 XX


26.6 XX
29.5 XX


21.8 XX
Кадры в секунду
Больше - лучше

Flight Simulator

3.840 x 2.160 - High

67.1 XX


45.4 XX
40.8 XX


29.9 XX
33.9 XX


26.3 XX
31.9 XX


23.5 XX
27.7 XX


20.7 XX
27.4 XX


21.4 XX
25.2 XX


19.9 XX
24.4 XX


18.5 XX
23.8 XX


17.4 XX
21.3 XX


17.3 XX
16.1 XX


12.1 XX
Кадры в секунду
Больше - лучше


Shadow of the Tomb Raider

1.920 x 1.080 - Ultra High

187 XX


156.5 XX
146.8 XX


132.8 XX
127.1 XX


113.9 XX
112.9 XX


101.4 XX
105.7 XX


97 XX
104.9 XX


96.2 XX
97.4 XX


84.7 XX
94.1 XX


87.1 XX
84.5 XX


77.2 XX
83.1 XX


75.4 XX
75.1 XX


68.2 XX
61.4 XX


56.8 XX
Кадры в секунду
Больше - лучше

Shadow of the Tomb Raider

2.560 x 1.440 - Ultra High

135.2 XX


123.4 XX
86.4 XX


81.2 XX
74.2 XX


68.2 XX
71.4 XX


66.7 XX
68.2 XX


63.1 XX
64.5 XX


60.4 XX
58.6 XX


53.6 XX
56.7 XX


52.2 XX
55.5 XX


51.8 XX
51.3 XX


47.4 XX
41.2 XX


38.6 XX
Кадры в секунду
Больше - лучше

Shadow of the Tomb Raider

3.840 x 2.160 - Ultra High

76.5 XX


71.6 XX
47.2 XX


43.6 XX
45.4 XX


43.2 XX
42.4 XX


39.4 XX
40.1 XX


37.2 XX
36.7 XX


34.4 XX
30.5 XX


28.4 XX
28.9 XX


26.9 XX
27.5 XX


25.4 XX
21.1 XX


19.9 XX
Кадры в секунду
Больше - лучше


Поскольку линейка GeForce RTX 30 обещает не только более высокую производительность потоковых процессоров, но и ускорение вычислений трассировки лучей благодаря новым ядрам RT, мы добавили соответствующие тесты.

Battlefield V - DXR и DLSS

2.560 x 1.440 - высокие

Кадры в секунду
Больше - лучше

Battlefield V - DXR и DLSS

3.840 x 2.560 - высокие

Кадры в секунду
Больше - лучше

Call of Duty Modern Warfare - DXR

2.560 x 1.440 - высокие

Кадры в секунду
Больше - лучше

Call of Duty Modern Warfare - DXR

3.840 x 2.160 - высокие

Кадры в секунду
Больше - лучше

Control - DXR и DLSS

2.560 x 1.440 - высокие

Кадры в секунду
Больше - лучше

Control - DXR и DLSS

3.840 x 2.560 - высокие

Кадры в секунду
Больше - лучше

Death Stranding - DLSS

2.560 x 1.440 - высокие

Кадры в секунду
Больше - лучше

Death Stranding - DLSS

3.840 x 2.160 - высокие

Кадры в секунду
Больше - лучше

Wolfenstein: Youngblood - DXR и DLSS

2.560 x 1.440 - высокие

Кадры в секунду
Больше - лучше

Wolfenstein: Youngblood - DXR и DLSS

3.840 x 2.160 - высокие

Кадры в секунду
Больше - лучше

Мы проведем анализ для пяти игр с поддержкой RTX и DLSS. Для этого мы оценим, сколько FPS видеокарты обеспечивают с эффектами трассировки лучей относительно оригинального уровня (без RTX). Что позволит нам сравнить ядра RT второго поколения в архитектуре Ampere с Turing. Два значения в процентах указывают на относительные fps в двух протестированных разрешениях (2.560 x 1.440 и 3.840 x 2.160).

Сравнение производительности трассировки лучей
Модель BF5 CoDControlWolfenstein
GeForce RTX 3080 50 / 43 % 81 / 78 %62 / 61 %57 / 54 %
GeForce RTX 2080 Ti 47 / 41 % 80 / 74 %58 / 57 %50 / 47 %
GeForce RTX 2080 46 / 39 % 77 / 77 %56 / 57 %50 / 48 %

Видеокарта GeForce RTX 3080 обеспечивает более высокий уровень производительности трассировки лучей по сравнению с GeForce RTX 2080, прирост fps по сравнению с GeForce RTX 2080 Ti тоже заметен. После активации трассировки лучей fps снижаются до уровня 50-80% от оригинального. Модели Turing теряют чуть больше. Впрочем, разница между потерями на самом деле не так велика, единицы процентов.

Для DLSS мы тоже провели похожее сравнение. Но важно помнить, что DLSS работает лучше при низких стартовых fps, иногда частота кадров увеличивается в два раза по сравнению с рендерингом с трассировкой лучей, но без DLSS. В Death Stranding есть поддержка только технологии DLSS без RTX. Здесь GeForce RTX 3080 получила прирост 21 или 36%, а GeForce RTX 2080 Ti - прирост 28 или 39%. Младшие видеокарты, такие как GeForce RTX 2060, показывают более высокий прирост DLSS из-за меньших стартовых fps. Так что более высокую производительность ядер Tensor архитектуры Ampere здесь оценить проблематично.

Quake RTX

3.840 x 2.160 - высокие

Кадры в секунду
Больше - лучше

QuakeRTX работает с полной трассировкой пути лучей. То есть трассировка лучей отвечает не за одиночные эффекты (например, отражения), а за полный рендеринг сцены. И здесь GeForce RTX 3080 оказалась примерно на 50% быстрее GeForce RTX 2080 Ti и почти в два раза быстрее GeForce RTX 2080. Все же потенциал новой архитектуры и GA102 GPU заметен хорошо.


Здесь мы попытаемся показать, насколько хорошо архитектура Ampere масштабируется из-за большего числа функциональных блоков при равных тактовых частотах. Для этого мы выставили на GeForce RTX 2080 Ti и GeForce RTX 3080 тактовую частоту 2 ГГц GPU. Мы сравниваем 4.352 против 8.704 - по блокам FP32 производительность удвоилась. Обе видеокарты обеспечивают 4.352 блока INT32 в данном варианте расширения, то есть на одном уровне.

Интересно будет посмотреть, как два GPU покажут себя на равных тактовых частотах 2 ГГц. Мы не стали менять пропускную способность памяти 616 Гбайт/с против 760 Гбайт/с в пользу новой модели.

Battlefield V

3.840 x 2.560 - высокие

Кадры в секунду
Больше - лучше

Control

3.840 x 2.560 - высокие

Кадры в секунду
Больше - лучше

DOOM Eternal

3.840 x 2.560 - Ultra Nightmare

Кадры в секунду
Больше - лучше

В Battlefield V и Control видеокарта GeForce RTX 3080 оказывается на 65% и 80% быстрее при равных скоростях GPU. Эффекты трассировки лучей были выключены. DOOM Eternal, с другой стороны, показала прирост на 100% - игра работает в два раза быстрее. Похоже, что Vulkan API умеет задействовать весь потенциал чистой увеличенной производительности. Мы наблюдали схожую картину и в QuakeRTX, где весьма важна производительность трассировки лучей.


Линейка GeForce RTX 30 от NVIDIA стала первым игровым семейством от NVIDIA с поддержкой PCI Express 4.0. Дает ли это преимущества на практике? AMD предлагает совместимую платформу с процессорами Ryzen, в случае Intel придется дождаться Rocket Lake-S в начале следующего года.

Видеокарта GeForce RTX 3080 сначала подключалась через PCI Express 3.0. С 16 линиями пропускная способность составляет 31,508 Гбайт/с. В случае PCI Express 4.0 с 16 линиями мы получаем уже 63,015 Гбайт/с, как можно видеть справа. посмотрим, есть ли преимущества от более скоростного интерфейса.

Для тестов мы использовали 6-ядерный Ryzen 5 3600. Процессор устанавливался на материнскую плату ASRock X570M Pro4 вместе с Patriot Viper VPN100 M.2 SSD и 16 GB DDR4-3600.

PCI Express 3.0 против 4.0

Battlefield V (3.840 x 2.160 пикселей - High)

Кадры в секунду
Больше - лучше

PCI Express 3.0 против 4.0

The Division 2 (3.840 x 2.160 пикселей - High)

Кадры в секунду
Больше - лучше

PCI Express 3.0 против 4.0

F1 2020 (3.840 x 2.160 пикселей - Very High)

Кадры в секунду
Больше - лучше

Как мы и ожидали, существенного преимущества переход на PCI Express 4.0 в играх не дает. Разница находится в пределах погрешности тестов. В профессиональном окружении все может выглядеть иначе, но здесь мы проведем тесты уже с видеокартами Quadro RTX на архитектуре Ampere.


Средние FPS с учетом 99% результатов - это одно, но только на графике времени вывода кадра можно оценить плавность.

По средним fps GeForce RTX 2080 неплохо показывает себя, мы получаем 7-8 мс для кадров. Но есть и пики, которые приводят к рывкам. GeForce RTX 3080 показывает 4-5 мс, и там, где у GeForce RTX 2080 имеются заметные рывки, GeForce RTX 3080 чаще всего дает задержку лишь до 10 мс. Хотя есть и более высокие пики, конечно. В целом, частота кадров выглядит более плавной.

В Control мы получаем плавную частоту кадров на обеих видеокартах, за исключением некоторых флуктуаций. Здесь мы не видим ничего особого. GeForce RTX 3080 дает более высокие fps, поэтому время вывода кадра меньше.

В DOOM Eternal мы видим привычную дистанцию между GeForce RTX 2080 и GeForce RTX 3080. Модель Ampere оказывается примерно в два раза быстрее. Но и здесь время вывода кадра намного более стабильно, у GeForce RTX 2080 мы видим смещения и вверх, и вниз.


GeForce RTX 3080 Founders Edition в наших тестах показала частоту Boost до 1.950 МГц. В зависимости от игры и нагрузки, иногда мы получали между 1.850 и 1.900 МГц. Конечно, мы попытались выжать больше производительности из видеокарты.

С помощью MSI Afterburner мы смогли увеличить Power Limit с 320 Вт на +15% до 368 Вт. В результате мы смогли увеличить частоты GPU и памяти. На момент тестов возможности увеличить напряжение GPU не было. Мы начали с максимального увеличения Power Limit, поскольку в тестах заметили, что ограничением является механизм Boost.

Но существенного выигрыша не получили. Мы смогли увеличить частоту памяти с 1.188 до 1.200 МГц. Частоту GPU нам удалось увеличить с 1.890 до 2.055 МГц на 165 МГц. Большего прироста мы не получили, по крайней мере, без более эффективного охлаждения или возможности изменять напряжение GPU.

Battlefield V

3.840 x 2.560 - высокие

109.8 XX


103.7 XX
103.0 XX


98.2 XX
Кадры в секунду
Больше - лучше

Control

3.840 x 2.560 - высокие

Кадры в секунду
Больше - лучше

DOOM Eternal

3.840 x 2.560 - Ultra Nightmare

187.5 XX


149.0 XX
176.3 XX


142.4 XX
Кадры в секунду
Больше - лучше

Shadow of the Tomb Raider

3.840 x 2.560 - Ultra High

Кадры в секунду
Больше - лучше

Разгон GDDR6X

По GPU мы довольно близко достигли предельной частоты. Поэтому разгон памяти все же лучше рассмотреть отдельно. Мы разгоняли чипы GDDR6X шаг за шагом, оценивая при этом производительность. Теоретически мы смогли увеличить пропускную способность с 760,3 Гбайт/с до 864 Гбайт/с. Теоретически. поскольку мы говорим лишь о частоте интерфейса памяти. На практике все может выглядеть иначе.

Масштабирование GDDR6X

Скорость копирования (AIDA64)

GB/s
Больше - лучше

Что касается копирования памяти, мы увеличили пропускную способность с 648,2 до 767,2 Гбайт/с. Но можно видеть, что максимальное значение мы получаем при частоте 1.250 МГц. Частоты 1.300 и 1.350 МГц оказываются уже медленнее. Здесь как раз работает технология Error Detection and Replay (EDR).

Масштабирование GDDR6X

Battlefield V (3.840 x 2.160 пикселей - High)

Кадры в секунду
Больше - лучше

Масштабирование GDDR6X

Shadow of the Tomb Raider (3.840 x 2.160 пикселей - Ultra High)

Кадры в секунду
Больше - лучше

Масштабирование GDDR6X

Control (3.840 x 2.160 пикселей - High)

Кадры в секунду
Больше - лучше

Мы промаркировали GeForce RTX 3080 со стандартной частотой красным. Все шаги разгона оказались лучше. Игры масштабируются от более высокой частоты памяти, но здесь мы говорим о приросте производительности от 2% до 5%. В любом случае, немного увеличить частоту памяти смысл есть.


Мы также провели тест "андервольтинга" GeForce RTX 3080 Founders Edition. Следует отметить, что на самом деле мы смогли снизить лишь планку Power Limit. Мы сравнили значения GeForce RTX 3080 Founders Edition с тепловым пакетом 320 Вт против 280 и 250 Вт.

Снижение планки Power Limit практически 1:1 привело к такому же уменьшению энергопотребления. В случае снижения с 320 до 280 Вт мы получили разницу 40 Вт (14,2%). Для снижения с 320 до 250 Вт - 70 Вт (28 %). Реальное энергопотребление находилось в диапазоне между 280 и 250 Вт.

Battlefield V

3.840 x 2.160 - высокие

Кадры в секунду
Больше - лучше

Control

3.840 x 2.160 - высокие

Кадры в секунду
Больше - лучше

DOOM Eternal

3.840 x 2.160 - Ultra Nightmare

Кадры в секунду
Больше - лучше

Снижение теплового пакета до 280 Вт привело к 3% уменьшению fps. В случае 250 Вт речь идет о 9-11%. Для снижения энергопотребления на 14 или 28% снижение всего на 3% или 11% - весьма достойный результат. Так что GeForce RTX 3080 Founders Edition весьма дружественно относится к уменьшению теплового пакета.

Температура GPU

Нагрузка

В°C
Меньше - лучше

При этом мы смогли снизить и температуру, вентиляторы вращались с меньшей скоростью. Что тоже является важным преимуществом андервольтинга/снижения TDP.


После многих страниц теории, тестов и аналитики, настало время выносить вердикт. Что видеокарта GeForce RTX 3080 обеспечит по сравнению с предшественницей, старым поколением Pascal и конкурентами? Какой прогресс NVIDIA достигла в разных сегментах, и на что обратить внимание?

Линейка GeForce RTX 20 в свое время убедила далеко не всех геймеров. Все же NVIDIA слишком сильно сфокусировалась на трассировке лучей и DLSS. Обе технологии получали поддержку в играх очень и очень неспешно, особенно в самом начале. А DLSS показала обещанные результаты лишь в начале этого года. Так что с критикой согласиться можно.

Поэтому ожидания от второго поколения RTX были выше. NVIDIA по-прежнему считает ключевым фактором аппаратное ускорение трассировки лучей, а также высокую производительность искусственного интеллекта на ядрах Tensor, которые обусловят развитие игр в 2020/2021 годах. И с этим вроде бы можно согласиться. Но на этот раз NVIDIA не забыла о классическом рендеринге (растеризация). Поколение Ampere оснащено намного большим числом функциональных блоков (FP32 и INT32), поэтому и по чистой производительности дает ощутимый прирост. На самом деле увеличение чистой производительности в игровых движках - задача не самая простая. Но NVIDIA с ней справилась, тем более растеризация по-прежнему является основой 3D-рендеринга. Полный расчет сцены через трассировку лучей все еще слишком сложен и практически невозможен в реальном времени.

Хороший шаг вперед по сравнению с GeForce RTX 2080 (Ti), огромный по сравнению с Pascal

GeForce RTX 3080 в варианте Founders Edition - первая видеокарта в новой серии, мы смогли провести сравнительные тесты с GeForce RTX 2080 (Ti) и конкурентами. Видеокарта GeForce RTX 3080 примерно на 40-70% быстрее номинальной предшественницы GeForce RTX 2080. В зависимости от разрешения и игры, прирост может быть даже двукратным (например, в DOOM Eternal). В целом, речь идет не о 20-30% в лучшем случае, а о намного более высоком уровне.

Конечно, нужно понимать, что именно мы сравниваем. Видеокарта GeForce RTX 2080 Founders Edition в 2018 году стоила 63.990 ₽ или €849, GeForce RTX 3080 теперь продается за €699 или 63.490 ₽. За GeForce RTX 2080 Ti в 2018 году пришлось отдавать 95.990 ₽ или €1.259. Поэтому GeForce RTX 3090 Founders Edition с ценой €1.499 или 136.990 ₽ кажется больше конкурентом GeForce RTX 2080 Ti.

По сравнению с GeForce RTX 2080 Ti преимущество уже не такое большое. Речь идет о среднем приросте 30%, кое-где и 40%. Но прирост вполне достойный, учитывая цену GeForce RTX 3080. Тест видеокарты GeForce RTX 3090 на следующей неделе покажет, насколько она сможет выделиться по сравнению с GeForce RTX 2080 Ti.

Если у вас имеется GeForce GTX 1080 Ti, то видеокарта GeForce RTX 3080 даст прирост производительности, как минимум, на 50-60% выше. Максимальное преимущество составляет 2,5 раза. С разрешения WQHD прирост производительности по сравнению с GeForce GTX 1080 Ti составляет не ниже 80% - в худшем случае. В среднем, мы получаем удвоение производительности, но больше тестов дают результат ближе к 2,5-кратному приросту, есть даже игры, которые выигрывают сильнее. Например, в DOOM Eternal мы получаем в четыре раза больше fps. Так что если у вас до сих пор работает поколение Pascal, с видеокартой GeForce RTX 3080 вы получите заметный прирост производительности.

Что касается конкурента, Radeon RX 5700 XT очень близка к GeForce RTX 2080. Впрочем, есть некоторые игры, которые тормозят на Radeon RX 5700 XT, особенно на высоких разрешениях. Здесь тоже можно говорить о более чем удвоении fps в пользу NVIDIA. AMD не может выставить оппонента GeForce RTX 3080. Интересно будет посмотреть на видеокарты Radeon RX 6000, которые выйдут в конце октября.

До анонса новых видеокарт ходили слухи, что NVIDIA существенно улучшит трассировку лучей. Но, если взглянуть на результаты тестов RTX, революции не получилось. Да, видеокарта GeForce RTX 3080 быстрее предшественниц, но нет ничего, выходящего за прирост "обычной" производительности растеризации. Возможно, оптимизации ядер RT проявят себя как-то иначе в будущем. Да и по производительности DLSS мы разницы пока не заметили.

Энергопотребление и эффективность

Конечно, главным недостатком поколения Ampere является высокое энергопотребление. GeForce RTX 3080 Founders Edition номинально потребляет до 320 Вт - почти на 100 Вт больше GeForce RTX 2080 Founders Edition. По сравнению с GeForce RTX 2080 Ti мы получаем увеличение с 260 до 320 Вт. Что конечно заставляет взглянуть на прирост производительности по сравнению с GeForce RTX 2080 в другом свете. Увеличение энергопотребления составляет порядка 40%, хотя прирост производительности во многих случаях существенно выше. Сравнение между GeForce RTX 3080 и GeForce RTX 2080 Ti приводит к схожим выводам.

Видеокарты Ampere потребляют больше, но, в отличие от предшественниц Turing, они смогли превратить дополнительную потребляемую мощность в прирост производительности. Конечно, не в соотношении 1:1, но масштабируемость хорошая.

С линейкой GeForce RTX 30 NVIDIA, наконец, добавила полупассивную работу кулера. При охлаждении GPU до температуры 32°C вентиляторы останавливаются, они снова раскручиваются при нагреве до 54°C. Но, несмотря на высокое энергопотребление, GeForce RTX 3080 Founders Edition все равно работает тихо под нагрузкой. По крайней мере, она существенно тише GeForce RTX 2080 Ti. Температуры тоже чуть ниже.

По разгону существенного прироста мы не получили. Мы смогли выжать лишь небольшой выигрыш по тактовым частотам GPU и памяти. Поэтому и прирост производительности небольшой. Но здесь требуется дополнительное время для работы с видеокартами, а также оптимизированные утилиты, которые пока не в полной мере "знают" новые GPU.

В целом, GeForce RTX 3080 Founders Edition оказалась шагом в правильном направлении, хотя частично увеличение производительности было достигнуто за счет более высокого энергопотребления. Производительность трассировки лучей увеличилась пропорционально чистой производительности, что позволяет не включать DLSS даже в высоких разрешениях. Но с учетом активной DLSS трассировка лучей везде работает достаточно быстро. AMD будет поддерживать интерфейс DXR с грядущим поколением Radeon RX, Intel планирует сделать то же самое с архитектурой Xe-HPG в следующем году. Так что трассировка становится все более важной, она медленно, но верно охватит большинство геймеров из-за игровых приставок.

За свою цену 63.490 ₽ видеокарта GeForce RTX 3080 Founders Edition предлагает весьма приличную производительность GPU. Улучшенная система охлаждения вполне компенсирует увеличение энергопотребления. Все же NVIDIA смогла внести правильные оптимизации. Будет интересно провести сравнение с видеокартами с альтернативным дизайном, но пока неизвестно, по каким ценам они будут продаваться.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).

Преимущества GeForce RTX 3080 Founders Edition:

Недостатки GeForce RTX 3080 Founders Edition: