Тест и обзор: NVIDIA GeForce GTX 980 и GeForce GTX 970 на архитектуре Maxwell

Опубликовано:

geforce-gtx-980-logoПосле появления видеокарт GeForce GTX 750 и GTX 750 Ti и презентации архитектуры Maxwell первого поколения стало понятно, что вскоре можно ожидать выхода на high-end рынок второго поколения Maxwell. Сегодня это и произошло с новыми видеокартами GeForce GTX 980 и 970. Видеокарты отличаются значительно улучшенным соотношением производительности на ватт, то есть они могут обеспечивать существенный прирост производительности при сохранении прежнего энергопотребления. Или существенное снижение энергопотребления при сохранении производительности. Всё это можно ожидать от новых GeForce GTX 980 и GTX 970, которые базируются на архитектуре Maxwell, но вместе с тем NVIDIA внесла ряд улучшений. В итоге мы получим самые быстрые и самые экономичные видеокарты в ассортименте NVIDIA. В нашу тестовую лабораторию поступила эталонная видеокарта GeForce GTX 980 и одна из первых розничных моделей GeForce GTX 970. Все подробности вы узнаете в обзоре.

Сначала нам хотелось бы поблагодарить NVIDIA за предоставление эталонного образца видеокарты GeForce GTX 980 и EVGA за модель GeForce GTX 970 Superclocked. NVIDIA вместе с партнёрами обещает доступность видеокарт в рознице с сегодняшнего дня. Видеокарта GeForce GTX 970 сразу же появится в разных дизайнах производителей, но GeForce GTX 980 первое время можно будет купить только в эталонной версии, так как далеко не все производители успели подготовить свои дизайны.

Сразу же хотелось отметить, что перед вами не просто классический тест и обзор, посвященный выходу нового продукта, мы добавили значительную часть теории. Мы не только детально рассмотри архитектуру Maxwell, но и поговорим о новых технологиях рендеринга и фильтрации, таких как DSR, MFAA и VXGI. Мы уделим внимание и функциям DirectX 12, поскольку GeForce GTX 980 и GeForce GTX 970 станут первыми видеокартами с аппаратной поддержкой DirectX 12. Многочисленные дополнительные функции тоже весьма интересны.

NVIDIA GeForce GTX 980 на GPU Maxwell
NVIDIA GeForce GTX 980 на GPU Maxwell

Но сначала мы хотели бы обсудить технические детали двух видеокарт и сравнить их с предшественницами и прямыми конкурентами. Конечно, основную роль здесь играет архитектура новинок.

Информация об архитектуре

NVIDIA GeForce GTX 980 в сравнении
МодельGeForce GTX 980Radeon R9 290XGeForce GTX 680GeForce GTX 780 Ti
Розничная цена 23.990 руб. от 15,5 тыс. рублей в России
от 395 евро в Европе
от 14,3 тыс. рублей в России
от 379 евро в Европе
от 23,3 тыс. рублей в России
от 499 евро в Европе
Сайт производителя NVIDIA AMD NVIDIA NVIDIA
Техническая информация
GPU Maxwell (GM204) Hawaii Kepler (GK104) Kepler (GK110)
Техпроцесс 28 нм 28 нм 28 нм 28 нм
Число транзисторов 5,2 млрд. 6,2 млрд. 3,54 млрд. 7,1 млрд.
Тактовая частота GPU (базовая) 1.126 МГц - 1.006 МГц 876 МГц
Тактовая частота GPU (Boost) 1.216 МГц 1.000 МГц 1.058 МГц 928 МГц
Частота памяти 1.750 МГц 1.250 МГц 1.500 МГц 1.750 МГц
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5
Объём памяти 4.096 MB 4.096 MB 2.048 MB 3.072 MB
Ширина шины памяти 256 бит 512 бит 256 бит 384 бит
Пропускная способность памяти 224,0 Гбайт/с 320,0 Гбайт/с 192,3 Гбайт/с 336,0 Гбайт/с
Потоковые процессоры 2.048 2.816 1.536 2.880
Текстурные блоки 128 176 128 240
Конвейеры растровых операций (ROP) 64 64 32 48
TDP 165 Вт > 250 Вт 195 Вт 250 Вт
SLI/CrossFire SLI CrossFire SLI SLI

Все современные high-end GPU, как и их предшественники, продолжают изготавливаться по 28-нм техпроцессу. Долгое время ходили слухи о том, что TSMC запустит 20-нм техпроцесс, но, вероятно, NVIDIA и AMD не удовлетворились долей выхода годных кристаллов, поэтому решили пока остаться на 28-нм техпроцессе. В GeForce GTX 980 и GeForce GTX 970 используется GPU с кодовым названием GM204 на архитектуре Maxwell. Он оснащён 5,2 млрд. транзисторов, то есть по их числу он уступает GPU Hawaii или "старшим" Kepler. Но по сравнению с прямым предшественником GK104 число транзисторов значительно увеличилось.

До сих пор NVIDIA выставляла тактовые частоты GPU в зависимости от их сложности. Чем сложнее архитектура, тем ниже были тактовые частоты. У видеокарт GeForce GTX 980 с GPU Maxwell NVIDIA, по всей видимости, решила значительно увеличить тактовые частоты, базовая частота и частота 2.048 потоковых процессоров составляет 1.126 МГц. Под нагрузкой при достаточном охлаждении гарантируется минимальная планка Boost 1.216 МГц – в реальности видеокарта достигает ещё более высоких тактовых частот. GPU работает с 4.096 Мбайт памяти GDDR5 на частоте 1.750 МГц. NVIDIA использовала самую быструю на сегодня память GDDR5, но она подключена по 256-битной шине памяти. По сравнению с 512-битной шиной Radeon R9 290X и 384-битной шиной GeForce GTX 780 Ti урезание шины памяти может стать самым слабым местом GeForce GTX 980. Об этом мы ещё поговорим подробнее в статье, но пока что стоит упомянуть пропускную способность памяти 224 Гбайт/с, которая, на первый взгляд, разочаровывает по сравнению с high-end конкурентами.

О деталях архитектуры мы тоже поговорим позже, но отметим наличие 2.048 потоковых процессоров, которые объединены в 16 потоковых мультипроцессоров Maxwell, каждый содержит 128 ядер CUDA. Отсюда понятно наличие 128 текстурных блоков и 64 конвейеров растровых операций, но, опять же, поговорим об этом позже. Самая впечатляющая техническая деталь – тепловой пакет (TDP) всего 165 Вт. При сохранении прежнего техпроцесса и усложнении GPU (по сравнению с GK104), с повышением тактовых частот NVIDIA удалось существенно снизить энергопотребление. Так что будет весьма интересно взглянуть на результаты тестов энергопотребления.

NVIDIA GeForce GTX 970 в сравнении
МодельGeForce GTX 970Radeon R9 290GeForce GTX 670GeForce GTX 770
Розничная цена 14.990 руб. от 13,5 тыс. рублей в России
от 270 евро в Европе
от 10,5 тыс. рублей в России
от 329 евро в Европе
от 11,3 тыс. рублей в России
от 255 евро в Европе
Сайт производителя NVIDIA AMD NVIDIA NVIDIA
Техническая информация
GPU Maxwell (GM204) Hawaii Kepler (GK104) Kepler (GK110)
Техпроцесс 28 нм 28 нм 28 нм 28 нм
Число транзисторов 5,2 млрд. 6,2 млрд. 3,54 млрд. 3,54 млрд.
Тактовая частота GPU (базовая) 1.050 МГц - 915 МГц 1.046 МГц
Тактовая частота GPU (Boost) 1.178 МГц 947 МГц 980 МГц 1.085 МГц
Частота памяти 1.750 МГц 1.250 МГц 1.500 МГц 1.750 МГц
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5
Объём памяти 4.096 MB 4.096 MB 2.048 MB 2.048 MB
Ширина шины памяти 256 бит 512 бит 256 бит 256 бит
Пропускная способность памяти 224,0 Гбайт/с 320,0 Гбайт/с 192,3 Гбайт/с 224,4 Гбайт/с
Потоковые процессоры 1.664 2.560 1.344 1.536
Текстурные блоки 104 160 112 128
Конвейеры растровых операций (ROP) 64 64 32 32
TDP 145 Вт 250 Вт 170 Вт 230 Вт
SLI/CrossFire SLI CrossFire SLI SLI

Видеокарте GeForce GTX 970 придётся столкнуться с конкурентами собственного производства и моделями AMD. Графический процессор здесь тот же самый – GM204. Так что кристалл изготовлен по 28-нм техпроцессу и содержит 5,2 млрд. транзисторов. Но NVIDIA отключила три SMM, так что мы получаем всего 1.664 потоковых процессора и 104 текстурных блока. По сравнению с GeForce GTX 980 количество конвейеров растровых операций не изменилось – 64 ROP. По тактовым частотам произошли изменения с GeForce GTX 980, базовая частота составляет 1.050 МГц, в режиме Turbo минимальная планка – 1.178 МГц под нагрузкой. Так что у GeForce GTX 970 имеется больший запас частоты для разгона.

Подсистема памяти не имеет отличий, у GeForce GTX 970 тоже установлено 4096 Мбайт памяти GDDR5 на 1.750 МГц. Она тоже подключена по 256-битному интерфейсу, пропускная способность составляет 224 Гбайт/с, то есть примерно на уровне GeForce GTX 770. Можно ли считать это недостатком? Поговорим позже. Для видеокарты GeForce GTX 970 NVIDIA указывает TDP 145 Вт, так что будет интересно посмотреть на результаты тестов энергопотребления и производительности.


С графическим процессором GM104 в видеокартах GeForce GTX 750 и GTX 750 Ti NVIDIA уже наглядно продемонстрировала, что даже на нынешнем 28-нм техпроцессе можно значительно улучшить эффективность. И появление более производительных видеокарт было лишь вопросом времени.

В упомянутом выше первом поколении архитектуры Maxwell NVIDIA смогла улучшить соотношение производительности на ватт примерно в два раза. Также можно отметить, что Maxwell представляет собой уже 10 поколение архитектуры GPU от NVIDIA – конечно, с учётом приобретения 3dfx и архитектур, разработанных этой компанией. Где-то в 2011 году NVIDIA объявила о начале работ над Maxwell, причём одновременно стартовала и разработка Tegra K1, первой SoC от NVIDIA с полностью настольной архитектурой графического блока. И прогресс по эффективности, который удалось достичь с Tegra K1, был перенесён и на Maxwell.

Архитектура Maxwell
Архитектура Maxwell

На диаграмме GM204 с архитектурой Maxwell можно видеть потоковые процессоры и дополнительные модули, в том числе интерфейс PCI Express 3.0, контроллер памяти, кэш L2, конвейеры растровых операций и движок GigaThread, а также организацию чипа в кластеры GPC. В каждом кластере GPC используются четыре мультипроцессора SMM (Maxwell Streaming Multiprocessors). На кристалле GM204 используются четыре GPC, по четыре SMM каждый, что даёт 16 SMM. Каждый из мультипроцессоров SMM, в свою очередь, разделяется на четыре блока по 32 потоковых процессора CUDA. В результате 4 GPC x 4 SMM x 4 блока SMM x 32 АЛУ и дают 2.048 потоковых процессоров. Каждый мультипроцессор SMM обладает восемью текстурными блоками. В общей сложности у GPU GM204 используется 128 таких блоков. Добавим 64 конвейера растровых операций и четыре 64-битных контроллера памяти.

На диаграмме выше показана структура GPU GM204 для GeForce GTX 980, у GeForce GTX 970 мы получаем несколько иную структуру. NVIDIA отключила три мультипроцессора SMM, что даёт всего 1.664 потоковых процессора 13 SMM x 4 блока SMM x 32 АЛУ = 1.664 потоковых процессоров).

Архитектура Maxwell
Архитектура Maxwell

Более высокую эффективность Maxwell NVIDIA смогла получить благодаря нескольким решениям. Кэш L2 в архитектуре "Maxwell" был увеличен до 2.048 кбайт по сравнению с 256 кбайт в архитектуре "Kepler". Пропускная способность кэша осталась на уровне 512 байт на такт. По сравнению с архитектурой Maxwell первого поколения была несколько увеличена общая память для каждого мультипроцессора SMM. Теперь она составляет уже 96 кбайт, а не 64 кбайт. Можно отметить и новый движок Polymorph Engine версии 3.0. Движок PolyMorph 3.0 отвечает за запросы текстур, тесселяцию, настройку атрибутов, трансформацию поля зрения и потоковый вывод. Результаты вычислений кластера SMM и движка PolyMorph 3.0 затем передаются на движок растеризации. На втором этапе тесселятор начинает расчеты позиций поверхностей, в зависимости от расстояния выбирается нужный уровень детализации. Скорректированные значения отсылаются на кластер SMM, где с ними работают доменные и геометрические шейдеры. Доменный шейдер рассчитывает финальную позицию каждого треугольника, учитывая данные Hull-шейдеров и тесселяторов. На данном этапе накладываются карты смещения. Геометрический шейдер затем сравнивает рассчитанные данные с действительно видимыми объектами и отсылает результаты обратно на движок тесселяции для окончательного расчета. На последнем этапе движок PolyMorph 3.0 выполняет трансформацию поля зрения и коррекцию перспективы. Наконец, рассчитанные данные выводятся через потоковый вывод, память освобождается для дальнейших расчетов. В данном процессе задействуются многочисленные функции рендеринга, о которых мы поговорим подробнее на страницах нашего обзора.

3D-рендеринг чипа Maxwell
3D-рендеринг чипа Maxwell

Перейдём к отдельным блокам мультипроцессора SMM. Каждый блок из 32 потоковых процессоров оснащен буфером инструкций и warp-планировщиком. Два блока диспетчеризации работают с 16.384 32-битными регистрами каждый. Если посмотреть на архитектуру "Kepler", то 192 потоковых процессора работали с четырьмя warp-планировщиками и восемью блоками диспетчеризации, всего было доступно 65.536 32-битных регистров. Теоретически на каждый потоковый процессор в архитектуре "Maxwell" приходятся 512 регистров, у "Kepler" их количество составляло около 341. Эта мера тоже способствовала приросту производительности потоковых процессоров до 35%. Также несколько изменилось соотношение между потоковыми процессорами и так называемыми специальными функциональными блоками (Special Function Units, SFU). В архитектуре "Kepler" соотношение составляло 6/1, в " Maxwell" оно снизилось до 4/1. То же самое касается и соотношения потоковых процессоров и блоков чтения/записи (Load/Store, LD/ST). Специальные блоки вычислений с двойной точностью на диаграмме не показаны, они, скорее всего, будут представлены в GPU GM210 (по аналогии между GK110 и GK104). Но, если верить NVIDIA, соотношение одиночной и двойной точности составляет 1/24, как и в чипах "Kepler" первого поколения (GK104).


Ширина шины памяти составляет всего 256 бит, что кажется довольно узким по сравнению с 512-битным интерфейсом GPU Hawaii от AMD или собственных GPU GK110 с 384-битной шиной. Но NVIDIA заявляет о том, что компании удалось обеспечить сравнимую производительность в данной области благодаря сжатию памяти.

Сжатие памяти в Maxwell
Сжатие памяти в Maxwell

NVIDIA использовала для сжатия памяти цветовую дельта-компрессию (Delta Color Compression). Она основана на хранении полной цветовой информации только о базовом пикселе, для остальных пикселей сохраняется только разница с базовым (дельта). Для этой цели используется матрица 8x8 пикселей. Поскольку близко расположенные пиксели обычно мало отличаются по цвету, хранение для них разницы оказывается по объёму информации выгоднее, чем полного значения цвета. Поэтому в случае дельта-компрессии информация о пикселях занимает меньше места памяти. В результате данные будут быстрее считываться и записываться в видеопамять, и доступные 224 Гбайт в секунду будут соответствовать эффективным 297 Гбайт/с, например.

Сжатие памяти Maxwell Сжатие памяти Maxwell

Сжатие памяти Maxwell

Чтобы показать типичные возможности сжатия цветовой информации, NVIDIA представила скриншот GRID 2, показанный выше. По нему сложно определить, какие текстуры являются сжатыми.

Реализация дельта-компрессии позволяет экономить объёмы данных. Выше показаны экстремальные примеры, которые на практике встречаются не так часто. Но сжатие позволяет существенно улучшить производительность контроллера памяти. Какой выигрыш мы получим на практике – покажут тесты. AMD в новых GPU Tonga (видеокарта Radeon R9 285) тоже использует новую технологию сжатия памяти.

В наших тестах мы также посмотрим, как поведёт себя GeForce GTX 980 по масштабируемости памяти.


Вместе с Maxwell NVIDIA также представила новую технологию, которая обеспечит более качественную картинку играм в разрешении 1080p на соответствующих дисплеях.

DSR (Dynamic Super Resolution)
DSR (Dynamic Super Resolution)

В принципе, суть технологии нельзя назвать неизвестной или даже новой. DSR расшифровывается как Dynamic Super Resolution (динамическое суперразрешение) и представляет собой даунсемплинг картинки из высокого разрешения в "родное", но теперь для этого не требуется прибегать к помощи специальных программ, всё работает напрямую в драйвере.

DSR (Dynamic Super Resolution)DSR (Dynamic Super Resolution)

DSR (Dynamic Super Resolution, динамическое суперразрешение) по сравнению с обычным "родным" разрешением.

Для демонстрации преимуществ NVIDIA представила ряд попиксельных сравнений. На иллюстрации выше, в "родном" разрешении слева показана травинка. После наложения текстуры на существующую геометрию остаются только несколько областей семплирования. Но если выполнить рендеринг той же самой травинки в более высоком разрешении (с более высоким уровнем семплинга), то травинка будет видна уже более отчётливо даже после даунсемплинга. Также при даунсемплинге NVIDIA использует специальный фильтр, улучшающий качество картинки.

DSR (Dynamic Super Resolution)
DSR (Dynamic Super Resolution)

Финальный результат показан на скриншоте, но лучше всего оценивать влияние технологии в динамике. Мы приводим демонстрационный видеоролик, где эффект лучше заметен.

Для использования функции DSR драйвер опирается на выделенные аппаратные ресурсы в кадровом буфере и в конвейерах рендеринга. Так что DSR первое время будет поддерживаться только в поколении Maxwell. Теоретически технология могла бы работать и на видеокартах Maxwell первого поколения, но у них просто недостаточно производительности, чтобы быстро выполнять даунсемплинг. Преимущества DSR кроются не только в рендеринге в более высоком разрешении, но и в разработке фильтра даунсемплинга, так как только с хорошим фильтром кадр будет выглядеть привлекательно. Следует отметить, что даунсемплинг выполняется для кадра полностью, включая пользовательский интерфейс. У тех игр, которые не оптимизированы под технологию DSR, элементы интерфейса будут выводиться слишком мелко. NVIDIA предлагает активацию DSR в своей утилите GeForce Experience только для игр, которые имеют соответствующую оптимизацию. Конечно, вы можете самостоятельно включить DSR в 3D-настройках драйвера.

DSR в драйвере GeForce
DSR в драйвере GeForce

DSR активируется и настраивается в 3D-настройках драйвера. Если система подключена к подходящему монитору, то вы можете выбрать множитель по отношению к "родному" разрешению дисплея. Он приводит к появлению в играх соответствующих настроек, которые можно будет выбрать. NVIDIA реализовала специальный фильтр, который позволяет выполнять дробное масштабирование без потери качества картинки. Мы планируем более подробно рассмотреть технологию DSR в ближайшем будущем. Поддержка DSR в драйвере будет доступна для мониторов с разрешением 2.560 x 1.600, 2.560 x 1.440 и 1.920 x 1.080 пикселей. То есть у мониторов 4K такой опции уже не будет. Так что NVIDIA сама продумала, в каких нативных разрешениях DSR имеет смысл, а в каких – нет. В любом случае, даунсемплинг до разрешения 3.840 x 2.160 пикселей вряд ли сегодня разумен, поскольку видеокарты просто не имеют соответствующих ресурсов для рендеринга в более высоких разрешениях.

DSR в драйвере GeForce
DSR в драйвере GeForce

Также NVIDIA в драйверах позволяет регулировать уровень работы фильтра Гаусса, то есть уровень сглаживания. Регулировка будет полезна, если вы хотите достичь оптимального качества картинки. Каждый геймер реагирует на уровень сглаживания по-своему, между играми оптимальный уровень DSR тоже отличается. Поэтому данной настройкой имеет смысл пользоваться, если вы планируете играть с активным динамическим суперразрешением. В разделе тестов мы проведем ряд измерений с активной технологией DSR.


Вторая инновация заключается в многокадровом сглаживании MFAA (Multiframe Sampled Anti-Aliasing). Новый алгоритм обеспечивает качество картинки высоких уровней MSAA, но накладывает в два раза меньшую нагрузку по производительности.

MFAA (Multiframe Sampled Anti-Aliasing)
MFAA (Multiframe Sampled Anti-Aliasing)

Чтобы понять MFAA, сначала следует рассмотреть работу алгоритма AA. На приведённом выше примере показан геометрический объект, на границе которого взяты четыре пикселя. Без сглаживания объект закрывает только один центр пикселя из четырёх, который и будет семплирован на финальном кадре. И видеокарта в пути рендеринга считает, что объект покрывает только один этот пиксель.

При сглаживании 4xMSAA учитываются уже четыре семпла покрытия на каждый пиксель. Они могут распределяться в пределах пикселя по-разному. Если взять тот же самый пример с четырьмя пикселями, то объект закрывает один семпл во втором пикселе и три семпла в четвертом. Соответственно, для пикселей считается покрытие 1/4 и 3/4, соответственно, на картинке же мы получаем более плавный переход границ объекта.

MFAA (Multiframe Sampled Anti-Aliasing)
MFAA (Multiframe Sampled Anti-Aliasing)

В методе MFAA используются два семпла покрытия, которые удваиваются благодаря учёту предыдущего кадра. На приведённом примере NVIDIA использовала две схемы распределения семплов покрытия по пикселю. Обе схемы поочерёдно используются в разных кадрах (в чётных n и нечётных n-1), что приводит к разному покрытию в двух случаях. NVIDIA называет подобную технику временным синтезирующим фильтром.

MFAA (Multiframe Sampled Anti-Aliasing)MFAA (Multiframe Sampled Anti-Aliasing)

MFAA (Multiframe Sampled Anti-Aliasing)

Фильтр учитывает два расчёта разных кадра, в результате качество 4xMFAA получается на уровне обычного сглаживания 4xMSAA. Так что MFAA, по сути, соответствует 2xMSAA, но даёт качество картинки на уровне 4xMSAA. При этом MFAA работает примерно на 30 процентов быстрее. Падение производительности из-за фильтра невелико, не больше двух процентов.

MFAA (Multiframe Sampled Anti-Aliasing)
MFAA (Multiframe Sampled Anti-Aliasing)

В примерах, показанных NVIDIA, нет разницы в попиксельном представлении. На практике, конечно, отличия имеются, но их можно заметить только на движущихся объектах. Именно по этой причине для работы MFAA требуется определенный минимальный уровень частоты кадров, чтобы сглаживание можно было рассчитывать на основе двух кадров. Сегодня NVIDIA утверждает, что частоты кадров 30-40 fps должно быть достаточно. К сожалению, тесты сглаживания мы провести не смогли, поскольку MFAA в драйвере недоступно. NVIDIA требуется ещё некоторое время на доработку и улучшение сглаживания MFAA, после чего в драйвере появится поддержка MFAA. В играх никакой специализированной поддержки не требуется. MFAA будет активироваться в эффективном режиме 4xMFAA, соответствующем 2xMSAA (или 4xMSAA).

Следующий видеоролик даёт лучшее представление о работе MFAA:


Реалистичный расчет освещения по-прежнему остаётся серьёзной проблемой. Самый качественный результат дала бы полная трассировка лучей, но прежде чем она станет возможна в нынешних разрешениях, пройдёт ещё немало лет. В качестве промежуточного шага NVIDIA предлагает технологию воксельного глобального освещения VXGI (Voxel Global Illumination).

VXGI (Voxel Global Illumination)
VXGI (Voxel Global Illumination)

С технологией VXGI NVIDIA выполняет динамический анализ сцены с учётом отражений прямых и непрямых источников света, в том числе от предыдущих отражений, а также рассеянного света.

VXGI (Voxel Global Illumination)
VXGI (Voxel Global Illumination)

Трассировка пути является подмножеством трассировки лучей, и она тоже может быть довольно сложной, как на приведённом выше примере двух отражений и небольшого числа путей света. Не говоря уже о почти бесконечной длине путей и количестве путей света, получающихся из трассировки лучей.

VXGI (Voxel Global Illumination)
VXGI (Voxel Global Illumination)

На пути к VXGI и трассировке лучей первой остановкой были карты освещения (Light Mapping), но с ними поверхность давала одинаковые отражения со всех направлений. В результате можно было добавлять красивые отражающие поверхности, но они не имели какой-либо структуры или характеристик отражения.

VXGI (Voxel Global Illumination)
VXGI (Voxel Global Illumination)

Технологии динамического прямого освещения (Dynamic Direct Lighting) и виртуальных точек освещения (Virtual Point Lights) увеличили детализацию освещения, а также обеспечили реалистичное представление света и тени от динамических источников освещения.

VXGI (Voxel Global Illumination)
VXGI (Voxel Global Illumination)

Технология Ambient Occlusion обеспечивала реалистичное освещение сложной геометрии, но не с помощью трассировки пути, а через более простые и приближённые вычисления, симулирующие освещение. В игре Watch_Dogs NVIDIA как раз недавно объявила поддержку улучшенного алгоритма HBAO+ (Horizon Based Ambient Occlusion). Современные способы освещения обычно сочетают приведённые выше технологии.

С новым методом VXGI NVIDIA желает сделать ещё один шаг вперёд, в сторону трассировки лучей. Для этого NVIDIA вводит ряд упрощений. Так, непрямой свет всегда считается несфокусированным, и он учитывается в расчете только первого отражения, то есть базовой интенсивности. Теоретически VXGI может выполнять расчеты и более одного отражения, но в таком случае объём вычислений значительно возрастает, и в реальном времени их провести проблематично.

VXGI (Voxel Global Illumination)
VXGI (Voxel Global Illumination)

Технология VXGI разделяет освещенное 3D-пространство на 3D-воксели. Они представляют собой простые 3D-объекты, которым можно привязать два свойства: прозрачность для света, а также в каком направлении и в каком цвете воксель излучает свет. Для разделения пространства на воксели требуется выполнение определенных процедур семплирования, которые опираются на выделенные аппаратные блоки, доступные только в архитектуре Maxwell. Они также входят в состав DirectX 12, где Maxwell тоже себя хорошо показывает. Но подробнее об этом позже.

VXGI (Voxel Global Illumination)VXGI (Voxel Global Illumination)

VXGI (Voxel Global Illumination)

Воксели представляют источники света в готовой сцене. В зависимости от расстояния до поверхности воксели могут иметь разный размер, а также могут отображаться с разными конусами света, с разной длиной и толщиной. Поскольку размер вокселя зависит от поверхности, добавляется новый "уровень детализации".

VXGI (Voxel Global Illumination)VXGI (Voxel Global Illumination)

VXGI (Voxel Global Illumination)

Направление и длина конуса описывают путь света, с данного направления свет падает на поверхность. Толщина конуса определяет рассеяность света: чем толще конус, тем более рассеянный получается свет. Сегодня на пиксель обычно используются 3-4 конуса. Это число можно менять, оно тоже соответствует уровню детализации освещения.

Для лучшего ознакомления с технологией мы рекомендуем посмотреть следующий видеоролик Youtube:


Maxwell – первая архитектура NVIDIA с поддержкой DirectX 12. Microsoft пока ещё не определилась с финальными требованиями DirectX 12, но NVIDIA уже поддержала все необходимые на сегодня спецификации. Но остаётся открытым вопрос, получите ли вы полную поддержку всех функций на аппаратном уровне.

Maxwell und DirectX 12
Maxwell и DirectX 12

В качестве доказательства готовности к DirectX 12 NVIDIA показала короткую демонстрацию Unreal Engine на основе DirectX 12. Разработчики сегодня могут получить доступ к комплекту разработчика Unreal Engine и Developer Kit от Microsoft, что позволяет начать работу над играми с поддержкой DirectX 12. Представитель Microsoft вновь подтвердил нынешние планы по выпуску DirectX 12, интерфейс планируется объявить к осени/зиме 2015. То же самое касается и выхода DirectX 11.3, который представляет собой программную реализацию функций DirectX 12 на уровне DirectX 11. Пока неизвестно, какое количество игр к тому моменту обзаведутся поддержкой нового API.

Доступность DirectX 12 для разработчиков была показана с помощью демо Fable:

Maxwell und DirectX 12
Maxwell и DirectX 12

Как мы уже отметили выше, финальный массив функций DirectX 12 пока не утвержден, поэтому во время презентации NVIDIA концентрировала внимание на том, что уже объявлено. Среди новых функций рендеринга можно отметить Rasterizer Ordered Views. Они играют важную роль в различных технологиях рендеринга и фильтрации. К ним относится сглаживание и технология Order Independent Transparency, которую мы обсудим ниже более детально.

Maxwell und DirectX 12
Maxwell и DirectX 12

Технология Order Independent Transparency описывает проблему, которая появляется в пути рендеринга и до сих пор не поддавалась решению. Для прозрачных объектов не всегда очевидно, в каком порядке их требуется представлять. Разработчикам приходилось тратить вычислительные ресурсы на решение этой проблемы, чтобы рендеринг был правильный, но при этом он оказывался довольно медленным. Если экономить на вычислительных расходах, то рендеринг может оказаться некорректным, и объекты, лежащие за прозрачным объектом, выводятся перед ним. Технология Rasterizer Ordered Views обеспечивает корректные вычисления, при этом не требующие существенной вычислительной производительности.

Maxwell und DirectX 12
Maxwell и DirectX 12

В качестве примера был приведён расчет вывода специфического объекта по отношению к полю зрения. Проблема кроется в том, что красная область является сквозной для прозрачного объекта. Обычные алгоритмы приводят к разным результатам, объект может располагаться за прозрачным объектом или перед ним. Но с помощью Rasterizer Ordered Views теперь можно будет выполнять каждый проход несложные расчеты.

Maxwell und DirectX 12
Maxwell и DirectX 12

DirectX 12 также снимает ряд ограничений, связанных с недавним изменением архитектуры CPU и операционных систем с 32 на 64 бита. Многие переменные имели длину только 32 бита, что приводило к сбоям типов и значений данных.

Maxwell и DirectX 12Maxwell и DirectX 12

Maxwell и DirectX 12

Ещё один важный аспект DirectX 12 – тайловые ресурсы (Tiled Resources), которые обеспечивают высокую эффективность использования памяти, а также улучшают уровень детализации и открывают путь к использованию так называемых мегатекстур. С помощью использования мелких текстур в различных ориентациях можно симулировать крупные текстуры. При этом существенно экономится память. Возможно, придётся пойти на некоторые компромиссы по качеству картинки, но вовсе необязательно.

В первом примере вызывалась классическая 3D-текстура DirectX 11 с разрешением 1.200 x 600 x 600 пикселей в 32-бином цвете размером 1,6 Гбайт. Затем то же самое качество текстуры было достигнуто с помощью тайловой 3D-текстуры разрешением 32 x 32 x 16 пикселей с 32-битной глубиной цвета и размером 156 Мбайт, которая просто использовалась несколько раз. В одном из примеров приводилась сцена рендеринга, в котором тайловую 3D-текстуру удавалось использовать 2.500 раз.

Maxwell und DirectX 12
Maxwell и DirectX 12

Третий важный момент в DirectX 12 касается консервативной растеризации (Conservative Rasterization). Она касается ситуаций использования фильтров Dynamic Super Resolution и Multi Frame Sampled Anti-Aliasing.

Maxwell und DirectX 12Maxwell und DirectX 12

Maxwell и DirectX 12

При растеризации небольшого объекта или пикселя результат часто зависит от удачного расположения точек семплирования. Иногда это приводит к несоответствию желаемому результату, поэтому лучше считать покрытыми и частично занятые участки, чтобы их тоже учесть. Технология Conservative Rasterization важна и для вокселизации VXGI. Для работы Conservative Rasterization требуются определенные аппаратные ресурсы, поэтому технология будет работать только на новых GPU.

Maxwell und DirectX 12
Maxwell и DirectX 12

В DirectX 11 Microsoft использовала так называемые состояния (States) для описания ортогональных объектов. В результате несколько состояний (Input Assembler States, Pixel Shader States, Rasterizer States и Output Merger States) можно было изменять независимо. Такой подход обеспечивал хорошую гибкость в программировании графического конвейера, но он не лучшим образом соответствует принципу работы современных GPU. Например, производители GPU объединяют Pixel Shader State и Output Merger State в отдельном аппаратном блоке. Но из-за независимости этих компонентов в DirectX 11, драйверу не всегда удавалось своевременно учесть все состояния, чтобы составить полную характеристику объекта – в результате появлялись задержки вывода финального кадра (Draw Time). Задержки приводили к тому что конвейер обрабатывал меньше операций Draw Call на кадр.

Maxwell und DirectX 12
Maxwell и DirectX 12

Новая модель Bind Model в Microsoft DirectX 12 лучше ориентирована на большое количество ядер CPU, она обеспечивает более высокую производительность и более широкую параллельную обработку. Также снижается и избыточная вычислительная нагрузка на CPU. Произошли изменения и со списками команд (Command Lists). Так называемые списки команд под DirectX 11 позволяют выполнять бесконечную последовательность команд на GPU. Но они тоже не очень хорошо соответствуют многозадачной природе GPU, поскольку команды в списке необходимо обрабатывать последовательно, планировщику приходится распределять команды максимально эффективно, что не всегда получается сделать идеально.

DirectX 12 больше не отсылает линейный список команд через драйвер на GPU, вместо этого используется четко определенный и конечный список, который содержит некоторое количество задач, необходимых для выполнения на GPU, и он оптимизирован под возможности и производительность аппаратной части. Во время обработки списка команд на GPU, драйвер, на основе нагрузки предыдущего списка, создаёт новый, который должен быть готов для выполнения после завершения текущего. Затем один последовательный процесс сводит списки вместе, но данный подход оказывается намного более эффективным, чем создание большого последовательного списка команд. Так называемые бандлы (Bundles) можно рассматривать как следующую ступень эволюции списка команд. Если необходимо рассчитать кадр, например, с двумя объектами, которые отличаются только текстурами, то во время первого прохода можно записать список команд, который затем требуется просто повторить без всех операций, сопутствующих первому проходу. Так что все инструкции и команды создаются только один раз.

Maxwell und DirectX 12
Maxwell и DirectX 12

DirectX 12 теперь объединяет различные состояния вместе в объект под названием Pipeline State Object (PSO). Теперь аппаратное и программное обеспечение оперирует полными блоками, которые можно намного быстрее вычислять на аппаратных ресурсах. Объекты PSO можно изменять динамически, при этом их не требуется вычислять каждый раз полностью. Всё это должно привести к выполнению большего числа операций Draw Calls на кадр, что приведёт к возможности увеличить число объектов в кадре или повысить частоту кадров.

Maxwell und DirectX 12
Maxwell и DirectX 12

Два, четыре, шесть или даже восемь ядер вместе с технологией Hyper-Threading быстро приводят к значительному количеству виртуальных ядер (до 12), которые требуется нагрузить со стороны программного обеспечения. Как правило, до сих пор удавалось нагрузить только несколько ядер. Хорошие игровые движки умеют нагружать до пяти-шести ядер, но об их эффективном использовании говорить не приходится. Для демонстрации распределения нагрузки Microsoft взяла версии DirectX 11 и DirectX 12 пакета 3DMark от Futuremark, после чего показала загрузку ядер CPU. В верхнем случае задачи были разбиты на четыре потока, на расчет потребовалось довольно много времени CPU, поскольку Thread0 не смог распределить часть своих задач на остальные свободные потоки.

Под DirectX 12 следует отметить два момента. Во-первых, задачи лучше распределились по четырем потокам (например, это касается задачи "UM Driver"). Во-вторых, у DirectX 12 снизилась избыточная вычислительная нагрузка, то есть ненужные вычисления, что привело к выполнению отдельных задач за меньшее время. Подобное сокращение вычислительного времени CPU приводит к снижению задержек, когда GPU приходится ждать данных от CPU, что даёт, в конечном итоге, большую частоту кадров.

В целом, картина DirectX 12 и предлагаемых функций пока не сложилась. Сложно удержать в голове все аппаратные и программные функции, и пока не совсем понятно, какие из упомянутых функций потребуют выделенных аппаратных блоков, а какие – нет. Для некоторых примеров мы указали аппаратные требования, для других они пока остаются в тумане. Скорее всего, это и приведёт к отличиям в поддержке DirectX 12 и 11.3, разница будет заключаться в программной или аппаратной поддержке функций.


Вместе с собственными видеокартами NVIDIA продолжает продвигать API GameWorks, и PhysX в нём отводится довольно важная роль. Некоторые описанные на предыдущих страницах технологии будут доступны разработчикам только через GameWorks.

GameWorks- und PhysX-API
GameWorks и PhysX API

NVIDIA рассматривает GameWorks как мост между нынешними средствами разработки игр и разработкой с использованием новых технологией. Разработчики получат доступ к новым технологиям в виде библиотек API. Кроме того, доступна поддержка NVIDIA и инструментарий Developer Tools.

GameWorks- und PhysX-API
GameWorks и PhysX API

Одна из новых разработок в ассортименте Maxwell под GameWorks - VXGI. Мы уже детально обсуждали эту технологию в статье. VXGI войдет в состав GameWorks, а в том же движке Unreal Engine 4 технология уже используется.

GameWorks- und PhysX-API
GameWorks и PhysX API

Кроме улучшенного освещения NVIDIA добавила ряд технологий, отвечающих за реалистичное отображение растительности. Была показана демонстрация, которую можно посмотреть на следующем видеоролике:

GameWorks- und PhysX-API
GameWorks и PhysX API

Симуляция жидкостей тоже претерпела ряд важных улучшений. Соответствующую демонстрацию вы можете посмотреть на видеоролике с момента 2:50.

Кроме новых функций и API в GameWorks NVIDIA также улучшила балансировку нагрузки между классическими операциями рендеринга и вычислениями. Но разработчики по-прежнему могут управлять тем, в какой пропорции и в каких местах использовать вычисления и расчеты геометрии.


Oculus не первой открыла возможности очков виртуальной реальности (VR), но сегодня компания может похвастаться наиболее проработанной практической реализацией. Facebook оценила потенциал компании, после чего приобрела Oculus VR. NVIDIA тоже не пожелала остаться в стороне, поэтому добавила прямую поддержку технологии VR. Она была реализована в виде VR Direct, набора различных технологий для улучшения качества поддержки VR.

VR Direct
VR Direct

Сюда относятся VR SLI, VR DSR и некоторые другие технологии, на которых хотелось бы остановиться более подробно. Конечно, сегодня VR Direct находится ещё на раннем этапе разработки. Да и очки Oculus VR пока ещё нельзя назвать полностью завершенными. Но демонстрации уже есть, и Unreal Engine на очках Oculus Rift DK2 позволяет получить представление о том, куда будут двигаться технологии виртуальной реальности в ближайшем будущем.

VR Direct
VR Direct

Для улучшения поддержки очков виртуальной реальности важно и дальше уменьшать задержки, которые возникают в процессе рендеринга. Теперь Oculus в дополнение к гироскопам использует камеру, что позволяет более точно определять движение головы. Но на время рендеринга Oculus повлиять не может – здесь как раз всё зависит от NVIDIA. Задержки ввода при отслеживании движения головы, неточное отслеживание, а также время рендеринга как раз и отвечают, по большей части, за снижение эффекта "морской болезни". На каждого геймера этот эффект действует по-разному, но максимально уменьшить негативное влияние не мешает.

Переход на DirectX 12 позволяет сократить время рендеринга. Мы уже обсуждали данную тему в главе, посвященной DirectX 12, где показаны некоторые сравнительные примеры реализации. MFAA тоже влияет положительно, поскольку данный алгоритм сглаживания тоже позволяет сократить время рендеринга не в ущерб качеству картинки.

VR Direct
VR Direct

Но самый большой прогресс в деле уменьшения задержек должна дать технология Asynchronous Warp. Без подобной функции каждое приложение приходилось оптимизировать под очки виртуальной реальности, движения головы могли передаваться конвейеру рендеринга только после выполнения определенного количества предварительных вычислений. Только потом можно было корректировать положение геймера. Цель NVIDIA заключается в уменьшении в два раза времени рендеринга, чтобы задержка от ввода пользователя (движение головы) до вывода картинки на экран не превышала 25 мс.

Ещё одна функция, связанная с очками виртуальной реальности, называется VR SLI. При использовании системы multi-GPU можно привязать к каждому глазу GPU, чтобы технология AFR (Alternate Frame Rendering) избавила от необходимости наличия задержки между кадрами. Для плавного восприятия игры необходима высокая частота кадров, причём не только на дисплее, но и при рендеринге. 75 fps можно назвать минимальной планкой, но это касается только одного глаза. Если учитывать два глаза, то на Oculus Rift должен подаваться поток кадров со скоростью 150 fps, что по производительности достичь не так просто. NVIDIA с новыми видеокартами GeForce GTX 980 и GTX 970 на архитектуре Maxwell создала все необходимые условия для максимально плавного рендеринга. Технология 3D Vision уже хорошо зарекомендовала себя среди настольных ПК, и она позволит играть на очках VR без предварительной адаптации. Справится ли NVIDIA с этой задачей – мы увидим на первых примерах. Но сегодня, похоже, все разработчики заинтересованы в том, чтобы игры хорошо шли на очках виртуальной реальности.


Первые видеокарты Maxwell в виде GeForce GTX 750 и GTX 750 Ti опирались на улучшенный декодер VP6, который NVIDIA оптимизировала для декодирования H.264 в разрешении 4K на 60 Гц (Level 5.2). Некоторые старые движки VP5 на такое не были способны – например, у всех видеокарт Kepler. У Maxwell кодер NVEC удвоил свою производительность кодирования по сравнению с Kepler.

Со вторым поколением архитектуры Maxwell NVIDIA вновь решила доработать NVENC. Теперь мы получаем первый аппаратный кодер H.265. Видео в кодеке H.265 сегодня встречаются редко, но из-за лучшего коэффициента сжатия при прежнем качестве картинки H.265 займёт достойное место в ближайшем будущем. NVIDIA стала первым производителем, кто представил первые GPU GM204 Maxwell с возможностью аппаратного кодирования H.265. Для NVIDIA раннее добавление поддержки нового метода кодирования может стать важным шагом, поскольку даёт возможность наиболее быстрого и эффективного стриминга. Частично это поможет функции GameStream у приставки NVIDIA Shield. Но более важно и вероятное расширение технологии NVIDIA GRID – и для профессиональной сферы, и для конечных пользователей.

Трансляцию ShadowPlay на видеокартах Maxwell можно вести в более высоких разрешениях благодаря улучшенному блоку кодирования
Трансляцию ShadowPlay на видеокартах Maxwell можно вести в более высоких разрешениях благодаря улучшенному блоку кодирования

Также следует отметить и более высокую производительность NVENC. В утилите GeForce Experience можно создавать записи геймплея или трансляцию ShadowPlay. Запись производится пока что только в кодеке H.264, но более высокая производительность NVENC позволила NVIDIA предложить более высокие разрешения и потоки. До сих пор поддерживался только режим 1.080p@60FPS с потоком 50 Мбит/с – предел для видеокарт Kepler. GPU GM204 на архитектуре Maxwell позволяют вести запись в режиме 1.440p@60FPS и даже 4K@60fps с потоком до 130 Мбит/с.

Несколько запутывает аппаратная реализация кодеров и декодеров, кодирование выполняется полностью аппаратно (на блоках FFU, Fixed Function Units). Но для декодирования NVIDIA использует гибридный декодер HEVC, который, в принципе, базируется на декодере HEVC поколения Kepler. И в тех случаях, когда декодера не хватало для выполнения аппаратного декодирования H.265, он обычно "перескакивал" на программный способ, который был медленнее и не таким эффективным. У Maxwell NVIDIA решила использовать доступные потоковые процессоры/шейдеры, которые не такие эффективные, как FFU, но всё же работают лучше чистого программного уровня. Так что NVIDIA изначально сфокусировалась на NVENC, то есть на кодировании. В следующем поколении GPU NVIDIA наверняка полностью изменит аппаратное ускорение кодирования и декодирования видео. На данный момент гибридное решение работает достаточно быстро и эффективно, так что вам не придётся ждать поколения Pascal.


Но позвольте перейти к рассмотрению непосредственно видеокарт. Мы начнём со "старшей" модели GeForce GTX 980, которую получили в эталонной версии. Между тем многие производители заявили о розничных моделях, которые будут частично базироваться на собственных дизайнах. В ближайшие дни и недели мы детально протестируем часть этих видеокарт.

GPU-Z-Screenshot der GeForce GTX 980
Скриншот GPU-Z видеокарты GeForce GTX 980

Начнём со скриншота GPU-Z. Информацией по количеству транзисторов утилита пока не владеет, но у нашего тестового образца мы получили эталонные тактовые частоты. Базовая частота составила 1.127 МГц, в режиме Boost частота увеличивается, как минимум, до 1.216 МГц. Память GDDR5 работает на частоте 1.753 МГц. Небольшие отличия от спецификаций связны с делителем и погрешностями округления.

Благодаря работе технологии PowerTune или GPU Boost 2.0, современные GPU больше не ограничены штатными тактовыми частотами. В зависимости от нагрузки, температуры и сценария использования видеокарты могут изменять тактовую частоту, и GeForce GTX 980 не стала исключением. Мы провели тесты и определили тактовую частоту GPU и температуру при разных нагрузках.

Сравнение температур и тактовых частот
Игра Температура Частота
The Elder Scrolls V Skyrim 79 °C 1.290 МГц
Company of Heroes 80 °C 1.151 МГц
Grid 2 79 °C 1.290 МГц
Metro: Last Light 80 °C 1.151 МГц
Crysis 3 80 °C 1.151 МГц
Battlefield 4 80 °C 1.151 МГц
Bioshock: Infinite 80 °C 1.151 МГц
Tomb Raider 80 °C 1.151 МГц

Видеокарта разгоняется до 1.290 МГц, но только если температура GPU остаётся ниже планки 80 °C. Планка 80 °C уже использовалась в качестве целевой у видеокарт Kepler. После достижения данной температуры видеокарта начинает снижать тактовые частоты и напряжение, либо повышает скорость вращения вентилятора, чтобы предотвратить дальнейшее повышение температуры. Так что даже в хорошо вентилируемых корпусах максимальные тактовые частоты будут обеспечиваться не всегда. В большинстве тестов и игр видеокарта довольно быстро упиралась в целевую температуру, после чего она переставала работать даже с минимальной частотой Boost 1.216 МГц. И в большинстве тестов видеокарта будет работать на частоте 1.151 МГц. Посмотрим, как такое поведение скажется на производительности.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

На первый взгляд, эталонная видеокарта GeForce GTX 980 очень похожа на эталонные версии линейки GTX 700 верхнего сегмента производительности, отличия можно найти, только если приглядеться. Видеокарта вновь опирается на радиальный вентилятор, который нагнетает воздух внутрь кожуха, после чего проталкивает его через рёбра радиатора в направлении слотовой заглушки. Через окно можно видеть радиатор с продольными рёбрами охлаждения.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

Раньше задняя пластина встречалась только у видеокарт Titan, но теперь NVIDIA решила её устанавливать штатно. Поэтому сама печатная плата скрыта за металлической пластиной. И чтобы её разглядеть, нам пришлось снять пластину.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

С тепловым пакетом всего 165 Вт видеокарта GeForce GTX 980 более экономична, чем предшественницы, поэтому вместо одного 6- и одного 8-контактного разъёмов дополнительного питания PCI Express мы получаем пару 6-контактных гнёзд. Вместе со слотом PCI Express видеокарта может получать от блока питания до 225 Вт, с учётом штатного теплового пакета 165 Вт мы получаем довольно большой запас для разгона.

Подобно high-end видеокартам семейства GTX 700, видеокарта может динамически переключать нагрузку между источниками питания. Если какой-то вход питания достигает максимума, то недостающая энергия может быть получена с другого разъёма. Механизм не новый, но у поколения Maxwell он оставлен для GeForce GTX 980, а GeForce GTX 970 его не использует.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

В отличие от новых GPU AMD, NVIDIA решила не отказываться от использования мостиков для построения конфигурации SLI. Связь между видеокартами и обмен кадров с основным GPU у новых моделей NVIDIA выполняется через классические мостики, а не через интерфейс PCI Express. Преимущества и недостатки есть у каждого подхода, но отсутствие мостиков, конечно, интереснее, поскольку дополнительные компоненты просто не требуются. Впрочем, мы не видим серьёзного недостатка и в обязательном использовании мостиков.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

NVIDIA для эталонного дизайна GeForce GTX 980 использовала хорошо знакомый радиальный вентилятор диаметром 65 мм. Он отличается тихой работой, всё же NVIDIA обещала оптимизировать угол атаки лопастей крыльчатки таким образом, чтобы шум воздушного потока был меньше. Конечно, хромированный центр вентилятора и магниевый кожух выглядят симпатично, но не будем на этом останавливаться ещё раз.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

Горячий воздух выбрасывается кулером не только через слотовую заглушку, но и через отверстия в задней части видеокарты (обращённой к передней панели корпуса). Без такой меры NVIDIA было не обойтись, чтобы охлаждать компоненты подсистемы питания должным образом.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

Здесь можно видеть типичную конфигурацию интерфейсов слотовой заглушки. У видеокарт Kepler мы обычно получали следующий набор: 2x Dual-Link DVI, по одному HDMI 1.4a и DisplayPort 1.2. В случае GeForce GTX 980 или GPU Maxwell произошли некоторые изменения. Число видеовыходов увеличилось, также и частота работы Pixel Clock была повышена до 1.045 МГц. В результате видеокарта может обеспечивать разрешение до 5.120 x 3.200 пикселей с частотой обновления 60 Гц.

Теоретически видеовыходы могут обеспечивать разрешение 5K с частотой 60 Гц, но для этого необходимы соответствующие протоколы. DisplayPort 1.3 с поддержкой подобного разрешения на частоте 60 Гц был утверждён только несколько дней назад, соответствующие продукты должны появиться на рынке в ближайшие пару лет. Также для видеокарт Maxwell NVIDIA поддержала стандарты HDMI 2.0 и DisplayPort 1.2. Есть и поддержка eDP, а именно Embedded DisplayPort для систем с высокой интеграцией, например, моноблоков. Отметим поддержку технологий кодирования LVDS (Low Voltage Differential Signaling) и TMDS (Transition-minimized Differential Signaling), которые обеспечивают передачу данных через выходы DVI и HDMI. Обе техники могут использоваться для управления дисплеями.

У эталонной видеокарты GeForce GTX 980 установлен двухканальный видеовыход DVI, три порта DisplayPort 1.2 и один HDMI 2.0. У розничных видеокарт мы получим и другие варианты конфигурации выходов.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

Есть и некоторые другие изменения, касающиеся видеовыходов. У предыдущих эталонных видеокарт мы не сталкивались тем, что кожух дополнительно защищал разъёмы изнутри слотовой заглушки.


После изучения внешнего вида GeForce GTX 980, позвольте перейти к рассмотрению видеокарты без кулера.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

Для снятия кулера сначала необходимо избавиться от задней пластины. За ней нет каких-либо крупных компонентов или разъёмов, она просто защищает печатную плату.

Если вы собираетесь устанавливать в систему две или даже отри видеокарты GeForce GTX 980 в конфигурацию SLI или 3-Way SLI, то могут возникнуть проблемы с поступлением свежего воздуха между видеокартами. Конечно, всё зависит от расположения слотов на материнской плате, то есть от расстояния между видеокартами. Если расстояние будет минимальным, то можно снять небольшую часть задней пластины, после чего вторая видеокарта получит чуть больше воздуха. Снимается только небольшая часть пластины, но она всё равно обеспечивает дополнительный воздушный поток для радиального вентилятора.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

Если снять заднюю пластину, то откроется свободный вид на печатную плату. Каких-либо крупных сюрпризов мы не обнаружили. Хорошо видны расположения GPU и чипов памяти, а также других компонентов. Также теоретически есть возможность установки более ёмкой конфигурации памяти, поскольку сзади оставлены точки пайки для дополнительных чипов памяти.

Есть и точки пайки для дополнительных разъёмов питания. NVIDIA использовала для видеокарты два 6-контактных разъёма. Но у платы есть возможность перейти на конфигурацию с одним 6- и одним 8-контактным разъёмом. Как и у high-end видеокарт на GPU GK110, можно видеть точки пайки для 8-контактного разъёма питания, направленного назад, но они всегда оставались свободными.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

Без кулера с лицевой стороны печатной платы можно рассмотреть все основные компоненты. По центру располагается GPU, окружённый чипами памяти. В правой части печатной платы расположена подсистема питания.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

Если присмотреться к подсистеме питания, то хорошо видно, что NVIDIA предусмотрела четыре фазы для GPU и одну для памяти. Как можно видеть, возможна установка ещё двух фаз. Почему NVIDIA выбрала именно такой эталонный дизайн, осталось для нас загадкой. Возможно, партнёры добавят две фазы к своим видеокартам на эталонном дизайне. Но скорее всего NVIDIA предусмотрела данный дизайн платы для других версий на GPU Maxwell. Возможно, компания сегодня работает над GeForce GTX 980 Ti?

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

GPU с трёх сторон окружён чипами памяти. Близкое и равномерное расположение чипов памяти необходимо для сокращения задержек на распространение сигнала. В грядущих дизайнах видеокарт всё большую роль будут играть более широкие и, особенно, более быстрые интерфейсы памяти. Через год-два можно ожидать GPU Pascal с поддержкой 3D Memory, у AMD, судя по слухам, имеются схожие планы.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

По центру фотографии можно видеть небольшой чип, обеспечивающий работу функции GPU Boost. Он хорошо знаком нам по предыдущим поколениям видеокарт. Некоторые партнёры NVIDIA устанавливают его таким же образом на небольшую плату, другие интегрируют напрямую на основную печатную плату.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

NVIDIA использовала чипы памяти производства Samsung. Ёмкость составляет 4.096 Мбайт, она разделена на восемь чипов памяти, каждый по 512 Мбайт (4 Гбит). Точная маркировка - K4G41325FC-HC28. Чипы заявлены на 1.750 МГц с напряжением 1,5 В.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

На фотографии можно рассмотреть заднюю часть печатной платы, хорошо виден дополнительный разъём питания, представленный точками пайки. Возможно, NVIDIA таким шагом готовится к новым моделям видеокарт. Или открывает возможность для внесения дополнительных модификаций своим партнёрам, либо разъём необходим для отладки видеокарты.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

NVIDIA почти полностью перенесла эталонный кулер с семейства GTX 700. На радиаторе предусмотрены места для чипов памяти, на которые нанесены теплопроводящие прокладки. GPU контактирует с медной пластиной. За ней скрыты три тепловые трубки с водой высокой степени очистки, которые обеспечивают улучшенную передачу тепла на рёбра алюминиевого радиатора.


NVIDIA в своей презентации и в фотографиях для прессы показала эталонную версию GeForce GTX 970, но пока неизвестно, появится ли видеокарта в таком виде в рознице. Партнёры уже подготовили видеокарты с собственным дизайном, и в нашу тестовую лабораторию как раз поступила EVGA GeForce GTX 970 Superclocked. Поэтому мы её и протестируем.

GPU-Z-Screenshot der EVGA GeForce GTX 970 Superclocked
Скриншот GPU-Z видеокарты EVGA GeForce GTX 970 Superclocked

Начнём со скриншота GPU-Z видеокарты EVGA GeForce GTX 970 Superclocked. Как и в случае GeForce GTX 980, утилита распознает не всю информацию о видеокарте. Но основные технические спецификации вполне соответствуют теории. EVGA для GeForce GTX 970 Superclocked выбрала намного более высокие частоты, чем заявила NVIDIA. Базовая частота, например, была увеличена с 1.050 МГц до 1.165 МГц. Минимальную планку Boost EVGA подняла до 1.317 МГц, хотя NVIDIA указала её всего 1.178 МГц. Память у видеокарты EVGA работает на штатных 1.750 МГц. Так что EVGA разогнала GPU примерно на 11 процентов. Но EVGA GeForce GTX 970 Superclocked использует те же механизмы Boost, разработанные NVIDIA. Потенциально видеокарта может работать на более высоких тактовых частотах из-за модифицированной системы охлаждения. В следующей таблице приведены результаты, которые мы получили на практике.

Сравнение температур и тактовых частот
Игра Температура Частота
The Elder Scrolls V Skyrim 70 °C 1.341 МГц
Company of Heroes 71 °C 1.341 МГц
Grid 2 70 °C 1.341 МГц
Metro: Last Light 70 °C 1.341 МГц
Crysis 3 71 °C 1.341 МГц
Battlefield 4 71 °C 1.341 МГц
Bioshock: Infinite 71 °C 1.341 МГц
Tomb Raider 71 °C 1.341 МГц

С максимальной температурой GPU 71 °C видеокарта GeForce GTX 970 Superclocked остаётся ниже планки целевой температуры, поэтому работает на максимальной частоте Boost. Она в данном случае составляет 1.341 МГц для GPU, так что вы даже получите небольшой прирост по сравнению с минимальной планкой Boost 1.317 МГц, что немало по сравнению с заявленной NVIDIA планкой 1.178 МГц. В наших тестах мы попытались симулировать эталонную версию GeForce GTX 970 с помощью EVGA GeForce GTX 970 Superclocked. Мы уменьшили базовые частоты до уровня эталонной GeForce GTX 970. Конечно, видеокарта не будет соответствовать эталонной модели на 100% из-за разницы в профиле Boost и другой системы охлаждения. Но поскольку в продаже эталонные видеокарты GeForce GTX 970 всё равно вряд ли появятся, нас такой компромисс устроил. Мы также добавим в тесты видеокарту EVGA GeForce GTX 970 Superclocked в её штатном состоянии.

Ниже мы вкратце рассмотрим видеокарту EVGA GeForce GTX 970 Superclocked, она также будет фигурировать в нашем сводном обзоре видеокарт GeForce GTX 970, который мы опубликуем в ближайшем будущем.

EVGA GeForce GTX 970 Superclocked
EVGA GeForce GTX 970 Superclocked

С новым семейством видеокарт GeForce GTX 900 EVGA решила изменить кулер ACX на модель второго поколения, что сразу же видно по маркировке. EVGA использовала для GeForce GTX 970 Superclocked двухслотовый кулер, оснащённый двумя осевыми вентиляторами.

EVGA GeForce GTX 970 Superclocked
EVGA GeForce GTX 970 Superclocked

Вид печатной платы сзади показывает заметно менее сложный дизайн PCB, по крайней мере, если сравнивать с GeForce GTX 980. Четыре из восьми чипов GDDR5 EVGA установила сзади печатной платы, видимо, не найдя им место на лицевой стороне. Связано это с тем, что длина видеокарты составляет всего 24 см, что существенно меньше GeForce GTX 980.

EVGA GeForce GTX 970 Superclocked
EVGA GeForce GTX 970 Superclocked

Два 90-мм вентилятора кулера по сравнению с предыдущей версией ACX 1.0 оснащены улучшенным мотором, который обеспечивает более высокие скорости вращения, но вместе с тем потребляет меньше энергии. Также 11 лопастей крыльчатки имеют другой дизайн, обеспечивающий больший воздушный поток с меньшим уровнем турбулентности. Если верить EVGA, кулер ACX 2.0 работает тише и охлаждает лучше, чем предшественник.

EVGA GeForce GTX 970 Superclocked
EVGA GeForce GTX 970 Superclocked

Два дополнительных 6-контактных разъёма питания видеокарты EVGA размещены не с краю печатной платы, а сдвинуты примерно на треть вперёд. Вместе со слотом PCI Express видеокарта может потреблять от блока питания до 225 Вт мощности. Учитывая тепловой пакет (TDP) 145 Вт у эталонной видеокарты, мы получаем запас по мощности даже с учётом заводского разгона.

EVGA GeForce GTX 970 Superclocked
EVGA GeForce GTX 970 Superclocked

Как и в случае видеокарты GeForce GTX 980, у "младшей" модели Maxwell было решено не отказываться от двух разъёмов SLI. Как можно видеть по маркировке чипов памяти в левой части фотографии, EVGA использовала те же чипы памяти, что и NVIDIA для эталонной версии GeForce GTX 980.

EVGA GeForce GTX 970 Superclocked
EVGA GeForce GTX 970 Superclocked

Как мы уже упоминали, у новых видеокарт NVIDIA предусмотрела иную конфигурацию видеовыходов на слотовой заглушке. EVGA осталась привержена старой схеме, поэтому мы получаем два двухканальных выхода DVI (по одному DVI-I и DVI-D), а также по одному HDMI 2.0 и DisplayPort 1.2.


Для проведения тестирования мы обновили нашу тестовую систему, а также и поколение драйверов. Процессор Intel Core i7-3960X был разогнан со штатной частоты 3,2 ГГц до 3,9 ГГц, чтобы максимально устранить "узкое место" по производительности CPU. Мы использовали следующие компоненты:

 

Тестовая конфигурация
Процессор Intel Core i7-3960X 3,3 ГГц, разгон до 3,9 ГГц
Материнская плата ASUS P9X79 Deluxe
Оперативная память ADATA XPG Gaming Series Low Voltage 4x 2 Гбайт PC3-12800U CL 9-9-9-24
Накопитель ADATA S510 SSD 60 Гбайт
Блок питания Seasonic Platinum Series 1000 Вт
Операционная система Windows 8 Pro 64 Bit
Видеокарты
NVIDIA NVIDIA GeForce GTX 980 (1.126/1.216/1.750 MHz, 4.096 MB)
  NVIDIA GeForce GTX 970 (1.050/1.178/1.750 MHz, 4.096 MB)
  NVIDIA GeForce GTX 780 Ti (876/928/1.750 MHz, 3.072 MB)
  NVIDIA GeForce GTX Titan (837/786/1.502 MHz, 6.144 MB)
  NVIDIA GeForce GTX 780 (863/902/1.502 MHz, 3.072 MB)
  NVIDIA GeForce GTX 770 (1.046/1.085/1.753 MHz, 2.048/4.096 MB)
  NVIDIA GeForce GTX 760 (980/1.033/1.502 MHz, 2.048 MB)
  NVIDIA GeForce GTX 750 Ti (1.020/1.085/1.350 MHz, 2.048 MB)
  NVIDIA GeForce GTX 750 (1.020/1.085/1.250 MHz, 1.024 MB)
  NVIDIA GeForce GTX 690 (915/1.502 MHz, 4.096 MB)
  NVIDIA GeForce GTX 680 (1.006/1.502 MHz, 2.048 MB)
  NVIDIA GeForce GTX 670 (915/1.502 MHz, 2.048 MB)
  NVIDIA GeForce GTX 660 Ti (915/1.502 MHz, 2.048 MB)
  NVIDIA GeForce GTX 660 (1.058/1.250 MHz, 2.048 MB)
  NVIDIA GeForce GTX 650 Ti Boost (980/1.502 MHz, 2.048 MB)
  NVIDIA GeForce GTX 650 Ti (925/1.350 MHz 2.048 MB)
  NVIDIA GeForce GTX 650 (1.058/1.250 MHz, 1.024/2.048 MB)
  NVIDIA GeForce GTX 590 (608/1.215/854 MHz, 3.072 MB)
  NVIDIA GeForce GTX 580 (772/1.544/1.000 MHz, 1.536 MB)
  NVIDIA GeForce GTX 570 (732/1.464/950 MHz, 1.280MB)
  NVIDIA GeForce GTX 560 Ti 448 Cores (732/1.464/950 MHz, 1.280 MB)
  NVIDIA GeForce GTX 560 Ti (820/1.640/1.000 MHz, 1.024 MB)
  NVIDIA GeForce GTX 560 (810/1.620/1.002 MHz, 1.024 MB) 
  NVIDIA GeForce GTX 550 Ti (900/1.800/1.026 MHz, 1.024 MB)
AMD AMD Radeon R9 290X (1.000/1.250 MHz, 4.096 MB)
  AMD Radeon R9 290 (947/1.500 MHz, 4096 MB)
  AMD Radeon R9 280X (1.000/1.500 MHz, 3.072 MB)
  AMD Radeon R9 270X (1.000/1.400 MHz, 2.048/4.096 MB)
  AMD Radeon R7 260X (1.100/1.625 MHz, 2.048 MB)
  AMD Radeon R7 265 (925/1.400 MHz, 2.048 MB)
  AMD Radeon R7 260 (1.000/1.500 MHz, 1.024 MB)
  AMD Radeon HD 7990 (950/1.000/1.500 MHZ, 6.144 MB)
  AMD Radeon HD 7970 GHz Edition (1.000/1.050/1.500 MHz, 3.072 MB)
  AMD Radeon HD 7970 (925/925/1.375 MHz, 3.072 MB)
  AMD Radeon HD 7950 (800/800/1.250 MHz, 3.072 MB)
  AMD Radeon HD 7870 (1.000/1.000/1.200 MHz, 2.048 MB)
  AMD Radeon HD 7850 (860/860/1.200 MHz, 2.048 MB)
  AMD Radeon HD 7790 (1.075/1.075/1.500 MHz, 1.024/2.048 MB)
  AMD Radeon HD 7770 (1.000/1.000/1.125 MHz, 1.024 MB)
  AMD Radeon HD 7750 (800/800/1.125 MHz, 1.024 MB)
  AMD Radeon HD 6990 (830/830/1.250 MHz, 4.096 MB)
  AMD Radeon HD 6970 (880/880/1.375 MHz, 2.048 MB)
  AMD Radeon HD 6950 (800/800/1.200 MHz, 2.048 MB)
  AMD Radeon HD 6870 (900/900/1.050 MHz, 1.024 MB)
  AMD Radeon HD 6850 (775/775/1.000 MHz, 1.024 MB)
  AMD Radeon HD 6790 (840/840/1.050 MHz, 1.024 MB)
  AMD Radeon HD 6770 (850/850/1.200 MHz, 1.024 MB)
Драйвер
NVIDIA GeForce 344.07
AMD Catalyst 14.7 Beta

Мы выражаем благодарность ASUS, Intel, Thermaltake и Seasonic за предоставленные компоненты.

 

Настройки драйверов NVIDIA:

Текстурные настройки AMD:


Перейдём к оценке уровня шума, энергопотребления и температуры GeForce GTX 980 и GeForce GTX 970.

Уровень шума

Бездействие

в дБ(A)
Меньше - лучше

Конечно, сравнение уровня шума здесь не совсем честное, поскольку GeForce GTX 980 мы тестировали в виде эталонной видеокарты, а GeForce GTX 970 от EVGA опирается на кулер собственной разработки. Поэтому мы не были удивлены низкими показателями 34,6 и 34,7 дБ(A) у видеокарты GeForce GTX 970, которая работала намного тише эталонных видеокарт. Кулер GeForce GTX 980 привёл к уровню шума 37,5 дБ(A), результат находится между GeForce GTX 780 и GTX 780 Ti.

Уровень шума

Нагрузка

в дБ(A)
Меньше - лучше

Под нагрузкой ситуация более интересна. Эталонная видеокарта GeForce GTX 980 показывает себя неплохо, с результатом 48,2 дБ(A) в верхней части списка. Здесь же можно видеть и другие видеокарты из семейства GTX 700 и Titan, оснащённые схожей системой охлаждения. Мы также заметили незначительный свист дросселей.

У видеокарты EVGA GeForce GTX 970 Superclocked, с помощью которой мы симулировали эталонную версию GeForce GTX 970, свиста дросселей уже не было. Конечно, из-за системы охлаждения разработки EVGA видеокарта показала меньшие результаты. Мы получили 42,2 и 42,4 дБ(A) под нагрузкой.

Температура

Бездействие

в градусах Цельсия
Меньше - лучше

Температуры в режиме бездействия не так интересны, поскольку современные видеокарты выделяют считанные ватты энергии, с их отведением справится даже самый простой кулер. У двух видеокарт Maxwell мы получили температуры между 32 и 34 °C. Но какие результаты покажут видеокарты под нагрузкой?

Температура

Нагрузка

в градусах Цельсия
Меньше - лучше

Под нагрузкой хорошо видно, что видеокарта GeForce GTX 980 работает вплотную к планке целевой температуры с эталонным кулером, что ограничивает возможности GPU Boost – видеокарта пытается с помощью увеличения скорости вентилятора и снижения тактовых частот и напряжения опустить температуру ниже целевой планки. Видеокарта NVIDIA GeForce GTX 980 показывает под нагрузкой целевую температуру 80 °C. Поэтому видеокарта GeForce GTX 980 не может обеспечить даже минимальную планку Boost, снижая частоты ещё ниже, что сказывается на производительности.

Несколько иную ситуацию мы получили в случае видеокарты GeForce GTX 970 от EVGA. Видеокарта не добирается до целевой температуры, мы получаем, максимум, 71 °C. Это приводит к тому, что видеокарта поддерживает на постоянной основе максимальную частоту Boost. Было бы интересно посмотреть на результаты GeForce GTX 970 с эталонной системой охлаждения, сможет ли она справиться с урезанным GPU Maxwell, охлаждая его ниже целевой температуры? Но поскольку видеокарты с эталонным кулером вряд ли поступят в розничную продажу, результаты EVGA имеют большее практическое значение для потенциальных покупателей.

Энергопотребление (вся система)

Бездействие

в Вт
Меньше - лучше

По энергопотреблению в режиме бездействия можно сказать то же самое, что и по поводу температуры: современные GPU и видеокарты потребляют очень мало энергии по сравнению с другими компонентами системы. Другие компоненты оказывают большее влияние на результаты, поэтому в режиме бездействия мы получаем довольно тесное расположение видеокарт относительно друг друга. Небольшой разброс можно списать на погрешности измерения.

Энергопотребление (вся система)

Нагрузка

в Вт
Меньше - лучше

NVIDIA для второго поколения GPU Maxwell обещала существенный прогресс по эффективности, то есть соотношению производительности на ватт, что должно проявить себя в тестах энергопотребления. Как видим, NVIDIA сдержала свои обещания, видеокарта GeForce GTX 980 потребляет примерно на 40 Вт меньше энергии, чем GeForce GTX 780 Ti. Мы получили результат 368,8 Вт, одна из самых быстрых видеокарт с одним GPU расположилась в середине списка. Отличный результат, который можно только приветствовать.

То же самое касается GeForce GTX 970 и варианта EVGA. Здесь мы получили энергопотребление всей системы 338,7 для эталонной GeForce GTX 970 и 353,9 для EVGA GeForce GTX 970 Superclocked. По крайней мере, на эталонных тактовых частотах мы получаем уровень GeForce GTX 770. Теперь будет интересно посмотреть на результаты производительности, после чего соотнести её с энергопотреблением. Но мы ожидаем такого же результата, что и в случае видеокарт Maxwell первого поколения (GeForce GTX 750 и GTX 750 Ti), то есть существенно снижение энергопотребления вместе с увеличением производительности.


Новый тест Futuremark 3DMark позволяет сравнивать разные устройства, от смартфонов до high-end ПК. В тесте предоставляются три пресета, которые охватывают все сферы производительности благодаря изменяемым настройкам. Конечно, в тесте используются такие технологии, как тесселяция, глубина поля резкости, объемное освещение и DirectCompute. Тестовый прогон Firestrike Extreme должен поставить даже high-end видеокарты "на колени". Скачать тест Futuremarks 3DMark можно в соответствующем разделе сайта.

Futuremark 3DMark

Ice Storm

Баллы Futuremark
Больше - лучше

Futuremark 3DMark

Cloud Gate

Баллы Futuremark
Больше - лучше

Futuremark 3DMark

Fire Strike

Баллы Futuremark
Больше - лучше

Futuremark 3DMark

Fire Strike Extreme

Баллы Futuremark
Больше - лучше


AMD и NVIDIA всегда подчёркивают вычислительную производительность своих GPU. И в дополнение к многочисленным движкам с поддержкой OpenCL, мы также решили оценить вычислительную производительность отдельно. Мы взяли тест LuxMark 2.0, тестовую сцену "Sala" с использованием RayTracing, результат теста выводится в сэмплах в секунду. Скачать LuxMark 2.0 можно по следующей ссылке.

luxmark-1-rsScreenshot zu Luxmark 2.0

Screenshot zu Luxmark 2.0Screenshot zu Luxmark 2.0

Luxmark 2.0

Sala

Баллы
Больше - лучше


С помощью теста ComputeMark мы пытались более точно оценить вычислительную производительность GPU. Тест основан на автоматическом выполнении нескольких вычислительных сценариев, которые накладывают различные требования к "железу". Вычислительная мощность тесту предоставляется через API DirectX 11 Compute. Среди всего прочего тест включает сценарий отслеживания лучей (RayTracing). Скачать ComputeMark можно на сайте разработчика.

Screenshot zu ComputeMark Screenshot zu ComputeMark
Screenshot zu ComputeMark Screenshot zu ComputeMark

ComputeMark

Fluid 2D

Баллы
Больше - лучше

ComputeMark

Fluid 3D

Баллы
Больше - лучше

ComputeMark

Mandel Vektor

Баллы
Больше - лучше

ComputeMark

Mandel Skalar

Баллы
Больше - лучше

ComputeMark

Ray Tracing

Баллы
Больше - лучше


Действие пятой игры в семействе The Elder Scrolls разворачивается в провинции Skyrim. Сюжет игры построен вокруг возвращения драконов, что было предсказано в древних свитках ("Elder Scrolls"). Геймер играет роль "довакина", то есть персонажа с телом человека и душой дракона. В игре вам предстоит сражаться не только с обычными тварями, но и с драконами. Добавим к этому реалистичные улицы и захватывающие дух пейзажи, уходящие в горизонт. Благодаря отличной детализации растительности и значительной дальности видимости Skyrim может нагрузить любую видеокарту.

The Elder Scrolls V: Skyrim

1.920 x 1.080 1xAA 1xAF

175.1 XX


118 XX
174.6 XX


122 XX
172.8 XX


115 XX
172.4 XX


113 XX
169.8 XX


107 XX
169.6 XX


113 XX
168.8 XX


114 XX
162.8 XX


110 XX
159.7 XX


113 XX
158.4 XX


105 XX
158.0 XX


106 XX
156.7 XX


116 XX
151.5 XX


109 XX
148.2 XX


105 XX
147.9 XX


114 XX
Кадры в секунду
Больше - лучше

The Elder Scrolls V: Skyrim

1.920 x 1.080 8xAA+FXAA 16xAF

160.7 XX


111 XX
160.0 XX


106 XX
157.4 XX


117 XX
156.4 XX


113 XX
153.7 XX


114 XX
150.8 XX


102 XX
145.7 XX


113 XX
145.3 XX


115 XX
144.1 XX


106 XX
135.1 XX


112 XX
120.7 XX


111 XX
119.9 XX


105 XX
116.1 XX


103 XX
115.8 XX


106 XX
110.6 XX


102 XX
Кадры в секунду
Больше - лучше

The Elder Scrolls V: Skyrim

2.560 x 1.600 1xAA 1xAF

170.5 XX


119 XX
167.3 XX


113 XX
165.9 XX


110 XX
163.2 XX


107 XX
160.9 XX


118 XX
160.0 XX


113 XX
157.0 XX


105 XX
149.6 XX


110 XX
147.6 XX


114 XX
146.8 XX


108 XX
132.1 XX


112 XX
127.1 XX


115 XX
126.4 XX


109 XX
119.3 XX


108 XX
116.2 XX


105 XX
Кадры в секунду
Больше - лучше

The Elder Scrolls V: Skyrim

2.560 x 1.600 8xAA+FXAA 16xAF

156.3 XX


103 XX
142.9 XX


102 XX
140.8 XX


115 XX
122.6 XX


109 XX
121.9 XX


112 XX
117.5 XX


108 XX
113.6 XX


100 XX
108.1 XX


98 XX
106.9 XX


98 XX
99.4 XX


91 XX
86.6 XX


78 XX
82.2 XX


74 XX
81.5 XX


74 XX
77.9 XX


70 XX
75.1 XX


68 XX
Кадры в секунду
Больше - лучше

The Elder Scrolls V: Skyrim

3.840 x 2.160 1xAA 1xAF

151.9 XX


101 XX
136.3 XX


102 XX
127.8 XX


117 XX
122.8 XX


113 XX
117.4 XX


111 XX
115.8 XX


104 XX
107.7 XX


99 XX
84.5 XX


77 XX
84.2 XX


61 XX
74.0 XX


65 XX
Кадры в секунду
Больше - лучше

The Elder Scrolls V: Skyrim

3.840 x 2.160 8xAA+FXAA 16xAF

Кадры в секунду
Больше - лучше


С игрой Crysis 3 мы получили нового технологического лидера. Игра поддерживает только видеокарты класса DirectX 11, так что Crytek, разработчик Crysis 3, однозначно задал направление развития. В игре используются тесселяция и мощные алгоритмы пост-обработки для сглаживания, способные "поставить на колени" даже новейшие видеокарты.

Crysis 3

1.920 x 1.080 1xAA 1xAF

Кадры в секунду
Больше - лучше

Crysis 3

1.920 x 1.080 4xMSAA 16xAF

Кадры в секунду
Больше - лучше

Crysis 3

2.560 x 1.600 1xAA 1xAF

Кадры в секунду
Больше - лучше

Crysis 3

2.560 x 1.600 4xMSAA 16xAF

Кадры в секунду
Больше - лучше

Crysis 3

3.840 x 2.160 1xAA 1xAF

Кадры в секунду
Больше - лучше

Crysis 3

3.840 x 2.160 4xMSAA 16xAF

Кадры в секунду
Больше - лучше


Среди горячих новинок 2013 года почетное место занимает Bioshock Infinite. Игра радует не только захватывающим сюжетом, но и технологическими инновациями. Движок игры может задействовать практически все современные эффекты DirectX 11, в игре они есть. Так что мы решили добавить Bioshock Infinite к нашему тестовому пакету.

BioShock Infinite

1.920 x 1.080 DirectX 10 High

200.1 XX


30 XX
180.5 XX


22 XX
170.5 XX


21 XX
158.6 XX


20 XX
155.1 XX


10 XX
154.7 XX


17 XX
152.8 XX


18 XX
151.9 XX


23 XX
146.7 XX


19 XX
140.2 XX


30 XX
127.1 XX


18 XX
120.4 XX


19 XX
115.5 XX


30 XX
112.1 XX


18 XX
101.7 XX


30 XX
Кадры в секунду
Больше - лучше

BioShock Infinite

1.920 x 1.080 DirectX 11 Ultra

Кадры в секунду
Больше - лучше

BioShock Infinite

2.560 x 1.600 DirectX 10 High

Кадры в секунду
Больше - лучше

BioShock Infinite

2.560 x 1.600 DirectX 11 Ultra

Кадры в секунду
Больше - лучше
 

BioShock Infinite

3.840 x 2.160 DirectX 10 High

Кадры в секунду
Больше - лучше

BioShock Infinite

3.840 x 2.160 DirectX 11 Ultra

Кадры в секунду
Больше - лучше


С игрой Battlefield 4 разработчик DICE и издатель EA продолжили успешную линию предшественника: в игре есть небольшая однопользовательская кампания, но суть игры кроется в масштабных многопользовательских сражениях. На крупных картах могут одновременно сражаться до 63 игроков, каждый в одном из трёх классов. В игре доступны десятки видов техники на суше, в воздухе и в воде. Визуально игра Battlefield 4 тоже поставила новую планку, поэтому она предсказуемо вошла в нашу тестовую методику.

Battlefield 4

1.920 x 1.080 1xAA 1xAF

170.9 XX


141 XX
136.4 XX


111 XX
123.1 XX


87 XX
111.6 XX


81 XX
103.8 XX


75 XX
103.7 XX


69 XX
98.6 XX


65 XX
95.7 XX


75 XX
95.1 XX


72 XX
86.4 XX


60 XX
78.3 XX


60 XX
75.0 XX


55 XX
71.6 XX


53 XX
69.9 XX


54 XX
64.6 XX


49 XX
Кадры в секунду
Больше - лучше

Battlefield 4

1.920 x 1.080 4xMSAA 16xAF

Кадры в секунду
Больше - лучше

Battlefield 4

2.560 x 1.600 1xAA 1xAF

Кадры в секунду
Больше - лучше

Battlefield 4

2.560 x 1.600 4xMSAA 16xAF

Кадры в секунду
Больше - лучше

Battlefield 4

3.840 x 2.160 1xAA 1xAF

Кадры в секунду
Больше - лучше

Battlefield 4

3.840 x 2.160 4xMSAA 16xAF

Кадры в секунду
Больше - лучше


Мы провели тесты на новой стратегии в реальном времени Company of Heroes 2, разработанной Relic Entertainment. Действие игры разворачивается на полях сражений Второй мировой войны, за графику отвечает собственный движок Essence 3.0. Графика в игре не самая впечатляющая, но даже последним high-end видеокартам не всегда удаётся выдавать плавную частоту кадров. А некоторые комбинации разрешения и сглаживания могут "поставить на колени" даже системы multi-GPU.

 

Company of Heroes 2

1.920 x 1.080 без AA 1xAF

Кадры в секунду
Больше - лучше

Company of Heroes 2

1.920 x 1.080 AA high 16xAF

Кадры в секунду
Больше - лучше

Company of Heroes 2

2.560 x 1.600 без AA 1xAF

Кадры в секунду
Больше - лучше

Company of Heroes 2

2.560 x 1.600 AA high 16xAF

Кадры в секунду
Больше - лучше
 

Company of Heroes 2

3.840 x 2.160 без AA 1xAF

Кадры в секунду
Больше - лучше

Company of Heroes 2

3.840 x 2.160 AA high 16xAF

Кадры в секунду
Больше - лучше


Metro: Last Light представляет собой продолжение Metro 2033, действие вновь происходит в пост-апокалиптическом будущем в московском метро. Мир Metro 2033 был разработан российским писателем Дмитрием Глуховским. Игра базируется на собственном движке A4 Engine, который поддерживает современные функции DirectX 11. Тесселяция, частицы и эффекты освещения способствуют созданию особой атмосферы, которая немало нагружает GPU.

Metro: Last Light

1.920 x 1.080 без AA 1xAF

Кадры в секунду
Больше - лучше

Metro: Last Light

1.920 x 1.080 1xSSAA 16xAF

Кадры в секунду
Больше - лучше

Metro: Last Light

2.560 x 1.600 без AA 1xAF

Кадры в секунду
Больше - лучше

Metro: Last Light

2.560 x 1.600 1xSSAA 16xAF

Кадры в секунду
Больше - лучше

Metro: Last Light

3.840 x 2.160 без AA 1xAF

Кадры в секунду
Больше - лучше

Metro: Last Light

3.840 x 2.160 1xSSAA 16xAF

Кадры в секунду
Больше - лучше


Игра Tomb Raider с Ларой Крофт в главной роли была возрождена в 2013 году. В отличие от предыдущих игр семейства, Лара Крофт превратилась из искателя приключений в начинающего археолога. Действие игры происходит на заброшенном острове в обстановке, полной опасностей. Движок игры Crystal Engine разработки Square Enix поддерживает последние эффекты DirectX 11, так что даже новейшим high-end видеокартам придётся несладко.

 

Tomb Raider

1.920 x 1.080 FXAA 1xAF

239.9 XX


170 XX
175.3 XX


130 XX
153 XX


118 XX
135.5 XX


108 XX
132.2 XX


104 XX
124.9 XX


96 XX
120.0 XX


98 XX
118.2 XX


92 XX
111.6 XX


95 XX
105.0 XX


88 XX
96.1 XX


76 XX
87.8 XX


69 XX
83.1 XX


66 XX
82.4 XX


66 XX
73.9 XX


58 XX
Кадры в секунду
Больше - лучше

Tomb Raider

1.920 x 1.080 2xSSAA 16xAF

Кадры в секунду
Больше - лучше

Tomb Raider

2.560 x 1.600 FXAA 1xAF

Кадры в секунду
Больше - лучше

Tomb Raider

2.560 x 1.600 2xSSAA 16xAF

Кадры в секунду
Больше - лучше

Tomb Raider

3.840 x 2.160 FXAA 1xAF

Кадры в секунду
Больше - лучше

Tomb Raider

3.840 x 2.160 2xSSAA 16xAF

Кадры в секунду
Больше - лучше


Игра Grid 2 представляет собой старые добрые гонки от разработчика Codemasters. Кросс-платформенная игра базируется на движке EGO 3.0. Он является дальнейшим развитием игрового движка Neon, который использовался в Colin McRae. Как и для любой гонки, здесь важна плавная игра с максимально высокой частотой кадров.

Grid 2

1.920 x 1.080 4xMSAA 16xAF

211.3 XX


154 XX
161.5 XX


109 XX
144.3 XX


96 XX
131.1 XX


91 XX
124.8 XX


85 XX
121.9 XX


85 XX
113.4 XX


79 XX
112.9 XX


77 XX
101.4 XX


69 XX
92.9 XX


65 XX
86.7 XX


57 XX
86.2 XX


60 XX
85.5 XX


58 XX
80.7 XX


56 XX
75.9 XX


51 XX
Кадры в секунду
Больше - лучше

Grid 2

2.560 x 1.600 4xMSAA 16xAF

Кадры в секунду
Больше - лучше

Grid 2

3.840 x 2.160 4xMSAA 16xAF

Кадры в секунду
Больше - лучше


Конечно, мы попытались проверить потенциал разгона обеих видеокарт, GeForce GTX 980 в эталонной версии и GeForce GTX 970 от EVGA. Для обеих видеокарт мы подняли планку по энергопотреблению Power Limit, но оставили целевые планки температуры. Также мы выставили скорость вентиляторов на более высокий уровень или на 100 процентов. Затем мы увеличивали тактовые частоты GPU и памяти, проводя тесты на каждом значении, пока не теряли стабильность работы.

EVGA PrecisionX 16
EVGA PrecisionX 16

Для видеокарты GeForce GTX 980 мы смогли увеличить базовую частоту с 1.127 МГц до 1.205 МГц, что в итоге дало планку Boost 1.249 МГц. Она соответствует приросту примерно на 7 процентов. На практике частота Boost была ещё выше – 1.348 МГц, что существенно лучше 1.151 МГц без разгона. То есть мы получили увеличение примерно на 17 процентов. Память с частоты 1.750 МГц мы смогли разогнать до 1.850 МГц, то есть на 6 процентов. Но разгон привёл к значительному увеличению энергопотребления видеокарты, а также к повышению уровня шума, который уже нельзя было назвать терпимым.

EVGA уже разогнала видеокарту GeForce GTX 970 Superclocked довольно прилично, базовая частота была увеличена с 1.050 МГц до 1.165 МГц. Частота Boost при этом была повышена с 1.178 МГц до 1.317 МГц. С помощью ручного разгона мы незначительно улучшили результаты. Мы смогли увеличить базовую частоту и Boost на 65 МГц каждую, в результате GPU работал под нагрузкой на 1.395 МГц, что соответствует разгону на 4 процента. Память, как и в случае GeForce GTX 980, мы смогли разогнать до 1.850 МГц.

Разгон привел к следующим результатам по производительности:

Разгон Futuremark 3DMark

Fire Strike Extreme

Баллы Futuremark
Больше - лучше

Разгон Battlefield 4

2.560 x 1.600 4xMSAA 16xAF

Кадры в секунду
Больше - лучше

Разгон Crysis 3

2.560 x 1.600 4xMSAA 16xAF

Кадры в секунду
Больше - лучше

Разгон энергопотребление

Нагрузка

в Вт
Меньше - лучше

Разгон Температура

Нагрузка

в градусах Цельсия
Меньше - лучше

Разгон Уровень шума

Нагрузка

дБ(A)
Меньше - лучше


Даунсемплинг не требует серьёзных ресурсов, поэтому нам было интересно посмотреть на производительность GeForce GTX 980 с разными настройками DSR и разрешениями. Сглаживание фильтра Гаусса мы оставили на штатном уровне 33 процента.

The Elder Scrolls V: Skyrim

1.920 x 1.080 DSR 8xAA+FXAA 16xAF

Кадры в секунду
Больше - лучше

The Elder Scrolls V: Skyrim

2.560 x 1.600 DSR 8xAA+FXAA 16xAF

Кадры в секунду
Больше - лучше

Battlefield 4

1.920 x 1.080 DSR 1xAA 1xAF

Кадры в секунду
Больше - лучше

Battlefield 4

2.560 x 1.600 DSR 1xAA 1xAF

Кадры в секунду
Больше - лучше

Tomb Raider

1.920 x 1.080 DSR 1xAA 1xAF

Кадры в секунду
Больше - лучше

Tomb Raider

2.560 x 1.600 DSR 1xAA 1xAF

Кадры в секунду
Больше - лучше

Влияние DSR на качество картинки нельзя оценить по скриншотам, поскольку они берутся не в той части конвейера рендеринга. Но благодаря системе FCAT мы можем захватить картинку на видеовыходе в полном разрешении. Мы использовали несколько примеров Assassins Creed IV: Black Flag, Battlefield 4 и Watch_Dogs, чтобы вы смогли получить представление о даунсемплинге и фильтрации. При нажатии на каждую картинку вы получите полноразмерный кадр (около 5 Мбайт) в формате PNG без потерь.

Assassins Creed IVAssassins Creed IV

Assassins Creed IV: Black Flag с FXAA (слева) и DSR+FXAA (справа)

Assassins Creed IVAssassins Creed IV

Assassins Creed IV: Black Flag с 4xMSAA (слева) и DSR+4xMSAA (справа)

Battlefield 4Battlefield 4

Battlefield 4 с 4xMSAA (слева) и DSR+4xMSAA (справа)

Watch DogsWatch Dogs

Watch Dogs с FXAA (слева) и DSR+FXAA (справа)

Watch DogsWatch Dogs

Watch Dogs с 4xMSAA (слева) и DSR+4xMSAA (справа)

Разницу между DRS/даунсемплингом и обычным режимом легче всего увидеть по растительности. Деревья и трава выводятся более детально, тонкие стебли не исчезают. Это хорошо видно и в Assassins Creed IV, и в Battlefield 4 с Watch_Dogs. На скриншотах Battlefield 4 обратите внимание на лопасти вертолёта. В Battlefield 4 пользовательский интерфейс масштабируется некорректно и выводится слишком мелким. Об этом тоже следует помнить, если вы решите воспользоваться DSR.


Снижение ширины шины памяти с 384 бит у GeForce GTX 780 до 256 бит у GeForce GTX 980, не говоря уже о 512 бит у видеокарт AMD, кажется шагом назад. Но ситуация несколько улучшается благодаря сжатию памяти. Для AMD и NVIDIA сегодня становится всё труднее оснащать видеокарты максимально быстрой и широкой шиной памяти. 256-битный интерфейс GeForce GTX 980 кажется ограниченным, но мы решили провести ряд тестов. Мы изменяли частоты памяти и GPU, чтобы найти возможные зависимости.

Crysis 3

2.560 x 1.600 4xMSAA 16xAF

Кадры в секунду
Больше - лучше

Tomb Raider

2.560 x 1.600 2xSSAA 16xAF

Кадры в секунду
Больше - лучше

При увеличении тактовых частот GPU и памяти мы получаем прирост производительности. Но прямой зависимости от медленной памяти мы не видим, разница между разными частотами памяти при одинаковой частоте GPU слишком мала. Чтобы оценить, насколько "узким местом" является подсистема памяти, нам требуется провести измерения пропускной способности памяти, что не так просто сделать на уровне пользователя. Взаимодействие между видеопамятью и GPU выполняется аппаратно, и "влезть" между ними для измерения не представляется возможным.


Две видеокарты на архитектуре Maxwell первого поколения, которые появились в феврале, уже хорошо показали, чего можно ожидать от второго поколения. NVIDIA удалость фактически удвоить соотношение производительности на ватт, и даже самые смелые предположения были далеки до того, что мы получили сегодня с GeForce GTX 980. NVIDIA смогла уменьшить энергопотребление по спецификациям до уровня 165 или 145 Вт, что соответствует видеокартам для массового рынка, но при этом по производительности мы получаем уровень high-end моделей Radeon R9 290X и GeForce GTX 780 Ti. Во многих тестах эти видеокарты остаются позади, хотя победу GeForce GTX 980 нельзя назвать всегда однозначной. Но можно смело утверждать, что GeForce GTX 980 сегодня является самой быстрой видеокартой с одним GPU на рынке.

В архитектуре Maxwell произошли многочисленные улучшения, особенно по сравнению с архитектурой Kepler, нацеленные на улучшение эффективности энергопотребления. Меньшая ширина шины памяти Maxwell компенсируется интеллектуальным методом сжатия. Но на практике всё же возникают ситуации, когда 256-битная шина памяти оказывается слишком узкой. Также вам придётся довольствоваться 4 Гбайт встроенной памяти, что вызывало много критических замечаний у high-end видеокарт семейства GTX 700. Кроме повышения эффективности энергопотребления, архитектура Maxwell добавляет новую технологию Dynamic Super Resolution, обеспечивающую заметное улучшение качества картинки. Чуть позднее мы проведем анализ алгоритма сглаживания Multiframe Sampled Anti Aliasing, который обеспечивает такое же качество картинки при существенной экономии вычислительной производительности. В этом году, скорее всего, поддержка новых технологий не сыграет решающей роли, но хотелось бы упомянуть Voxel Global Illumination, DirectX 12, новый API GameWorks для более реалистичной симуляции растительности и жидкостей, а также лучшую поддержку Oculus Rift.

У видеокарт Maxwell есть и другие интересные функции. К ним относится поддержка HDMI 2.0, дисплеи соответствующего стандарта должны появиться в ближайшем будущем. Также NVIDIA позволяет подключать больше мониторов в высоком разрешении. Но где GM204 не может конкурировать с архитектурой Kepler и GK110, так это по производительности вычислений с двойной точностью. Но данный вопрос интересен ограниченному числу пользователей.

NVIDIA GeForce GTX 980 mit Maxwell-GPU
NVIDIA GeForce GTX 980 на GPU Maxwell

При оценке GeForce GTX 980 следует учитывать не только производительность, но и обещанные улучшения по эффективности энергопотребления – они будут заметны пользователю. Всё же GeForce GTX 980 потребляет примерно на 40 Вт меньше энергии, чем GeForce GTX 780 Ti. По сравнению с Radeon R9 290X экономия составляет уже 64 Вт. Снижение энергопотребления и увеличение производительности желательны при переходе на каждое новое поколение, но так бывает, к сожалению, далеко не всегда. На этот раз NVIDIA удалось осуществить задуманное даже на устаревающем техпроцессе.

Но не всё так гладко, как хотелось бы. У GeForce GTX 980 слабым местом оказался эталонный кулер. После небольшого периода прогрева, температура GPU поднимается до критической отметки для механизма Boost, и вместо обещанной минимальной планки 1.216 МГц мы получаем всего 1.151 МГц – несмотря на хорошую вентиляцию в корпусе. Видеокарта GeForce GTX 980 освобождается от данного ограничения только при повышении целевой температуры или увеличении скорости вращения вентилятора. Но даже на штатных настройках вентилятор уже нельзя назвать тихим, да и у нашего тестового образца мы обнаружили свист дросселей. Скорее всего, собственные дизайны видеокарт партнёров NVIDIA с кулерами собственной разработки смогут раскрыть потенциал GeForce GTX 980 в полной мере.

Наконец, остаётся вопрос цены. NVIDIA указывает рекомендованную цену 539 евро или 23.990 руб. в России. В магазинах мы будем встречать разные цены, для эталонных видеокарт они будут ниже, для моделей на альтернативном дизайне производителей – выше. На цене будет сказываться система охлаждения и уровень заводского разгона. Но всё это – тема для обсуждения в ближайшие дни.

Преимущества NVIDIA GeForce GTX 980:

Недостатки NVIDIA GeForce GTX 980:

За все проявленные качества мы присуждаем видеокарте GeForce GTX 980 на втором поколении архитектуры Maxwell нашу награду "Отличное железо".

Несколько иной будет наша оценка видеокарты GeForce GTX 970 и образца от EVGA. По сравнению с GeForce GTX 980 у неё заметно меньшее количество потоковых процессоров и других компонентов, особенно это касается высокого разрешения. Впрочем, сказанное верно только при сравнении с GeForce GTX 980, поскольку GeForce GTX 970 в тестах легко конкурирует с GeForce GTX 780 и Radeon R9 290. Если вас устраивает производитель EVGA с высоким уровнем заводского разгона, то GeForce GTX 970 Superclocked обходит указанные модели и атакует самую быструю видеокарту с одним GPU.

EVGA GeForce GTX 970 Superclocked
EVGA GeForce GTX 970 Superclocked

Причина кроется в отличном кулере ACX 2.0 производства EVGA. Он обеспечивает температуру GPU в приемлемых границах, позволяющих видеокарте активировать полную частоту Boost. По сравнению с эталонной версией GeForce GTX 980 видеокарта порадовала снижением уровня шума. Но всё же окончательные выводы здесь следует делать после сравнительного тестирования видеокарт GeForce GTX 980 и GTX 970 с альтернативным дизайном и другими системами охлаждения, что мы планируем на ближайшие недели. Видеокарта GeForce GTX 970 по энергопотреблению показала себя не так ярко, как "старшая" модель. Здесь, похоже, потенциал для экономии был ниже.

Цена 319 евро или 14.990 рублей у GeForce GTX 970 привлечёт многих пользователей, особенно с учётом хорошей производительности. Пока что мы не знаем уровня розничных цен, они появятся в ближайшие дни. Также на рынок выйдет множество видеокарт с альтернативными дизайнами производителей.

Ограничения пропускной способности памяти GeForce GTX 970:

NVIDIA признала, что в изначальных спецификациях GeForce GTX 970 было несколько ошибок. Среди всего прочего, только 3,5 Гбайт памяти из 4 Гбайт могут работать с полной скоростью, также у видеокарты оказался меньше объём кэша L2 и число ROP. Если вам интересна более подробная информация, то рекомендуем обратиться к соответствующей статье.

Преимущества EVGA GeForce GTX 970 Superclocked:

Недостатки EVGA GeForce GTX 970 Superclocked:

Что касается цен: GeForce GTX 980 будет продаваться от 539 евро или от 23.990 рублей. Для видеокарты GeForce GTX 970 цена составляет 319 евро или от 14.990 рублей. Вместе с тем NVIDIA снижает рекомендованную цену на GeForce GTX 760 до 219 евро. С объявлением GeForce GTX 980 и GTX 970, NVIDIA завершает производство GeForce GTX 780 Ti, GTX 780 и GTX 770. Эти видеокарты будут продаваться до тех пор, пока не опустеют склады в магазинах.

 

Личное мнение

После представления новой архитектуры Maxwell и первых тестов видеокарт в феврале, перспективы нового поколения GPU NVIDIA показались мне более радужными. В то время ещё не было понятно, сможет ли TSMC дать достаточно хороший техпроцесс 20 нм, но для 28 нм результаты были впечатляющими. Чуть позже появились слухи, что AMD тоже работает над обновлением архитектуры, нацеленной на улучшение соотношения производительности на ватт. К сожалению, Tonga не оправдала наши ожидания в полной мере, поэтому остаётся надеяться на преемника Hawaii.

GeForce GTX 980 мне кажется очень интересной моделью поколения Maxwell. Меньшее энергопотребление при увеличении производительности – чего ещё можно желать? Не менее интересны и дополнительные технологии, реализованные NVIDIA. VXGI, DSR, MFAA и реалистичная физика – всё это может стать движущей силой архитектуры Maxwell в следующем году. Пока не хватает только реализации в играх. Что касается поддержки G-Sync, то видеокарта GeForce GTX 980 с монитором ASUS ROG Swift PG278Q показала себя просто великолепно. Будет интересно взглянуть на результаты видеокарт с альтернативным дизайном и системой охлаждения. (Андрей Шиллинг).