Страница 1: Тест и обзор: NVIDIA GeForce GTX 960 – пять видеокарт для массового рынка

gtx960-logoNVIDIA представила второе поколение "Maxwell" с видеокартами GeForce GTX 980 и GeForce GTX 970, которые заняли high-end сегмент и верхнюю часть массового рынка. Но большинство видеокарт продаются на массовом рынке, где производители получают максимальную прибыль. NVIDIA, конечно же, не желает упускать этот рынок, поэтому для него сегодня представлена видеокарта GeForce GTX 960. Преимущество архитектуры "Maxwell" в случае GeForce GTX 960 предлагается по разумной цене, чтобы его смогли получить максимальное число геймеров. В нашем обзоре мы посмотрим, смогла ли NVIDIA достичь поставленной цели с GeForce GTX 960, сможет ли новая видеокарта изменить расстановку сил на рынке с интенсивной конкуренцией.

Покупатели обычно выигрывают от ориентации производителей на "золотую середину", получая максимум за свои деньги. Видеокарты в десятки тысяч рублей – продукт престижный, они всегда вызывают интерес читателей Hardwareluxx, но основную прибыль производители получают на массовом рынке. AMD долгое время гордилась тем, что выпускает не так много видеокарт, но все они ориентированы на "золотую середину". Хотя за последние годы AMD наводнила рынок множеством продуктов, в которых нелегко разобраться неискушенному пользователю.

В случае NVIDIA ассортимент кажется проще. Сегодня портфолио производителя меняется в сторону архитектуры "Maxwell". Сначала появились видеокарты GeForce GTX 750 и GeForce GTX 750 Ti (тест и обзор) в феврале прошлого года. Они получили обновлённые блоки SMM (Maxwell Streaming Multiprocessor) с другой раскладкой потоковых процессоров, NVIDIA смогла улучшить производительность на потоковый процессор на 135 процентов, а производительность на ватт – в два раза. Все эти теоретические преимущества сказались и на практике, пусть даже прирост производительности оказался не таким большим. И в то время энтузиастов интересовал вопрос: как покажет себя архитектура "Maxwell" в "старших" версиях GPU. Видеокарты GeForce GTX 750 и GeForce GTX 750 Ti были, как нам кажется, пробным шаром, с ними NVIDIA оценивала новую архитектуру и вносила ряд оптимизаций в драйверы

Пять видеокарт GeForce GTX 960
Пять видеокарт GeForce GTX 960

Только в сентябре, то есть полгода спустя, NVIDIA представила видеокарты на втором поколении "Maxwell". Видеокарты GeForce GTX 980 и GeForce GTX 970 (тест и обзор) оказались самыми быстрыми моделями на новой архитектуре. Все подробности приведены в статье по ссылке выше. Там же мы рассмотрели архитектуру нового GPU GM204.

NVIDIA с видеокартой GeForce GTX 960 перенесла преимущества архитектуры "Maxwell" на массовый рынок. Видеокарты получили такие плюсы архитектуры, как сжатие памяти, DSR (Dynamic Super Resolution), MFAA (Multiframe sampled anti-aliasing), VXGI (Voxel Global Illumination) и DirectX 12. Для NVIDIA всё большее значение имеют собственные API GameWorks и PhysX, новостей по этому поводу пока нет, но от их поддержки выиграют и покупатели GeForce GTX 960.

Из новшеств можно отметить улучшенный движок обработки видео, который присутствовал во всех последних GPU NVIDIA. Он снимает часть нагрузки с центрального процессора при обработке видео, но подробнее мы поговорим о движке чуть ниже.

Информация об архитектуре

Позвольте начать с обсуждения архитектуры новых GPU, а также сравнения с предполагаемыми основными конкурентами от AMD. На эту роль позиционируются видеокарты AMD Radeon R9 280 и R9 285. В разделе тестов как обычно представлено сравнение с большим числом видеокарт.

GeForce GTX 960 в сравнении
Модель GeForce GTX 960 Radeon R9 280 Radeon R9 285
Розничная цена 13.990 рублей в России
199 евро
14 тыс. рублей в России
175 евро
15 тыс. рублей в России
195 евро
Сайт производителя NVIDIA AMD AMD
Техническая информация
GPU Maxwell
(GM206-300-A1)
Tahiti XL Tonga Pro
Техпроцесс 28 нм 28 нм 28 нм
Число транзисторов 2,94 млрд. 4,3 млрд. 5,0 млрд.
Тактовая частота GPU (базовая) 1.126 МГц - -
Тактовая частота GPU (Boost) 1.178 МГц 933 МГц 918 МГц
Частота памяти 1.750 МГц 1.250 МГц 1.375 МГц
Тип памяти GDDR5 GDDR5 GDDR5
Объём памяти 2.048 Мбайт 3.072 Мбайт 2.048 Мбайт
Ширина шины памяти 128 бит 384 бит 256 бит
Пропускная способность памяти 112,2 Гбайт/с 240,0 Гбайт/с 176,0 Гбайт/с
Версия DirectX 12 11.2 12
Потоковые процессоры 1.024 1.792 1.792
Текстурные блоки 64 112 112
Конвейеры растровых операций (ROP) 32 32 32
SLI/CrossFire SLI CrossFire CrossFire
Тепловой пакет (TDP) 120 Вт 250 Вт 190 Вт

У видеокарты GeForce GTX 960 используется GPU GM206, вероятно, не в полной версии – под маркировкой GM206-300-A1. Кристалл оснащён 2,94 млрд. транзисторов, он существенно менее сложный, чем "Tahiti" или "Tonga" от AMD. Поскольку эталонной видеокарты GeForce GTX 960 не представлено, информация о базовой частоте и Boost в таблице выше практического значения не имеет. NVIDIA указывает базовую частоту 1.126 МГц, а частоту GPU Boost – 1.178 МГц. Как мы увидим чуть ниже, у розничных версий видеокарт эти значения существенно выше. 2.048 Мбайт памяти GDDR5 NVIDIA выставила на 1.750 МГц, память подключена по 128-битному интерфейсу. В результате мы получаем пропускную способность памяти 112,2 Гбайт/с – немного по сравнению с конкурентами. Но не забывайте, что NVIDIA использует технологию сжатия памяти, которая теоретически увеличивает эффективную пропускную способность памяти, но обещанные NVIDIA 148,8 Гбайт/с всё равно достигаются в редких случаях. NVIDIA указывает TDP 120 Вт, но видеокарты с заводским разгоном его явно обходят. Если производитель видеокарты предоставил соответствующую информацию, то мы указали её рядом с каждой видеокартой.

GPU GM206 опирается на 1.024 потоковых процессора, которые объединены в восемь блоков SMM (streaming multiprocessors), по 4x 32 потоковых процессора в каждом. Четыре SMM составляют кластер GPC, мы получаем два таких кластера на GPU. 8 (SMM) x 4 (блока SMM) x 32 потоковых процессора как раз дают 1.024 потоковых процессора.

Диаграмма GPU GM206
Диаграмма GPU GM206

На диаграмме GM206 "Maxwell" можно видеть отдельные участки: интерфейс PCI Express 3.0, контроллер памяти, кэш L2, конвейеры растровых операций (ROP), движок GigaThread и оба кластера Graphics Processing Clusters. Каждый GPC состоит из четырёх потоковых мультипроцессоров (SMM), которые содержат остальные компоненты конвейера рендеринга помимо потоковых процессоров.

В каждом SMM используется восемь текстурных блоков. Соответственно, восемь SMM у GeForce GTX 960 дают 64 текстурных блока. Два 64-битных контроллера памяти подключен к 32 конвейерам растровых операций (ROP).

Диаграмма SMM в архитектуре Maxwell
Диаграмма SMM в архитектуре Maxwell

Более высокую эффективность Maxwell NVIDIA смогла получить благодаря нескольким решениям. Кэш L2 в архитектуре "Maxwell" был увеличен до 2.048 кбайт по сравнению с 256 кбайт в архитектуре "Kepler". Пропускная способность кэша осталась на уровне 512 байт на такт. По сравнению с архитектурой Maxwell первого поколения была несколько увеличена общая память для каждого мультипроцессора SMM. Теперь она составляет уже 96 кбайт, а не 64 кбайт. Можно отметить и новый движок Polymorph Engine версии 3.0. Движок PolyMorph 3.0 отвечает за запросы текстур, тесселяцию, настройку атрибутов, трансформацию поля зрения и потоковый вывод. Результаты вычислений кластера SMM и движка PolyMorph 3.0 затем передаются на движок растеризации. На втором этапе тесселятор начинает расчеты позиций поверхностей, в зависимости от расстояния выбирается нужный уровень детализации. Скорректированные значения отсылаются на кластер SMM, где с ними работают доменные и геометрические шейдеры. Доменный шейдер рассчитывает финальную позицию каждого треугольника, учитывая данные Hull-шейдеров и тесселяторов. На данном этапе накладываются карты смещения. Геометрический шейдер затем сравнивает рассчитанные данные с действительно видимыми объектами и отсылает результаты обратно на движок тесселяции для окончательного расчета. На последнем этапе движок PolyMorph 3.0 выполняет трансформацию поля зрения и коррекцию перспективы. Наконец, рассчитанные данные выводятся через потоковый вывод, память освобождается для дальнейших расчетов.

GPU GM206 видеокарты GeForce GTX 960
GPU GM206 видеокарты GeForce GTX 960

Перейдём к отдельным блокам мультипроцессора SMM. Каждый блок из 32 потоковых процессоров оснащен буфером инструкций и warp-планировщиком. Два блока диспетчеризации работают с 16.384 32-битными регистрами каждый. Если посмотреть на архитектуру "Kepler", то 192 потоковых процессора работали с четырьмя warp-планировщиками и восемью блоками диспетчеризации, всего было доступно 65.536 32-битных регистров. Теоретически на каждый потоковый процессор в архитектуре "Maxwell" приходятся 512 регистров, у "Kepler" их количество составляло около 341. Эта мера тоже способствовала приросту производительности потоковых процессоров до 35%. Также несколько изменилось соотношение между потоковыми процессорами и так называемыми специальными функциональными блоками (Special Function Units, SFU). В архитектуре "Kepler" соотношение составляло 6/1, в " Maxwell" оно снизилось до 4/1. То же самое касается и соотношения потоковых процессоров и блоков чтения/записи (Load/Store, LD/ST). Специальные блоки вычислений с двойной точностью на диаграмме не показаны, они, скорее всего, будут представлены в GPU GM210 (по аналогии между GK110 и GK104). Но, если верить NVIDIA, соотношение одиночной и двойной точности составляет 1/24, как и в чипах "Kepler" первого поколения (GK104).

Небольшие изменения по сравнению с предыдущей реализацией архитектуры "Maxwell" произошли в движке обработки видео (Video Engine). Теперь он обеспечивает не только аппаратное кодирование в H.265, но и аппаратное декодирование. У GeForce GTX 980 и GeForce GTX 970 также отсутствовала поддержка HDCP в HDMI 2.2, в GeForce GTX 960 и GPU GM206 она была добавлена. Так что теперь набор функций кажется более сбалансированным, хотя GPU GM204 наверняка можно рассматривать как переходный вариант к "старшим" чипам, пусть даже видеокарты на GM204 будут продаваться длительное время.