Страница 1: Тест и обзор: NVIDIA GeForce GTX 980 Ti
NVIDIA, похоже, отказалась от привычной схемы представления новых видеокарт через регулярные, но длительные промежутки времени. Как раз к выставке Computex разработчик графических процессоров представил новый флагман для потребительского рынка GeForce GTX 980 Ti. Как и в случае GeForce GTX Titan X (тест и обзор) здесь используется максимальная конфигурация архитектуры "Maxwell", хотя она была урезана в нескольких областях – в частности, видеопамять была уменьшена до более привычного уровня 6 Гбайт. Зато вы получите самую быструю видеокарту для разрешений 4K/UltraHD, по сравнению с GeForce GTX Titan X она приятно радует меньшей ценой. В нашем обзоре мы рассмотрим производительность новой видеокарты GeForce GTX 980 Ti и вынесем вердикт. Какую видеокарту NVIDIA можно назвать лучшим выбором для геймера: GeForce GTX 980, GTX 980 Ti или GeForce GTX Titan X?
В сентябре 2014 мы опубликовали тест видеокарт GeForce GTX 980 и GTX 970 – первых моделей на втором поколении архитектуры "Maxwell", весной к ним добавились две модели с противоположных концов - GeForce GTX 960 (тест и обзор) и GeForce GTX Titan X (тест и обзор). Графические процессоры GM206, GM204 и GM200 изготавливаются на заводах TSMC по 28-нм техпроцессу, который производитель продолжает оптимизировать. Графический процессор GM200 мы уже встречали в видеокартах GeForce GTX Titan X или Quadro M6000, теперь он используется и в новой GeForce GTX 980 Ti. Но из-за целевого рынка NVIDIA решила урезать GM200.
С первого взгляда понятно, что NVIDIA использовала для эталонной версии видеокарты GeForce GTX 980 Ti тот же самый дизайн кулера, что и у GeForce GTX 970, GTX 980 и GTX Titan X. Впрочем, детально к кулеру мы вернемся чуть позже. Уже сегодня мы можем раскрыть информацию о том, что GeForce GTX 980 Ti производители могут выпускать с альтернативными дизайнами. Так что на рынок должны выйти множество разных моделей. По тактовым частотам и системе охлаждения производители наверняка будут стараться обойти друг друга, поэтому в ближайшие месяцы можно ожидать оживления рынка.
Конечно, весьма интересно сравнить нового флагмана NVIDIA с конкурирующими видеокартами AMD. Мы имеем в виду новые видеокарты "Fiji" на архитектуре "Graphics Core Next" с видеопамятью High Bandwidth Memory (HBM). Но до их появления пройдёт ещё несколько дней или даже недель. В любом случае, наша статья посвящена видеокарте GeForce GTX 980 Ti, её подробному описанию и техническим спецификациям.
Информация об архитектуре
NVIDIA GeForce GTX 980 Ti | |
---|---|
Розничная цена | 39.990 рублей 740 евро |
Сайт производителя | NVIDIA |
Техническая информация | |
GPU | GM200 (GM200-310-A1) |
Техпроцесс | 28 нм |
Число транзисторов | 8 млрд. |
Тактовая частота GPU (базовая) | 1.000 МГц |
Тактовая частота GPU (Boost) | 1.075 МГц |
Частота памяти | 1.750 МГц |
Тип памяти | GDDR5 |
Объём памяти | 6 Гбайт |
Ширина шины памяти | 384 бит |
Пропускная способность памяти | 336,6 Гбайт/с |
Версия DirectX | 12 |
Потоковые процессоры | 2.816 |
Текстурные блоки | 176 |
Конвейеры растровых операций (ROP) | 96 |
Пиксельная скорость заполнения | 96 Гпиксель/с |
SLI/CrossFire | SLI |
NVIDIA использовала для видеокарты GeForce GTX 980 Ti тот же самый GPU, что и в случае GeForce GTX Titan X - GM200. Но сейчас используется степпинг GM200-310-A1, представляющий собой урезанную версию GM200. NVIDIA по-прежнему изготавливает свои GPU на заводах TSMC по 28-нм техпроцессу – чип впечатляет, учитывая 8 млрд. транзисторов.
В отличие от 3.072 потоковых процессоров у GeForce GTX Titan X, видеокарта GeForce GTX 980 Ti может похвастаться только 2.816 потоковыми процессорами. Они распределены по 6 кластерам Graphics Processing Cluster (GPC) и 22 потоковым мультипроцессорам Maxwell. 22 SMM x 4 блока SMM x 32 АЛУ как раз и дают 2.816 потоковых процессоров GeForce GTX 980 Ti. К каждому SMM подключено восемь текстурных блоков, что даёт 176 текстурных блоков в сумме. 16 конвейеров растровых операций обеспечивают 64-битный интерфейс, что даёт в сумме 384-битный интерфейс с 96 ROP.
GPU GM200 видеокарты GeForce GTX 980 Ti работает на базовой частоте 1.000 МГц, минимальная планка Boost установлена на 1.075 МГц. Здесь мы получаем аналогию с GeForce GTX Titan X, которая работает на тех же тактовых частотах. Разница с производительности между двумя видеокартами может быть связана с разным количеством потоковых процессоров, некоторыми отличиями в архитектуре, а также меньшей конфигурации памяти.
GPU GM200 видеокарты GeForce GTX 980 Ti обеспечивает полный набор функций архитектуры "Maxwell". Так что вы получите почти все функциональные блоки, присутствующие у GeForce GTX Titan X. К ним можно отнести 3 Мбайт кэша L2, в отличие от 2 Мбайт у GeForce GTX 980 и GeForce GTX 970, где из-за ограничений пропускной способности памяти мы получаем 1.792 кбайт. Пропускная способность кэша остаётся 512 байт на такт.
6 Гбайт памяти GDDR5 подключены по 384-битному интерфейсу. Память работает с тактовой частотой 1.750 МГц. NVIDIA по каким-то причинам решила не устанавливать память на 2.000 МГц, которую уже производят SK Hynix и Samsung. Память High Bandwidth Memory NVIDIA тоже оставила для будущего поколения, которое выйдет под кодовым названием "Pascal" в следующем году. С тактовой частотой 1.750 МГц и 384-битной шиной память GeForce GTX 980 Ti работает с пропускной способностью 336,5 Гбайт/с.
Максимальное энергопотребление GeForce GTX 980 Ti NVIDIA указывает на уровне 250 Вт. Конечно, видеокарта совместима с технологией SLI multi-GPU, позволяющей объединять одну, две и три видеокарты в одну систему.
По сравнению с архитектурой Maxwell первого поколения была несколько увеличена общая память для каждого мультипроцессора SMM. Теперь она составляет уже 96 кбайт, а не 64 кбайт. Можно отметить и новый движок Polymorph Engine версии 3.0. Движок PolyMorph 3.0 отвечает за запросы текстур, тесселяцию, настройку атрибутов, трансформацию поля зрения и потоковый вывод. Результаты вычислений кластера SMM и движка PolyMorph 3.0 затем передаются на движок растеризации. На втором этапе тесселятор начинает расчеты позиций поверхностей, в зависимости от расстояния выбирается нужный уровень детализации. Скорректированные значения отсылаются на кластер SMM, где с ними работают доменные и геометрические шейдеры. Доменный шейдер рассчитывает финальную позицию каждого треугольника, учитывая данные Hull-шейдеров и тесселяторов. На данном этапе накладываются карты смещения. Геометрический шейдер затем сравнивает рассчитанные данные с действительно видимыми объектами и отсылает результаты обратно на движок тесселяции для окончательного расчета. На последнем этапе движок PolyMorph 3.0 выполняет трансформацию поля зрения и коррекцию перспективы. Наконец, рассчитанные данные выводятся через потоковый вывод, память освобождается для дальнейших расчетов. В данном процессе задействуются многочисленные функции рендеринга, о которых мы поговорим подробнее на страницах нашего обзора.
Перейдём к отдельным блокам мультипроцессора SMM. Каждый блок из 32 потоковых процессоров оснащен буфером инструкций и warp-планировщиком. Два блока диспетчеризации работают с 16.384 32-битными регистрами каждый. Если посмотреть на архитектуру "Kepler", то 192 потоковых процессора работали с четырьмя warp-планировщиками и восемью блоками диспетчеризации, всего было доступно 65.536 32-битных регистров. Теоретически на каждый потоковый процессор в архитектуре "Maxwell" приходятся 512 регистров, у "Kepler" их количество составляло около 341. Эта мера тоже способствовала приросту производительности потоковых процессоров до 35%. Также несколько изменилось соотношение между потоковыми процессорами и так называемыми специальными функциональными блоками (Special Function Units, SFU). В архитектуре "Kepler" соотношение составляло 6/1, в " Maxwell" оно снизилось до 4/1. То же самое касается и соотношения потоковых процессоров и блоков чтения/записи (Load/Store, LD/ST).
Графический процессор GeForce GTX 980 Ti опирается на архитектуру "Maxwell", поэтому многие функции мы уже рассматривали в обзорах GeForce GTX Titan X, GeForce GTX 980, GTX 970 и GTX 960. Мы не будем повторяться, рекомендуем прочитать следующие статьи по ссылкам:
- 256-битный контроллер и сжатие памяти
- DSR (Dynamic Super Resolution)
- MFAA (Multiframe Sampled Anti-Aliasing)
- VXGI (Voxel Global Illumination)
- DirectX 12
- GameWorks und PhysX
- VR Direct
- H.265 и стриминг 4K