Страница 1: Тест и обзор: NVIDIA Titan X на архитектуре Pascal в SLI

NVIDIA многих удивила несколько недель назад, представив Titan X – самую быструю видеокарту с одним GPU для сетей глубокого обучения и игр. Впрочем, линейка Titan фокусируется не столько на играх, сколько на профессиональных приложениях. Поэтому NVIDIA и изменила название с GeForce на Titan. В нашу тестовую лабораторию поступили две флагманские видеокарты, что позволяет оценить их производительность в одиночном режиме, а также в SLI.

После представления первых игровых видеокарт Pascal, а именно GeForce GTX 1080 и GeForce GTX 1070, появились слухи, что между GPU GP104 и GPU GP100 (используется в вычислительных ускорителях Tesla P100) должна быть промежуточная ступень в виде GPU GP102. Но до последнего времени было не понятно, насколько интересен этот GPU окажется для геймеров, то есть для потребительского сегмента.

Видеокарты NVIDIA Titan X опираются на GPU GP102, который также используется в профессиональных видеокартах Quadro P6000. В последнем случае мы получаем полную версию GPU с 3.840 потоковыми процессорами и 24 Гбайт видеопамяти. Но видеокарты Quadro ориентированы на профессиональных сегмент рынка, и та же P6000 выйдет только в октябре. До сих пор не появилось информации о тактовых частотах, поэтому производительность оценить сложно. Видеокарты Titan X, с другой стороны, уже доступны на рынке, а цена их составляет примерно четверть от Quadro P6000. Основным рынком Titan X NVIDIA считает университеты и компании, участвующие в исследованиях в сфере искусственного интеллекта. Но, конечно, и геймерам подобная видеокарта может пригодиться, если они не против отдать за нее 1.299 евро в Европе. В России видеокарта на момент публикации еще не появилась, но NVIDIA указывает, что заказать видеокарту можно будет только напрямую у компании. Поэтому в рознице она может и не появиться. Видеокарта Titan X фокусируется на вычислениях FP32 и INT8, поэтому она одинаково хорошо подходит и для сферы глубокого обучения, и для классического рендеринга/игр.

Ниже под видеокартой Titan X мы будем подразумевать новую модель на архитектуреPascal. В случае предыдущей версии Titan X на архитектуре Maxwell мы будем делать соответствующую добавку.

Технические спецификации Titan X в сравнении
Модель NVIDIA GeForce GTX Titan X NVIDIA GeForce GTX 1080 AMD Radeon R9 Fury X
Цена 1.299 евро от 45,5 тыс. рублей от 44 тыс. рублей
Сайт производителя NVIDIA NVIDIA AMD
Техническая информация
GPU GP102 GP104 Fiji XT
Техпроцесс 16 нм 16 нм 28 нм
Число транзисторов 12 млрд. 7,2 млрд. 8,9 млрд.
Тактовая частота GPU (базовая) 1.417 МГц 1.607 МГц -
Тактовая частота GPU (Boost) 1.531 МГц 1.733 МГц 1.050 МГц
Частота памяти 2.500 МГц 2.500 МГц 500 МГц
Тип памяти GDDR5X GDDR5X HBM
Объём памяти 12 GB 8 GB 4 GB
Ширина шины памяти 384 бит 256 бит 4.096 бит
Пропускная способность памяти 480 Гбайт/с 320 Гбайт/с 512 Гбайт/с
Версия DirectX 12 12 12
Потоковые процессоры 3.584 2.560 4.096
Текстурные блоки 224 160 256
Конвейеры растровых операций (ROP) 96 64 64
Тепловой пакет 250 Вт 180 Вт 275 Вт
SLI/CrossFire SLI SLI CrossFire

Перейдем к техническим спецификациям NVIDIA Titan X: 3.584 потоковых процессора, которые работают на тактовой частоте до 1.531 МГц. Вычислительная производительность составляет 11 TFLOPs. Кроме того, к GPU подключены 12 Гбайт памяти GDDR5X. Как и можно было ожидать, GPU GP102 производится по 16-нм техпроцессу FinFET и содержит 12 млрд. транзисторов. У GP102 потоковых процессоров примерно на 40% больше, чем у GPU GP104 в видеокарте GeForce GTX 1080, хотя тактовая частота чуть ниже. Базовая частота составляет 1.417 МГц, а минимальная планка GPU Boost – 1.531 МГц. Вычислительная производительность 11 TFLOPs у новой видеокарты Titan X на 34% выше GeForce GTX 1080, в играх можно ожидать соответствующий прирост. Если вам интересны подробности архитектуры Pascal, рекомендуем ознакомиться с обзором GeForce GTX 1080 Founders Edition.

12 Гбайт памяти GDDR5X подключены по 384-битному интерфейсу. В результате пропускная способность памяти составляет 480 Гбайт/с. Со столь высоким уровнем пропускной способности видеокарта приближается к первому поколению HBM. Что касается ROP, то на каждый 32-битный контроллер памяти их приходится восемь, что дает 96 ROP. Текстурные блоки, в полном соответствии с принципами архитектуры Pascal, присутствуют в количестве 224. Тепловыделение новой GeForce GTX Titan X составляет до 250 Вт.

Диаграмма GPU GP102 видеокарты Titan X
Диаграмма GPU GP102 видеокарты Titan X

Если сравнивать GP100 и GP102, то можно прийти к следующему. GPU GP102 имеет площадь 471 мм², то есть на 139 мм² меньше GPU GP100, где мы получили 610 мм². Оба GPU содержат в полной конфигурации 3.840 потоковых процессора, хотя у Tesla P100 и Titan X используется только 3.584 потоковых процессора. Лишь у Quadro P6000, которая выходит в октябре, будут доступны полные 3.840 потоковых процессора.

Экономия площади чипа была достигнута разными средствами. GPU GP102 лишился поддержки NVLink, быстрого выполнения операций FP64/FP16 и крупного блока регистров. Разделение между сферами HPC и играми/рабочими станциями для NVIDIA теперь важно и экономически, поскольку себестоимость GPU GP102 существенно ниже (меньший размер кристалла, большая доля выхода годных кристаллов). Раньше такое не представлялось возможным, по крайней мере, если обе линейки опирались на идентичный GPU.

Сравнение вычислительной производительности и функций
Модель NVIDIA Tesla P100 NVDIDIA Quadro P6000 NVIDIA Titan X
GPU GP100 GP102 GP102
FP64 5,3 TFLOPS - 343 GFLOPS
FP32 10,6 TFLOPS - 11 TFLOPS
FP16 21,2 TFLOPS - 172 GFLOPS
Соотношение FP64 1/2 1/32 1/32
Соотношение FP16 2/1 1/64 1/64
Соотношение INT8 4:1 4:1 4:1
Тип памяти HBM2 GDDR5X GDDR5X
Объем памяти 16 GB 24 GB 12 GB
Интерфейс памяти 4.096 бит 384 бит 384 бит
Пропускная способность памяти 720 Гбайт/с 480 Гбайт/с 480 Гбайт/с
Потоковые процессоры 3.584 3.840 3.584

Видеокарта Titan X заинтересует многих геймеров, но NVIDIA все же нацеливает ее на вычислительную сферу, где важна производительность FP32 и INT8. Поэтому компания решила отказаться от добавок "GeForce" и "GTX". Предыдущие видеокарты Titan хорошо зарекомендовали себя как в области вычислений, так и игр, но NVIDIA решила выставить приоритеты. Видеокарты Titan, Titan X и Titan Z часто использовались как дешевая альтернатива Quadro и Tesla для вычислений. Посмотрим, как будет обстоять дело с видеокартами Titan X на архитектуре Pascal.