Hardwareluxx > Статьи > Железо > Видеокарты > Тест и обзор: NVIDIA Titan X на архитектуре Pascal в SLI

Тест и обзор: NVIDIA Titan X на архитектуре Pascal в SLI

Опубликовано: 12.08.2016 в 20:40 Андрей Шиллинг

Страница 1: Тест и обзор: NVIDIA Titan X на архитектуре Pascal в SLI

NVIDIA многих удивила несколько недель назад, представив Titan X – самую быструю видеокарту с одним GPU для сетей глубокого обучения и игр. Впрочем, линейка Titan фокусируется не столько на играх, сколько на профессиональных приложениях. Поэтому NVIDIA и изменила название с GeForce на Titan. В нашу тестовую лабораторию поступили две флагманские видеокарты, что позволяет оценить их производительность в одиночном режиме, а также в SLI.

После представления первых игровых видеокарт Pascal, а именно GeForce GTX 1080 и GeForce GTX 1070, появились слухи, что между GPU GP104 и GPU GP100 (используется в вычислительных ускорителях Tesla P100) должна быть промежуточная ступень в виде GPU GP102. Но до последнего времени было не понятно, насколько интересен этот GPU окажется для геймеров, то есть для потребительского сегмента.

Видеокарты NVIDIA Titan X опираются на GPU GP102, который также используется в профессиональных видеокартах Quadro P6000. В последнем случае мы получаем полную версию GPU с 3.840 потоковыми процессорами и 24 Гбайт видеопамяти. Но видеокарты Quadro ориентированы на профессиональных сегмент рынка, и та же P6000 выйдет только в октябре. До сих пор не появилось информации о тактовых частотах, поэтому производительность оценить сложно. Видеокарты Titan X, с другой стороны, уже доступны на рынке, а цена их составляет примерно четверть от Quadro P6000. Основным рынком Titan X NVIDIA считает университеты и компании, участвующие в исследованиях в сфере искусственного интеллекта. Но, конечно, и геймерам подобная видеокарта может пригодиться, если они не против отдать за нее 1.299 евро в Европе. В России видеокарта на момент публикации еще не появилась, но NVIDIA указывает, что заказать видеокарту можно будет только напрямую у компании. Поэтому в рознице она может и не появиться. Видеокарта Titan X фокусируется на вычислениях FP32 и INT8, поэтому она одинаково хорошо подходит и для сферы глубокого обучения, и для классического рендеринга/игр.

» Fotostrecke

Ниже под видеокартой Titan X мы будем подразумевать новую модель на архитектуреPascal. В случае предыдущей версии Titan X на архитектуре Maxwell мы будем делать соответствующую добавку.

Технические спецификации Titan X в сравнении
Модель	NVIDIA GeForce GTX Titan X	NVIDIA GeForce GTX 1080	AMD Radeon R9 Fury X
Цена	1.299 евро	от 45,5 тыс. рублей	от 44 тыс. рублей
Сайт производителя	NVIDIA	NVIDIA	AMD
Техническая информация
GPU	GP102	GP104	Fiji XT
Техпроцесс	16 нм	16 нм	28 нм
Число транзисторов	12 млрд.	7,2 млрд.	8,9 млрд.
Тактовая частота GPU (базовая)	1.417 МГц	1.607 МГц	-
Тактовая частота GPU (Boost)	1.531 МГц	1.733 МГц	1.050 МГц
Частота памяти	2.500 МГц	2.500 МГц	500 МГц
Тип памяти	GDDR5X	GDDR5X	HBM
Объём памяти	12 GB	8 GB	4 GB
Ширина шины памяти	384 бит	256 бит	4.096 бит
Пропускная способность памяти	480 Гбайт/с	320 Гбайт/с	512 Гбайт/с
Версия DirectX	12	12	12
Потоковые процессоры	3.584	2.560	4.096
Текстурные блоки	224	160	256
Конвейеры растровых операций (ROP)	96	64	64
Тепловой пакет	250 Вт	180 Вт	275 Вт
SLI/CrossFire	SLI	SLI	CrossFire

Перейдем к техническим спецификациям NVIDIA Titan X: 3.584 потоковых процессора, которые работают на тактовой частоте до 1.531 МГц. Вычислительная производительность составляет 11 TFLOPs. Кроме того, к GPU подключены 12 Гбайт памяти GDDR5X. Как и можно было ожидать, GPU GP102 производится по 16-нм техпроцессу FinFET и содержит 12 млрд. транзисторов. У GP102 потоковых процессоров примерно на 40% больше, чем у GPU GP104 в видеокарте GeForce GTX 1080, хотя тактовая частота чуть ниже. Базовая частота составляет 1.417 МГц, а минимальная планка GPU Boost – 1.531 МГц. Вычислительная производительность 11 TFLOPs у новой видеокарты Titan X на 34% выше GeForce GTX 1080, в играх можно ожидать соответствующий прирост. Если вам интересны подробности архитектуры Pascal, рекомендуем ознакомиться с обзором GeForce GTX 1080 Founders Edition.

12 Гбайт памяти GDDR5X подключены по 384-битному интерфейсу. В результате пропускная способность памяти составляет 480 Гбайт/с. Со столь высоким уровнем пропускной способности видеокарта приближается к первому поколению HBM. Что касается ROP, то на каждый 32-битный контроллер памяти их приходится восемь, что дает 96 ROP. Текстурные блоки, в полном соответствии с принципами архитектуры Pascal, присутствуют в количестве 224. Тепловыделение новой GeForce GTX Titan X составляет до 250 Вт.

Если сравнивать GP100 и GP102, то можно прийти к следующему. GPU GP102 имеет площадь 471 мм², то есть на 139 мм² меньше GPU GP100, где мы получили 610 мм². Оба GPU содержат в полной конфигурации 3.840 потоковых процессора, хотя у Tesla P100 и Titan X используется только 3.584 потоковых процессора. Лишь у Quadro P6000, которая выходит в октябре, будут доступны полные 3.840 потоковых процессора.

Экономия площади чипа была достигнута разными средствами. GPU GP102 лишился поддержки NVLink, быстрого выполнения операций FP64/FP16 и крупного блока регистров. Разделение между сферами HPC и играми/рабочими станциями для NVIDIA теперь важно и экономически, поскольку себестоимость GPU GP102 существенно ниже (меньший размер кристалла, большая доля выхода годных кристаллов). Раньше такое не представлялось возможным, по крайней мере, если обе линейки опирались на идентичный GPU.

Сравнение вычислительной производительности и функций
Модель	NVIDIA Tesla P100	NVDIDIA Quadro P6000	NVIDIA Titan X
GPU	GP100	GP102	GP102
FP64	5,3 TFLOPS	-	343 GFLOPS
FP32	10,6 TFLOPS	-	11 TFLOPS
FP16	21,2 TFLOPS	-	172 GFLOPS
Соотношение FP64	1/2	1/32	1/32
Соотношение FP16	2/1	1/64	1/64
Соотношение INT8	4:1	4:1	4:1
Тип памяти	HBM2	GDDR5X	GDDR5X
Объем памяти	16 GB	24 GB	12 GB
Интерфейс памяти	4.096 бит	384 бит	384 бит
Пропускная способность памяти	720 Гбайт/с	480 Гбайт/с	480 Гбайт/с
Потоковые процессоры	3.584	3.840	3.584

Видеокарта Titan X заинтересует многих геймеров, но NVIDIA все же нацеливает ее на вычислительную сферу, где важна производительность FP32 и INT8. Поэтому компания решила отказаться от добавок "GeForce" и "GTX". Предыдущие видеокарты Titan хорошо зарекомендовали себя как в области вычислений, так и игр, но NVIDIA решила выставить приоритеты. Видеокарты Titan, Titan X и Titan Z часто использовались как дешевая альтернатива Quadro и Tesla для вычислений. Посмотрим, как будет обстоять дело с видеокартами Titan X на архитектуре Pascal.

<>Тест и обзор: NVIDIA Titan X на архитектуре Pascal в SLI
NVIDIA Titan X | На практике