Страница 1: Тест и обзор: NVIDIA Titan X на архитектуре Pascal в SLI
NVIDIA многих удивила несколько недель назад, представив Titan X – самую быструю видеокарту с одним GPU для сетей глубокого обучения и игр. Впрочем, линейка Titan фокусируется не столько на играх, сколько на профессиональных приложениях. Поэтому NVIDIA и изменила название с GeForce на Titan. В нашу тестовую лабораторию поступили две флагманские видеокарты, что позволяет оценить их производительность в одиночном режиме, а также в SLI.
После представления первых игровых видеокарт Pascal, а именно GeForce GTX 1080 и GeForce GTX 1070, появились слухи, что между GPU GP104 и GPU GP100 (используется в вычислительных ускорителях Tesla P100) должна быть промежуточная ступень в виде GPU GP102. Но до последнего времени было не понятно, насколько интересен этот GPU окажется для геймеров, то есть для потребительского сегмента.
Видеокарты NVIDIA Titan X опираются на GPU GP102, который также используется в профессиональных видеокартах Quadro P6000. В последнем случае мы получаем полную версию GPU с 3.840 потоковыми процессорами и 24 Гбайт видеопамяти. Но видеокарты Quadro ориентированы на профессиональных сегмент рынка, и та же P6000 выйдет только в октябре. До сих пор не появилось информации о тактовых частотах, поэтому производительность оценить сложно. Видеокарты Titan X, с другой стороны, уже доступны на рынке, а цена их составляет примерно четверть от Quadro P6000. Основным рынком Titan X NVIDIA считает университеты и компании, участвующие в исследованиях в сфере искусственного интеллекта. Но, конечно, и геймерам подобная видеокарта может пригодиться, если они не против отдать за нее 1.299 евро в Европе. В России видеокарта на момент публикации еще не появилась, но NVIDIA указывает, что заказать видеокарту можно будет только напрямую у компании. Поэтому в рознице она может и не появиться. Видеокарта Titan X фокусируется на вычислениях FP32 и INT8, поэтому она одинаково хорошо подходит и для сферы глубокого обучения, и для классического рендеринга/игр.
Ниже под видеокартой Titan X мы будем подразумевать новую модель на архитектуреPascal. В случае предыдущей версии Titan X на архитектуре Maxwell мы будем делать соответствующую добавку.
Технические спецификации Titan X в сравнении | |||
---|---|---|---|
Модель | NVIDIA GeForce GTX Titan X | NVIDIA GeForce GTX 1080 | AMD Radeon R9 Fury X |
Цена | 1.299 евро | от 45,5 тыс. рублей | от 44 тыс. рублей |
Сайт производителя | NVIDIA | NVIDIA | AMD |
Техническая информация | |||
GPU | GP102 | GP104 | Fiji XT |
Техпроцесс | 16 нм | 16 нм | 28 нм |
Число транзисторов | 12 млрд. | 7,2 млрд. | 8,9 млрд. |
Тактовая частота GPU (базовая) | 1.417 МГц | 1.607 МГц | - |
Тактовая частота GPU (Boost) | 1.531 МГц | 1.733 МГц | 1.050 МГц |
Частота памяти | 2.500 МГц | 2.500 МГц | 500 МГц |
Тип памяти | GDDR5X | GDDR5X | HBM |
Объём памяти | 12 GB | 8 GB | 4 GB |
Ширина шины памяти | 384 бит | 256 бит | 4.096 бит |
Пропускная способность памяти | 480 Гбайт/с | 320 Гбайт/с | 512 Гбайт/с |
Версия DirectX | 12 | 12 | 12 |
Потоковые процессоры | 3.584 | 2.560 | 4.096 |
Текстурные блоки | 224 | 160 | 256 |
Конвейеры растровых операций (ROP) | 96 | 64 | 64 |
Тепловой пакет | 250 Вт | 180 Вт | 275 Вт |
SLI/CrossFire | SLI | SLI | CrossFire |
Перейдем к техническим спецификациям NVIDIA Titan X: 3.584 потоковых процессора, которые работают на тактовой частоте до 1.531 МГц. Вычислительная производительность составляет 11 TFLOPs. Кроме того, к GPU подключены 12 Гбайт памяти GDDR5X. Как и можно было ожидать, GPU GP102 производится по 16-нм техпроцессу FinFET и содержит 12 млрд. транзисторов. У GP102 потоковых процессоров примерно на 40% больше, чем у GPU GP104 в видеокарте GeForce GTX 1080, хотя тактовая частота чуть ниже. Базовая частота составляет 1.417 МГц, а минимальная планка GPU Boost – 1.531 МГц. Вычислительная производительность 11 TFLOPs у новой видеокарты Titan X на 34% выше GeForce GTX 1080, в играх можно ожидать соответствующий прирост. Если вам интересны подробности архитектуры Pascal, рекомендуем ознакомиться с обзором GeForce GTX 1080 Founders Edition.
12 Гбайт памяти GDDR5X подключены по 384-битному интерфейсу. В результате пропускная способность памяти составляет 480 Гбайт/с. Со столь высоким уровнем пропускной способности видеокарта приближается к первому поколению HBM. Что касается ROP, то на каждый 32-битный контроллер памяти их приходится восемь, что дает 96 ROP. Текстурные блоки, в полном соответствии с принципами архитектуры Pascal, присутствуют в количестве 224. Тепловыделение новой GeForce GTX Titan X составляет до 250 Вт.
Если сравнивать GP100 и GP102, то можно прийти к следующему. GPU GP102 имеет площадь 471 мм², то есть на 139 мм² меньше GPU GP100, где мы получили 610 мм². Оба GPU содержат в полной конфигурации 3.840 потоковых процессора, хотя у Tesla P100 и Titan X используется только 3.584 потоковых процессора. Лишь у Quadro P6000, которая выходит в октябре, будут доступны полные 3.840 потоковых процессора.
Экономия площади чипа была достигнута разными средствами. GPU GP102 лишился поддержки NVLink, быстрого выполнения операций FP64/FP16 и крупного блока регистров. Разделение между сферами HPC и играми/рабочими станциями для NVIDIA теперь важно и экономически, поскольку себестоимость GPU GP102 существенно ниже (меньший размер кристалла, большая доля выхода годных кристаллов). Раньше такое не представлялось возможным, по крайней мере, если обе линейки опирались на идентичный GPU.
Сравнение вычислительной производительности и функций | |||
---|---|---|---|
Модель | NVIDIA Tesla P100 | NVDIDIA Quadro P6000 | NVIDIA Titan X |
GPU | GP100 | GP102 | GP102 |
FP64 | 5,3 TFLOPS | - | 343 GFLOPS |
FP32 | 10,6 TFLOPS | - | 11 TFLOPS |
FP16 | 21,2 TFLOPS | - | 172 GFLOPS |
Соотношение FP64 | 1/2 | 1/32 | 1/32 |
Соотношение FP16 | 2/1 | 1/64 | 1/64 |
Соотношение INT8 | 4:1 | 4:1 | 4:1 |
Тип памяти | HBM2 | GDDR5X | GDDR5X |
Объем памяти | 16 GB | 24 GB | 12 GB |
Интерфейс памяти | 4.096 бит | 384 бит | 384 бит |
Пропускная способность памяти | 720 Гбайт/с | 480 Гбайт/с | 480 Гбайт/с |
Потоковые процессоры | 3.584 | 3.840 | 3.584 |
Видеокарта Titan X заинтересует многих геймеров, но NVIDIA все же нацеливает ее на вычислительную сферу, где важна производительность FP32 и INT8. Поэтому компания решила отказаться от добавок "GeForce" и "GTX". Предыдущие видеокарты Titan хорошо зарекомендовали себя как в области вычислений, так и игр, но NVIDIA решила выставить приоритеты. Видеокарты Titan, Titan X и Titan Z часто использовались как дешевая альтернатива Quadro и Tesla для вычислений. Посмотрим, как будет обстоять дело с видеокартами Titan X на архитектуре Pascal.