> > > > GTC 2016: NVIDIA может устанавливать более емкие чипы HBM2, первые результаты тестов P100

GTC 2016: NVIDIA может устанавливать более емкие чипы HBM2, первые результаты тестов P100

Опубликовано:

nvidia gtcВчера мы опубликовали подробности архитектуры Pascal, но позднее появились новые интересные детали, касающиеся будущего дизайна GPU GP100.

NVIDIA объяснила, почему компания использовала память HBM2, а не Hybrid Memory Cube (HMC), например, которую Intel применяет в ускорителях Xeon Phi на Knights Landing. Как считает NVIDIA, у HBM2 имеется существенный потенциал по пропускной способности памяти. С частотой 740 МГц и пропускной способностью 720 Гбайт/с память на ускорителях Tesla P100 работает не в максимальном режиме, поскольку JEDEC для HBM2 указывает тактовые частоты до 1.000 МГц. NVIDIA указала, что не планирует оснащать GPU GP100 памятью HBM2 на полной частоте 1.000 МГц.

Весьма интересна и производительность интерконнекта, причем это касается не только NVLink, но и соединений между кэшами и регистрами в GPU. На самом GPU пропускная способность интерконнектов составляет до 80 Тбайт/с. Здесь хорошо видна огромная разница между интерконнектами GPU и сравнительно медленным подключением памяти 720 Гбайт/с. Как мы ранее отмечали, память поддерживает коррекцию ошибок ECC на аппаратном уровне. Это касается всей инфраструктуры хранения данных, от кэшей L1 и L2 до регистров памяти и непосредственно самой HBM2.

GPU GP100 с памятью HBM2
GPU GP100 с памятью HBM2

Мы посетили зону выставки GPU Technology Conference, где нас заинтересовал сервер PSR-1 с восемью модулями Tesla P100. Мы смогли сфотографировать и непосредственно сами модули Tesla P100. Интересно, что NVIDIA сделала высоту GPU и четырех чипов памяти одинаковыми, мы получаем плоскую поверхность. В случае AMD и GPU Fiji у чипов памяти и GPU высота разная.

NVIDIA использует специальную накладку (spacer), компенсирующую разницу в высоте между GPU и чипами памяти. Ее хорошо видно на фотографиях. На данный момент NVIDIA планирует использовать память HBM2 емкостью 4 Гбайт на чип. Samsung уже объявила о готовности к производству памяти HBM2 с емкостью 8 Гбайт на чип. Но массовое производство этой памяти, по всей видимости, еще не началось. NVIDIA может убрать накладку или уменьшить ее толщину, что позволит устанавливать в упаковку более высокие чипы памяти. Так что в обозримом будущем можно ждать вычислительных ускорителей Tesla на GPU GP100 с 32 Гбайт HBM2.

Видеопамять от SK HynixВидеопамять от SK Hynix

Видеопамять от SK Hynix

Также на выставке демонстрировались чипы памяти SK Hynix. NVIDIA подтвердила, что чипы памяти для GPU GP100 производятся Samsung. Поэтому развитие технологий SK Hynix по производству HBM2 для NVIDIA значения не имеет. Но, возможно, в будущих продуктах компании можно будет встретить чипы GDDR5 от SK Hynix. Не менее возможными кандидатами кажутся и чипы памяти GDDR5X от Micron.

GPU GP100 с памятью HBM2
GPU GP100 с памятью HBM2

Пока что NVIDIA представила только значения теоретической производительности Tesla P100. А именно показатели TFLOPS с одинарной и двойной точностью. Йохан Альбен (Jonah Alben), старший вице-президент подразделения разработки GPU в NVIDIA, с юмором подтвердил, что Tesla P100 справится с Crysis 3 с достаточной частотой кадров. Впрочем, Tesla P100 все же является вычислительным ускорителем, поэтому и результаты тестов будут ориентированы на соответствующие приложения. По ним сложно оценить игровую производительность чипа.