В последнее время на презентациях нового железа, в частности, такие производители, как AMD, NVIDIA или Intel не утруждают себя рассказывать о всех деталях новых разработок, и эта участь выпадает на долю журналистов или конкурентов. Так, популярные некогда снимки кристаллов в последние годы сменились диаграммами, поскольку на последних производителям проще скрыть детали, о которых они не хотят говорить.
Тем не менее, на конференции Hot Chip 28 в Купертино NVIDIA представила снимок кристалла чипа GP100 с поддержкой NVLink и HBM. Напомним, что GP100 является «старшим» чипом на архитектуре Pascal и в настоящее время используется только в ускорителе Tesla P100. Этот снимок позволяет впервые посмотреть на структуру GPU с NVLink и HBM, и здесь мы хотели бы остановиться на некоторых деталях.
На снимке хорошо видно 60 потоковых мультипроцессоров (SM), которые расположены в 30 TPC (Texture/Processor Cluster). Они расположены по обеим сторонам чипа и окрашены на снимке в зеленый цвет. Каждый из SM насчитывает по 64 потоковых процессора, которые уже нельзя различить на снимке. Посередине расположен диспетчер потоков и другие составляющие блока Uncore.
На верхней и нижней части снимка можно увидеть интерфейс HBM2. По сравнению с остальным GPU, этот участок довольно маленький и занимает незначительную часть чипа, что еще больше удивляет, учитывая шину шириной 4.096 бита. Это еще раз доказывает преимущества этого типа памяти. Слева видно другие функции Uncore, о назначении которых можно только догадываться. Возможно, там расположен интерфейс NVLink.
Изготовить такой GPU крайне сложно. NVIDIA использует для этого 16-нм техпроцесс на мощностях TSMC. На площади 610 мм² производителю удалось разместить 15,3 миллиарда транзисторов для GPU, а во всей упаковке насчитывает около 150 миллиардов транзисторов. Конечно, здесь NVIDIA посчитала и транзисторы в чипах памяти, а также интерконнекты. HBM2 расположена на подложке рядом с GPU и состоит из восьми чипов. Подложка также изготавливается TSMC, и здесь NVIDIA не зависит от сторонних разработчиков. На фото чипа видно, насколько плотно расположены чипы памяти и кристалл GPU. Из-за и без того больших размеров чипа, здесь важен каждый миллиметр, и размер подложки полностью соответствует расположенным на ней компонентам.