Hardwareluxx > Новости > Железо > Видеокарты > NVIDIA разрабатывает мультичиповые модули MCM для своих GPU

NVIDIA разрабатывает мультичиповые модули MCM для своих GPU

Опубликовано: 04.07.2017 в 16:31 Андрей Шиллинг

nvidia Мультичиповые модули MCM – технология не новая, но именно она должна стать основой будущих поколений GPU. AMD уже использует модули MCM в современных процессорах Ryzen и Epyc, да и из прошлого примеры можно привести. Первые двуядерные процессоры на самом деле состояли из двух одноядерных кристаллов в одной упаковке.

Что касается GPU, то до сих пор многочиповые модули активно не использовались. Но все должно измениться в будущем, поскольку производство становится все сложнее, площадь кристалла растет – все же разместить 15 млрд. транзисторов на площади 815 мм² нелегко. И обеспечивать дальнейший прирост производительности через монолитные GPU становится все труднее.

Соответственно разработчики GPU сегодня активно работают над дизайнами MCM. NVIDIA опубликовала документацию под названием "MCM GPU: Multi-Chip GPUs for Continued Performance Scalability" (скачать PDF), созданную вместе с исследователями из Университета штата Аризона, Техасского университета в Остине и Центра суперкомпьютеров в Барселоне.

В документации обсуждается разработка довольно "простого" модуля GPU (GPM), который затем объединяется с другими подобными модулями в упаковке MCM. Используется специальные MCM GPU, адаптированные под нужды MCM. Исследователи смогли создать внутренний интерконнект, который позволил уменьшить в пять раз внутренний обмен данных GPU, а также увеличил производительность отдельных GPM на 22,8%.

Как показывают симуляции, GPU в дизайне MCM могут быть намного сложнее, чем на монолитном кристалле. В то же время производительность будет сравнима с монолитными дизайнами (±10%). По сравнению с классическими системами multi-GPU дизайны MCM обеспечивают преимущество 26,8%.

В дизайнах MCM важно обеспечить как можно меньший обмен данных между отдельными модулями. Дело в том, что обмен данными между модулями ограничен пропускной способностью каналов, а также задержками. Что можно проиллюстрировать выбранными стратегиями AMD и Intel.

Если сравнить размер чипов современных процессоров Intel и AMD, то можно видеть, что обе компании выбрали разные стратегии по созданию крупных чипов. AMD решила опереться на модульный дизайн, Intel по-прежнему производит монолитные чипы огромной площади.

Оба подхода имеют свои преимущества и недостатки. Кристаллы в дизайне MCP проще производить, но производительность зависит от быстрых интерконнектов. Крупные монолитные чипы имеют значительно большую площадь, производить их дороже, но скорость связи внутри чипа предсказать проще, причем не только по пропускной способности, но и по задержкам. Все это переносится на GPU.

Но вернемся к NVIDIA. Кроме различных подробностей иерархии кэша и соответствующей структуры в документе делается вывод, что дизайн MCM лучше всего подходит для GPU. Особенно это касается все более сложных и крупных чипов.

В принципе, с памятью High Bandwidth Memory и подложкой основа технологии уже готова, причем за связь между чипом и памятью отвечает подложка.

AMD тоже работает над GPU MCM

Если посмотреть на планы AMD по разработке GPU, то там тоже просматриваются дизайны MCM. После архитектуры Vega должна выйти Navi. Для нее AMD разработала новую архитектуру памяти, но подробностей пока не приводится. Кроме того, AMD указывает масштабируемость в контексте Navi. В будущем AMD ожидает дальнейший рост спроса на вычисления GPU. В том числе благодаря росту популярности виртуальной реальности и дисплеев с высоким разрешением. Данной цели вряд ли можно будет достигнуть с монолитными GPU, на что AMD намекнула еще в марте 2016.

Подложка предлагает больше возможностей, чем используется сегодня, что сыграет свою роль в ближайшие годы. Несмотря на уменьшение техпроцесса, производить крупные кристаллы становится все сложнее. В сфере GPU производители пытаются уместить все больше потоковых процессоров и других структур на один кристалл, что становится все сложнее. Технология подложки позволяет соединять несколько GPU, что дает своего рода систему CrossFire в упаковке. Но, опять же, пока все это домыслы, без конкретных примеров и подтверждений.

Роберт Хэллок: "Yes, it is absolutely possible that one future for the chip design industry is breaking out very large chips into multiple small and discrete packages mounted to an interposer. We're a long ways off from that as an industry, but it's definitely an interesting way to approach the problem of complexity and the expenses of monolithic chips."