> > > > Manticore: RISC-V с чиплетами, HBM2 и 4.096 ядрами

Manticore: RISC-V с чиплетами, HBM2 и 4.096 ядрами

Опубликовано:

manticore-risc-vНа конференции HotChips исследователи из Лаборатории систем Швейцарской высшей технической школы Цюриха и Университета Болоньи представили многочиповую концепцию на дизайне RISC-V. Она характеризуется использованием чиплетов, памяти HBM2, скоростного интерконнекта и до 4.096 ядер. Дизайн назван Manticore, он ориентирован на высокопроизводительные вычисления HPC.

Проект Manticore состоит из четырех чиплетов, каждый имеет площадь 222 мм² (14,9 x 14,9 мм). Производство будет осуществляться на заводах GlobalFoundries по технологии 22 нм (22FDX). Данный техпроцесс был выбран из-за оптимального сочетания доли выхода годных кристаллов и цены. Каждый из четырех чиплетов подключается к трем остальным интерконнектом. Также каждый чиплет работает со своими 8 Гбайт HBM2. К системе ускоритель Manticore подключается через интерфейсPCI Express.

Каждый чиплет состоит из четырех квадрантов (в них расположены вычислительные ядра), 27 Мбайт кэша L2, интерфейса памяти HBM2 и контроллера PCI Express. Каждый квадрант имеет 32 кластера или 256 ядер. То есть в каждом кластере используются восемь ядер RV32G Snitch. За каждый такт ядра могут выполнить 16 DP и 32 SP операций. Тактовая частота чипа составляет 1.000 МГц. Каждый чиплет содержит четыре ядра управления под названием Ariane. На них может работать, например, Linux.

Ядра RV32G оснащены 8 кбайт кэша инструкций L1 и 128 кбайт кэша данных L1. Более крупный кэш в последнем случае обеспечивает максимальную близость данных к вычислительным ядрам. То же самое касается крупного кэша L2 и памяти HBM2. Ядра Ariane (RV64G) имеют уже другой дизайн, кэш L1 инструкций/данных составляет 16/32 кбайт.

Исследователи пока не приступили к этапу производства чипов, поскольку пока он слишком затратный. Изготовлен прототип площадью всего 9 мм². На нем можно протестировать основные компоненты, в том числе ядра RV32G Snitch, 1,25 Мбайт кэша L2 и ядра Ariane на дизайне RV64G.

Что касается вычислительной производительности и эффективности, пока приходится оперировать показателями прототипа. Судя по всему, концепт Manticore обеспечит вычислительную производительность на уровне NVIDIA GV100 GPU - конечно, в зависимости от типа вычислений. Поскольку чип ориентирован на HPC, он фокусируется на вычислениях с двойной точностью FP64. С адаптированной кривой напряжение/частота концепт Manticore может быть даже более эффективным, чем ускоритель A100 от NVIDIA. По вычислительной производительности FP32 концепт уже уступает, но все равно превосходит многие другие дизайны.

На следующем этапе будет изготовлен прототип с четырьмя чиплетами. Впрочем, здесь еще рано говорить об интегрированной корпусировке. Сначала чиплеты будут переведены на современный техпроцесс FinFET.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).