> > > > QUEST: слои SRAM в нейропроцессоре связываются посредством индукции

QUEST: слои SRAM в нейропроцессоре связываются посредством индукции

Опубликовано:

tciЧтобы увеличить вычислительную производительность современных процессоров, необходимо обеспечивать высокую пропускную способность памяти, в том числе и между несколькими кристаллами в стеке. В случае High Bandwidth Memory производители используют связи TSV (Through Silicon Via), которые передают данные по специальным каналам, пробитым через кристаллы.

Из-за TSV сложность производства существенно увеличивается, в том числе это касается и контроля качества чипов. Сложность TSV как раз является одним из серьезных препятствий на пути изготовления стеков из множества кристаллов. Исследователи из университетов Хоккайдо и Кэйо несколько лет назад разработали индукционный интерфейс ThruChip Interface (TCI), который теперь представлен в виде первого чипа-прототипа. TCI является технологией передачи данных малого радиуса действия (NFC) на основе индукции. По сути, беспроводной технологией. Intel для соединений разных кристаллов использует свой способ EMIB, который применяется для связи процессоров Core с графикой Radeon RX Vega M, но он уже контактный.

На конференции International State Circuits Conference (ISSCC) команда исследователей представила QUEST, первый чип для обработки запросов в сети глубокого обучения, который работает со стеками SRAM через TCI.

QUEST состоит из девяти кристаллов. Восемь из них - кристаллы SRAM, верхний - кристалл логики. У HBM схожая структура с восемью слоями. Чип изготавливается на заводах TSMC по 40-нм техпроцессу CMOS Low Power. Площадь составляет 121,55 мм². На верхнем кристалле логики располагаются 24 ядра процессора по причинам лучшего охлаждения. Под ними установлены восемь слоев SRAM. 24 ядра с соответствующими блоками SRAM под ними формируют хранилища (Vaults). Каждое хранилище содержит 8 x 512 кбайт памяти SRAM, то есть 4 Мбайт. Для связи слоев между собой используется TCI. Впрочем, каналы TSV у чипа QUEST тоже остаются, но используются только для питания.

Но в перспективе планируется перейти на технологию Highly-Doped Silicon Vias (HDSVs). А именно вертикальные каналы, состоящие из легированного кремния, но они тоже будут использоваться для подачи питания, а не для передачи данных. В отличие от TSVs, каналы HDSVs производить проще. Но разработка HSDVs пока находится на раннем этапе, поэтому применяются TSVs.

24 ядра QUEST работают на 300 МГц. Каналы TCI работают на 3,6 ГГц, на каждое ядро предусмотрен один канал, состоящий из семи передающих дросселей и пяти принимающих. Задержки при чтении и записи данных составляют 3 такта. Пропускная способность составляет 9,6 Гбайт/с на хранилище или 28,8 Гбайт на модуль. 24 ядра соединены сетчатой топологией. Они имеют по каналу до прямых соседей и на глобальный интерконнект.

Чип QUEST обеспечивает обработку запросов в сеть глубокого обучения, то есть inferencing. Например, для распознавания изображения или обработки информации датчиков. До сих пор многие решения занимались и тренировкой сетей глубокого обучения, и обработкой запросов. Но все же более эффективно оптимизировать аппаратные ресурсы под определенную задачу, с которой они будут справляться быстрее.

Вычислительная производительность чипа QUEST зависит от сложности выполняемой задачи. Точность можно выставлять от 1 до 4 битов. При точности 4 бита производительность QUEST составляет 1,96 TOPS, при точности 1 бит - 7,49 TOPS. Энергопотребление вместе с памятью SRAM составляет 3,3 Вт.