> > > > High Bandwidth Instance: ARM хочет разогнать SRAM до 7 ГГц

High Bandwidth Instance: ARM хочет разогнать SRAM до 7 ГГц

Опубликовано:

hardwareluxx news newЧтобы данные были как можно ближе к ядрам или ускорителям и как можно быстрее к ним попадали, почти в каждом дизайне CPU или GPU предусмотрена иерархия кэша. Кэш-память L0 или L1 - в зависимости от того, как ее называет производитель, - имеет наименьший объем, но является самой быстрой. Она представляет собой самый близкий к ядру уровень памяти, в котором могут храниться данные.

Производители чипов выбирают размер кэша L1 в зависимости от конструкции кристалла и ограничений по размеру. Конечно, здесь есть определенные зависимости. Например, кэш данных L1 в архитектуре Lion Cove от Intel имеет размер 48 кбайт. В архитектуре Zen 4 от AMD он составляет 32 кбайт.

Используемая здесь SRAM обычно состоит из битовых ячеек 6T-1RW. Чтение и запись могут производиться за один такт. Если разработчик чипа использует два банка, то один банк может использоваться для чтения, а другой - для записи. Это значительно увеличит производительность кэша данных L1, но его недостатком является увеличение площади чипа и энергопотребления.

На VLSI Symposium 2024 компания ARM представила концепцию под названием High Bandwidth Instance (HBI). Здесь есть ячейки памяти 8T 1R1RW SRAM имеют дополнительный порт, что позволяет одновременно выполнять две операции чтения или операцию чтения и записи.

Кроме того, ARM предполагает использовать память HBI DDATA, что позволяет отказаться от классического представления и реализации SRAM для кэша данных L1 и упростить дизайн. ARM также видит небольшое преимущество в задержках - от 10 до 15 пс при типичных задержках около 0,8 нс для кэша L1.

Хотя ячейка памяти 8T 1R1RW SRAM на 33% больше при той же емкости (128 кбайт 1RW SRAM требуют 83.991 мкм², а 64 кбайт 1R1RW HBI – 55.636 мкм²), если нормировать по пропускной способности, то кэш данных L1 будет на 33% меньше. Но если требуется прежняя емкость, то занимаемая площадь будет больше.

Для тестов ARM взяла чип, изготовленный по техпроцессу 3 нм с площадью 2,9986 x 3,9945 мм (11,98 мм²), и нанесла на него 112 макроячеек SRAM HBI, чтобы проверить электрические свойства. При напряжении 0,945 В тактовая частота составила 7,74 ГГц. При напряжении 0,495 В, более типичном для SRAM, удалось достичь частоты 3,13 ГГц. Выход годных кристаллов составил 100%. Однако производство SRAM не представляет особой сложности благодаря относительно простой структуре и возможности включения резервных элементов. Серьезной проблемой в чипах стало масштабирование SRAM, поэтому пропускная способность на единицу площади также играет все более важную роль.

То, что ARM представляет на VLSI 2024 как High Bandwidth Instance, пока является концепцией и демонстрирует разностороннее развитие дизайна чипов. От более быстрой SRAM выигрывают все современные процессоры и ускорители/GPU. SRAM – это основной строительный блок любого чипа, поэтому ее важность нельзя недооценивать.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).

Социальные сети

комментарии (0)

Войдите, чтобы оставить комментарий