> > > > Hot Chips 33: IBM Z Telum - 5+ ГГц и много (виртуального) кэша

Hot Chips 33: IBM Z Telum - 5+ ГГц и много (виртуального) кэша

Опубликовано:

ibmIBM представила новое поколение своих чипов Z под кодовым названием Telum. Но IBM выбрала иной путь: новое поколение будет меньше и намного более гибким. Предшественник z15 был анонсирован осенью 2019 года, 12 ядер процессора работают на тактовой частоте до 5,2 ГГц. Кэш L2 составляет 4 Мбайт, кэш L3 был удвоен до 256 Мбайт по сравнению с предыдущим поколением.

С Telum IBM представила процессор, который оснащен восемью ядрами с внеочередным выполнением, благодаря поддержке SMT2 они могут выполнять по два потока. Весь дизайн ориентирован на быстрое выполнение приложений в реальном времени, поэтому в фокусе однопоточная производительность. IBM установила 32 Мбайт кэша L2, причем для каждого ядра CPU. Доступ к кэшу L2 осуществляется максимально быстро благодаря четырем конвейерам, полная запись выполняется всего за 19 тактов (3,8 нс).

Учитывая восемь ядер с 32 Мбайт кэша L2 каждое, в сумме объем составляет 256 Мбайт, причем кэш может быть доступен для всех ядер в качестве когерентного или виртуального L3. Для кэша используется кольцевая шина с пропускной способностью 320 Гбайт/с, которая позволяет обращаться к кэшу L2 другого ядра. В результате ядра могут работать с 256 Мбайт виртуального кэша L3 с задержками всего 12 нс.

В стойке с восемью чипами Telum тоже поддерживается объединение ресурсов, в итоге емкость виртуального кэша L4 составляет до 2 Гбайт.

На последнем уровне в иерархии памяти работают контроллеры DDR с восемью каналами памяти. Здесь тоже гарантируются минимальные задержки.

Конечно, Telum не обошелся без ускорителя ИИ, который обеспечивает производительность 6 TFLOPS для вычислений FP16. Ускоритель ИИ имеет прямой доступ к кэшу L2 процессора со скоростью чтения до 120 Гбайт/с и записи до 80 Гбайт/с. Однако данные можно заранее подготовить для ускорителя, что увеличивает пропускную способность до 600 Гбайт/с. Но полная емкость кэшей 8x 32 Мбайт при этом уже недоступна.

IBM Z Telum интересен для широкого спектра приложений. В фокусе задачи реального времени из разных сфер (финансы, страхование, инфраструктура и т.д.). Масштабирование возможно от одного чипа до двух, затем до стоек с 8 - 32 процессорами.

IBM Z Telum производятся по 7-нм техпроцессу Samsung. Чипы содержат 22,5 млрд. транзисторов на площади 530 мм². Процессор состоит из 17 слоев. Базовая частота будет чуть выше 5 ГГц. Более детальной информации IBM не представляет.

Наконец, позвольте привести снимки подложки и чипов IBM Z Telum.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).