> > > > IBM z16 Telum: высокая эффективность и низкие задержки интерфейса

IBM z16 Telum: высокая эффективность и низкие задержки интерфейса

Опубликовано:

ibmБудущие процессоры все чаще будут опираться на модульный дизайн, то же самое касается GPU и других чипов. AMD уже перешла на дизайн чиплетов с процессорами Ryzen, Intel сделает то же самое с Meteor Lake и Sapphire Rapids. GPU AMD и NVIDIA рано или поздно перейдут на несколько чипов.

На прошлогодней конференции Hotchips 33 IBM представила z16 Telum. Процессор состоит из двух кристаллов, каждый с восемью ядрами, 32 Мбайт кэша L2, а также общим кэшем L3 и L4 емкостью 256 Мбайт и виртуальные 2 Гбайт, соответственно, для восьми ядер. Они производятся по 7-нм техпроцессу на мощностях TSMC и содержат 22,5 млрд. транзисторов на площади 530 мм². В корпусировке соединены два таких кристалла.

Данное соединение представляет собой довольно большую проблему для дизайна, поскольку два кристалла должны работать как единый процессор. IBM разработала интерфейс Dual Chip Module (DCM) Synchronous Interface, который интересно сравнить с решениями конкурентов. Дилан Пател проанализировал имеющуюся информацию.

Интерфейс IBM DCM сравнивался с Intel MDFIO, который будет использоваться в грядущих процессорах Sapphire Rapids Xeon. Также сравнивалась шина Advanced Interface Bus (AIB), тоже разработанная Intel, и интерфейсы BoW-64 (Bunch of Wires) и OpenHBI.

Интерфейс IBM DCM использует передачу SDR (Single Data Rate) вместо DDR (Double Data Rate), то есть передает только один бит за такт, а не два. Поэтому пропускная способность в расчете на контакт в два раза ниже. Зато эффективность значительно лучше конкурентов. IBM показывает всего 0,26 пДж/бит, а MDFIO потребляет в два раза больше энергии для передачи одного бита – 0,5 пДж/бит. С учетом пропускной способности на контакт 2,7 Гбит/с интерконнект будет потреблять порядка 1 Вт. Пропускная способность всего интерфейса составляет 468,5 Гбайт/с.

Второй удивительный факт кроется в задержках, которые IBM удалось достичь при связи двух чипов. Они составляют всего 0,37 нс, хотя у Intel – 2,4 нс. Что положительно повлияет на оперативность обмена данными, все же два кристалла должны выглядеть как единый процессор.

Между кристаллами данные передаются по 1.388 контактам. Количество можно было бы уменьшить, перейдя на DDR, но IBM отказалась от подобного шага. Причина, вероятно, в том, что IBM здесь не требуется специальная подложка или мост, поэтому усилия по производству заметно меньше. В целом, было весьма интересно взглянуть на реализацию IBM.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).