> > > > Новые подробности Lakefield и интерфейса корпусировки Foveros

Новые подробности Lakefield и интерфейса корпусировки Foveros

Опубликовано:

intel-lakefield-2020В статье WikiChip приведены новые подробности процессоров Lakefield, который является первым продуктом с корпусировкой Foveros, превращающей чип в "бутерброд" из нескольких кристаллов. Недавно был опубликован снимок кристалла в низком разрешении, а также появились первые тесты однопоточной производительности.

В статье WikiChip приводятся новые подробности структуры процессора. Базовый кристалл (Base Die) производится по техпроцессу 22FFL. На первый взгляд, техпроцесс кажется довольно старым, но на самом деле речь идет о современной реализации. Базовый кристалл оптимизируется под наименьшее возможное энергопотребление, и здесь 22FFL раскрывает свои сильные стороны. Отметим низкие токи утечки и дешевизну. По сути, техпроцесс 22FFL можно назвать "растянутой" версией 14-нм техпроцесса. На базовом кристалле располагаются контроллеры USB 3, аудио, SDIO, PCI Express 3.0 и другие компоненты ввода/вывода.

Базовый кристалл имеет площадь 92 мм², он состоит из десяти металлических слоев, отличается низким энергопотреблением и дешевизной производства. Используется простая технология Back End of Line (BEOL), когда для всех соединений подложки требуется лишь одна маска.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).

Мы рекомендуем ознакомиться с нашим руководством по выбору лучшего процессора Intel и AMD на весну 2020. Оно поможет выбрать оптимальный CPU за свои деньги и не запутаться в ассортименте моделей на рынке.

Базовый кристалл, по сути, можно назвать активной подложкой. Несмотря на сравнительно большую площадь (по сравнению с вычислительным кристаллом), он содержит всего 650 млн. транзисторов.

Перейдем к вычислительному кристаллу. На нем присутствуют четыре ядра Tremont, ядро Sunny Cove и графика Gen11 (плюс Gen11.5 Display Engine и Imaging Processing Unit (IPU) 5.5). Вычислительный кристалл расположен над базовым, площадь составляет 82 мм². Intel также впервые раскрыла число транзисторов - чуть более 5 млрд. Вычислительный кристалл производится по техпроцессу 10 nm+. То есть по второму поколению 10-нм техпроцесса Intel, который также используется для процессоров Tiger Lake.

Для вычислительного кристалла Intel использует кольцевой интерконнект. Он соединяет System Agent с пятью ядрами и GPU. У кольца предусмотрены четыре "остановки": ядро Sunny Cove, четыре ядра Tremont, GPU и Uncore.

На вычислительном кристалле площадью 82 мм² справа можно видеть фиолетовую область - встроенный GPU поколения Gen11. Обратите внимание, что GPU уже занимает порядка 40% области чипа. По центру кристалла расположено ядро Sunny Cove, то есть высокопроизводительное ядро процессора Lakefield. Зеленая область по центру вверху - четыре ядра Atom на архитектуре Tremont. Левая треть - многочисленные компоненты Uncore. Intel здесь сэкономила место, поскольку контроллеры Thunderbolt 3 и PCI Express 3.0 расположены на базовом кристалле.

С процессором Lakefield Intel впервые выбрала гибридный дизайн, состоящий из крупного и мощного ядра Sunny Cove, а также четырех "младших" ядер Tremont. Таким образом, на CPU доступны пять ядер. Поддержки Hyper-Threading на ядре Sunny Cove и четырех ядрах Tremont нет. Ядро Sunny Cove лишилось и поддержки AVX512, чтобы обеспечить совместимость по набору инструкций между разными ядрами.

Результаты производительности, которые называет Intel, весьма интересны. Одно ядро Tremont должно обеспечивать примерно 70% производительности ядра Sunny Cove. Но по эффективности ядро Atom намного обходит "старшего" собрата. Для многопоточных окружений будет использоваться 4-ядерный кластер из четырех ядер Tremont, а для однопоточных приложений - ядро Sunny Cove. Конечно, аппаратная и программная экосистема должна быть разработана таким образом, чтобы использовать сильные стороны процессора Lakefield.

Из общей площади вычислительного ядра 82 мм² кластер Tremont занимает порядка 5,14 мм², включая 1.5 Мбайт кэша L2. Одно ядро занимает 0,88 мм². Однако одно ядро Sunny Cove, с другой стороны, "отъедает" на кристалле 4,49 мм² - с 512 кбайт кэша L2. Так что Intel удалось собрать интересную смесь по производительности, энергопотреблению и занимаемой площади. Впрочем, у ядра Sunny Cove в данной реализации есть и недостаток, например, блоки AVX512 присутствуют, но отключены.

Связь между базовым и вычислительным кристаллами выполняется через Foveros Die Interface (FDI). Ячейки FDI I/O располагаются непосредственно под микро-шариками кристалла, чтобы улучшить качество передача сигнала и минимизировать дефекты, подобные ESD. Элементы приема и передачи располагаются только на базовом кристалле. Скорость передачи данных на контакт не такая большая, около 500 MT/s, но интерфейс FDI очень широкий и работает по 200 каналам. Эффективность передачи при этом составляет всего 0,2 пикоджоуля на бит, что в 10 раз меньше стандартных интерфейсов чипсета Intel OPI (или AMD IF). FDI был разработан с учетом 0,15 пДж/бит, здесь Intel продолжит оптимизировать грядущие продукты. Для сравнения: TSMC CoWoS работает с эффективностью 0,56 пДж/бит, а AMD Infinity Fabric - 2 пДж/бит (меньше - лучше).

Над базовым и вычислительным кристаллом располагаются два или четыре стека памяти LPDDR4, они подключены к вычислительному кристаллу через TSV. Данные стеки называются PoP (Package over Package).

Для Intel корпусировка Lakefield Foveros является пробным шаром, который позволит протестировать новые технологии. Процессоры Lakefield, которые будут выпущены небольшой партией, кажутся идеальным кандидатом для этой цели. Размер упаковки составляет 12 x 12 мм, толщина всего 1 мм.

Foveros второго поколения для HPC-ускорителей Ponte Vecchio

Первые устройства на процессоре Lakefield давно известны - ноутбуки Microsoft Surface Neo, Samsung Galaxy Book S и Lenovo ThinkPad X1 Fold. Однако все они еще не вышли на рынок. О втором поколении CPU Intel здесь тоже пока не говорит.

Но технология Foveros будет развиваться и дальше. В случае Co-EMIB Intel будет сочетать существующую технологию интерконнекта с Foveros, что позволит сделать дизайн еще более гибким. И первым продуктом на данной базе станет HPC-ускоритель Ponte Vecchio на основе архитектуры Xe HPC.

Вычислительное ядро будет производиться по 7-нм техпроцессу (1276), а базовое ядро - по улучшенному 10-нм техпроцессу (1274.Foveros). Опытные образцы чипа должны выйти в середине 2020 года, а финальная версия ускорителя - в 2021 году. Intel также говорит о переходе в будущем на техпроцесс 1278 (5 нм?) для вычислительного кристалла и 1276.Foveros. Похоже, что Intel сможет задействовать преимущества сочетания разных технологий производства кристаллов в составе подобных чипов, о чем шла речь на Architecture Day 2018.