> > > > Представлена финальная версия процессора Xeon Phi Knights Landing для HPC

Представлена финальная версия процессора Xeon Phi Knights Landing для HPC

Опубликовано:

intel3Несколько лет назад у Intel возникли серьезные амбиции в сфере GPU, которые вылились в проект Larabee, после чего наработки и идеи были использованы для создания вычислительных ускорителей Xeon Phi. Хотя когда-то Intel планировала создать настольный GPU для конкуренции с видеокартами AMD и NVIDIA. В любом случае, на конференции International Supercomputing Conference 2016 во Франкфурте-на-Майне Intel, наконец, представила финальную версию вычислительных ускорителей Xeon Phi нового поколения Knights Landing, ориентированных на высокопроизводительные вычисления (HPC).

Технически Xeon Phi Knights Landing представляют собой кристалл площадью 700 мм², который изготавливается Intel по 14-нм техпроцессу FinFET. Самой важной чертой архитектуры можно назвать 76 ядер Silvermont, хотя с оригинальными ядрами данного поколения они имеют не так много общего – Intel внесла оптимизации, ориентированные на вычисления. Среди них – векторные блоки для поддержки AVX-512, более крупные кэши и возможность через Hyper-Threading запускать до четырех потоков на ядро. Шесть каналов памяти чипа позволяют подключать до 384 Гбайт ОЗУ DDR4.

HPC-процессор Xeon Phi Knights Landing
HPC-процессор Xeon Phi Knights Landing

Подсистема памяти у HPC Xeon Phi Knights Landing играет важную роль, пользователи могут работать с оперативной памятью, которая дает сравнительно небольшую пропускную способность (обычно 90-120 Гбайт/с), или интегрированную на упаковку память MCDRAM от Micron. Последняя имеет емкость всего 16 Гбайт, зато пропускная способность составляет 500 Гбайт/с. Данная память может использоваться в так называемой плоской модели, формируя собственный узел хранения данных для каждого ускорителя. Либо память может работать в качестве кэша, наподобие памяти EDRAM, дополняющей некоторые iGPU Intel. Также имеется и гибридный режим между двумя вариантами.

HPC-процессор Xeon Phi Knights Landing
HPC-процессор Xeon Phi Knights Landing

Intel представляет четыре модели Xeon Phi Knights Landing. Топовый ускоритель будет доступен только в сентябре, поставки трех других уже начались. Что, кстати, видно по списку суперкомпьютеров Top 500. Осенью, а именно в октябре, HPC-ускоритель обзаведется опциональной поддержкой Omni Path, интерконнекта на основе оптического волокна. Данные модели будут дороже на $278 и будут потреблять на 15 Вт больше. К концу года также должны быть представлены варианты ускорителей в виде карт расширения PCI Express.

Intel Xeon Phi Knights Landing
Модель Ядра Частота MCDRAM DDR4 TDP Цена
7290 72 1,5 ГГц 16 Гбайт
500 Гбайт/с
384 Гбайт
2.400 МГц
245 Вт 6.254 долларов США
7250 68 1,4 ГГц 16 Гбайт
500 Гбайт/с
384 Гбайт
2.400 МГц
215 Вт 4.876 долларов США
7230 64 1,3 ГГц 16 Гбайт
500 Гбайт/с
384 Гбайт
2.400 МГц
215 Вт 3.710 долларов США
7210 64 1,3 ГГц 16 Гбайт
444 Гбайт/с
384 Гбайт
2.133 МГц
215 Вт 2.438 долларов США

Все варианты Xeon Phi Knights Landing устанавливаются в сокет LGA 3647, оснащаются 16 Гбайт памяти MCDRAM и могут адресовать до 384 Гбайт DDR4. У топовой модели 7290 активированы 72 из 76 ядер, которые работают на 1,5 ГГц. 16 Гбайт памяти MCDRAM дают пропускную способность 500 Гбайт/с, энергопотребление составляет 245 Вт. Цена - $6.254. Вторая модель в рейтинге 7250 предлагает 68 ядер на 1,4 ГГц. Энергопотребление снижено до 215 Вт, как и цена до $4.876. Высокая пропускная способность памяти сохраняется и у 7230. 64 ядра работают на 1,3 ГГц, энергопотребление составляет 215 Вт. Цена - $3.710. На оптимальное соотношение цена/производительность ориентированы ускорители 7210 с 64 ядрами на тактовой частоте 1,3 ГГц. Но здесь память MCDRAM работает на 444,4 Гбайт/с, частота оперативной памяти DDR4 тоже снижена до 2.133 МГц. Энергопотребление составляет 215 Вт, цена - $2.438.

HPC-процессор Xeon Phi Knights Landing
HPC-процессор Xeon Phi Knights Landing

Детали производительности Intel раскрыла только для самой быстрой модели 7290. Производительность с одинарной точностью составляет 7 TFLOPS, с двойной – 3,5 TFLOPS. Для сравнения, у NVIDIA Tesla P100, которая недавно была представлена в варианте PCI Express, мы получаем 10,6 и 5,3 TFLOPS в варианте NVLINK, а также 9,3 и 4,7 TFLOPS в версии PCI Express. Энергопотребление составляет порядка 250 Вт. Теоретически новые Xeon Phi Knights Landing больше не зависят от host-процессора и могут самостоятельно загружаться и выполнять программное обеспечение. Возможно, мы получим расширение спектра функций HPC-ускорителей в ближайшем будущем.