Несколько лет назад у Intel возникли серьезные амбиции в сфере GPU, которые вылились в проект Larabee, после чего наработки и идеи были использованы для создания вычислительных ускорителей Xeon Phi. Хотя когда-то Intel планировала создать настольный GPU для конкуренции с видеокартами AMD и NVIDIA. В любом случае, на конференции International Supercomputing Conference 2016 во Франкфурте-на-Майне Intel, наконец, представила финальную версию вычислительных ускорителей Xeon Phi нового поколения Knights Landing, ориентированных на высокопроизводительные вычисления (HPC).
Технически Xeon Phi Knights Landing представляют собой кристалл площадью 700 мм², который изготавливается Intel по 14-нм техпроцессу FinFET. Самой важной чертой архитектуры можно назвать 76 ядер Silvermont, хотя с оригинальными ядрами данного поколения они имеют не так много общего – Intel внесла оптимизации, ориентированные на вычисления. Среди них – векторные блоки для поддержки AVX-512, более крупные кэши и возможность через Hyper-Threading запускать до четырех потоков на ядро. Шесть каналов памяти чипа позволяют подключать до 384 Гбайт ОЗУ DDR4.
Подсистема памяти у HPC Xeon Phi Knights Landing играет важную роль, пользователи могут работать с оперативной памятью, которая дает сравнительно небольшую пропускную способность (обычно 90-120 Гбайт/с), или интегрированную на упаковку память MCDRAM от Micron. Последняя имеет емкость всего 16 Гбайт, зато пропускная способность составляет 500 Гбайт/с. Данная память может использоваться в так называемой плоской модели, формируя собственный узел хранения данных для каждого ускорителя. Либо память может работать в качестве кэша, наподобие памяти EDRAM, дополняющей некоторые iGPU Intel. Также имеется и гибридный режим между двумя вариантами.
Intel представляет четыре модели Xeon Phi Knights Landing. Топовый ускоритель будет доступен только в сентябре, поставки трех других уже начались. Что, кстати, видно по списку суперкомпьютеров Top 500. Осенью, а именно в октябре, HPC-ускоритель обзаведется опциональной поддержкой Omni Path, интерконнекта на основе оптического волокна. Данные модели будут дороже на $278 и будут потреблять на 15 Вт больше. К концу года также должны быть представлены варианты ускорителей в виде карт расширения PCI Express.
Intel Xeon Phi Knights Landing | ||||||
---|---|---|---|---|---|---|
Модель | Ядра | Частота | MCDRAM | DDR4 | TDP | Цена |
7290 | 72 | 1,5 ГГц | 16 Гбайт 500 Гбайт/с |
384 Гбайт 2.400 МГц |
245 Вт | 6.254 долларов США |
7250 | 68 | 1,4 ГГц | 16 Гбайт 500 Гбайт/с |
384 Гбайт 2.400 МГц |
215 Вт | 4.876 долларов США |
7230 | 64 | 1,3 ГГц | 16 Гбайт 500 Гбайт/с |
384 Гбайт 2.400 МГц |
215 Вт | 3.710 долларов США |
7210 | 64 | 1,3 ГГц | 16 Гбайт 444 Гбайт/с |
384 Гбайт 2.133 МГц |
215 Вт | 2.438 долларов США |
Все варианты Xeon Phi Knights Landing устанавливаются в сокет LGA 3647, оснащаются 16 Гбайт памяти MCDRAM и могут адресовать до 384 Гбайт DDR4. У топовой модели 7290 активированы 72 из 76 ядер, которые работают на 1,5 ГГц. 16 Гбайт памяти MCDRAM дают пропускную способность 500 Гбайт/с, энергопотребление составляет 245 Вт. Цена - $6.254. Вторая модель в рейтинге 7250 предлагает 68 ядер на 1,4 ГГц. Энергопотребление снижено до 215 Вт, как и цена до $4.876. Высокая пропускная способность памяти сохраняется и у 7230. 64 ядра работают на 1,3 ГГц, энергопотребление составляет 215 Вт. Цена - $3.710. На оптимальное соотношение цена/производительность ориентированы ускорители 7210 с 64 ядрами на тактовой частоте 1,3 ГГц. Но здесь память MCDRAM работает на 444,4 Гбайт/с, частота оперативной памяти DDR4 тоже снижена до 2.133 МГц. Энергопотребление составляет 215 Вт, цена - $2.438.
Детали производительности Intel раскрыла только для самой быстрой модели 7290. Производительность с одинарной точностью составляет 7 TFLOPS, с двойной – 3,5 TFLOPS. Для сравнения, у NVIDIA Tesla P100, которая недавно была представлена в варианте PCI Express, мы получаем 10,6 и 5,3 TFLOPS в варианте NVLINK, а также 9,3 и 4,7 TFLOPS в версии PCI Express. Энергопотребление составляет порядка 250 Вт. Теоретически новые Xeon Phi Knights Landing больше не зависят от host-процессора и могут самостоятельно загружаться и выполнять программное обеспечение. Возможно, мы получим расширение спектра функций HPC-ускорителей в ближайшем будущем.