> > > > Intel представила Omni Scale, Knights Landing с ядрами Silvermont и Hybrid Memory Cube (обновление)

Intel представила Omni Scale, Knights Landing с ядрами Silvermont и Hybrid Memory Cube (обновление)

Опубликовано:

intel3На конференции International Supercomputing Conference (ISC) в Лейпциге Intel представила некоторые подробности о новом интерконнекте Omni Scale между отдельными процессорами и картами ускорения, а также следующее поколение карт Xeon Phi "Knights Landing". Начнём с быстрого интерконнекта под названием Omni Scale, реализация которого стала возможной после приобретения соответствующих технологических подразделений Cray и Qlogic. В серверных системах становится всё более важной более тесная и быстрая связь отдельных компонентов сервера и серверов между собой. В данном направлении NVIDIA, например, разрабатывает собственную технологию NVLINK, но почти все производители аппаратного обеспечения уверены, что у PCI Express, скорее всего, не будет альтернативы в ближайшем будущем по подключению карт ускорения к процессорам.

Подробностей об интерфейсе Omni Scale пока не предоставлено. Intel говорит только об использовании так называемых граничных коммутаторов ("Edge Switches") для подключения к интерконнекту – в сетевой терминологии граничные коммутаторы соединяют две сети (например, локальную сеть и сеть провайдера). Также Intel, скорее всего, представит карту адаптера PCI Express, планируется и использование оптических соединений в качестве среды передачи данных. Поддержка интерконнекта Omni Scale планируется в 2015 году в процессорах Xeon на архитектуре "Broadwell EP", которые будут производиться по 14-нм техпроцессу. В планах Intel эти процессоры должны устанавливаться на платы ожидаемых вскоре "Haswell EP" с Socket LGA2011-R3 и поддержкой DDR4. Но довольно сомнительно, что интерконнект Omni Scale появится на этих материнских платах или его можно будет как-то добавить.

Перейдём к "Knights Landing" – следующему поколению карт ускорения Xeon Phi. Они тоже появятся в 2015 году, чип будет изготавливаться по новому 14-нм техпроцессу. Конечно, Intel здесь тоже планирует поддержать новый интерконнект Omni Scale. От высокой пропускной способности и низких задержек выиграют и процессор, и карта ускорения. "Knight Landing" базируется на 72 ядрах "Silvermont". Они могут обрабатывать до четырёх потоков на ядро, также ядра оснащаются блоками AVX512. В результате новые ускорители Xeon Phi достигают производительности 3 TFLOPS при работе с числами двойной точности. Для сравнения, профессиональная видеокарта AMD FirePro W9100 даёт производительность до 2,62 TFLOPS, а NVIDIA Tesla K40 – 1,43 TFLOPS. Важно отметить и наличие локальной памяти объёмом до 16 Гбайт. Intel говорит о пятикратном приросте производительности по сравнению с DDR4. Подсистему памяти Intel разрабатывает совместно с Micron, но пока еще не совсем понятно, будет ли использоваться технология Hybrid Memory Cube (HMC).

На конференции Intel также объявила о сотрудничестве с центром National Energy Research Scientific Computing Center (NERSC) Министерства энергетики США, по итогам которого в 2016 году будет запущен суперкомпьютер "Cori" на новых картах Xeon 9300 Phi. Конечно, тестов системы пока ещё нет, но два партнёра говорят о производительности в 10 петафлопов. Самый быстрый на сегодня суперкомпьютер Tianhe-2 обеспечивает скорость до 33,8 петафлопов в тесте Linpack, он опирается на 45 800 карт Xeon Phi нынешнего поколения.

Обновление:

Между тем Intel и Micron подтвердили использование Hybrid Memory Cube (HMC). Данная память будет работать в качестве кэша L2 или L3, расположенного напрямую на чипе. Пропускная способность памяти HMC тоже должна соответствовать кэшу.

Также появилась некоторая новая информация по поводу ядер "Knights Landing". Они базируются на ядрах "Silvermont", которые используются в платформе "Bay Trail". Технически Intel внесла несколько изменений, чтобы данные ядра работали на вычислительных картах Xeon Phi. В том числе использовала другую иерархию кэша, также на ядро может обрабатываться больше четырёх потоков. Более высокая плотность в серверах у новых "Knights Landing" Xeon Phi Intel планирует получить через использование сокета вместо нынешнего формата карты расширения. В результате в сервер 1U можно будет установить больше вычислительных ускорителей, чем сегодня. Дополнительную информацию о моделях Xeon Phi x200, в том числе и точное количество ядер, Intel пока не сообщила.