> > > > Задержки Intel: Министерство энергетики США заказывает еще один суперкомпьютер

Задержки Intel: Министерство энергетики США заказывает еще один суперкомпьютер

Опубликовано:

intel-auroraNVIDIA анонсировала еще один суперкомпьютер, который будет собран для Министерства энергетики США. Система под названием Polaris будет запущена уже в этом году. Ранее на 2022 и 2023 годы были запланированы два суперкомпьютера класса экзаскейла. А именно El Capitan с процессорами EPYC и ускорителями Radeon Instinct на 2023 год, а также Aurora на процессорах Xeon (Sapphire Rapids) и ускорителях Ponte Vecchio, причем данный суперкомпьютер изначально должны были запустить в конце 2021 года.

Слухи о задержках ходили уже давно. С одной стороны, Intel не смогла выдержать расписание с процессорами Xeon. С другой стороны, с ускорителями Ponte Vecchio тоже все пошло не так. И в сумме все задержки привели к тому, что Министерство энергетики США (оператор Argonne Leadership Computing Facility, ALCF) решило заказать еще одну систему.

В результате суперкомпьютер Polaris на какое-то время заменит Aurora - если верить консенсусу аналитиков индустрии. Polaris состоит из 560 узлов, каждый использует процессор EPYC и четыре GPU-ускорителя A100. В общей сложности число GPU-ускорителей достигнет 2.240. Однако неизвестно, идет речь о вариантах на 40 или 80 Гбайт. Системы будут собираться HPE, поэтому планируется использовать интерконнект Slingshot.

Суперкомпьютер в вычислениях ИИ обеспечит 1,4 EFLOPS. Что касается более высокой точности, ожидается производительность 44 PFLOPS. Конечно, Aurora и El Capitan будут играть в другом классе производительности. Даже в высоком классе точности (FP64) производительность превышает EFLOPS, а El Capitan дает даже более 2 EFLOPS.

Задержки и отсутствие поддержки CXL (Type 3)

Кроме очевидных задержек компонентов Intel, на конференции Hot Chips было объявлено, что Sapphire Rapids и Ponte Vecchio не будут поддерживать интерконнект CXL, по крайней мере, в ожидавшемся ранее варианте.

Каждый интерфейс PCI Express с 16 линиями процессоров Sapphire Rapids поддерживает CXL 1.1, но только типа 1 и 2, а не типа 3. Напомним, что только тип 3 позволяет увеличить объем памяти, и Samsung как раз представила подобное решение CXL. Но Sapphire Rapids его поддерживать не будут.

Ponte Vecchio не будет поддерживать CXL вообще. Здесь в качестве интерфейса остается PCI Express 5.0. Когерентный доступ к памяти по-прежнему заявлен, хотя именно CXL облегчает его реализацию. В оригинальном анонсе системы Aurora в качестве протокола Xe-Link был указан CXL.

Ариджит Бисвас, старший инженер Intel, на конференции Hot Chips сказал следующее: "CXL makes atomics easier, CPU-side cachability easier, GPU-side cacheability easier, and offer finer granularity of coherence...but is not required to present a coherent view of memory. I expect future versions will move to a CXL interface..."

Так что Intel в курсе, что отсутствие поддержки CXL ускорителями Ponte Vecchio приведет к своим недостаткам.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).