> > > > Epyc и Vega: AMD показала стойку производительностью в один PFLOP в секунду

Epyc и Vega: AMD показала стойку производительностью в один PFLOP в секунду

Опубликовано:

С новыми серверными процессорами Epyc и ускорителями Radeon Instinct компания AMD представила мощные компоненты, многие из которых уже появились в продаже, а другие появятся в ближайшие недели и месяцы. Процессоры Epyc должны потеснить в этом сегменте практически монополиста в лице Intel, а Radeon Instinct составит конкуренцию видеокартам NVIDIA Tesla.

Сама AMD представила комбинацию обоих этих компонентов в рамках мероприятия Capsaicin на Siggraph. Под названием "Project 47" скрывается одна серверная стойка с производительностью один петафлоп в секунду.

Project 47 насчитывает 20 серверных узлов, изготовленных Inventec для AMD. Каждый узел оснащен процессором AMD Epyc 7601 (32 ядра; 64 потока; 2,2 - 3,2 ГГц; 64 Мбайт кэша L3; 180 Вт), а также четырьмя AMD Radeon Instinct MI25 (Vega GPU; 4.096 потоковых процессоров; 16 Гбайт HBM2 с пропускной способностью 484 Гбайт/с; 24,6 TFLOPS при вычислениях FP16; 12,3 TFLOPS при FP32; 768 GFLOPS при FP64; 300 Вт). Теоретически только одни GPU-ускорители смогли бы обеспечить производительность в 1 PFLOPS, поэтому процессоры в данном случае служат в качестве инфраструктуры для GPU.

Кроме этого, сервер оснащен 512 Гбайт памяти DDR4, NVMe-SSD и картой InfiniBand для подключения серверов между собой. Соответствующий коммутатор InfiniBand входит в комплект оснащение серверной стойки.

Для наглядности приведем пример: один из современных суперкомпьютеров Sunway TaihuLight обладает производительностью в 94 PFLOPS, то есть для него понадобилось бы 94 таких стойки. Сам китайский суперкомпьютер ненамного больше, но он опирается на специализированное оборудование. В это же самое время, если взять до недавнего времени самый мощный суперкомпьютер Tianhe-2 на 33 PFLOPS, то его можно было бы укомплектовать 33 стойками, что по площади гораздо меньше оригинала.

AMD также подчеркивает, что область применения новых серверных стоек гораздо шире, а энергопотребление меньше. Теоретически, на каждом GPU могут работать до 16 пользователей в виртуальной среде. Имея 80 ускорителей в одной стойке, количество пользователей может составлять до 1.280.

Эффективность Project 47 достигает 30 GFLOPS/Вт. Номер один из топ 500 суперкомпьютеров достигает всего 6 GFLOPS/Вт. Если рассматривать более эффективные суперкомпьютеры, то здесь мы видим 14 GFLOPS/Вт, но в вычислениях FP64, в которых AMD значительно проигрывает конкурентам. Но здесь вопрос лишь целесообразности использования оборудования для конкретных приложений.

Также предлагаем посмотреть несколько демо Radeon Pro WX 9100 и Radeon Pro SSG.

Социальные сети

комментарии (0)

Войдите, чтобы оставить комментарий