AMD планирует конкурировать с NVIDIA в сегменте дата-центров на равных

Опубликовано:

amd-newhorizonНа вчерашнем мероприятии "Новый горизонт" AMD сфокусировалась на дата-центрах. Были представлены ускорители Radeon Instinct MI60 и Radeon Instinct MI50 на основе 7-нм GPU Vega 20. Также AMD раскрыла производительность своих ускорителей.

Но начнем с аппаратной составляющей. Ускорители Radeon Instinct MI60 базируются на GPU Vega 20. Они оснащаются 64 блоками CU, то есть, 4.096 потоковыми процессорами - как и GPU Vega 10 в видеокартах Radeon RX Vega 64. Тактовая частота GPU составляет 1.800 МГц.

Ускорители Radeon Instinct MI50 тоже опираются на GPU Vega 20, но уже в другой конфигурации. Они оснащаются всего 60 блоками CU и, соответственно, 3.840 потоковыми процессорами. Тактовая частота GPU заявлена на 1.746 МГц. Оба ускорителя используют 4.096-битный интерфейс памяти HBM2 емкостью 16 или 32 Гбайт, с четырьмя чипами HBM2 на 1.000 МГц. В результате пропускная способность памяти составляет 1 Тбайт/с.

Оба ускорителя опираются на интерфейс PCI Express. Поддерживаются стандарты 3.0 и 4.0, в случае PCI Express 4.0 мы получаем удвоение пропускной способности до 64 Гбайт/с, что наверняка даст преимущество в дата-центрах. NVIDIA разработала ускорители Tesla V100, которые подключаются через NVLink с пропускной способностью более 300 Гбайт/с. AMD позволяет соединять четыре Radeon Instinct MI60 или Radeon Instinct MI50 через интерконнект Infinity Fabric, который обеспечивает пропускную способность до 100 Гбайт/с между GPU и до 54 Гбайт/с между GPU и CPU через PCI-Express 4.0.

На мероприятии были опубликованы и некоторые подробности производительности ускорителей:

В рамках первого сравнения AMD отмечает прирост по сравнению с предшествующим поколением, сравнивания новый Radeon Instinct MI60 и старый Radeon Instinct MI25. В зависимости от сценария, прирост составляет от 2,8 до 8,8 раз.

Для повышения производительности новые блоки CU у графических процессоров Vega 20 были дополнены выделенными блоками FP64. Также теперь с высокой производительностью выполняются простые вычисления INT8 и INT4.

В крупных серверах ускорители GPU редко используются по одиночке. Как правило, их устанавливают несколько штук. И здесь становится актуальным интерконнект. Тот же Infinity Fabric Link обеспечивает пропускную способность до 100 Гбайт/с, причем можно соединять до четырех GPU. Поскольку у второго поколения процессоров EPYC появилась поддержка PCI Express 4.0, системы с более чем четырьмя GPU тоже будут весьма хорошо масштабироваться.

Наконец, весьма интересно сравнение AMD между Radeon Instinct MI60 и версией NVIDIA Tesla V100 с интерфейсом PCI Express, которая продается уже порядка 18 месяцев. Если верить результатам тестов AMD, в некоторых случаях ускорители Radeon Instinct обеспечивают более высокую производительность.

Похоже, что AMD считает свои позиции на рынке дата-центров весьма сильными, так что у системных интеграторов и производителей серверов теперь есть альтернатива. Однако не совсем понятно, как долго AMD сможет наслаждаться своим положением, поскольку у NVIDIA уже есть преемник архитектуре Volta для дата-центров, который будет представлен весной. Как и в случае серверных процессоров, AMD придется доказать свои позиции, чтобы занять долю в весьма консервативном серверном сегменте.

Еще один вопрос касается программной поддержки, поскольку NVIDIA уже потратила весьма много усилий на разработку экосистемы CUDA. Поэтому перед AMD стоит весьма сложная задача, поскольку важна не только высокая производительность GPU, но и программная обвязка.