Страница 1: Тест AMD EPYC 7003 против Ice Lake-SP

epyc-3rd-genМы протестировали два Xeon Platinum 8380 с 40 ядрами Sunny Cove поколения Intel Ice Lake, но для сравнения привели результаты лишь двух предыдущих поколений. Теперь настало время опубликовать прямое сравнение с современными процессорами AMD EPYC 7003. Мы протестируем четыре пары двухсокетных процессоров AMD, что позволит охватить довольно широкий рынок по сравнению с Intel Ice Lake-SP. Интересно будет посмотреть, в каких областях AMD продемонстрирует свои сильные стороны и обойдет лидера индустрии Intel. Все подробности вы узнаете в нашем обзоре.

В середине марта 2021 AMD официально представила новое поколение EPYC 7003 с кодовым названием Milan. Оно предлагает до 64 ядер на сокет, что значительно больше Intel, которая с последним поколением процессоров обеспечивает до 40 ядер Sunny Cove. Оба производителя теперь предлагают восемь каналов памяти DDR4-3200, но 128 линий PCI Express по стандарту 4.0 остаются преимуществом платформы AMD по функциональности ввода/вывода. Несмотря на нынешнее технологическое преимущество, AMD смогла "отъесть" лишь около 10% доли серверного рынка. Все же бизнес дата-центров очень консервативен, и не все здесь хотят менять поставщиков. Кроме того, Intel предлагает различные специализированные решения, которые умело обходят ограничения поколений Skylake и Cascade-Lake. Поэтому в наших тестах используются бенчмарки с набором инструкций AVX-512, AVX-512 VNNI или DL-Boost, а также Optane Persistent Memory 200.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).

Между тем долгосрочные планы AMD принесли свои плоды. Архитектура Zen 3 позволила достичь паритета с Intel, она стала центральным компонентом во всех мобильных, настольных и серверных процессорах. AMD несколько раз подчеркивала, что архитектура Zen 3 является первой существенной разработкой после оригинального поколения Zen. Важной составляющей эволюции стали новые 8-ядерные Core Complex (CCX), которые содержат общий кэш L3 32 Мбайт с другими функциональными блоками.

Мы уже рассматривали подробности архитектуры Zen 3 во время выхода семейства Ryzen 5000. Отличий у процессоров EPYC здесь нет, хотя две группы продуктов по-разному используют функции архитектуры Zen 3.

Техпроцесс остался прежним - 7 нм. Прирост IPC связан с микроархитектурой, причин тому несколько. Отметим изменения в блоках Load/Store, фронтальной части конвейера, кэше микроопераций, блоке предсказания ветвлений (Branch Predictor), вычислительных блоках и унифицированном кэше.

Ранее кристалл CCD содержал два блока CCX по четыре ядра. И четыре ядра использовали 16 Мбайт общего кэша L3, что приводило к 2x 16 Мбайт кэша L3 на CCD. С архитектурой Zen 3 AMD переходить на CCX с восемью ядрами, которые используют 32 Мбайт общего кэша L3. В конце концов, теперь уже не требуется crossbar-коммутатор между двумя кластерами кэша L3, а также в случае, если ядра из одного CCX желают обратиться к памяти другого.

Что снижает задержки работы с кэшем L3. Однако чем больше ядер будут обращаться в общий кэш, тем задержки будут больше. И восемь ядер для 32 Мбайт кэша можно назвать золотой серединой. Все ядра в комплексе CCX теперь напрямую соединены друг с другом. Кэш разделен на восемь участков по 4 Мбайт на ядро. Но преимущество единого кэша L3 в архитектуре Zen 3 кроется в том, что ядро может получать до 24 Мбайт кэша L3 эксклюзивно для себя, в таком случае 8 Мбайт кэша остаются общими для всех ядер.

В иерархии кэшей от L1 до L3 ничего не изменилось. Обмен данными идет со скоростью 32 байт за такт. Поэтому пропускные способности от L1 до L3 остаются прежними.

На первый взгляд, при переходе со второго на третьего поколения EPYC изменений не так много:

Максимальное число ядер 64 на процессор остается и с новым поколением EPYC. Ядра могут выполнять два потока одновременно, что для 64 ядер дает 128 потоков. TDP меняется от 120 до 280 Вт, процессоры EPYC 7003 можно устанавливать в существующие материнские платы SP3 и системы.

Остались прежними и восемь каналов памяти, которые могут работать с DDR4-3200 (RDIMM, LRDIMM, 3DS и NVDIMM-N) с максимальной емкостью 256 Гбайт на канал. То есть получается до 4 Тбайт на сокет. Из новшеств отметим поддержку чередования памяти AMD (memory interleaving). Чуть ниже мы остановимся на данной функции подробнее.

По остальным характеристикам платформа не изменилась. Она по-прежнему обеспечивает 128 линий PCI Express 4.0. В случае двух сокетов доступны 162 линии PCI Express.

В IOD линейки 7003 не изменилось почти ничего. Данный центральный кристалл отвечает за соединение восьми CCD, а также работает с каналами памяти и линиями PCI Express. В случае предшественника IOD имел площадь 416 мм² и содержал 8,34 млрд. транзисторов.

IOD в линейке 7003 не идентичен предшественнику, но все еще производится по 14-нм техпроцессу. AMD указывает на прежнюю площадь, но чередование памяти привело к небольшому увеличению числа транзисторов.

Сравнение площади и числа транзисторов
  Площадь кристалла Число транзисторов
CCD (Zen) 212 мм² 4,8 млрд.
CCD (Zen+) 212 мм² 4,8 млрд.
CCD (Matisse & Rome) 74 мм² 3,9 млрд.
CCD (Vermeer & Milan) 80,7 мм² 4,15 млрд.
IOD (Matisse) 125 мм² 2,09 млрд.
IOD (Vermeer) 125 мм² 2,09 млрд.
IOD (Rome) 416 мм² 8,34 млрд.
IOD (Milan)

416 мм²

8,34 млрд.*
Rome в сумме: 8x CCD + IOD 1.008 мм² 39,54 млрд.
Milan в сумме: 8x CCD + IOD 1.061,6 мм² 39,54 млрд*
Intel XCC-Die (Skylake) 694 мм² -
NVIDIA GA100-GPU 826 мм² 54,2 млрд.

*Точное количество транзисторов Milan IOD пока неизвестно.

С объявлением процессоров Ryzen 5000, AMD анонсировала площадь Zen 3 CCD 80,7 мм². Каждый кристалл-чиплет содержит 4,15 млрд. транзисторов. То есть CCD с ядрами стали крупнее и сложнее. Если верить AMD, кристалл IOD между поколениями Rome и Milan почти не изменился. Но более крупные CCD все равно привели к изменению масштаба и сложности конструкции из чиплетов.

Кристаллы Rome в сумме дают 1.008 мм² и 39,54 млрд. транзисторов. У Milan площадь увеличивается до 1.061,6 мм² и 39,54 млрд. транзисторов. Впрочем, в корпусировке под распределителем тепла изменилось мало что. Чиплеты теперь расположены чуть ближе друг к другу. Энергопотребление осталось прежним, а более крупные CCD должны лучше отдавать тепло на распределитель.

Чередование памяти (Memory interleaving) для менее дорогих конфигураций

С процессорами EPYC 7003 AMD представила чередование памяти, что позволяет использовать только шесть каналов из доступных восьми. Конечно, и с предыдущими поколениями EPYC можно было использовать меньше восьми каналов памяти. Но максимальная пропускная способность достигалась только с восемью занятыми каналами. А четыре канала, например, давали порядка 50% пропускной способности. При этом каждый из четырех контроллеров памяти с двумя каналами должен был нагружаться одним каналом. Если нагружалось только два контроллера, но двумя каналами каждый, это приводило к асимметрии, что негативно сказывалось на производительности. Если приложения не чувствительны к пропускной способности памяти или не требуют максимальную емкость, подобная конфигурация имеет смысл (нагрузка одного канала памяти из двух на каждом контроллере).

Однако возникали проблемы, например, при использовании шести каналов памяти из восьми. Половина контроллеров памяти работала с одним каналом, вторая половина - с двумя каналами. В итоге нагрузка получалась асимметричной. И вместо 75% от максимальной пропускной способности, на практике получалось между 40% и 60%.

Функция чередования памяти теперь решает проблемы с несбалансированными 6-канальными конфигурациями, которые получают пропускную способность до 75% от полной. Что позволяет покупателям более рационально расходовать средства на закупку памяти. Технология чередования балансирует нагрузку, теперь даже при установке шести модулей производительность будет близка к возможному максимуму.