> > > > AMD представила третье поколение EPYC 7003 Milan

AMD представила третье поколение EPYC 7003 Milan

Опубликовано:

amd-epyc-milanAMD сегодня анонсировала третье поколение серверных процессоров EPYC. Они используют ядра Zen 3, знакомые по нынешним процессорам Ryzen, которые теперь распространяются и до серверного пространства. С линейкой 7003 AMD продолжает путь, взятый с первыми двумя поколениями, продолжая улучшать платформу в сферах, которым ранее не уделялось много внимания.

Если посмотреть на спецификации, AMD предлагает существенно больше Intel: до 64 ядер на сокет, 128 линий PCI Express 4.0 и восемь каналов памяти DDR4-3200. Но, несмотря на техническое превосходство, AMD смогла выбить только около 10% рыночной доли в сегменте серверов. Все же данный сегмент очень консервативен, поэтому изменения здесь растягиваются на многие годы. Кроме того, Intel закрывает многие специальные сегменты, умело обходя ограничения поколений Skylake и Cascade Lake.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).

И хотя AMD сегодня представляет линейку 7003 и сравнивает ее с нынешним поколением Intel, данная ситуация не продлится долго, поскольку Intel скоро анонсирует новое поколение Ice Lake-SP.

Перед тем, как мы перейдем к рассмотрению отдельных моделей, позвольте поговорить об архитектуре Zen 3, которая является центральным компонентом современных мобильных, настольных и серверных процессоров AMD. AMD описывает Zen 3 как первую полностью новую разработку после первого поколения Zen. Центральным компонентом является новый 8-ядерный Core Complex (CCX), который содержит общий кэш L3 32 Мбайт, таких CCX в корпусировке может быть несколько.

Мы уже рассматривали подробности архитектуры Zen 3 в момент выхода линейки Ryzen 5000. Отличий в случае EPYC нет, хотя две группы процессоров используют разные функции архитектуры Zen 3.

Кристалл по-прежнему производится по 7-нм техпроцессу. Прирост IPC связан с микроархитектурой, причин тому несколько. Отметим изменения в блоках Load/Store, фронтальной части конвейера, кэше микроопераций, блоке предсказания ветвлений (Branch Predictor), вычислительных блоках и унифицированном кэше.

Ранее кристалл CCD содержал два блока CCX по четыре ядра. И четыре ядра использовали 16 Мбайт общего кэша L3, что приводило к 2x 16 Мбайт кэша L3 на CCD. С архитектурой Zen 3 AMD переходить на CCX с восемью ядрами, которые используют 32 Мбайт общего кэша L3. В конце концов, теперь уже не требуется crossbar-коммутатор между двумя кластерами кэша L3, а также в случае, если ядра из одного CCX желают обратиться к памяти другого.

Что снижает задержки работы с кэшем L3. Однако чем больше ядер будут обращаться в общий кэш, тем задержки будут больше. И восемь ядер для 32 Мбайт кэша можно назвать золотой серединой. Все ядра в комплексе CCX теперь напрямую соединены друг с другом. Кэш разделен на восемь участков по 4 Мбайт на ядро. Но преимущество единого кэша L3 в архитектуре Zen 3 кроется в том, что ядро может получать до 24 Мбайт кэша L3 эксклюзивно для себя, в таком случае 8 Мбайт кэша остаются общими для всех ядер.

В иерархии кэшей от L1 до L3 ничего не изменилось. Обмен данными идет со скоростью 32 байт за такт. Поэтому пропускные способности от L1 до L3 остаются прежними.

Прежняя константа: 8x CCD + 1x IOD

В ядрах Zen 3 произошло множество улучшений, о которых мы говорили ранее, и теперь новые ядра будут использоваться не только в процессорах Ryzen, но и EPYC.

На следующем слайде AMD приводит наиболее важные характеристики EPYC SoC:

Максимальное число ядер 64 на процессор остается и с новым поколением EPYC. Ядра могут выполнять два потока одновременно, что для 64 ядер дает 128 потоков. TDP меняется от 120 до 280 Вт, процессоры EPYC 7003 можно устанавливать в существующие материнские платы SP3 и системы.

Остались прежними и восемь каналов памяти, которые могут работать с DDR4-3200 (RDIMM, LRDIMM, 3DS и NVDIMM-N) с максимальной емкостью 256 Гбайт на канал. То есть получается до 4 Тбайт на сокет. Из новшеств отметим поддержку чередования памяти AMD (memory interleaving). Чуть ниже мы остановимся на данной функции подробнее.

По остальным характеристикам платформа не изменилась. Она по-прежнему обеспечивает 128 линий PCI Express 4.0. В случае двух сокетов доступны 162 линии PCI Express.

В IOD линейки 7003 не изменилось почти ничего. Данный центральный кристалл отвечает за соединение восьми CCD, а также работает с каналами памяти и линиями PCI Express. В случае предшественника IOD имел площадь 416 мм² и содержал 8,34 млрд. транзисторов.

IOD в линейке 7003 не идентичен предшественнику, но все еще производится по 14-нм техпроцессу. AMD указывает на прежнюю площадь, но чередование памяти привело к небольшому увеличению числа транзисторов.

Сравнение площади и числа транзисторов
  Площадь кристалла Число транзисторов
CCD (Zen) 212 мм² 4,8 млрд.
CCD (Zen+) 212 мм² 4,8 млрд.
CCD (Matisse & Rome) 74 мм² 3,9 млрд.
CCD (Vermeer & Milan) 80,7 мм² 4,15 млрд.
IOD (Matisse) 125 мм² 2,09 млрд.
IOD (Vermeer) 125 мм² 2,09 млрд.
IOD (Rome) 416 мм² 8,34 млрд.
IOD (Milan)

416 мм²

8,34 млрд.*
Rome в сумме: 8x CCD + IOD 1.008 мм² 39,54 млрд.
Milan в сумме: 8x CCD + IOD 1.061,6 мм² 39,54 млрд.*
Intel XCC (Skylake) 694 мм² 43,09 млрд.
NVIDIA GA100-GPU 826 мм² 54,2 млрд.

*Точное количество транзисторов Milan IOD пока неизвестно.

С объявлением процессоров Ryzen 5000, AMD анонсировала площадь Zen 3 CCD 80,7 мм². Каждый кристалл-чиплет содержит 4,15 млрд. транзисторов. То есть CCD с ядрами стали крупнее и сложнее. Если верить AMD, кристалл IOD между поколениями Rome и Milan почти не изменился. Но более крупные CCD все равно привели к изменению масштаба и сложности конструкции из чиплетов.

Кристаллы Rome в сумме дают 1.008 мм² и 39,54 млрд. транзисторов. У Milan площадь увеличивается до 1.061,6 мм² и 39,54 млрд. транзисторов. Впрочем, в корпусировке под распределителем тепла изменилось мало что. Чиплеты теперь расположены чуть ближе друг к другу. Энергопотребление осталось прежним, а более крупные CCD должны лучше отдавать тепло на распределитель.

Новые конфигурации CCD

В линейке EPYC 7003 теперь появились новые конфигурации CCD с 56 и 28 ядрами, которые раньше не встречались. Суть в том, как AMD распределяет 56 и 28 ядер по имеющимся CCD. AMD проинформировала нас, что 56-ядерный процессор опирается на восемь CCD с семью ядрами каждый. 28-ядерный реализован через четыре CCD с семью ядрами. На диаграмме это выглядит следующим образом.

Так что мы получили новые возможные конфигурации. Например, восьмиядерный CPU теперь доступен только с восемью CCD с одним активным ядром на каждом. Ранее были конфигурации 4 x 2 и 2 x 4 ядра. Так что AMD отказалась от некоторых моделей в младших конфигурациях. Зато были добавлены упомянутые выше модели с 56 и 28 ядрами.

Чередование памяти (Memory interleaving) для менее дорогих конфигураций

С процессорами EPYC 7003 AMD представила чередование памяти, что позволяет использовать только шесть каналов из доступных восьми. Конечно, и с предыдущими поколениями EPYC можно было использовать меньше восьми каналов памяти. Но максимальная пропускная способность достигалась только с восемью занятыми каналами. А четыре канала, например, давали порядка 50% пропускной способности. При этом каждый из четырех контроллеров памяти с двумя каналами должен был нагружаться одним каналом. Если нагружалось только два контроллера, но двумя каналами каждый, это приводило к асимметрии, что негативно сказывалось на производительности. Если приложения не чувствительны к пропускной способности памяти или не требуют максимальную емкость, подобная конфигурация имеет смысл (нагрузка одного канала памяти из двух на каждом контроллере).

Однако возникали проблемы, например, при использовании шести каналов памяти из восьми. Половина контроллеров памяти работала с одним каналом, вторая половина - с двумя каналами. В итоге нагрузка получалась асимметричной. И вместо 75% от максимальной пропускной способности, на практике получалось между 40% и 60%.

Функция чередования памяти теперь решает проблемы с несбалансированными 6-канальными конфигурациями, которые получают пропускную способность до 75% от полной. Что позволяет покупателям более рационально расходовать средства на закупку памяти. Технология чередования балансирует нагрузку, теперь даже при установке шести модулей производительность будет близка к возможному максимуму.

Линейка процессоров EPYC 7003

Перейдем к линейке процессоров 7003:

Сравнение процессоров

Ядра БазоваяBoost Кэш L3TDPЦена
EPYC 7763 642,45 ГГц3,5 ГГц 256 MB280 Вт7.890 USD
EPYC 7713 642,0 ГГц3,675 ГГц 256 MB225 Вт7.060 USD
EPYC 7713/P 642,0 ГГц3,675 ГГц 256 MB225 Вт5.010 USD
EPYC 7663 562,0 ГГц3,5 ГГц 256 MB240 Вт6.366 USD
EPYC 7643 482,3 ГГц3,6 ГГц 256 MB225 Вт4.995 USD
EPYC 75F3 322,95 ГГц4,0 ГГц 256 MB280 Вт4.860 USD
EPYC 7543 322,8 ГГц3,7 ГГц 256 MB225 Вт3.761 USD
EPYC 7543P 322,8 ГГц3,7 ГГц 256 MB225 Вт2.730 USD
EPYC 7513 322,6 ГГц3,65 ГГц 128 MB200 Вт2.840 USD
EPYC 7453 282,75 ГГц3,45 ГГц 64 MB225 Вт1.570 USD
EPYC 74F3 243,2 ГГц4,0 ГГц 256 MB240 Вт2.900 USD
EPYC 7443 242,85 ГГц4,0 ГГц 128 MB200 Вт2.010 USD
EPYC 7443P 242,85 ГГц4,0 ГГц 128 MB200 Вт1.337 USD
EPYC 7413 242,65 ГГц3,6 ГГц 128 MB180 Вт1.825 USD
EPYC 73F3 163,5 ГГц4,0 ГГц 256 MB240 Вт3.521 USD
EPYC 7343 163,2 ГГц3,9 ГГц 128 MB190 Вт1.565 USD
EPYC 7313 163,0 ГГц3,7 ГГц 128 MB155 Вт1.083 USD
EPYC 7313P 163,0 ГГц3,7 ГГц 128 MB155 Вт913 USD
EPYC 72F3 83,7 ГГц4,1 ГГц 256 MB180 Вт2.468 USD

AMD представила 15 новых процессоров EPYC, которые подразделяются по нескольким категориям. Модели 7xF3 обеспечивают максимальную производительность ядер и значительный объем кэша L3 на ядро. Также есть модели с 48, 56 и 64 ядрами, которые ориентированы на приложения, способные нагрузить такое количество ядер. Есть и широкий спектр моделей с числом ядер от 16 до 32 и разным TDP, что обеспечивает достаточную гибкость для соответствия требованиям по вычислительной производительности и распределению нагрузки по потокам.

Новые процессоры дополняются моделями EPYC предыдущего поколения, которые обеспечивают целостность ассортимента. В том числе это касается 12-ядерных и 8-ядерных CPU, которые в линейке 7003 почти отсутствуют. Речь идет о следующих процессорах.

Сравнение процессоров

ЯдраБазоваяBoost Кэш L3TDP
EPYC 7532 322,4 ГГц3,3 ГГц 256 MB200 Вт
EPYC 7352 242,3 ГГц3,2 ГГц 128 MB155 Вт
EPYC 7282 162,8 ГГц3,2 ГГц 64 MB120 Вт
EPYC 7272 122,9 ГГц3,2 ГГц 64 MB120 Вт
EPYC 7262 83,2 ГГц3,4 ГГц 128 MB155 Вт
EPYC 7252 83,1 ГГц3,2 ГГц 64 MB120 Вт

AMD решила позиционировать процессоры предыдущего поколения на бюджетный сегмент. Вероятно, причина кроется в том, что отобранные и дорогие кристаллы Zen 3, как и процессоры EPYC 7003, не так выгодно урезать до малого числа ядер. Да и преимущества архитектуры Zen 3 оправдывают себя не везде.

Первые тесты AMD

Конечно, AMD показала собственные тесты. Как обычно, мы относимся к ним с долей скепсиса. Кроме того, AMD сравнивает нынешнее поколение Cascade Lake от Intel, хотя скоро выходит новое. Да, у AMD не было возможности сравнить собственные продукты с пока еще не вышедшими чипами от Intel. Но все это следует помнить.

AMD выбрала для сравнения поколение Intel Cascade Lake, а именно Xeon Gold 6258R с 28 ядрами. По информации AMD, все процессоры EPYC с 28 ядрами и больше оказываются быстрее по сравнению с конкурентом. Для тестов производительности использовался бенчмарк SPECRATE 2017_INT_Base. На бюджетном сегменте AMD атаковала Xeon Silver 4216 с 16 ядрами, и тоже весьма успешно.

Процессоры EPYC 7003 будут доступны клиентам с сегодняшнего дня. Впрочем, пройдет какое-то время, прежде чем они появятся в рознице. Производители серверов, в том числе Dell, HPE и Supermicro, первыми представят соответствующие системы. Следом выйдут решения от Atos, ASRock, ASUS, Cisco, Foxconn, Gigabyte, H3C, Inventec, Lenovo, MiTAC, MSI, QCT, Tyan, wiwynn и wistron.

Со стороны облачных инстанций установка новых серверов на процессорах EPYC уже стартовала. И облачные провайдеры, такие как AWS, Alibaba, Microsoft, Google, IBM, Oracle и Tencent, скоро объявят соответствующие предложения.

Для AMD остается вопрос поставки требуемого количества процессоров. Кроме того, весьма интересно и следующее поколение процессоров Xeon, поскольку Intel закроет разрыв с AMD по числу ядер, производительности отдельных ядер и функциям платформы. В опубликованных тестах AMD находится "на коне", но ситуация была таковой и до линейки 7003. По тестам производительности приложений ситуация на практике может отличаться. Как и AMD, Intel публикует результаты тестов приложений с высокой степенью оптимизации, которые задействуют специальные функции процессоров.

Посмотрим, сможет ли AMD увеличить свою рыночную долю. Многое здесь будет зависеть и от того, получится ли у AMD поставить на рынок достаточное количество процессоров. Сегодня на рынке наблюдается дефицит практически всех компонентов, поэтому ситуация для AMD не из легких. В случае Intel все несколько проще, поскольку компания занимается производством самостоятельно. AMD же приходится зависеть от мощностей TSMC, конкурируя со многими другими клиентами.