AMD представила третье поколение EPYC 7003 Milan
Если посмотреть на спецификации, AMD предлагает существенно больше Intel: до 64 ядер на сокет, 128 линий PCI Express 4.0 и восемь каналов памяти DDR4-3200. Но, несмотря на техническое превосходство, AMD смогла выбить только около 10% рыночной доли в сегменте серверов. Все же данный сегмент очень консервативен, поэтому изменения здесь растягиваются на многие годы. Кроме того, Intel закрывает многие специальные сегменты, умело обходя ограничения поколений Skylake и Cascade Lake.
Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).
И хотя AMD сегодня представляет линейку 7003 и сравнивает ее с нынешним поколением Intel, данная ситуация не продлится долго, поскольку Intel скоро анонсирует новое поколение Ice Lake-SP.
Перед тем, как мы перейдем к рассмотрению отдельных моделей, позвольте поговорить об архитектуре Zen 3, которая является центральным компонентом современных мобильных, настольных и серверных процессоров AMD. AMD описывает Zen 3 как первую полностью новую разработку после первого поколения Zen. Центральным компонентом является новый 8-ядерный Core Complex (CCX), который содержит общий кэш L3 32 Мбайт, таких CCX в корпусировке может быть несколько.
Мы уже рассматривали подробности архитектуры Zen 3 в момент выхода линейки Ryzen 5000. Отличий в случае EPYC нет, хотя две группы процессоров используют разные функции архитектуры Zen 3.
Кристалл по-прежнему производится по 7-нм техпроцессу. Прирост IPC связан с микроархитектурой, причин тому несколько. Отметим изменения в блоках Load/Store, фронтальной части конвейера, кэше микроопераций, блоке предсказания ветвлений (Branch Predictor), вычислительных блоках и унифицированном кэше.
Ранее кристалл CCD содержал два блока CCX по четыре ядра. И четыре ядра использовали 16 Мбайт общего кэша L3, что приводило к 2x 16 Мбайт кэша L3 на CCD. С архитектурой Zen 3 AMD переходить на CCX с восемью ядрами, которые используют 32 Мбайт общего кэша L3. В конце концов, теперь уже не требуется crossbar-коммутатор между двумя кластерами кэша L3, а также в случае, если ядра из одного CCX желают обратиться к памяти другого.
Что снижает задержки работы с кэшем L3. Однако чем больше ядер будут обращаться в общий кэш, тем задержки будут больше. И восемь ядер для 32 Мбайт кэша можно назвать золотой серединой. Все ядра в комплексе CCX теперь напрямую соединены друг с другом. Кэш разделен на восемь участков по 4 Мбайт на ядро. Но преимущество единого кэша L3 в архитектуре Zen 3 кроется в том, что ядро может получать до 24 Мбайт кэша L3 эксклюзивно для себя, в таком случае 8 Мбайт кэша остаются общими для всех ядер.
В иерархии кэшей от L1 до L3 ничего не изменилось. Обмен данными идет со скоростью 32 байт за такт. Поэтому пропускные способности от L1 до L3 остаются прежними.
Прежняя константа: 8x CCD + 1x IOD
В ядрах Zen 3 произошло множество улучшений, о которых мы говорили ранее, и теперь новые ядра будут использоваться не только в процессорах Ryzen, но и EPYC.
На следующем слайде AMD приводит наиболее важные характеристики EPYC SoC:
Максимальное число ядер 64 на процессор остается и с новым поколением EPYC. Ядра могут выполнять два потока одновременно, что для 64 ядер дает 128 потоков. TDP меняется от 120 до 280 Вт, процессоры EPYC 7003 можно устанавливать в существующие материнские платы SP3 и системы.
Остались прежними и восемь каналов памяти, которые могут работать с DDR4-3200 (RDIMM, LRDIMM, 3DS и NVDIMM-N) с максимальной емкостью 256 Гбайт на канал. То есть получается до 4 Тбайт на сокет. Из новшеств отметим поддержку чередования памяти AMD (memory interleaving). Чуть ниже мы остановимся на данной функции подробнее.
По остальным характеристикам платформа не изменилась. Она по-прежнему обеспечивает 128 линий PCI Express 4.0. В случае двух сокетов доступны 162 линии PCI Express.
В IOD линейки 7003 не изменилось почти ничего. Данный центральный кристалл отвечает за соединение восьми CCD, а также работает с каналами памяти и линиями PCI Express. В случае предшественника IOD имел площадь 416 мм² и содержал 8,34 млрд. транзисторов.
IOD в линейке 7003 не идентичен предшественнику, но все еще производится по 14-нм техпроцессу. AMD указывает на прежнюю площадь, но чередование памяти привело к небольшому увеличению числа транзисторов.
Площадь кристалла | Число транзисторов | |
CCD (Zen) | 212 мм² | 4,8 млрд. |
CCD (Zen+) | 212 мм² | 4,8 млрд. |
CCD (Matisse & Rome) | 74 мм² | 3,9 млрд. |
CCD (Vermeer & Milan) | 80,7 мм² | 4,15 млрд. |
IOD (Matisse) | 125 мм² | 2,09 млрд. |
IOD (Vermeer) | 125 мм² | 2,09 млрд. |
IOD (Rome) | 416 мм² | 8,34 млрд. |
IOD (Milan) | 416 мм² | 8,34 млрд.* |
Rome в сумме: 8x CCD + IOD | 1.008 мм² | 39,54 млрд. |
Milan в сумме: 8x CCD + IOD | 1.061,6 мм² | 39,54 млрд.* |
Intel XCC (Skylake) | 694 мм² | 43,09 млрд. |
NVIDIA GA100-GPU | 826 мм² | 54,2 млрд. |
*Точное количество транзисторов Milan IOD пока неизвестно.
С объявлением процессоров Ryzen 5000, AMD анонсировала площадь Zen 3 CCD 80,7 мм². Каждый кристалл-чиплет содержит 4,15 млрд. транзисторов. То есть CCD с ядрами стали крупнее и сложнее. Если верить AMD, кристалл IOD между поколениями Rome и Milan почти не изменился. Но более крупные CCD все равно привели к изменению масштаба и сложности конструкции из чиплетов.
Кристаллы Rome в сумме дают 1.008 мм² и 39,54 млрд. транзисторов. У Milan площадь увеличивается до 1.061,6 мм² и 39,54 млрд. транзисторов. Впрочем, в корпусировке под распределителем тепла изменилось мало что. Чиплеты теперь расположены чуть ближе друг к другу. Энергопотребление осталось прежним, а более крупные CCD должны лучше отдавать тепло на распределитель.
Новые конфигурации CCD
В линейке EPYC 7003 теперь появились новые конфигурации CCD с 56 и 28 ядрами, которые раньше не встречались. Суть в том, как AMD распределяет 56 и 28 ядер по имеющимся CCD. AMD проинформировала нас, что 56-ядерный процессор опирается на восемь CCD с семью ядрами каждый. 28-ядерный реализован через четыре CCD с семью ядрами. На диаграмме это выглядит следующим образом.
Так что мы получили новые возможные конфигурации. Например, восьмиядерный CPU теперь доступен только с восемью CCD с одним активным ядром на каждом. Ранее были конфигурации 4 x 2 и 2 x 4 ядра. Так что AMD отказалась от некоторых моделей в младших конфигурациях. Зато были добавлены упомянутые выше модели с 56 и 28 ядрами.
Чередование памяти (Memory interleaving) для менее дорогих конфигураций
С процессорами EPYC 7003 AMD представила чередование памяти, что позволяет использовать только шесть каналов из доступных восьми. Конечно, и с предыдущими поколениями EPYC можно было использовать меньше восьми каналов памяти. Но максимальная пропускная способность достигалась только с восемью занятыми каналами. А четыре канала, например, давали порядка 50% пропускной способности. При этом каждый из четырех контроллеров памяти с двумя каналами должен был нагружаться одним каналом. Если нагружалось только два контроллера, но двумя каналами каждый, это приводило к асимметрии, что негативно сказывалось на производительности. Если приложения не чувствительны к пропускной способности памяти или не требуют максимальную емкость, подобная конфигурация имеет смысл (нагрузка одного канала памяти из двух на каждом контроллере).
Однако возникали проблемы, например, при использовании шести каналов памяти из восьми. Половина контроллеров памяти работала с одним каналом, вторая половина - с двумя каналами. В итоге нагрузка получалась асимметричной. И вместо 75% от максимальной пропускной способности, на практике получалось между 40% и 60%.
Функция чередования памяти теперь решает проблемы с несбалансированными 6-канальными конфигурациями, которые получают пропускную способность до 75% от полной. Что позволяет покупателям более рационально расходовать средства на закупку памяти. Технология чередования балансирует нагрузку, теперь даже при установке шести модулей производительность будет близка к возможному максимуму.
Линейка процессоров EPYC 7003
Перейдем к линейке процессоров 7003:
Ядра | Базовая | Boost | Кэш L3 | TDP | Цена | |
EPYC 7763 | 64 | 2,45 ГГц | 3,5 ГГц | 256 MB | 280 Вт | 7.890 USD |
EPYC 7713 | 64 | 2,0 ГГц | 3,675 ГГц | 256 MB | 225 Вт | 7.060 USD |
EPYC 7713/P | 64 | 2,0 ГГц | 3,675 ГГц | 256 MB | 225 Вт | 5.010 USD |
EPYC 7663 | 56 | 2,0 ГГц | 3,5 ГГц | 256 MB | 240 Вт | 6.366 USD |
EPYC 7643 | 48 | 2,3 ГГц | 3,6 ГГц | 256 MB | 225 Вт | 4.995 USD |
EPYC 75F3 | 32 | 2,95 ГГц | 4,0 ГГц | 256 MB | 280 Вт | 4.860 USD |
EPYC 7543 | 32 | 2,8 ГГц | 3,7 ГГц | 256 MB | 225 Вт | 3.761 USD |
EPYC 7543P | 32 | 2,8 ГГц | 3,7 ГГц | 256 MB | 225 Вт | 2.730 USD |
EPYC 7513 | 32 | 2,6 ГГц | 3,65 ГГц | 128 MB | 200 Вт | 2.840 USD |
EPYC 7453 | 28 | 2,75 ГГц | 3,45 ГГц | 64 MB | 225 Вт | 1.570 USD |
EPYC 74F3 | 24 | 3,2 ГГц | 4,0 ГГц | 256 MB | 240 Вт | 2.900 USD |
EPYC 7443 | 24 | 2,85 ГГц | 4,0 ГГц | 128 MB | 200 Вт | 2.010 USD |
EPYC 7443P | 24 | 2,85 ГГц | 4,0 ГГц | 128 MB | 200 Вт | 1.337 USD |
EPYC 7413 | 24 | 2,65 ГГц | 3,6 ГГц | 128 MB | 180 Вт | 1.825 USD |
EPYC 73F3 | 16 | 3,5 ГГц | 4,0 ГГц | 256 MB | 240 Вт | 3.521 USD |
EPYC 7343 | 16 | 3,2 ГГц | 3,9 ГГц | 128 MB | 190 Вт | 1.565 USD |
EPYC 7313 | 16 | 3,0 ГГц | 3,7 ГГц | 128 MB | 155 Вт | 1.083 USD |
EPYC 7313P | 16 | 3,0 ГГц | 3,7 ГГц | 128 MB | 155 Вт | 913 USD |
EPYC 72F3 | 8 | 3,7 ГГц | 4,1 ГГц | 256 MB | 180 Вт | 2.468 USD |
AMD представила 15 новых процессоров EPYC, которые подразделяются по нескольким категориям. Модели 7xF3 обеспечивают максимальную производительность ядер и значительный объем кэша L3 на ядро. Также есть модели с 48, 56 и 64 ядрами, которые ориентированы на приложения, способные нагрузить такое количество ядер. Есть и широкий спектр моделей с числом ядер от 16 до 32 и разным TDP, что обеспечивает достаточную гибкость для соответствия требованиям по вычислительной производительности и распределению нагрузки по потокам.
Новые процессоры дополняются моделями EPYC предыдущего поколения, которые обеспечивают целостность ассортимента. В том числе это касается 12-ядерных и 8-ядерных CPU, которые в линейке 7003 почти отсутствуют. Речь идет о следующих процессорах.
Ядра | Базовая | Boost | Кэш L3 | TDP | |
EPYC 7532 | 32 | 2,4 ГГц | 3,3 ГГц | 256 MB | 200 Вт |
EPYC 7352 | 24 | 2,3 ГГц | 3,2 ГГц | 128 MB | 155 Вт |
EPYC 7282 | 16 | 2,8 ГГц | 3,2 ГГц | 64 MB | 120 Вт |
EPYC 7272 | 12 | 2,9 ГГц | 3,2 ГГц | 64 MB | 120 Вт |
EPYC 7262 | 8 | 3,2 ГГц | 3,4 ГГц | 128 MB | 155 Вт |
EPYC 7252 | 8 | 3,1 ГГц | 3,2 ГГц | 64 MB | 120 Вт |
AMD решила позиционировать процессоры предыдущего поколения на бюджетный сегмент. Вероятно, причина кроется в том, что отобранные и дорогие кристаллы Zen 3, как и процессоры EPYC 7003, не так выгодно урезать до малого числа ядер. Да и преимущества архитектуры Zen 3 оправдывают себя не везде.
Первые тесты AMD
Конечно, AMD показала собственные тесты. Как обычно, мы относимся к ним с долей скепсиса. Кроме того, AMD сравнивает нынешнее поколение Cascade Lake от Intel, хотя скоро выходит новое. Да, у AMD не было возможности сравнить собственные продукты с пока еще не вышедшими чипами от Intel. Но все это следует помнить.
AMD выбрала для сравнения поколение Intel Cascade Lake, а именно Xeon Gold 6258R с 28 ядрами. По информации AMD, все процессоры EPYC с 28 ядрами и больше оказываются быстрее по сравнению с конкурентом. Для тестов производительности использовался бенчмарк SPECRATE 2017_INT_Base. На бюджетном сегменте AMD атаковала Xeon Silver 4216 с 16 ядрами, и тоже весьма успешно.
Процессоры EPYC 7003 будут доступны клиентам с сегодняшнего дня. Впрочем, пройдет какое-то время, прежде чем они появятся в рознице. Производители серверов, в том числе Dell, HPE и Supermicro, первыми представят соответствующие системы. Следом выйдут решения от Atos, ASRock, ASUS, Cisco, Foxconn, Gigabyte, H3C, Inventec, Lenovo, MiTAC, MSI, QCT, Tyan, wiwynn и wistron.
Со стороны облачных инстанций установка новых серверов на процессорах EPYC уже стартовала. И облачные провайдеры, такие как AWS, Alibaba, Microsoft, Google, IBM, Oracle и Tencent, скоро объявят соответствующие предложения.
Для AMD остается вопрос поставки требуемого количества процессоров. Кроме того, весьма интересно и следующее поколение процессоров Xeon, поскольку Intel закроет разрыв с AMD по числу ядер, производительности отдельных ядер и функциям платформы. В опубликованных тестах AMD находится "на коне", но ситуация была таковой и до линейки 7003. По тестам производительности приложений ситуация на практике может отличаться. Как и AMD, Intel публикует результаты тестов приложений с высокой степенью оптимизации, которые задействуют специальные функции процессоров.
Посмотрим, сможет ли AMD увеличить свою рыночную долю. Многое здесь будет зависеть и от того, получится ли у AMD поставить на рынок достаточное количество процессоров. Сегодня на рынке наблюдается дефицит практически всех компонентов, поэтому ситуация для AMD не из легких. В случае Intel все несколько проще, поскольку компания занимается производством самостоятельно. AMD же приходится зависеть от мощностей TSMC, конкурируя со многими другими клиентами.