Страница 1: Тест: два Intel Xeon Platinum 8280 в сервере или рабочей станции

intel-xeon-8280В начале апреля Intel официально представила поколение Cascade Lake процессоров Xeon. Они устанавливаются на платформу Purley с сокетом LGA3647, которая уже используется для процессоров Skylake SP/AP. Однако в архитектуре CPU произошли некоторые изменения, в том числе и касающиеся поддержки памяти, в результате чего Cascade Lake Xeon смотрятся намного лучше. В нашу тестовую лабораторию поступили два Xeon Platinum 8280, которые мы сравним с прямыми предшественниками в разных сценариях.

Со вторым поколением процессоров Xeon Scalable Intel изменила направление развития линейки Xeon. Если процессоры Skylake-SP были ориентированы на классическую вычислительную производительность, а для особых сценариев предусматривались ускорители Xeon Phi или дополнительные чипы FPGA, то архитектура Cascade Lake приводит к тому, что подобные специальные решения уже не нужны. Cascade Lake Xeon выпущены в весьма широком ассортименте, есть и специальные варианты для различных сценариев, причем все это - на единой платформе.

Новые процессоры

Мы привели список новых процессоров в нашем подобном обзоре Xeon Scalable второго поколения.

С процессорами Cascade Lake Intel внесла изменения в архитектуру и техпроцесс по сравнению со Skylake, но оба поколения аппаратно довольно близки. Intel производит процессоры Cascade Lake SP на кристаллах трех размеров. Кристаллы LCC (Low Core Count) со степпингом R1 содержат до восьми ядер. Для более мощных CPU Intel использует кристаллы HCC (High Core Count) со степпингом L1 - до 18 ядер. Наконец, для CPU с числом ядер до 28 Intel использует степпинг B1 кристалла XCC (Extreme Core Count)..

Все кристаллы по-прежнему производятся по 14-нм технологии. К сожалению, Intel не дает информации о числе транзисторов или размере кристалла. Но по расчетам кристалл LCC имеет площадь 322 мм², HCC - 484 мм², а XCC - 698 мм². Но вряд ли изменения по сравнению с поколением Skylake SP по числу транзисторов и площади велики, поскольку интеграция VNNI и аппаратное исправление уязвимостей не приводит к существенному увеличению числа транзисторов.

По сравнению с процессорами Skylake, для некоторых CPU Intel обещает прирост производительности в 1,6 раза. Если внимательно рассмотреть некоторые модели и сравнить с предшествующими CPU, то Intel не только немного увеличила тактовые частоты, но и в ряде случаев добавила ядра. Например, если у Intel Xeon 6130 использовалось только 16 ядер, Xeon 6230N получил 20. То же самое можно видеть и для некоторых других CPU. Благодаря улучшенному техпроцессу Intel удалось увеличить тактовые частоты на 200-300 МГц.

Optane DC Persistent Memory

Важной особенностью новых Xeon на архитектуре Cascade Lake является поддержка Optane DC Persistent Memory. Уже несколько месяцев Intel активно подчеркивала, что память Optane DC Persistent Memory будет играть ключевую роль с новыми процессорами Cascade Lake Xeon.

Платформа Purley изначально создавалась с поддержкой новой памяти. Вероятно, Intel планировала представить Optane DC Persistent Memory еще с Skylake Xeon, но решила все же ограничить поддержку только в целях разработки. Многие серверы и материнские платы содержат определенное количество слотов DIMM для установки модулей Optane DC Persistent Memory.

Если вам интересны технические подробности, работа и структура Optane DC Persistent Memory, мы рекомендуем обратиться к нашему обзору процессоров Xeon Scalable второго поколения. Там мы рассмотрели конфигурацию и режимы работы Optane DC Persistent Memory. Поскольку на момент тестов новые модули Optane мы не получили, то ограничимся работой с классической памятью.

Resource Director и Speed Select

Технологии Resource Director и Speed Select позволяют процессорам Cascade Lake лучше адаптироваться к нагрузкам. В случае Resource Director Technology (RDT) управление осуществляется программными средствами. RDT позволяет Intel более эффективно распоряжаться доступными ресурсами. Администратор может выбирать между выделением ресурсов исключительно для указанной нагрузки и гибким распределением. Технология выполняет мониторинг кэшей и пропускной способности памяти, позволяя гибко их распределять.

Цель заключается в более высокой степени использования процессоров, чтобы повысить эффективность серверов. Вместе с тем на администратора переносится часть ответственности за грамотное распределение ресурсов. Конечно, RDT не следует использовать для нагрузок, которым нужна максимальная производительность.

Speed Select Technology (SST) тоже опирается на схожий подход. Она позволяет выставлять на выбранных ядрах более высокие тактовые частоты. На других ядрах частоты, напротив, снижаются. Для начала Intel будет поддерживать три профиля на трех моделях Xeon (процессоры Y).

Кроме того, существуют нагрузки, которые должны выполняться с определенной тактовой частотой, чтобы давать расчетную производительность. В случае Speed Select Technology данная проблема тоже решается, поскольку ресурсы CPU полностью контролируются.

VNNI и DL Boost

Intel добавила поддержку новых наборов инструкций. В контексте инструкций AVX-512 важной спецификой новых процессоров Xeon являются Vector Neural Network Instructions (VNNI). Вычислительная производительность AVX-512 с одинарной и двойной точностью между поколениями Skylake и Cascade Lake остается идентичной. Но поскольку теперь возможен расчет 4x INT MAC/такт по сравнению с AVX2 в процессорах Skylake-SP, новые CPU Cascade Lake теоретически получают четырехкратный прирост вычислительной производительности в данных вычислениях. Intel говорит, что на практике можно рассчитывать на трехкратное увеличение.

Поддержка VNNI в процессорах Xeon Scalable позволяет более гибко использовать их при тренировке сетей глубокого обучения и в инференсе. Впрочем, для инференса, то есть для запросов в сеть глубокого обучения, все же лучше подходят специализированные процессоры. Intel как раз предлагает здесь Agilex FPGAs.