> > > > AMD продемонстрировала производительность серверного процессора Naples

AMD продемонстрировала производительность серверного процессора Naples

Опубликовано:

amd naplesAMD использовала мероприятие RYZEN Tech Day, чтобы раскрыть новую информацию о Naples, серверном процессоре на архитектуре Zen. Еще прошлым летом появились первые сведения. Но до сих пор кроме наличия 32 ядер и поддержке 64 потоков на процессор было мало что известно. Соответственно, в двухсокетной системе мы получаем 64 ядра и 128 потоков. Все это, как надеется AMD, позволит компании утвердиться в серверном сегменте.

Процессор Naples, как и другие процессоры нового поколения Zen, производится по 14-нм техпроцессу, но он ориентирован на максимальную надежность, что видно, помимо всего прочего, по частоте. Хотя AMD не указывает конкретные тактовые частоты. Процессор Naples состоит из четырех ядер Zeppelin. Каждое ядро Zeppelin, по сути, представляет собой 8-ядерный процессор RYZEN, вместе кристаллы собраны в многочиповой упаковке (multichip package, MCP). В прошлом AMD уже экспериментировала с MCP. Если взять за основу сложность и размер 8-ядерных кристаллов Ryzen, то у Zeppelin мы получим 19,2 млрд. транзисторов и площадь порядка 800 мм².

Вполне логично, что процессоры Naples опираются на 8-ядерный контроллер памяти (2x 4). Каждый канал может оснащаться двумя планками памяти, в результате мы получаем 16 DIMM на сокет, в двухсокетной системе количество модулей может составлять 32 DIMM, что дает теоретически до 4 Тбайт памяти. До сих пор подобный объем для двухсокетного сервера был невозможен, поэтому мы получаем уникальную функцию. Доступны 128 линий PCI Express 3.0, что тоже является важным преимуществом по сравнению с последним поколением Xeon, где мы получаем намного меньше линий. В случае Intel Xeon E7-8894 v4 доступно лишь 40 линий, у нового поколения сам процессор будет обеспечивать только 48 линий PCI Express. 128 линий PCI Express процессора Naples можно мультиплексировать, используя их, например, для прямого подключения контроллеров накопителей SATA или контроллеров Ethernet. Чипсет для процессоров Naples уже не нужен.

Но в двухсокетной системе на процессор доступны не полные 128 линий PCI Express, а только 64. У каждого процессора 64 линии забираются для связи между двумя CPU через Infinity Fabric. Пропускная способность составляет порядка 64 Гбайт/с. Напомним, что Intel QPI в нынешней версии дает только 25,6 Гбайт/с (3,2 ГГц x 2 бита/Гц (DDR) x 16(20) бит/ширину канала QPI x 2 (двунаправленный прием и передача) /8 бит = 25,6 Гбайт/с). Будет интересно посмотреть, как скоростной интерконнект скажется на производительности. Мы также опубликовали дополнительную статью, в которой рассмотрели подробности интерконнекта Infinity Fabric от AMD.

Ниже мы привели сравнение характеристик двухсокетных систем AMD Naples и Intel Xeon E5-2699 v4.

Сравнение двухсокетных систем
  AMD Naples Intel Xeon E5-2699 V4
Число процессоров 2 2
Число ядер 64 44
Число потоков 128 88
Каналы памяти 16 8
Емкость памяти (16 Гбайт DIMM) 512 384
Частота памяти 2.400 МГц 1.866 МГц
Число линий PCI Express 8x 16 = 128 2x 40 = 80

Как можно видеть, у AMD имеется явное преимущество по числу ядер и доступных потоков. Впрочем, здесь все зависит от производительности, которую может обеспечить каждое ядро. Ниже мы приведем несколько тестов, после чего обсудим их. В пользу AMD говорит поддержка 8-канальной памяти DDR4 и более высоких частот памяти. В тестах имеется соответствующий пример.

Первые тесты

AMD впервые поделилась результатами тестов. Они проводились на разных системах, чтобы лучше сравнить результаты с платформой Intel. Программное обеспечение используется для анализа сейсмических данных в геологоразведке. Поле данных состоит из одного или четырех миллиардов точек. Инструкции AVX были активированы, в случае процессоров Naples частота была фиксирована.

В первом тесте система Intel с 44 ядрами и памятью на 1.866 МГц сравнивалась с системой Naples, число ядер которой было ограничено тоже 44, память тоже работала только на 1.866 МГц. Таким образом, мы получаем сравнение, близкое к 1:1. Тестовый массив состоял из 500 x 1.408 x 1.408 точек, то есть 991.232.000 в сумме. С самого начала демонстрации было видно, что система Naples загружает данные в память быстрее, она быстрее перешла к расчетам. Таким образом, система Naples не только быстрее выполняет итерации, но и выигрывает от более быстрой работы с памятью. У системы Intel ушло на расчеты более чем в два раза больше времени – 38 с. Еще более интересной картина становится, когда систему Naples ничего не сдерживает. Она работает с 64 ядрами и частотой памяти 2.400 МГц, в результате время расчетов становится еще меньше.

Симуляция сейсмоданных

10 итераций

Секунды
Меньше - лучше

Симуляция сейсмоданных

10 итераций

Секунды
Меньше - лучше

Симуляция сейсмоданных

Среднее время итерации

Секунды
Меньше - лучше

Симуляция сейсмоданных

Среднее время итерации

Секунды
Меньше - лучше

AMD также выбрала более экстремальный случай с массивом 2.000 x 1.408 x 1.408 точек, в сумме 3.964.928.000. Система Intel уже не смогла загрузить все данные в память и прекратила расчет. Даже по сравнению с процессорами Skylake-EP у AMD сохранятся преимущества в виде более скоростной памяти и большего объема памяти, Naples поддерживает новые NVDIMM, как энергозависимые, так и энергонезависимые.

После успешного старта процессоров RYZEN для настольных компьютеров, AMD, похоже, возвращается в большую игру. Однако несколько отдельных тестов пока не проясняют всю картину. В разных приложениях производительность процессоров может отличаться, AMD наверняка выбрала приложение, которое лучше всего показывает себя на процессорах Naples.

Процессоры будут объявлены летом, но AMD говорит о доступности первых систем на процессорах Naples во втором квартале 2017.