> > > > Анализ тестов Radeon Vega Frontier Edition

Анализ тестов Radeon Vega Frontier Edition

Опубликовано:

amd-vega-logoНа мероприятии Financial Analyst Day 2017 AMD не только показала первые графические ускорители на GPU Vega, но и поделилась результатами тестов. Соответственно, видеокарта Radeon Vega Frontier Edition с 16 Гбайт HBM2 должна работать примерно в 1,5 раза быстрее NVIDIA Tesla P100. Наши коллеги из издания c't, а именно Андреас Стиллер (Andreas Stiller), специализирующийся на анализе процессорных архитектур и высокопроизводительных вычислениях, детально разобрали результаты тестов на презентации AMD.

Но начнем с того, с чем сравнивала AMD видеокарту Radeon Vega Frontier Edition на мероприятии. Были представлены результаты сравнения с Intel Xeon Phi Knights Landing 7250, NVIDIA Tesla M40 или Tesla P100. Но подобное сравнение нельзя назвать полностью честным, поскольку уже некоторое время на рынке доступна новая видеокарта NVIDIA Tesla P40, которая вышла на смену M40. Кроме того, NVIDIA две недели назад представила вычислительный ускоритель Tesla V100 на архитектуре Volta. Впрочем, здесь как раз объяснение понятно – AMD просто не могла достать соответствующие GPU.

Каждый производитель хотел бы выглядеть в благоприятном свете

Начнем с общего представления результатов тестов. Конечно, каждый производитель хотел бы выглядеть в наиболее благоприятном свете. По этой причине тесты обычно отбираются такие, чтобы в них лучше всего смотрелись собственные компоненты производителя. В случае игр подобрать нужный тест довольно просто, поскольку почти любая студия разработки не против обзавестись таким партнером, как AMD или NVIDIA. Но в профессиональной сфере все сложнее, хотя и здесь можно вносить оптимизации благодаря разным компиляторам и библиотекам.

AMD для первого теста производительности использовала DeepBench от Baidu. Но показанные AMD значения (миллисекунды) полному тесту не соответствуют. AMD, по всей видимости, использовала лишь часть полного тестового пакета под названием Convolutions. Данная часть состоит из 36 отдельных бенчмарков, а результаты отображаются в TFLOPS.

Как же выглядят результаты тестового пакета Convolutions? Лучше всего обратиться к графику ниже. AMD просто сложила время обработки всех 36 тестов, что вряд ли можно назвать честным. Некоторые тесты выполняются за несколько сотен миллисекунд, другие – за несколько сотен микросекунд, разница составляет три порядка. Сложение здесь вряд ли даст достоверную картину, следует использовать, как минимум, среднее геометрическое.

Но и с простым сложением не все гладко. Как считают наши коллеги из c't, не все значения соответствуют базе данных. AMD добавила сноску о том, что компания использовала менее производительную версию Tesla P100 с интерфейсом PCI Express, что кажется разумным, поскольку новая Radeon Vega Frontier Edition тоже будет работать через PCI Express.

Редакторы c't обратились к странице Baidu Research DeepBench на Github и выбрали другое представление данных. В частности, по значениям DeepBench было получено среднее геометрическое производительности, а не времени выполнения. В результате ускоритель NVIDA Titan Xp оказался в 2,75 раза быстрее Intel Xeon Phi 7250, который был взят за основу. А NVIDIA Tesla P100 в 1,83 раза быстрее GPU-ускорителя Intel. Новинка AMD Radeon Vega Frontier Edition в два раза быстрее Xeon Phi, то есть разрыв между NVIDIA Tesla P100 и Radeon Vega Frontier Edition существенно сократился по сравнению с представлением данных AMD.

Показанные значения наглядно говорят о том, какую существенную разницу могут вносить разные библиотеки. NVIDIA, например, оптимизирует CudaDNN под определенные алгоритмы, причем подобные оптимизации могут отсутствовать у библиотек Intel и AMD. Что касается AMD, то известно лишь использование драйвера ROCm 1.5. Информация об используемых библиотеках и алгоритмах не раскрывается. AMD может использовать разные библиотеки, оптимизированные под архитектуры Graphics Core Next 3 (Fiji GPU) и в некоторых частях под GCN4 (Polaris GPU).

Опять же, следует напомнить, что производители хотят представлять себя в наиболее выгодном свете, поэтому подбирают соответствующие тесты. В любом случае. критический взгляд на результаты тестов со стороны наших коллег из c't явно не помешает.

Социальные сети

комментарии (2)

#1
Зарегистрирован: 28.01.2015
Москва
Постоялец
Постов: 653
Профи подбирают карту под свои задачи. Опять же разные библиотеки, компиляторы, оптимизированные под определенную архитектуру бенчи вносят хаос в прямое сравнение. Честно было бы сравнить все числодробилки в нейтральном тесте, если такой существует...
#2
Зарегистрирован: 21.08.2013

Постоялец
Постов: 387
Шиллинг, у тебя весеннее обострение?
"...вычислительный ускоритель Tesla V100 на архитектуре Volta. Впрочем, здесь как раз объяснение понятно – AMD просто не могла достать соответствующие GPU." Пока ещё никто не смог достать "соответствующие GPU", потому, что Хуань опять макетом размахивал.
Войдите, чтобы оставить комментарий

Возможно, вам будут интересны следующие статьи: