> > > > AMD представила Radeon Instinct – в фокусе машинное обучение

AMD представила Radeon Instinct – в фокусе машинное обучение

Опубликовано:

radeon instinctНельзя сказать, что AMD покинула профессиональный рынок, поскольку компания все же выпускает видеокарты FirePro, в том числе и новую линейку WX, но они не играют существенной роли, особенно в сегменте суперкомпьютеров. К счастью, AMD решила в корне изменить ситуацию, представив новую стратегию для данного сегмента: Radeon Instinct.

С Radeon Instinct AMD представляет готовую экосистему для машинного обучения (Machine Learning) или сетей глубокого обучения (Deep Learning). Архитектура Zen для процессоров, архитектура Vega для видеокарт и окружение ROCm с открытым исходным кодом – все это должно помочь AMD увеличить долю рынка, где пока доминирует NVIDIA. Мы поинтересовались, почему AMD представляет данную экосистему именно сейчас, на что получили ответ: технологии Deep Learning и Machine Learning достигли технического уровня, который позволит AMD предоставить должную аппаратную поддержку, причем это касается и этапа тренировки (training), и обработки запросов (inferencing).

В будущем разработка инфраструктуры будет расширена и до гетерогенных систем. Сегодня в суперкомпьютерах используются проприетарные технологии, подобные NVIDIA CUDA и соответствующей инфраструктуры вычислений на GPU, но они слишком специализированные и не универсальные – по крайней мере, так считает AMD. С инициативой ROCm AMD атакует со стороны программного обеспечения, позволяя даже выполнять код CUDA на своих GPU.

Аппаратное обеспечение частично опирается на архитектуру Vega

AMD объявила несколько "железных" новинок, а именно три вычислительных ускорителя. Среди них – модель на новой архитектуре Vega, опубликованная информация позволяет примерно рассчитать некоторые параметры GPU Vega.

AMD Radeon Instinct
Radeon Instinct MI6 Radeon Instinct MI8 Radeon Instinct MI25 with NCU
Polaris 10 Pro Fiji  Vega
5,7 TFLOPS (FP32) 8,2 TFLOPS (FP32) 12,5 TFLOPS (FP32)
224 Гбайт/с 512 Гбайт/с 512 Гбайт/с
16 GB GDDR5 4 GB HBM1 16 GB HBM2
150 Вт 175 Вт 300 Вт

Технических подробностей не так много, но AMD указывает производительность 2x Packed Math и использование High Bandwidth Cache Controller. Самой быстрой моделью как раз становится Radeon Instinct MI25 with NCU. Если под CU AMD понимает Compute Unit (вычислительные блоки), то NCU расшифровывается как New Compute Unit – новые вычислительные блоки. Из вычислительной производительности можно сделать вывод о частоте GPU 1.525 МГц, если у Vega работают 4.096 потоковых процессора.

AMD в слайдах не дает подробностей о подсистеме памяти. Но источникам с мероприятия AMD Tech Summit на прошлой неделе указывают 16 Гбайт HBM2 и 512 Гбайт/с. Все это вполне хорошо соответствует спецификациям HBM2, причем перед нами "младшая" версия архитектуры Vega, которая использует только два стека памяти по 8 Гбайт (8Hi HBM2). С четырьмя стеками емкость может достигать 32 Гбайт, пропускная способность – до 1.024 Гбайт/с.

AMD показала некоторые результаты производительности, но отметила, что они получены на ранних образцах GPU, поэтому здесь имеется определенный потенциал оптимизации в будущем. Чтобы более эффективно атаковать конкурента, AMD представила несколько программных инициатив. Помимо упомянутых OpenCompute и ROCm, здесь можно отметить фирменный программный API, который в паре с аппаратным обеспечением Radeon Instinct может потеснить конкурента. Упоминается библиотека MIOpen для глубокого обучения, которая дает почти трехкратный рост производительности на аппаратном обеспечении Radeon по сравнению с API на основе GEMM. AMD также показала несколько тестов Radeon Instinct MI8 и MI25 против NVIDIA GeForce GTX Titan X на основе Maxwell или NVIDIA Titan X на Pascal.

Аппаратная виртуализация и стойки с GPU Vega

Чуть раньше в этом году AMD показала первую реализацию технологии MxGPU, которая опирается на SR-IOV (Single Root I/O Virtualization). GPU может виртуализировать несколько аппаратных машин, которые используют собственную защищенную память. Были объявлены и первые видеокарты AMD FirePro S7150 и AMD FirePro S7150 x2, поддерживающие технологию.

Все более важную роль сегодня играет распределение вычислительной производительности по сети, будь то Интернет или локальная сеть компании. Все это верно и для сферы машинного обучения. Аппаратная виртуализация интересна для рабочих станций, поскольку вычислительную производительность можно не накапливать непосредственно на станции – достаточно оснастить соответствующими ресурсами сервер, к которому можно будет обращаться. К преимуществам подобного решения можно отнести одновременное обращение к вычислительным ресурсам сразу нескольких машин. На каждом GPU поддерживается работа до 16 виртуальных машин. Из других функций отметим 64-битную адресацию PCI Express и Large Base Address Register (BAR).

AMD и партнеры представили первую аппаратную реализацию. А именно серверные стойки от компаний 1026 Labs, Inventec, SuperMicro и Xilinx. Они содержат до 16 блоков Radeon Instinct MI25 with NCU. Вычислительная производительность подобного сервера составляет до 400 TFLOPS, причем это касается только GPU – данные сведения тоже позволяют рассчитать примерную тактовую частоту. Стойки с несколькими серверами дадут производительность до 3 PFLOPS со 120 блоками Radeon Instinct MI25, причем подобная конфигурация более эффективна, чем NVIDIA DGX SATURNV с GPU-ускорителями Tesla P100.

Первые аппаратные реализации Radeon Instinct выйдут в первой половине 2017. Но AMD пока не назвала цен. На конференции AMD Tech Summit глава Radeon Technologies Group показал первые аппаратные решения, причем он был твердо уверен в перспективах общей концепции.

"Radeon Instinct существенно увеличит темпы усиления машинного интеллекта благодаря опоре на высокопроизводительные GPU-ускорители и бесплатное программное обеспечение с открытым исходным кодом в виде MIOpen и ROCm," сказал Раджа Кодури (Raja Koduri). "Комбинация высокопроизводительных вычислений, графических возможностей и наша экспертиза на протяжении многих поколений GPU привели к тому, что мы является единственной компанией с достаточным опытом в сфере чипов GPU и x86, чтобы удовлетворить широкие запросы дата-центров и усилить распространение машинного интеллекта".

Наконец, на видеоролике с AMD Tech Summit можно посмотреть демонстрации Radeon Instinct. Вы можете видеть тренировку сети глубокого обучения на системе с Radeon Instinct MI25 (на новой архитектуре Vega) и запросы в сеть глубокого обучения на системе с Radeon Instinct MI8.