NVIDIA представила Drive PX Pegasus: 2x Xavier SoC + 2x Next-Gen GPU и 320 TOPS

PDFПечатьE-mail

Опубликовано:
Андрей Шиллинг

NVIDIA на пленарном докладе GTC Europe в Мюнхене представила новый вычислительный модуль для автомобильной индустрии. Модуль Drive PX под названием Pegasus использует две SoC Xavier и два дискретных GPU на архитектуре нового поколения, которые пока не названы. Drive PX Pegasus обеспечивает достаточную вычислительную производительность для автономного вождения уровня 5 (ASIL D - Automotive Safety Integrity Level D). На данный момент выпущенные на рынок автомобили, подобные Tesla или новому Audi A8, работают на уровне 3.

Наиболее интересной функцией Drive PX Pegasus можно назвать вычислительную производительность 320 TOPS (тера операций в секунду), здесь подразумеваются простые вычисления INT8, необходимые для тренировки сети глубокого обучения и обработки запросов (inferencing). Подобная вычислительная производительность обеспечивается хорошо знакомыми SoC Xavier и двумя GPU на новой архитектуре, ранее неизвестными.

Для автономного вождения считываются данные с нескольких десятков датчиков. К ним относятся камеры, радары, лидары, ультразвуковые датчики и многие другие. Все эти данные должны собираться и обрабатываться с высокой скоростью, частота опроса может составлять несколько сотен раз в секунду. Конечно, для обработки требуется соответствующая вычислительная производительность – она нужна не столько для тренировки сети глубокого обучения, которая располагается в дата-центрах производителя, сколько для обработки всех поступающих данных.

Старый знакомый: Xavier

Примерно год назад NVIDIA представила SoC Xavier. Он сочетает восемь вычислительных ядер CPU с отдельным GPU Volta с 512 потоковыми процессорами и некоторыми специальными функциональными блоками SFU (Special Function Units), такими как сигнальный процессор, способный кодировать и анализировать два потока 8K в формате HDR. NVIDIA указывает производительность Xavier SoC 30 TOPS при энергопотреблении 30 Вт. Первые модули на Xavier SoC начнут поставляться ближе к концу года.

Как видим, NVIDIA решила отложить свои первоначальные планы. Модули Xavier изначально планировались на середину 2017, но теперь они выйдут позже. Кроме того, был пересмотрен тепловой пакет Xavier, производительность достигает 30 TOPS вместо 20, но и энергопотребление составляет 30 Вт вместо 20 Вт.

Next-Gen GPU: что же следует за Volta?

С модулем Drive PX Pegasus NVIDIA комбинирует две SoC Xavier. Более интересно здесь то, что NVIDIA впервые называет преемника архитектуры Volta, кроме двух SoC в Drive PX Pegasus будут использоваться два дискретных GPU на основе "Next-Gen GPU". Имя NVIDIA пока не называет.

Но мы все же смогли добыть некоторые подробности в кулуарах: GPU нового поколения продолжит стратегию отдельных аппаратных блоков для искусственного интеллекта и глубокого обучения. Ядра Tensor, впервые представленные с архитектурой Volta, продолжат играть важную роль. Пока не совсем понятно, изменится ли число ядер Tensor по отношению к потоковым мультипроцессорам по сравнению с архитектурой Volta. На данный момент на каждый SM доступно восемь ядер Tensor, 640 таких ядер дают вычислительную производительность 120 TOPS.

Данные 120 TOPS примерно соответствуют вычислительной производительности, которую должен обеспечивать GPU нового поколения в модуле Drive PX Pegasus. Действительно, из 320 TOPS модуля Drive PX Pegasus, 2x 30 TOPS можно отнести на две SoC Xavier. Оставшиеся 260 TOPS распределяются по двум GPU – 130 TOPS на каждый. У Tesla V100 ядра Tensor дают только 120 TOPS.

Впрочем, ускорители Tesla V100 с тепловым пакетом от 150 до 300 Вт вряд ли подходят для автомобилей. Кроме того, они ориентированы на тренировку сетей глубокого обучения, а в случае машины более актуальна обработка запросов в сеть (inferencing). NVIDIA указывает тепловой пакет модуля Drive PX Pegasus 500 Вт. Так что о пассивном охлаждении можно даже не думать, NVIDIA придумает какую-либо систему охлаждения вместе с производителями автомобилей.

Кроме вычислительной производительности важна и инфраструктура, с помощью которой сенсоры обеспечат модуль всеми необходимыми данными. Для этой цели доступны интерфейсы 4x 10GbE, 8x 1GBE и 16x 100 MbE.

Весьма интересен рендеринг модуля NVIDIA Drive PX Pegasus. Конечно, следует помнить, что перед нами, по сути, трехмерный рисунок. Но некоторые элементы и чипы все же приближены к реальности.

Слева можно видеть два новых GPU. Они вновь построены на базе модулей SMX2. Кроме GPU мы получаем не память HBM, но шесть чипов памяти, напоминающих GDDR5. Данный тип памяти используется и для SoC Xavier (справа). NVIDIA указывает комбинированную пропускную способность памяти всего модуля 1 Тбайт/с. Для сравнения, у NVIDIA Tesla V100 с памятью HBM2 мы уже получаем 900 Гбайт/с. То есть 1 Тбайт/с в данном случае является следствием памяти GDDR5, чья пропускная способность составляет между 256 и 384 Гбайт/с, в зависимости от интерфейса и числа чипов памяти. И мы можем легко получить в сумме 1 Тбайт/с на четырех чипах.

Drive PX Pegasus во второй половине 2018

Модули Drive PX Pegasus станут доступны исследовательским институтам и партнерам NVIDIA в автомобильной индустрии во второй половине 2018. Ранние образцы начнут отсылаться в конце первого квартала 2018. Но пройдет еще несколько лет, прежде чем мы увидим модули NVIDIA в первых автомобилях. На GPU Technology Conference 2018 мы ожидаем новые подробности об архитектуре GPU, которая будет следовать за Volta.

NVIDIA привезла несколько тестовых автомобилей в Германию, чтобы протестировать аппаратную и программную начинку. Автомобили уже прошли несколько километров, собрав тестовые данные. Интересно, что тесты на дорогах Европы отличаются от американских, поскольку велики отличия по разметке и знакам.

Сенсоры на автомобиле калиброваны и адаптированы под модель "Крайслер", но NVIDIA уже работает с немецкими производителями, которые могут симулировать свои модели, используя тестовую систему NVIDIA. Конечно, в будущем производители автомобилей будут самостоятельно тестировать платформу Drive PX на своих моделях.

Социальные сети

Ваш голос

Ø Голосование: 0

Теги

Комментарии (0)

Вам необходимо войти, чтобы оставлять комментарии!