NVIDIA расширяет поддержку TensorRT на архитектуры Titan Xp и Volta

Опубликовано:

nvidiaNVIDIA продолжает расширять свою инициативу AI. Облако NVIDIA GPU Cloud (NGC) позволяет разработчикам быстро и легко распределять свои приложения по нескольким облакам, а также упрощает начальную конфигурацию тренировки. NVIDIA расширяет поддержку контейнеров NGC на видеокарты Titan Xp и GPU-ускорители на архитектуре Volta, теперь они поддерживаются напрямую.

Разработчики сетей глубокого обучения теперь получили три варианта, которые можно легко и быстро конвертировать друг в друга, а также масштабировать. Во-первых, тренировка на собственных компонентах – например, на видеокартах Titan, что обойдется не так дорого. Во-вторых, можно приобрести более мощные аппаратные ускорители или задействовать облако. NVIDIA предлагает, например, воспользоваться собственными дата-центрами DGX-1. Если же требуется еще более высокая вычислительная мощность, контейнеры NGC можно перенести на облако Amazon EC2-P3 вместе с приложениями, там работают ускорители Tesla V100 на архитектуре Volta.

TensorRT 3 теперь доступна

Разработчики теперь могут использовать новую библиотеку TensorRT 3. Она оптимизирована под приложения глубокого обучения и чипы NVIDIA, обещая прирост производительности. Конечно, TensorRT 3 может по-прежнему ускорять расчеты INT8 и FP16 с низкими задержками. Сама NVIDIA говорит о более высокой производительности (в 3,7 раз) обработки запросов в сеть (Inferencing) на Tesla V100 по сравнению с Tesla P100 при использовании TensorRT 3, пропускная способность увеличилась в 40 раз, в результате работа с моделями TensorFlow выполняется в 18 раз быстрее.

В TensorRT 3 можно импортировать модели тренировки из других сетей AI, в том числе Caffe и TensorFlow. Также добавлена оптимизация и валидация под Python API.

Участники NVIDIA Developer Program могут скачать TensorRT 3 напрямую у NVIDIA.