> > > > NVIDIA DGX Spark и RTX AI PC: NVFP4/FP8 и оптимизация ПО ускоряют новые AI-функции

NVIDIA DGX Spark и RTX AI PC: NVFP4/FP8 и оптимизация ПО ускоряют новые AI-функции

Опубликовано:

hardwareluxx news newПомимо DLSS 4.5 и (Dynamic) Multi Frame Generation 6x для AI-рендеринга, NVIDIA последовательно расширяет применение ИИ и в других областях. О таких сценариях компания говорила еще при анонсе архитектуры Blackwell — в частности, об интерактивных NPC и поддержке игрового процесса через G-Assist.

В 2026 году эти идеи должны перейти в практическую плоскость. Одним из первых примеров станет PUBG Ally — AI-персонаж, который компания Krafton называет CPC (Co-Playable Character). Игрок сможет общаться с этим персонажем, получать подсказки в ходе матча и отдавать команды на выполнение конкретных действий. При этом CPC адаптируется к стилю игры пользователя и берет на себя долгосрочные задачи.

Все AI-модели в этом случае выполняются локально и не требуют облачной инфраструктуры. При этом многие современные игры даже в одиночных режимах все равно зависят от постоянного интернет-подключения. В случае PUBG это не критично, так как базовый геймплей изначально ориентирован на мультиплеер.

В этом же году NVIDIA ожидает выход обновления для Total War: PHARAOH. В игре появится AI-советник, который поможет лучше разобраться в механиках, укажет на ошибки и подскажет более эффективные решения в ходе партии.

NVFP4 и NVFP8: ускорение моделей за счет квантизации

Оптимизация программного обеспечения и интерфейсов продолжает повышать производительность в дата-центрах. Существенную роль здесь играет повторная квантизация моделей с пониженной точностью, которая ускоряет их выполнение. Для LLM NVIDIA указывает рост производительности на 30–40 % в период с сентября 2025 года по январь 2026-го.

Архитектура Ada Lovelace уже поддерживала формат FP8. С приходом Blackwell NVIDIA добавила FP4, а также представила оптимизированные варианты моделей — NVFP4 и NVFP8. Эти версии позволяют запускать AI-модели на совместимом GPU в разы быстрее и при этом существенно снижать потребление видеопамяти.

В качестве примера NVIDIA приводит генерацию 4K-видео. Задача, которая обычно занимает около 15 минут, с использованием NVFP8-оптимизированной модели и последующего апскейлинга выполняется примерно за три минуты. Поддержку соответствующих интерфейсов и пакетов ComfyUI получит уже в феврале.

Программная эволюция DGX Spark

Все перечисленные улучшения, достигнутые исключительно за счет оптимизации ПО, напрямую влияют и на развитие AI-системы DGX Spark. За последние месяцы NVIDIA добилась здесь последовательного прироста производительности, который в отдельных сценариях достигает двукратного ускорения.

Компания приводит показательный пример: генерация AI-видео по текстовому запросу на MacBook Pro занимает около восьми минут, тогда как DGX Spark справляется с этой задачей примерно за одну минуту.

Кроме того, DGX Spark позиционируется как эффективный инструмент для разработки игр. Он позволяет выносить отдельные AI-задачи в локальную среду, ускоряя рабочие процессы и улучшая результат. Поскольку все модели выполняются локально, данные остаются в защищенном контуре, а разработчики избегают расходов на облачные AI-сервисы.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).