NVIDIA минувшей ночью на мероприятии Editors Day в Остине (Техас) представила версию GPU Pascal для потребительского рынка. На сцену вышел сам Дженсен Хуанг, он начал презентацию с краткого обзора нынешнего состояния разработки GPU. Вторая часть была посвящена появлению нового вида искусства, когда графические движки и игры используются для создания художественных произведений.
NVIDIA создала программную виртуальную камеру под названием Ansel. Она реализована в виде SDK в драйвере, камеру можно вызывать в играх. Камера позволяет пользователю свободно перемещаться в 3D-пространстве. Доступны такие функции, как фильтры, масштабирование разрешения до 30 раз, а также возможность создавать виртуальное окружение (360°) нынешней сцены. NVIDIA демонстрировала Ansel на примере игры The Witness. Конечно, решения Free Cam существуют давно. Но NVIDIA утверждает, что Ansel будет работать почти во всех играх. Хотя для поддержки разработчикам следует активировать SDK и добавить код.
NVIDIA Ansel
VRWorks Audio
NVIDIA приготовила на Editors Day сюрприз для разработчиков игр VR. Пока что основное внимание разработчиков было уделено визуальной составляющей VR. Но для глубокого погружения звук играет не менее важную роль. Технология VRWorks Audio базируется на IRAY – но вместо виртуальных лучей света симулируются и просчитываются волны звука, что дает максимальный реализм. NVIDIA называет данную технологию Path Tracing Audio.
Нынешние GPU от NVIDIA способны просчитывать тысячи «путей прохождения звука». Конечно, немалую роль здесь играет высокая вычислительная производительность GPU. NVIDIA называет VRWORKS Audio первой технологией расчета 3D-аудио в реальном времени. Впрочем, у Sony PlayStation VR тоже имеется дополнительный аппаратный блок, который отвечает за расчет аудио.
GeForce GTX 1080
Но перейдем к самому интересному: видеокарте NVIDIA GeForce GTX 1080. GPU опирается на новую архитектуру Pascal. Над данной архитектурой работали тысячи разработчиков на протяжении более чем двух лет. Вся разработка обошлась NVIDIA в 2-3 млрд. долларов США. Кроме новой архитектуры следует отметить новый техпроцесс 16 нм FinFET, использование памяти GDDR5X (NVIDIA называет ее G5X), новые технологии PCB и кулера, а также неизвестную пока технологию рендеринга.
Особое внимание при разработке GeForce GTX 1080 было уделено энергопотреблению GPU. Из-за большего числа транзисторов, меньшего техпроцесса и высокой тактовой частоты энергию следует подавать быстрее и точнее. Для GeForce GTX 1080 удалось добиться стабильности питания в диапазоне 120 мВ (от пика к пику). Для GeForce 980 данное значение составляло 209 мВ. Все это положительно сказывается на эффективности видеокарты, которая должна быть еще выше.
NVIDIA привела некоторые данные производительности. Видеокарта GeForce GTX 1080 должна быть быстрее системы SLI из двух видеокарт GeForce GTX 980. Производительность должна быть выше GeForce GTX Titan X, здесь называется прирост между 15 и 20 процентами. Энергопотребление GeForce GTX 1080 составляет 180 Вт. Хотя у прямого предшественника GeForce GTX 980 оно было еще ниже – 165 Вт.
Производительность GeForce GTX 1080
Тим Свини (Tim Sweeny) из Epic поднялся на сцену и показал демонстрацию последнего проекта Pegatron. Используемая видеокарта достигала тактовой частоты GPU 2.114 МГц. NVIDIA удвоила частоту Boost по сравнению с предыдущим поколением. Память GDDR5X работала на 1.377 МГц, с воздушным охлаждением GPU не нагревался выше 67 °C. Демонстрация занимала 2.665 Мбайт в памяти видеокарты. Демо выводилась с частотой кадров 60 fps.
До 16 Viewports для систем Multi-monitor
Системы с несколькими мониторами распространены не так широко, но NVIDIA нацелилась решить проблему при использовании более одного монитора. Расчет 3D-сцены на 2D-пространство мониторов не учитывает углы расположения мониторов. NVIDIA представила технологию еще с архитектурой Maxwell. Там NVIDIA предусмотрела несколько Viewport для реализации Multi-Resolution Shading. Если у Maxwell поддерживаются 9 viewports, в архитектуре Pascal - уже 16 viewports.
Simultaneous Multi Projection
Технология интересна не только для конфигураций с несколькими мониторами, но и в приложениях VR. Здесь 16 viewports можно использовать для вычисления двух кадров для 3D-дисплея за один проход. В приложениях VR видеокарта GeForce GTX 1080 может достигать в два раза большей производительности по сравнению с GeForce GTX Titan X, а также в три раза большей эффективности. Как раз технология Simultaneous Multi Projection обеспечивает прирост производительности на 50-60 процентов. Вычислительная производительность NVIDIA GeForce GTX 1080 составляет 9 TFLOPS.
Simultaneous Multi Projection
Архитектура Pascal
На протяжении статьи мы будем использовать название GP104 в качестве GPU для видеокарты GeForce GTX 1080. NVIDIA пока не раскрыла техническое наименование чипа. Но при сравнении с GP100 в ускорителе Tesla P100 мы уже привыкли использовать GP104 для GeForce GTX 1080. Центральным компонентом архитектуры по-прежнему являются блоки Streaming Multiprocessors (SM). Структура чипа состоит из кластеров Graphics Processing Cluster (GPC), блоков Streaming Multiprocessors (SM) и контроллеров памяти. GP104, скорее всего, опирается на четыре GPC, каждый из которых имеет 10 SM по 64 потоковых процессора каждый. В результате мы получаем 2.560 потоковых процессора (4x10x64). Помимо 64 потоковых процессоров в каждом SM содержатся четыре текстурных блока, что дает 160 TMU в сумме.
Обзор технических спецификаций GPU GP104 | |||||
---|---|---|---|---|---|
GPU | GP100 | GP104 | Fiji XT | GM200 | GM204 |
Техпроцесс | 16 нм | 16 нм | 28 нм | 28 нм | 28 нм |
Число транзисторов | 15,3 млрд. | 7,2 млрд. | 8,9 млрд. | 8 млрд. | 5,2 млрд. |
Частота памяти | 737 МГц | 1.250 МГц | 500 МГц | 1.750 МГц | 1.750 МГц |
Тип памяти | HBM2 | GDDR5X | HBM | GDDR5 | GDDR5 |
Объем памяти | 16 GB | 8 GB | 4 GB | 6 GB | 4 GB |
Интерфейс памяти | 4.096 бит | - бит | 4.096 бит | 384 бит | 256 бит |
Версия DirectX | 12 | 12 | 12 | 12 | 12 |
Потоковые процессоры | 3.840 | 2.560 | 4.096 | 2.816 | 2.048 |
Текстурные блоки | 224 | 160 | 256 | 176 | 128 |
Конвейеры растровых операций (ROP) | - | - | 64 | 96 | 64 |
Типичное энергопотребление | 300 Вт | 180 Вт | 275 Вт | 250 Вт | 165 Вт |
SLI/CrossFire | - | SLI | CrossFire | SLI | SLI |
Конечно, NVIDIA продолжила увеличивать эффективность. Частично улучшение связано с переходом на 16-нм техпроцесс FinFET. Могли сказаться и изменения в архитектуре SM. В целом, NVIDIA называет для GeForce GTX 1080 максимальное энергопотребление 180 Вт.
Впечатляют и тактовые частоты GPU GP104 в видеокарте GeForce GTX 1080. NVIDIA по-прежнему не называет точных чисел базовой частоты и Boost. Но на демонстрациях видно, что частота Boost намного превышает 2.000 МГц.
Позвольте более подробно рассмотреть структуру потоковых мультипроцессоров. Мы уже отметили 64 потоковых процессора на SM – скорее всего, то же самое мы получим и у GP104. Они относятся к категории FP32. У Maxwell и Kepler использовалось 128 или 192 потоковых процессора FP32 на SM, что указывает на явную ориентацию на одиночную точность. Каждый SM у GPU GP100 разделен на два блока. Каждый блок опирается на 32 потоковых процессора, буфер инструкций, Warp Scheduler и два диспетчера. Получается, что SM в архитектуре Pascal содержат в два раза меньше потоковых процессоров по сравнению с Maxwell, но размер регистров, warp и thread block не изменился.
Диаграмма GPU GP100 и SM
NVIDIA оптимизировала пути прохождения данных на кристалле. В результате NVIDIA удалось уменьшить площадь кристалла, что снизило энергопотребление и повысило эффективность. Также новая архитектура диспетчеров позволяет лучше нагружать конвейеры, любой Warp Scheduler может работать с двумя инструкциями Warp за такт.
Обзор технических спецификаций GeForce GTX 1080 | |||
---|---|---|---|
Модель | NVIDIA GeForce GTX 1080 | AMD Radeon R9 Fury X | NVIDIA GeForce GTX 980 Ti |
Цена | $599 | от 45,2 тыс. рублей от 615 евро |
от 44,2 тыс. рублей от 620 евро |
Сайт производителя | NVIDIA | AMD | NVIDIA |
Техническая информация | |||
GPU | GP104 | Fiji XT | GM200 |
Техпроцесс | 16 нм | 28 нм | 28 нм |
Число транзисторов | 7,2 млрд. | 8,9 млрд. | 8 млрд. |
Тактовая частота GPU (базовая) | 1.607 МГц | - | 1.000 МГц |
Тактовая частота GPU (Boost) | 1.733 МГц | 1.050 МГц | 1.075 МГц |
Частота памяти | 1.250 МГц | 500 МГц | 1.750 МГц |
Тип памяти | GDDR5X | HBM | GDDR5 |
Объём памяти | 8 GB | 4 GB | 6 GB |
Ширина шины памяти | - бит | 4.096 бит | 384 бит |
Пропускная способность памяти | - Гбайт/с | 512,0 Гбайт/с | 336,6 Гбайт/с |
Версия DirectX | 12 | 12 | 12 |
Потоковые процессоры | 2.560 | 4.096 | 2.816 |
Текстурные блоки | 160 | 256 | 176 |
Конвейеры растровых операций (ROP) | - | 64 | 96 |
Тепловой пакет | 180 Вт | 275 Вт | 250 Вт |
SLI/CrossFire | SLI | CrossFire | SLI |
Для существенного увеличения производительности с двойной точностью NVIDIA изменила соотношение вычислительных блоков FP64 и FP32. У архитектуры Kepler оно составляло 1/3, у предыдущей архитектуры Maxwell 1/32, теперь же NVIDIA обеспечивает соотношение 1/2 в архитектуре Pascal. Впрочем, для игр и видеокарты GeForce GTX 1080 это не так важно. В любом случае, упомянуть стоит.
Для сетей глубокого обучения (Deep Learning) важны вычисления с половинной точностью или FP16, и здесь NVIDIA также обеспечивает соотношение 1/2 к вычислениям FP32. NVIDIA изменила обработку вычислений FP16 таким образом, чтобы задействовать выделенные ядра FP32. Некоторые вычисления FP16 можно объединять, что позволяет выполнять их на ядрах FP32. Однако для объединения вычислений FP16 они должны выполнять одинаковые операции. Например, можно объединять только две операции сложения или умножения. Операции FP16 важны для игр и расчетов текстур, для анализа данных фото и видео.
В рамках новой архитектуры Pascal NVIDIA пересмотрела стандарты видеовыходов. У GeForce GTX 1080 будут доступны HDMI 2.0b и DisplayPort 1.4. Видеокарта GeForce GTX 1080 поступит в продажу 27 мая. Пока неизвестно, будет ли доступна только эталонная версия, или партнеры NVIDIA представят свои стандарты. Цена GeForce GTX 1080 будет составлять $599, версия Founders Edition в специальном дизайне обойдется в $699.
Новый стандарт памяти GDDR5X
В конце прошлого года Micron представила детали нового стандарта памяти GDDR5X. Micron видит память GDDR5X как переходную между GDDR5 и HBM или альтернативный вариант до массового перехода на HBM второго поколения. Для повышения производительности ширина prefetch была удвоена с 32 до 64 бит. Число слов данных на доступ тоже увеличилось в два раза, с 8 до 16. Пропускная способность данных на чип памяти у стандарта GDDR5 на 2.000 МГц составляет 8 Гбит/с. Micron у нынешней версии GDDR5X планирует увеличить пропускную способность до 10-12 Гбит/с, в будущем возможен рост до 16 Гбит/с. Как указывает Micron, небольшие отличия между GDDR5 и GDDR5X облегчают доработку контроллера памяти, что не составит особого труда для AMD и NVIDIA.
Несколько примеров: если GPU работает с 256-битной шиной памяти, то переход на GDDR5X 12 Гбит/с позволит увеличить пропускную способность с 256 до 384 Гбайт/с (при частоте 2.000 МГц). Скорость 16 Гбит/с позволит даже удвоить пропускную способность до 512 Гбайт/с, что соответствует нынешнему поколению HBM. Но следует помнить, что GDDR5X на 16 Гбит/с пока недоступна.
GeForce GTX 1070
Также NVIDIA представила GeForce GTX 1070. Она обеспечивает производительность 6,5 TFLOPS и оснащена 8 Гбайт памяти GDDR5. Видеокарта будет доступна с 10 июня по цене $379 в стандартной версии и $449 за Founders Edition.
Обновление 1:
На мероприятии была показана NVIDIA GeForce GTX 1080, мы смогли сделать несколько снимков:
Среди всего прочего можно видеть интерфейсы подключения дисплеев. Интересно, что у GeForce GTX 1080 мы вновь получаем разъемы SLI. Дополнительное питание подается через 8-контактный разъем. Вместе со слотом PCI Express на видеокарту можно теоретически подавать до 225 Вт.
В выставочной зоне были представлены демонстрационные системы, которые привлекли наше внимание. Одна из систем состояла из конфигурации SLI на двух видеокартах GeForce GTX 1080. Как правило, для работы подобной системы достаточного одного мостика SLI. Но NVIDIA предусмотрела два разъема для конфигураций 3-Way или даже 4-Way SLI. Но система SLI с двумя GeForce GTX 1080 использует мостик SLI, занимающий два разъема SLI.
К сожалению, мы не смогли получить официальных комментарий по этому поводу. Вполне вероятно, что таким решением NVIDIA решила обойти ограничение пропускной способности, которое может возникать на очень высоких разрешениях и в конфигурациях с несколькими мониторами. Соединения в мостике SLI обычно работают на 400 МГц, то есть на той же частоте, что и контроллеры видеовыходов. В прошлом году производители, такие как ASUS, EVGA и MSI, предложили специальные мостики SLI, которые работают на частоте 540 МГц вместо 400 МГц. Соответствующий прирост пропускной способности позволяет использовать подобные конфигурации с мониторами разрешением 4K или частотой обновления выше 120 Гц. Поэтому вполне вероятно, что NVIDIA решила обойти проблему, установив двойной мостик.
Если оба соединения SLI задействованы в режиме 2-Way SLI, то уже вряд ли возможны конфигурации 3-Way или 4-Way SLI. Пока не понятно, будет ли работать конфигурация SLI с одиночным мостиком. Мы постараемся разузнать подробности на мероприятии NVIDIA.
Обновление 2:
Между тем загадка двойного мостика SLI разрешилась. NVIDIA, таким образом, действительно увеличила пропускную способность соединения, чтобы поддержать более высокие разрешения и частоты обновления. Сама NVIDIA называет мостик SLI HB, где HB означает High Bandwidth (высокая пропускная способность). Соответствующие мостики SLI можно приобрести у NVIDIA – с различной длиной, которая зависит от материнской платы.
Мостики SLI HB не поддерживают режим 3-Way или 4-Way SLI, здесь возможны только классические простые мостики. Мы сняли небольшой видеоролик, на котором видеокарту можно посмотреть во всей красе.
Во время презентации NVIDIA показала ряд интересных демо. Мы тоже предлагаем посмотреть их на видеоролике. Среди демо – Free Cam Ansel, демонстрация VRWORKS Audio, а также Epic Games Paragon – возможность взглянуть на Simultaneous Multi Projection.
Личное мнение
NVIDIA смогла привлечь к себе внимание на Editors Day 2016. Архитектура Pascal уже удивила многих в ранее представленном графическом процессоре GP100 или ускорителе Tesla P100, теперь она позиционируется на совершенно другой рынок. Видеокарта GeForce GTX 1080 предназначена для игр, но, к сожалению, пока слишком мало технической информации. Как нет и результатов независимых тестов. На первый взгляд, NVIDIA справилась со своей задачей «на отлично». Прирост производительности более чем на 50 процентов – как раз то, чего ждут многие геймеры. Радует и то, что прирост производительности сопровождается снижением энергопотребления (если сравнивать с GeForce GTX 980 Ti), что тоже радует. Мы с нетерпением ждем образца видеокарты, чтобы прогнать на нем все наши тесты. Только тогда мы можем сделать финальные выводы. (Андрей Шиллинг)