> > > > NVIDIA представила GeForce GTX 1080 на архитектуре Pascal (обновление)

NVIDIA представила GeForce GTX 1080 на архитектуре Pascal (обновление)

Опубликовано:

geforce gtx 1080NVIDIA минувшей ночью на мероприятии Editors Day в Остине (Техас) представила версию GPU Pascal для потребительского рынка. На сцену вышел сам Дженсен Хуанг, он начал презентацию с краткого обзора нынешнего состояния разработки GPU. Вторая часть была посвящена появлению нового вида искусства, когда графические движки и игры используются для создания художественных произведений.

NVIDIA создала программную виртуальную камеру под названием Ansel. Она реализована в виде SDK в драйвере, камеру можно вызывать в играх. Камера позволяет пользователю свободно перемещаться в 3D-пространстве. Доступны такие функции, как фильтры, масштабирование разрешения до 30 раз, а также возможность создавать виртуальное окружение (360°) нынешней сцены. NVIDIA демонстрировала Ansel на примере игры The Witness. Конечно, решения Free Cam существуют давно. Но NVIDIA утверждает, что Ansel будет работать почти во всех играх. Хотя для поддержки разработчикам следует активировать SDK и добавить код.

NVIDIA AnselNVIDIA Ansel

NVIDIA Ansel

VRWorks Audio

NVIDIA приготовила на Editors Day сюрприз для разработчиков игр VR. Пока что основное внимание разработчиков было уделено визуальной составляющей VR. Но для глубокого погружения звук играет не менее важную роль. Технология VRWorks Audio базируется на IRAY – но вместо виртуальных лучей света симулируются и просчитываются волны звука, что дает максимальный реализм. NVIDIA называет данную технологию Path Tracing Audio.

VRWORKS Audio
VRWORKS Audio

Нынешние GPU от NVIDIA способны просчитывать тысячи «путей прохождения звука». Конечно, немалую роль здесь играет высокая вычислительная производительность GPU. NVIDIA называет VRWORKS Audio первой технологией расчета 3D-аудио в реальном времени. Впрочем, у Sony PlayStation VR тоже имеется дополнительный аппаратный блок, который отвечает за расчет аудио.

GeForce GTX 1080

Но перейдем к самому интересному: видеокарте NVIDIA GeForce GTX 1080. GPU опирается на новую архитектуру Pascal. Над данной архитектурой работали тысячи разработчиков на протяжении более чем двух лет. Вся разработка обошлась NVIDIA в 2-3 млрд. долларов США. Кроме новой архитектуры следует отметить новый техпроцесс 16 нм FinFET, использование памяти GDDR5X (NVIDIA называет ее G5X), новые технологии PCB и кулера, а также неизвестную пока технологию рендеринга.

Оптимизация энергопотребления GeForce GTX 1080
Оптимизация энергопотребления GeForce GTX 1080

Особое внимание при разработке GeForce GTX 1080 было уделено энергопотреблению GPU. Из-за большего числа транзисторов, меньшего техпроцесса и высокой тактовой частоты энергию следует подавать быстрее и точнее. Для GeForce GTX 1080 удалось добиться стабильности питания в диапазоне 120 мВ (от пика к пику). Для GeForce 980 данное значение составляло 209 мВ. Все это положительно сказывается на эффективности видеокарты, которая должна быть еще выше.

NVIDIA привела некоторые данные производительности. Видеокарта GeForce GTX 1080 должна быть быстрее системы SLI из двух видеокарт GeForce GTX 980. Производительность должна быть выше GeForce GTX Titan X, здесь называется прирост между 15 и 20 процентами. Энергопотребление GeForce GTX 1080 составляет 180 Вт. Хотя у прямого предшественника GeForce GTX 980 оно было еще ниже – 165 Вт.

Производительность GeForce GTX 1080Производительность GeForce GTX 1080

Производительность GeForce GTX 1080

Тим Свини (Tim Sweeny) из Epic поднялся на сцену и показал демонстрацию последнего проекта Pegatron. Используемая видеокарта достигала тактовой частоты GPU 2.114 МГц. NVIDIA удвоила частоту Boost по сравнению с предыдущим поколением. Память GDDR5X работала на 1.377 МГц, с воздушным охлаждением GPU не нагревался выше 67 °C. Демонстрация занимала 2.665 Мбайт в памяти видеокарты. Демо выводилась с частотой кадров 60 fps.

До 16 Viewports для систем Multi-monitor

Системы с несколькими мониторами распространены не так широко, но NVIDIA нацелилась решить проблему при использовании более одного монитора. Расчет 3D-сцены на 2D-пространство мониторов не учитывает углы расположения мониторов. NVIDIA представила технологию еще с архитектурой Maxwell. Там NVIDIA предусмотрела несколько Viewport для реализации Multi-Resolution Shading. Если у Maxwell поддерживаются 9 viewports, в архитектуре Pascal - уже 16 viewports.

Simultaneous Multi ProjectionSimultaneous Multi Projection

Simultaneous Multi Projection

Технология интересна не только для конфигураций с несколькими мониторами, но и в приложениях VR. Здесь 16 viewports можно использовать для вычисления двух кадров для 3D-дисплея за один проход. В приложениях VR видеокарта GeForce GTX 1080 может достигать в два раза большей производительности по сравнению с GeForce GTX Titan X, а также в три раза большей эффективности. Как раз технология Simultaneous Multi Projection обеспечивает прирост производительности на 50-60 процентов. Вычислительная производительность NVIDIA GeForce GTX 1080 составляет 9 TFLOPS.

Simultaneous Multi ProjectionSimultaneous Multi Projection

Simultaneous Multi Projection

Архитектура Pascal

На протяжении статьи мы будем использовать название GP104 в качестве GPU для видеокарты GeForce GTX 1080. NVIDIA пока не раскрыла техническое наименование чипа. Но при сравнении с GP100 в ускорителе Tesla P100 мы уже привыкли использовать GP104 для GeForce GTX 1080. Центральным компонентом архитектуры по-прежнему являются блоки Streaming Multiprocessors (SM). Структура чипа состоит из кластеров Graphics Processing Cluster (GPC), блоков Streaming Multiprocessors (SM) и контроллеров памяти. GP104, скорее всего, опирается на четыре GPC, каждый из которых имеет 10 SM по 64 потоковых процессора каждый. В результате мы получаем 2.560 потоковых процессора (4x10x64). Помимо 64 потоковых процессоров в каждом SM содержатся четыре текстурных блока, что дает 160 TMU в сумме.

Обзор технических спецификаций GPU GP104
GPU GP100 GP104 Fiji XT GM200 GM204
Техпроцесс 16 нм 16 нм 28 нм 28 нм 28 нм
Число транзисторов 15,3 млрд. 7,2 млрд. 8,9 млрд. 8 млрд. 5,2 млрд.
Частота памяти 737 МГц 1.250 МГц 500 МГц 1.750 МГц 1.750 МГц
Тип памяти HBM2 GDDR5X HBM GDDR5 GDDR5
Объем памяти 16 GB 8 GB 4 GB 6 GB 4 GB
Интерфейс памяти 4.096 бит - бит 4.096 бит 384 бит 256 бит
Версия DirectX 12 12 12 12 12
Потоковые процессоры 3.840 2.560 4.096 2.816 2.048
Текстурные блоки 224 160 256 176 128
Конвейеры растровых операций (ROP) - - 64 96 64
Типичное энергопотребление 300 Вт 180 Вт 275 Вт 250 Вт 165 Вт
SLI/CrossFire - SLI CrossFire SLI SLI

Конечно, NVIDIA продолжила увеличивать эффективность. Частично улучшение связано с переходом на 16-нм техпроцесс FinFET. Могли сказаться и изменения в архитектуре SM. В целом, NVIDIA называет для GeForce GTX 1080 максимальное энергопотребление 180 Вт.

Впечатляют и тактовые частоты GPU GP104 в видеокарте GeForce GTX 1080. NVIDIA по-прежнему не называет точных чисел базовой частоты и Boost. Но на демонстрациях видно, что частота Boost намного превышает 2.000 МГц.

Позвольте более подробно рассмотреть структуру потоковых мультипроцессоров. Мы уже отметили 64 потоковых процессора на SM – скорее всего, то же самое мы получим и у GP104. Они относятся к категории FP32. У Maxwell и Kepler использовалось 128 или 192 потоковых процессора FP32 на SM, что указывает на явную ориентацию на одиночную точность. Каждый SM у GPU GP100 разделен на два блока. Каждый блок опирается на 32 потоковых процессора, буфер инструкций, Warp Scheduler и два диспетчера. Получается, что SM в архитектуре Pascal содержат в два раза меньше потоковых процессоров по сравнению с Maxwell, но размер регистров, warp и thread block не изменился.

Диаграмма GPU GP100 и SMДиаграмма GPU GP100 и SM

Диаграмма GPU GP100 и SM

NVIDIA оптимизировала пути прохождения данных на кристалле. В результате NVIDIA удалось уменьшить площадь кристалла, что снизило энергопотребление и повысило эффективность. Также новая архитектура диспетчеров позволяет лучше нагружать конвейеры, любой Warp Scheduler может работать с двумя инструкциями Warp за такт.

Обзор технических спецификаций GeForce GTX 1080
Модель NVIDIA GeForce GTX 1080 AMD Radeon R9 Fury X NVIDIA GeForce GTX 980 Ti
Цена $599 от 45,2 тыс. рублей
от 615 евро
от 44,2 тыс. рублей
от 620 евро
Сайт производителя NVIDIA AMD NVIDIA
Техническая информация
GPU GP104 Fiji XT GM200
Техпроцесс 16 нм 28 нм 28 нм
Число транзисторов 7,2 млрд. 8,9 млрд. 8 млрд.
Тактовая частота GPU (базовая) 1.607 МГц - 1.000 МГц
Тактовая частота GPU (Boost) 1.733 МГц 1.050 МГц 1.075 МГц
Частота памяти 1.250 МГц 500 МГц 1.750 МГц
Тип памяти GDDR5X HBM GDDR5
Объём памяти 8 GB 4 GB 6 GB
Ширина шины памяти - бит 4.096 бит 384 бит
Пропускная способность памяти - Гбайт/с 512,0 Гбайт/с 336,6 Гбайт/с
Версия DirectX 12 12 12
Потоковые процессоры 2.560 4.096 2.816
Текстурные блоки 160 256 176
Конвейеры растровых операций (ROP) - 64 96
Тепловой пакет 180 Вт 275 Вт 250 Вт
SLI/CrossFire SLI CrossFire SLI

Для существенного увеличения производительности с двойной точностью NVIDIA изменила соотношение вычислительных блоков FP64 и FP32. У архитектуры Kepler оно составляло 1/3, у предыдущей архитектуры Maxwell 1/32, теперь же NVIDIA обеспечивает соотношение 1/2 в архитектуре Pascal. Впрочем, для игр и видеокарты GeForce GTX 1080 это не так важно. В любом случае, упомянуть стоит.

Для сетей глубокого обучения (Deep Learning) важны вычисления с половинной точностью или FP16, и здесь NVIDIA также обеспечивает соотношение 1/2 к вычислениям FP32. NVIDIA изменила обработку вычислений FP16 таким образом, чтобы задействовать выделенные ядра FP32. Некоторые вычисления FP16 можно объединять, что позволяет выполнять их на ядрах FP32. Однако для объединения вычислений FP16 они должны выполнять одинаковые операции. Например, можно объединять только две операции сложения или умножения. Операции FP16 важны для игр и расчетов текстур, для анализа данных фото и видео.

В рамках новой архитектуры Pascal NVIDIA пересмотрела стандарты видеовыходов. У GeForce GTX 1080 будут доступны HDMI 2.0b и DisplayPort 1.4. Видеокарта GeForce GTX 1080 поступит в продажу 27 мая. Пока неизвестно, будет ли доступна только эталонная версия, или партнеры NVIDIA представят свои стандарты. Цена GeForce GTX 1080 будет составлять $599, версия Founders Edition в специальном дизайне обойдется в $699.

Новый стандарт памяти GDDR5X

В конце прошлого года Micron представила детали нового стандарта памяти GDDR5X. Micron видит память GDDR5X как переходную между GDDR5 и HBM или альтернативный вариант до массового перехода на HBM второго поколения. Для повышения производительности ширина prefetch была удвоена с 32 до 64 бит. Число слов данных на доступ тоже увеличилось в два раза, с 8 до 16. Пропускная способность данных на чип памяти у стандарта GDDR5 на 2.000 МГц составляет 8 Гбит/с. Micron у нынешней версии GDDR5X планирует увеличить пропускную способность до 10-12 Гбит/с, в будущем возможен рост до 16 Гбит/с. Как указывает Micron, небольшие отличия между GDDR5 и GDDR5X облегчают доработку контроллера памяти, что не составит особого труда для AMD и NVIDIA.

Несколько примеров: если GPU работает с 256-битной шиной памяти, то переход на GDDR5X 12 Гбит/с позволит увеличить пропускную способность с 256 до 384 Гбайт/с (при частоте 2.000 МГц). Скорость 16 Гбит/с позволит даже удвоить пропускную способность до 512 Гбайт/с, что соответствует нынешнему поколению HBM. Но следует помнить, что GDDR5X на 16 Гбит/с пока недоступна.

GeForce GTX 1070

NVIDIA GeForce GTX 1070
NVIDIA GeForce GTX 1070

Также NVIDIA представила GeForce GTX 1070. Она обеспечивает производительность 6,5 TFLOPS и оснащена 8 Гбайт памяти GDDR5. Видеокарта будет доступна с 10 июня по цене $379 в стандартной версии и $449 за Founders Edition.

Обновление 1:

На мероприятии была показана NVIDIA GeForce GTX 1080, мы смогли сделать несколько снимков:

Среди всего прочего можно видеть интерфейсы подключения дисплеев. Интересно, что у GeForce GTX 1080 мы вновь получаем разъемы SLI. Дополнительное питание подается через 8-контактный разъем. Вместе со слотом PCI Express на видеокарту можно теоретически подавать до 225 Вт.

В выставочной зоне были представлены демонстрационные системы, которые привлекли наше внимание. Одна из систем состояла из конфигурации SLI на двух видеокартах GeForce GTX 1080. Как правило, для работы подобной системы достаточного одного мостика SLI. Но NVIDIA предусмотрела два разъема для конфигураций 3-Way или даже 4-Way SLI. Но система SLI с двумя GeForce GTX 1080 использует мостик SLI, занимающий два разъема SLI.

Конфигурация SLI на двух GeForce GTX 1080
Конфигурация SLI на двух GeForce GTX 1080

К сожалению, мы не смогли получить официальных комментарий по этому поводу. Вполне вероятно, что таким решением NVIDIA решила обойти ограничение пропускной способности, которое может возникать на очень высоких разрешениях и в конфигурациях с несколькими мониторами. Соединения в мостике SLI обычно работают на 400 МГц, то есть на той же частоте, что и контроллеры видеовыходов. В прошлом году производители, такие как ASUS, EVGA и MSI, предложили специальные мостики SLI, которые работают на частоте 540 МГц вместо 400 МГц. Соответствующий прирост пропускной способности позволяет использовать подобные конфигурации с мониторами разрешением 4K или частотой обновления выше 120 Гц. Поэтому вполне вероятно, что NVIDIA решила обойти проблему, установив двойной мостик.

Если оба соединения SLI задействованы в режиме 2-Way SLI, то уже вряд ли возможны конфигурации 3-Way или 4-Way SLI. Пока не понятно, будет ли работать конфигурация SLI с одиночным мостиком. Мы постараемся разузнать подробности на мероприятии NVIDIA.

Обновление 2:

Между тем загадка двойного мостика SLI разрешилась. NVIDIA, таким образом, действительно увеличила пропускную способность соединения, чтобы поддержать более высокие разрешения и частоты обновления. Сама NVIDIA называет мостик SLI HB, где HB означает High Bandwidth (высокая пропускная способность). Соответствующие мостики SLI можно приобрести у NVIDIA – с различной длиной, которая зависит от материнской платы.

Мостики SLI HB не поддерживают режим 3-Way или 4-Way SLI, здесь возможны только классические простые мостики. Мы сняли небольшой видеоролик, на котором видеокарту можно посмотреть во всей красе.

Во время презентации NVIDIA показала ряд интересных демо. Мы тоже предлагаем посмотреть их на видеоролике. Среди демо – Free Cam Ansel, демонстрация VRWORKS Audio, а также Epic Games Paragon – возможность взглянуть на Simultaneous Multi Projection.

Личное мнение

NVIDIA смогла привлечь к себе внимание на Editors Day 2016. Архитектура Pascal уже удивила многих в ранее представленном графическом процессоре GP100 или ускорителе Tesla P100, теперь она позиционируется на совершенно другой рынок. Видеокарта GeForce GTX 1080 предназначена для игр, но, к сожалению, пока слишком мало технической информации. Как нет и результатов независимых тестов. На первый взгляд, NVIDIA справилась со своей задачей «на отлично». Прирост производительности более чем на 50 процентов – как раз то, чего ждут многие геймеры. Радует и то, что прирост производительности сопровождается снижением энергопотребления (если сравнивать с GeForce GTX 980 Ti), что тоже радует. Мы с нетерпением ждем образца видеокарты, чтобы прогнать на нем все наши тесты. Только тогда мы можем сделать финальные выводы. (Андрей Шиллинг)

Социальные сети

комментарии (11)

#2
Зарегистрирован: 28.01.2015
Москва
Постоялец
Постов: 653
Сообщение Chipi;20490
Кто бы сомневался !



Если это так, это будет запредельная производительность.



GTX 1080 будет быстрее в 2 РАЗА, чем Titan X ? Если тесты подтвердят эти слова, даже фанаты AMD зацелуют Хуанга до смерти.



Планка 2 ГГц по частоте пробита, всё таки дожили ! Ай да Хуанг.



Если GTX 1080 будет реально показывать удвоенную производительность относительно Titan X, то энергопотребление в 180 Вт можно назвать крохотным.



Два Titan X стоят 2000$ и потребляют до 600 Вт, а тут предлагают на халяву карту с той же производительностью на одном чипе, с втрое низким энергопотреблением, а также с втрое более низкой ценой. Ну прям настали времена неслыханной щедрости, вот и прилетела манна небесная ! Всё это выглядит слишком хорошо, чтобы быть правдой. Где подвох, ведь Хуанг такими действиями просто потопил свой Титаник ? Ждем тестов !

P.S. И если какой то маленький обрубок с 2.560 ядрами так разрывает пару предыдущих топов, страшно представить, какую мощь выдаёт полная версия Pascal с 3840 ядрами ?


Полная версия GP100 стоит 10000$. Геймеры никогда не увидят ее в игровых картах. Что касается твоих дифирамбов 1080 и якобы производительности 2-х Титан Х - то это отборный бред, обычный для тебя! В 3DMark 1080 сильнее 980 Ти всего на 10%. По-этому в играх мы вряд ли увидим преимущество больше 20% для разогнанной версии (Founders Edition). Покупать этот обрубок за 700$ (а в Европе 100% за 700€) - чистое безумие. Красная цена этому форсированному миддлу - 400$.

Если AMD выпустит Polaris 10 (производительность 980 Ти) за 300$, как и обещала, то похоронит оба огрызка Паскаля! :D
#3
Зарегистрирован: 26.09.2014

Постоялец
Постов: 1135
Сообщение vorvort;20504
Полная версия GP100 стоит 10000$. Геймеры никогда не увидят ее в игровых картах.


Тебе это бабка Ванга сказала ? Вот когда будешь работать в Nvidia, тогда и будешь делать такие заявления.

Сообщение vorvort;20504
Что касается твоих дифирамбов 1080 и якобы производительности 2-х Титан Х - то это отборный бред, обычный для тебя!


Это не бред, — это официальное утверждение Nvidia о производительности GTX1080 в среде виртуальной реальности. Я понимаю, что подобные тебе индивиды лезут в сеть лишь посмотреть картинки, но попробуй научиться читать, прежде чем писать всякие глупости.

Сообщение vorvort;20504
В 3DMark 1080 сильнее 980 Ти всего на 10%.


И снова я вижу твои влажные фантазии. Оставь свои голоЗлобные заявления при себе. Даже если бы GTX1080 была всего на 10% быстрее, это тоже очень хороший результат при таком низком ТДП 180 Вт. Ведь GTX980Ti потребляла в 2 РАЗА БОЛЬШЕ ВАТТ !
Но у меня для тебя плохие новости, в игровых тестах GTX1080 уже быстрее до 80%, чем GTX980 ! А все мы знаем, что карты Хуанга в разгоне дают дополнительно прирост по частоте кадров минимум 30% ! Вот в этом и есть суровая правда, в отличие от твоего пустого трёпа.

Сообщение vorvort;20504
Если AMD выпустит Polaris 10, то похоронит оба огрызка Паскаля! :D


Наивный фантазёр-сказочник...

P.S. Я всегда обеими руками за конкуренцию, так как без этого нет прогресса.. Но развелось тут столько нефанаток бабок "Ванг", что уже пора вызывать санитаров.
#4
Зарегистрирован: 28.01.2015
Москва
Постоялец
Постов: 653
Chipi, мечтай, мечтай, лол! )) Тебя не смутило, что твое божество Хуанг молчит о производительности 1080 в DX12 и Async Compute?
Вывод простой: 1070,1080 - это Максвелл на новом техпроцессе, с импотенцией в DX12 и асинхронных шейдерах! А прирост производительности достигнут лишь форсированием частот.

Представляю, как тебя бомбанет, когда появятся первые игровые тесты! ))
#5
Зарегистрирован: 26.09.2014

Постоялец
Постов: 1135
Сообщение vorvort;20522
прирост производительности достигнут лишь форсированием частот.


Никто с этим и не спорит. Переход на техпроцесс 16nm FinFET Plus сам по себе позволяет на 65% увеличить частоту при сохранении прежнего ТДП, или на 70% снизить энергопотребление относительно 28HPM. Грех было бы для Хуанга не воспользоваться такой халявой и не произвести очередной ребрендинг без лишних расходов простым разгоном. В любом случае, геймерам главное — результат. Судя по предварительным тестам, там результат огромный.
#6
Зарегистрирован: 28.01.2015
Москва
Постоялец
Постов: 653
Сообщение Chipi;20525
Никто с этим и не спорит. Переход на техпроцесс 16nm FinFET Plus сам по себе позволяет на 65% увеличить частоту при сохранении прежнего ТДП, или на 70% снизить энергопотребление относительно 28HPM. Грех было бы для Хуанга не воспользоваться такой халявой и не произвести очередной ребрендинг без лишних расходов простым разгоном. В любом случае, геймерам главное — результат. Судя по предварительным тестам, там результат огромный.

12% отрыва от 980 Ти в Ashes of the Singularity и 10% в 3DMark - это огромный? :D Ты давай выныривай из виртуала!
#7
Зарегистрирован: 26.09.2014

Постоялец
Постов: 1135
Сообщение vorvort;20562
12% отрыва от 980 Ти в Ashes of the Singularity и 10% в 3DMark - это огромный? :D Ты давай выныривай из виртуала!


Вот только в официальных тестах Хуанга по нескольким играм совсем другие результаты.
#8
Зарегистрирован: 28.01.2015
Москва
Постоялец
Постов: 653
Сообщение Chipi;20564
Вот только в официальных тестах Хуанга по нескольким играм совсем другие результаты.

Пруф в студию! :D
#9
Зарегистрирован: 26.09.2014

Постоялец
Постов: 1135
Сообщение vorvort;20598
Пруф в студию! :D
ВОТ ПРУФВ приложениях виртуальной реальности прирост реально на графике в 2,5 раза !
#10
Зарегистрирован: 28.01.2015
Москва
Постоялец
Постов: 653
Ты серьезно? )) В VR Radeon Pro Duo рвет всех, с разработчиками больше года работа ведется!
А в играх у "зеленых" в DX12 тотальный слив, и дальше для Nvidia все будет хуже. Вот тебе пища для раздумий

https://www.overclockers.ua/video/directx-12-amd-vs-nvidia/all/
))
#11
Зарегистрирован: 10.05.2016

Пользователь
Постов: 37
Сообщение vorvort;20607
Ты серьезно? )) В VR Radeon Pro Duo рвет всех, с разработчиками больше года работа ведется!
А в играх у "зеленых" в DX12 тотальный слив, и дальше для Nvidia все будет хуже. Вот тебе пища для раздумий

https://www.overclockers.ua/video/directx-12-amd-vs-nvidia/all/
))

Вы прослушали передачу из цикла "В гостях у сказки".
Войдите, чтобы оставить комментарий

Возможно, вам будут интересны следующие статьи: