Страница 2: Быстрая GDDR5X, Tiled Caching и улучшенная подсистема питания

Быстрая GDDR5X

По памяти изменения довольно обширные. NVIDIA вновь использовала память GDDR5X, а не HBM второго поколения. Ту же память мы получали у видеокарт GeForce GTX 1080 и Titan X. Но NVIDIA и Micron смогли существенно увеличить пропускную способность памяти, в том числе оптимизациями прохождения сигнала

NVIDIA показала два изображения, на которых хорошо видна целостность сигнала. "Глаз" по центру должен быть как можно более чистым. Если это не так, мы получим ошибку передачи данных. NVIDIA указывает, что сигналы накладываются друг на друга специальным образом, что позволяет получить в итоге более чистый сигнал. В результате NVIDIA и Micron смогли увеличить тактовую частоту с 1.250 до 1.375 МГц.

Tiled Caching

Как и в случае предыдущих поколений NVIDIA вновь акцентирует внимание на технологии сжатия памяти, поскольку пропускная способность памяти является решающим фактором для высокой производительности GPU. Новые технологии памяти разрабатывать долго и затратно, поэтому AMD и NVIDIA пытаются выжать максимум из существующих технологий, используя при возможности сжатие данных.

NVIDIA демонстрирует "узкое место" на двух примерах. При выполнении непосредственного рендеринга (Immediate Rendering) кадр обрабатывается за один проход. Данные геометрии передаются из памяти DRAM в кэш L2 и затем поступают на GPU. После расчетов пиксели передаются GPU в кэш L2 и, после сжатия, поступают в DRAM. Здесь ограничивающим фактором будет пропускная способность между кэшем L2 и памятью.

Второй подход – тайловый рендеринг (Tiled Rendering), в котором сцена разделяется на участки – тайлы. Для каждого тайла следует сначала передать данные геометрии, что является основным недостатком данной технологии рендеринга. Но вывод пикселей, с другой стороны, потребляет меньше пропускной способности, поскольку используется быстрый тайловый буфер. Для буфера выделена часть пространства кэша L2. Вывод пикселей осуществляется из этого буфера.

Технология Tiled Caching призвана сочетать лучшее из двух миров. Основу технологии NVIDIA заложила в GPU еще с поколения Maxwell. Первая информация появилась еще в августе прошлого года. AMD с архитектурой Vega использует схожий подход, но NVIDIA не подтверждает это официально. В конвейер рендеринга между блоками растеризации и геометрии добавлен блок Binner с очередью. В него загружаются данные геометрии и рассчитываются в тайлах по мере заполнения очереди. Данные геометрии остаются в кэше L2, их не придется постоянно переносить из DRAM в кэш L2, как в случае обработки отдельных тайлов. Пиксели, рассчитанные в тайлах, остаются в кэше L2, они передаются в DRAM только для вывода. Такой подход позволяет обойти потенциальное "узкое место" по передаче слишком больших объемов данных между кэшем L2 и DRAM. Но Tiled Caching можно использовать не всегда, в таких случаях NVIDIA поддерживает переход на непосредственный рендеринг.

Подобные технологии позволяют NVIDIA отложить переход на более быстрые стандарты памяти, подобные HBM2, не принося в жертву производительность. Память GDDR5X на 11 Гбит/с, которая как раз устанавливается на видеокарты GeForce GTX 1080 Ti, по пропускной способности находится на уровне HBM. Конечно, HBM2 оказывается еще намного быстрее с пропускной способностью 720-1.000 Гбайт/с, но и в производстве память с подложкой обходится дороже. С помощью технологий сжатия памяти и Tiled Caching NVIDIA намеревается достичь виртуальной пропускной способности памяти 1.200 Гбайт/с. На аппаратном уровне пропускная способность остается 484 Гбайт/с, виртуальный прирост как раз и обуславливают новые технологии. Конечно, для демонстрации технологий сжатия и Tiled Caching NVIDIA выбрала наилучшие сценарии, хотя она все равно носит теоретический характер.

11 Гбайт памяти GDDR5X у GeForce GTX 1080 Ti, судя по информации NVIDIA, будет достаточно и на ближайшее будущее. Те же игры Watchdogs 2 или Deus Ex: Mankind Divided даже в разрешении 5K занимаю только около 11 или 9 Гбайт в видеопамяти.

Лучшее охлаждение, лучшая подсистема питания

NVIDIA вновь улучшила систему питания и кулер GeForce GTX 1080 Ti по сравнению с предшественниками. Избавившись от выхода DVI, NVIDIA получила дополнительное пространство на слотовой заглушке. Теперь там остались только 1x HDMI 2.0b и 3x DisplayPort 1.3/1.4. NVIDIA указывает в два раза большую площадь охлаждения. Также в кулер устанавливается испарительная камера (Vapor Chamber).

Что касается подсистемы питания, NVIDIA говорит о семи фазах с двойной нагрузкой, то есть 14 dual-FET, которые могут обеспечивать ток до 250 А. С переходом на Dual-FET NVIDIA удалось увеличить эффективность видеокарты. У каждого GPU есть оптимальная область, в которой он работает наиболее эффективно. NVIDIA сравнивает эффективность GeForce GTX 1080 Ti с GeForce GTX 1080 и GeForce GTX 980, можно видеть существенные улучшения.

Кроме количества в типе и дизайне дросселей, конденсаторов и MOSFET ничего не изменилось. Драйверы MOSFET идентичные (TPS53603A от Texas Instruments). За управление драйверами MOSFET GPU по-прежнему отвечает VRM-контроллер uP9511P от uPI Semiconductor. Но в случае VRM-контроллера MOSFET памяти произошли изменения, поскольку новый uP1658P может управлять более чем двумя состояниями питания памяти. У NVIDIA Titan X контроллер мог управлять только двумя состояниями. В случае GeForce GTX 1080 Ti Founders Edition используется таблица VID, в которой указываются разные состояния и соответствующие напряжения памяти.

Доступные семь фаз разделяются следующим образом: две уходят на питание памяти, на GPU отведены оставшиеся пять. Дополнительное питание на видеокарту подается через один 6-контактный и один 8-контактный разъемы, а также через слот PCI Express. Слот PCI Express обеспечивает питание для двух фаз GPU, 6-контактный разъем – еще для двух фаз GPU, а 8-контактный отвечает за две фазы GPU и оставшиеся фазы памяти. Одна из фаз GPU, за которую может отвечать 6- или 8-контактный разъем, отсутствует.

Дизайн "Dual-FET" подразумевает, что в каждой фазе используются два конденсатора, один дроссель и два MOSFET. В случае дизайна Single-FET используются два конденсатора, один дроссель и только один MOSFET. Удвоение числа MOSFET на фазу позволяет разделить напряжение между двумя данными компонентами, что должно существенно снизить температуры.

Кулер также позволяет видеокарте работать тише и холоднее. NVIDIA указывает меньшую на 5 °C температуру и меньший уровень шума на 2,5 дБ(А). Но нам еще предстоит посмотреть, как видеокарта покажет себя на практике. NVIDIA приводит данные результаты при сравнении кулеров с нагрузкой 220 Вт. Ниже в статье приведены результаты наших тестов.

Насколько интересна новая GeForce GTX 1080 Ti? NVIDIA отвечает на данный вопрос, приводя сравнение с предыдущими версиями Ti. Видеокарта GeForce GTX 780 Ti давала 18% прирост по сравнению с версией не-Ti. GeForce GTX 980 Ti обеспечивала прирост 25% по сравнению с GeForce GTX 980, в случае же GeForce GTX 1080 Ti видеокарта на целых 35% быстрее GeForce GTX 1080. Конечно, вскоре мы проведем собственные тесты. Дополнительное питание поставляется на GeForce GTX 1080 Ti с помощью одного 8- и одного 6-контактных гнезд.