Страница 3: Архитектура (2)

Теперь мы бы хотели подчеркнуть различия между архитектурами "Fermi" и "Kepler" чуть более детально.

gtx680-pres-12-rs

NVIDIA в блоке SMX не только увеличила количество ядер, но и оптимизировала выполнение инструкций. И в "Fermi", и в "Kepler" используются схожие аппаратные элементы для распределения инструкций на выбранные вычислительные ядра. Но в "Fermi" некоторые элементы использовались для проверки зависимости инструкций.

В "Kepler" компилятор решает проблему зависимости на программном уровне, и Nvidia смогла немного сэкономить на сложных аппаратных блоках.

gtx680-pres-11-rs

Мы уже упомянули отказ от повышения частоты потоковых процессоров (Hotclocks). Причина кроется в том, что подобное решение было признано малоэффективным. Путём удвоения тактовой частоты потоковых процессоров Nvidia экономила площадь чипа, но вместе с тем получала более высокое энергопотребление. В приведённом выше примере на примере простой арифметической операции (на самом деле, двух операций) это хорошо заметно. Архитектура "Fermi" выполняла в два раза больше операций по отношению к количеству ядер, но "Kepler" обеспечивает более высокую производительность путём значительного увеличения количества ядер.

Кроме более высокого энергопотребления немаловажна и задействованная логика. В архитектуре NVIDIA "Fermi" требовалось в два раза больше конвейеров, чтобы наполнять потоковые процессоры данными. Из-за перехода на меньший техпроцесс Nvidia смогла увеличить количество ядер без повышения площади кристалла.

gtx680-pres-13-rs

В поколении "Fermi" шейдеры могли одновременно работать со 128 текстурами из-за ограничений API DirectX 11. В случае "Kepler" шейдеры теперь могут напрямую адресовать текстуры в памяти с помощью так называемых таблиц привязки ("Binding Tables"). Таким образом, шейдер может обращаться к более чем миллиону текстур, что даёт превосходную детализацию и разнообразие сцен.

gtx680-pres-14-rs

NVIDIA GeForce GTX 680 стала первой видеокартой с памятью GDDR5 и пропускной способностью 6 Гбит/с. NVIDIA особо акцентировала значение интеграции и физического дизайна. На рисунке выше показан график целостности сигнала. Чем больше будут два окна на графике, тем выше является качество сигнала.