> > > > GeForce GTX 780 содержит 4 или 5 GPC: кому как повезет (обновление 2)

GeForce GTX 780 содержит 4 или 5 GPC: кому как повезет (обновление 2)

Опубликовано:

nvidiaСегодня была объявлена видеокарта GeForce GTX 780 (тест и обзор), которая опирается на вполне ожидаемые архитектурные спецификации. А именно 2304 потоковых ядер CUDA сгруппированы в 12 кластеров SMX (каждый имеет 192 ядра CUDA). В полной версии GK110 кластеры SMX сгруппированы в пять крупных кластеров GPC (Graphics Processing Clusters). То же самое касается и GeForce GTX Titan с 14 кластерами SMX. В каждом GPC содержится по три кластера SMX. В случае GeForce GTX 780 используется 12 кластеров SMX, что отнюдь не означает, что они сгруппированы в четыре GPC. Если верить NVIDIA, GPU GK110-300-A1 может содержать как четыре, так и пять GPC.

GK110 Blockdiagramm
Диаграмма GK110 для GeForce GTX Titan

Количество кластеров GPC может повлиять на производительность. Если текстурные блоки и кэши содержатся в кластерах SMX, то растеризатор относится ко всему блоку GPC (см. диаграмму GeForce GTX Titan выше). Каждый из растеризаторов может обрабатывать восемь пикселей за такт. В случае пяти блоков GPC мы получаем производительность 40 пикселей за такт, а в случае четырёх GPC - только 32 пикселя за такт. У GeForce GTX Titan используются пять GPC, что даёт пиксельную скорость заполнения 33,48 Гпиксель/с. У GeForce GTX 780 с пятью GPCs мы получаем 34,5 Гпиксель/с, но у GeForce GTX 780 с четырьмя GPC - всего 27,62 Гпиксель/с. То есть пиксельная скорость заполнения будет на 25 процентов ниже.

Какой эффект на производительность в играх окажет разница по пиксельной скорости заполнения - предсказать сложно. Как-то определить количество GPC по спецификациям не представляется возможным. Найти количество GPC получится лишь с помощью тестов.

NVIDIA GeForce GTX 780

Но почему мы получили такие различия в количестве GPC именно у GeForce GTX 780? NVIDIA, скорее всего, использует не полностью функциональные GPU GK110, а отбраковку после отсева чипов, годных для GeForce GTX Titan и Tesla K20 (X). Но у дефектных GPU ошибки могут быть в совершенно разных областях. Так что из дефектного кристалла можно сделать GPU с 12 кластерами SMX в разных раскладках - в некоторых случаях из четырёх, в других - из пяти GPC.

Обновление:

До сих пор не ясно, как разница в пиксельной скорости заполнения влияет на производительность. Но сегодня стал известен способ, который позволяет быстро определить количество блоков GPC у GeForce GTX 780: четыре или пять. Двойным кликом по иконке NVIDIA запускается утилита "NVIDIA Inspector". В ней нужно найти запись PipeCount. Значение PipeCount [000]: 5 (0x00000005) соответствует GPU с пятью GPC, PipeCount [000]: 4 (0x00000004) - с четырьмя GPC.

Обновление 2:

Оказывается, что и программа NVIDIA Inspector не всегда корректно считывает количество GPC. Так что лучшим способом остаётся проверка пиксельной скорости заполнения, которую можно измерить с помощью данной утилиты.