> > > > Turing: ядра RT и Tensor занимают небольшую площадь чипа

Turing: ядра RT и Tensor занимают небольшую площадь чипа

Опубликовано:

turing-gpuNVIDIA уже представила две видеокарты GeForce GTX 1660 Ti и GeForce GTX 1660 на архитектуре Turing, которые лишены ядер Tensor и RT, то есть работают без соответствующих функций Deep Learning Super Sampling и RTX.

GPU TU116 у данных видеокарт имеет площадь 284 мм², что позволяет оценить влияние ядер Tensor и RT на размер чипа. У номинального предшественника GP106 площадь составляет 200 мм². Число транзисторов увеличилось с 4,4 до 6,6 млрд. То есть мы наблюдаем практически линейное увеличение числа транзисторов по отношению к площади при переходе с GPU GP106 на TU116.

Сравнение чипов Pascal и Turing
Чип TU102 TU104 TU106 TU116
Площадь кристалла 754 мм² 545 мм² 445 мм² 284 мм²
Количество транзисторов 18,6 млрд. 13,6 млрд. 10,8 млрд. 6,6 млрд.
Ядра RT 68 46 36 -
Ядра Tensor 544 368 288 -

GPU NVIDIA Turing по-прежнему производятся по 12-нм техпроцессу на TSMC, площадь в случае GPU TU102 составляет приличные 754 мм². GPU TU104 и TU106 хорошо масштабируются по площади в зависимости от числа потоковых процессоров, блоков RT и Tensor.

Но насколько велики новые аппаратные блоки архитектуры Turing? NVIDIA не дает какой-либо подробной информации по данному вопросу. Наш форумчанин OC_Burner вновь опубликовал на Flickr новые снимки кристаллов. Хотя снимки GPU в высоком разрешении с разными фильтрами пока отсутствуют, сравнение полированных GPU TU106 и TU116 позволяет оценить площадь кластеров Texture Processor Cluster (TPC). TU106 GPU оснащен 18 TPC - шесть на каждый Graphics Processing Cluster (GPC).

Измерения на основе снимков кристаллов дают площадь TPC на TU106 GPU 10,89 мм², хотя кластер на GPU TU116 составляет всего 8,94 мм². Разница в площади 1,95 мм² как раз должна быть обусловлена отсутствием ядер Tensor и RT. Из предыдущих снимков GPU GV100 на архитектуре Volta можно сделать предположение о размере ядер Tensor 1,25 мм². Что оставляет порядка 0,7 мм² на отсутствующие ядра RT у TU116 GPU. В случае каждого TPC мы подразумеваем два ядра RT на площади 0,7 мм² и 16 ядер Tensor на площади 1,25 мм².

Можно сделать три вывода:

1. Ядра Tensor и RT намного меньше, чем ожидалось ранее. Конечно, GPU Turing - это не маленькие и эффективные чипы, и дешево их производить не получится. Но причина кроется и в том, что NVIDIA сохранила 12-нм техпроцесс, существенно увеличив при этом число функциональных блоков.

2. Даже без ядер Tensor и RT NVIDIA "раздула" архитектуру большими кэшами и выделенными вычислительными блоками INT32, поэтому площадь чипов увеличилась. Кроме того, обновленные потоковые процессоры тоже могут повлиять на размер чипов.

3. После выхода GeForce GTX 1660 Ti на TU116 GPU появились слухи о том, не использует ли NVIDIA ядра Tensor в качестве выделенных блоков FP16 в TU116 GPU. По всей видимости, это не так. В случае TU10x GPUs вычисления с плавающей запятой FP16 выполняются на ядрах Tensor, но в TU116 GPU они отсутствуют.

В итоге аргумент NVIDIA, что видеокарты Turing так дорого из-за значительного пространства, занимаемого ядрами Tensor и RT, не имеет под собой почвы. Конечно, NVIDIA закладывает в цену расходы на разработку чипов. Но сложно оценить, насколько велика эта доля.