Страница 24: Так ли хорош младший Turing?

Перед тем, как мы перейдем к заключению, позвольте подробнее рассмотреть младший чип Turing. Если верить NVIDIA, TU116 на видеокарте GeForce GTX 1660 Ti используется в полной версии. То есть больше 1.536 потоковых процессоров на TU116 мы не получим. Но NVIDIA раскрывает не все карты. Мы были удивлены, обнаружив два свободных участка для чипов памяти на PCB GeForce GTX 1660 Ti. Новой видеокарты GeForce GTX на Turing с 256-битным интерфейсом пока не объявлено, да и ASUS использует другую раскладку PCB для видеокарт GeForce RTX. Откуда тогда появились два данных участка? Возможно, мы скоро получим более мощный чип Turing (TU114?) без ядер RT и Tensor? Впрочем, нынешние слухи указывают, напротив, на меньший чип.

По сравнению с номинальным предшественником, а именно GeForce GTX 1060 на GP106 GPU, площадь чипа увеличилась с 200 до 284 мм². Число транзисторов тоже возросло с 4,4 до 6,6 млрд. Пропорции площади и числа транзисторов увеличились практически линейно. Однако это не наблюдается в случае потоковых процессоров. Но здесь стоит учитывать блоки INT32 и большие кэши.

В любом случае, производительность в расчете на квадратный миллиметр GPU TU116 лишь ненамного увеличилась по сравнению с архитектурой Pascal. GPU GP104 у видеокарты GeForce GTX 1070 имеет площадь 314 мм², по производительности он примерно соответствует GeForce GTX 1660 Ti с GPU 284 мм².

На двух фотографиях выше показаны SM Turing TU116 GPU (слева) и TU102 GPU (справа). Самое большое отличие кроется в отсутствии ядер RT и Tensor у TU116 GPU. В последнем случае ядра были заменены блоками FP16. В случае GPU TU102 вычисления с плавающей запятой FP16 выполнялись на ядрах Tensor.

NVIDIA производила GPU Pascal по 16-нм техпроцессу, новые GPU Turing производятся по технологии 12 нм. В случае GPU Volta NVIDIA со своим партнером TSMC смогла оптимизировать 12-нм техпроцесс, то же самое коснется и всех GPU Turing. Но переход с 200 на 284 мм² приведет к удорожанию себестоимости производства.

В Turing SM имеются не только аппаратные изменения с выделенными блоками INT32 и иерархией кэша, но и новые программные функции. Среди них можно отметить технологию Variable Rate Shading (VRS), которую NVIDIA называет Adaptive Shading (NAS). Пока что данная функция поддерживается только в Wolfenstein II: The new Colossus. В зависимости от сложности сцены, NAS может давать определенный прирост производительности.

Впрочем, как и в случае других подобных реализаций, успех зависит от поддержки со стороны разработчиков. Будем надеяться, что в будущем мы увидим больше игр с поддержкой NAS. То же самое касается видеокарт GeForce RTX и функций RTX и DLSS.