Страница 1: Тест и обзор: NVIDIA GeForce GTX 1080 на архитектуре Pascal

geforce gtx 1080Сегодня NVIDIA представляет видеокарты GeForce GTX 1080 и GeForce GTX 1070 на новой архитектуре Pascal, которая в нынешнем году распространится и на другие модели. Вскоре AMD тоже выпустит свои новинки. Десять дней назад NVIDIA пригласила журналистов в Остин (Техас), где компания анонсировала новые видеокарты. Сегодня мы можем дать больше информации о прошедшем мероприятии, а также приводим результаты тестов. Кроме информации об архитектуре мы рассмотрим эталонный дизайн в виде Founders Edition, опубликуем тесты, а также расскажем о новых технологиях.

В этом году NVIDIA решила использовать конференцию GPU Technology Conference для объявления новой архитектуры GPU. Удивив многих, NVIDIA в середине марта представила архитектуру Pascal, объявив вычислительные ускорители Tesla P100 с первыми GPU на новой архитектуре. Журналисты тоже были немало удивлены, поскольку ранее NVIDIA даже не намекала на подобное развитие событий. Идея архитектуры Pascal во многом строится на высокой вычислительной производительности. Как показал первый анализ архитектуры Pascal, у нее действительно имеется приличный потенциал вычислительной производительности.

Как сообщил CEO Дженсен Хуанг на пленарном докладе, NVIDIA использовала для GPU GP100 полную версию архитектуры. Чип использует 15,3 млрд. транзисторов, 16 Гбайт памяти HBM2, а площадь составляет 610 мм². GPU с памятью устанавливаются на подложку, так что NVIDIA пришлось преодолеть немало технических проблем. На разработку архитектуры ушло несколько лет, в общей сложности над ней работали тысячи инженеров. Бюджет на разработку архитектуры Pascal составил от 2 до 3 млрд. долларов. Никто не ожидал, что NVIDIA подготовит чипы с новой архитектурой уже в начале года. Впрочем, GPU GP100 ориентированы на вычисления, а не на геймеров. Цена ускорителей P100 составляет от 12 до 15 тыс. долларов – точной цены NVIDIA так и не назвала.

Пять основных особенностей GeForce GTX 1080
Пять основных особенностей GeForce GTX 1080

Видеокарты GeForce GTX 1080 и GTX 1070 можно назвать шагом назад. NVIDIA использовала другой дизайн чипа, который во многих областях существенно отличается от GPU GP100 в вычислительных ускорителях Tesla P100. Ниже мы рассмотрим сходства и различия. А также поговорим о новых технологиях, которые могут играть важную роль в будущем.

Обзор технических спецификаций GeForce GTX 1080
Модель NVIDIA GeForce GTX 1080 AMD Radeon R9 Fury X NVIDIA GeForce GTX 980 Ti
Цена 789 евро от 45,2 тыс. рублей
от 615 евро
от 44,2 тыс. рублей
от 620 евро
Сайт производителя NVIDIA AMD NVIDIA
Техническая информация
GPU GP104 Fiji XT GM200
Техпроцесс 16 нм 28 нм 28 нм
Число транзисторов 7,2 млрд. 8,9 млрд. 8 млрд.
Тактовая частота GPU (базовая) 1.607 МГц - 1.000 МГц
Тактовая частота GPU (Boost) 1.733 МГц 1.050 МГц 1.075 МГц
Частота памяти 2.500 МГц 500 МГц 1.750 МГц
Тип памяти GDDR5X HBM GDDR5
Объём памяти 8 GB 4 GB 6 GB
Ширина шины памяти 256 бит 4.096 бит 384 бит
Пропускная способность памяти 320,0 Гбайт/с 512,0 Гбайт/с 336,6 Гбайт/с
Версия DirectX 12 12 12
Потоковые процессоры 2.560 4.096 2.816
Текстурные блоки 160 256 176
Конвейеры растровых операций (ROP) 64 64 96
Тепловой пакет 180 Вт 275 Вт 250 Вт
SLI/CrossFire SLI CrossFire SLI

В рамках данной статьи мы будем называть GPU в видеокарте GeForce GTX 1080 модельным номером GP104. То же самое касается и видеокарты GeForce GTX 1070, хотя здесь архитектура подверглась некоторым сокращениям. NVIDIA пока не раскрыла техническое название чипов. Для ясности сравнения с GP100 в Tesla P100, мы будем использовать название GP104 для чипа в видеокартах GeForce GTX 1080 и GTX 1070. Производство GPU выполняется по 16-нм техпроцессу FinFET на заводах TSMC. NVIDIA указала число транзисторов 7,2 млрд. Площадь кристалла составляет 314 мм².

Архитектура Pascal

Центральным компонентом архитектуры по-прежнему являются потоковые мультипроцессоры Streaming Multiprocessors (SM). Графический процессор состоит из кластеров GPC (Graphics Processing Cluster, потоковых мультипроцессоров SM и контроллеров памяти. У GP104 на видеокарте GeForce GTX 1080 мы получаем четыре GPC, двадцать SM, каждый содержит по два блока с 64 потоковыми процессорами. В результате число потоковых процессоров составляет 2.560 (20x128). У каждого SM кроме 128 потоковых процессоров имеются восемь текстурных блоков, что дает 160 TMU в сумме. Интерфейс памяти 256-битный, NVIDIA использовала восемь 32-битных контроллеров. К каждому контроллеру подключено восемь конвейеров растровых операций, что дает 64 ROP у GeForce GTX 1080.

Диаграмма GPU GP104
Диаграмма GPU GP104

Движок PolyMorph Engine получил специальный аппаратный блок для функции Simultaneous Multi Projection. Комбинация SM с движком PolyMorph Engine названа Thread Processing Cluster (TPC). Каждый Streaming Multiprocessor оснащен 256-кбайт блоком File Register, 96-кбайт блоком Shared Register и 48-кбайт кэшем L1. Также имеется кэш L2 емкостью 2.048 кбайт.

Диаграмма Streaming Multiprocessor GPU GP104
Диаграмма Streaming Multiprocessor GPU GP104

Если сравнивать GPU GP104 GeForce GTX 1080 с GPU GP100 Tesla P100, то можно заметить некоторые изменения. У GPU GP100 каждый SM содержал 64 потоковых процессора, у GPU GP104 их число увеличилось до 128. Кроме того, изменились размеры блоков регистров и кэша. Таким образом, NVIDIA впервые в архитектуре изменила не только количество функциональных блоков, но и внесла более глубокие изменения, адаптируя архитектуру под потребности семейств Tesla или GeForce (изменяя число блоков FP64 и потоковых процессоров).

Подача питания

У чипа, изготавливаемого по 16-нм техпроцессу с несколькими миллиардами транзисторов, вопросы подачи питания выходят на передний план. К каждой области GPU необходимо подвести как можно более стабильное питание, именно по этой причине используются выделенные проводники. Чем больше будет инфраструктура питания на GPU, тем более стабильными будут напряжения. NVIDIA при разработке архитектуры Pascal и GPU GP104 провела тысячи симуляций, чтобы найти эффективное соотношение между напряжениями и частотами GPU – то же самое верно и для GPU GP100 в Tesla P100.

Новая подсистема питания
Новая подсистема питания

В начале разработки учитывалось порядка 1.300 линий подачи напряжения, что позволило увеличить частоту Boost до 1.325 МГц. Со временем количество линий подачи напряжения превысило 1.700, что позволило добиться частоты Boost, как минимум, 1.733 МГц у GeForce GTX 1080. Конечно, количество линий можно увеличивать и дальше, но отдача в виде тактовых частот будет уже непропорциональной.

Кроме самого GPU довольно высокие требования по питанию накладывают и другие компоненты. Поэтому важно гарантировать стабильную подачу питания на упаковку GPU. NVIDIA использовала специальный дизайн печатной платы (Board Channel Design), который описывает раскладку линий. Дизайн печатной платы дополняет архитектура питания самого GPU (GPU Circuit Architecture), описывающая подачу питания на компоненты, расположенные непосредственно на кристалле.

Новая подсистема питанияНовая подсистема питания

Новая подсистема питания

Высокие требования к печатной плате и упаковке BGA GPU накладываются и по передаче сигналов. Это касается интерфейса PCI Express и памяти GDDR5X. В данном случае память работает на довольно высоких частотах до 2.500 МГц. Длина волны сигналов сокращается, для симуляции уже недостаточно учитывать омическое сопротивление, перекрестные помехи, длину проводников. Необходимо, например, принимать во внимание емкость и индуктивность проводников.

Чтобы гарантировать целостность сигналов во всех участках цепи, модуляция и декодирование должны выполняться максимально точно. Чтобы сигналы проходили за примерно равное время, чипы памяти равномерно распределены вокруг GPU. Данная методика будет применяться и с будущими поколениями памяти, NVIDIA продолжит ее оптимизацию.