> > > > Intel опубликовала документацию графики Gen11

Intel опубликовала документацию графики Gen11

Опубликовано:

intelПодготовка к выходу новых процессоров идет полным ходом, Intel опубликовала документацию (PDF) нового графического ядра Gen11. Графика Gen11 будет использоваться во многих грядущих SoC, в том числе процессорах Lakefield и Ice Lake.

Все процессоры Gen11 будут изготавливаться по 10-нм техпроцессу. В архитектуре будут доступны 64 исполнительных блока (EU). Кроме архитектурных изменений, графика Gen11 предложит и другие функции, в том числе Coarse Pixel Shading (CPS) и Position Only Shading Tile Based Rendering (PTBR).

Графика Gen11 будет подключаться к остальным компонентам процессора или SoC через кольцевую шину (SoC Ring Interconnect). Важно понимать, что в составе чипа используются разные домены, работающие на своих тактовых частотах. В частности, в отдельный домен выделены ядра CPU, графика (Processor Graphics Clock Domain) и шина (Ring Interconnect Clock Domain).

Шина SoC Ring Interconnect соединяет графику Gen11 с ядрами CPU, кэшем Last Level Cache (LLC) и System Agent (контроллер памяти, контроллер PCI Express, контроллер дисплея и т.д.).

Графика Gen11 состоит из так называемого слайса, который разделяется на, максимум, восемь субслайсов. Последние используют общий кэш L3, пиксельную часть конвейера (pixel backend), диспетчер пикселей (pixel dispatcher), растеризатор (raster) и блок обрезки/Z-буфер (HiZ/Depth). Если верить Intel, большинство процессоров с графикой Gen11 будут опираться на восемь субслайсов, то есть 64 EU. Однако вполне возможно появление меньших версий Gen11.

Каждый субслайс содержит локальный диспетчер потоков и собственный кэш инструкций. Можно отметить блоки 3D Texture Sampler Unit, Media Sampler Unit и Dataport Unit.

Основным компонентом остаются исполнительные блоки (Execution Unit). Они опираются на Simultaneous Multi-Threading (SMT) и Fine-Grained Interleaved Multi-Threading (IMT). В случае IMTархитектура гарантирует, что различные вычислительные блоки EU будут постоянно получать данные для работы.

Каждый EU оснащен двумя блоками SIMD Floating Point Units (ALUs). Несмотря на название, они выполняют целочисленные вычисления. Каждый ALUs может выполнять до четырех 32-битных операций с плавающей запятой (или целочисленных), либо до восьми 16-битных операций с плавающей запятой. В результате каждый EU может выполнять 16 операций FP32 за такт (2 ALUs x SIMD-4 x 2 Ops (Add + Mul)) и 32 операции FP16 за такт (2 ALUs x SIMD-8 x 2 Ops (Add + Mul)). EU работают в многопоточном режиме, используя 28-кбайт регистровый файл (GRF) с 32 байтами на регистр.

По сравнению с графикой Gen9, в gen11 память Shared Local Memory (SLM) расположена на субслайсах. Таким образом, восемь EU субслайса могут напрямую обращаться к 64 кбайт памяти SLM, им не приходится проходить путь к SLM (в составе кэша L3) через DataPort. В данном случае Gen11 выигрывает от более высокой пропускной способности и меньших задержек.

Через DataPort обеспечивается доступ к кэшу L3. Intel увеличила размер кэша L3 до 3 Мбайт. DataPort может считывать или записывать 64 байта за такт в кэш L3. Чтобы передача данных была максимально эффективной, можно сочетать два 32-байтных доступа к 64 байтам кэша. Кроме того, Intel добавила новые механизмы сжатия без потерь, которые тоже вносят свой вклад при работе с основной памятью. Несмотря на увеличение размера кэша L3 до 3 Мбайт, данные все равно приходится считывать и записывать в основную память системы.

В целом, вся подсистема памяти графики Gen11 была оптимизирована под минимальные задержки и высокую пропускную способность. Архитектура поддерживает память LPDDR4.

Intel также внесла некоторые трюки для повышения производительности: у GPU Gen11 поддерживается технология Coarse Pixel Shading. Она довольно близка к NVIDIA Variable Rate Shading, благодаря сжатию деталей можно уменьшить нагрузку рендеринга и увеличить частоту кадров. Как и в случае Variable Rate Shading, игра должна специально поддерживать Intel Coarse Pixel Shading, но сколько таких игр мы получим в итоге? Coarse Pixel Shading должна войти в состав DirectX 12, как и Variable Rate Shading.

Есть и многие другие оптимизации. Контроллер дисплея поддерживает все современные стандарты, в том числе появилась возможность использовать порт Type C. Поддерживается и Adaptive Sync. В целом, Intel подняла уровень своей интегрированной графики до планки нынешних архитектур GPU во многих сферах. Что отлично готовит почву для новых GPU, в которых мы наверняка получим инновации. Первые сведения о грядущей архитектуре Xe появятся ближе к 2020 году.

С графикой Gen11 Intel пока не ориентируется на high-end сегмент. Gen11 GPU будут использоваться в составе интегрированной графики процессоров, производительность должна быть примерно на уровне a Vega 8 GPU от AMD (1 TFLOPS).