Страница 2: Архитектура Fiji

На диаграмме показана структура GPU "Fiji". Можно видеть 64 блока Compute Unit, каждый из которых содержит 64 потоковых процессора. Весьма любопытна диаграмма архитектуры слева: здесь видны четыре чипа HBM, каждый из которых подключен через 2x 512-битных контроллера к GPU. За ними находится кэш L2 ёмкостью 2 Мбайт. Как и в случае "Hawaii", чип "Fiji" содержит восемь Asynchronous Compute Engine, которые обеспечивают поддержку асинхронных шейдеров и ускоряют рендеринг.

Слайд презентации AMD Radeon R9 Fury X
Слайд презентации AMD Radeon R9 Fury X

С помощью блоков Global Data Share и Shader Engine задачи распределяются между четырьмя блоками по 16 Compute Units каждый. Также на GPU имеется блок TrueAudio, хотя AMD продвигает его уже не так активно. На данный момент AMD ждёт подвижек со стороны разработчиков, которые должны уделить большее внимание качеству звука в играх. Из выпущенных игр только Thief серьёзно задействует возможности TrueAudio.

Блок Unified Video Decoder (UVD) реализован на том же уровне, что и в современных APU "Carrizo", то есть поддерживает кодек H.265 HVEC. Контроллер Eyefinity Display Controller отвечает за возможность подключения до шести дисплеев. К сожалению, поддержка HDMI 2.0 здесь отсутствует, на чём мы ещё остановимся позже. Ранее уже встречался движок XDMA, который обеспечивает работу Crossfire без мостиков. Интерфейс с системой реализован через PCI Express 3.0 – уже некоторое время данный стандарт остаётся современным.

Строение GCN Compute Unit
Строение GCN Compute Unit

AMD с GPU "Fiji" GPU опирается на архитектуру GCN третьего поколения. Она находится на уровне GPU "Tonga" прошлого года, мы получаем те же самые оптимизации. Один из способов увеличить производительность чипа при прежней тактовой частоте заключается в увеличении числа вычислений на такт. По сравнению с предыдущей архитектурой у GPU "Fiji" за такт рассчитываются четыре так называемых "примитива", то есть простые операции сложения. В результате мы получили удвоение по сравнению с "Tahiti", что даёт существенный прирост по общей производительности. В данном отношении "Fiji" выступает на уровне GPU "Hawaii" и "Tonga". По производительности тесселяции "Fiji" также продвинулся вперёд на уровень "Hawaii" и "Tonga", он должен быть в 2-4 раза быстрее "Tahiti". Для компенсации наличия всего 4 Гбайт видеопамяти AMD разработала цветовую дельта-коррекцию без потерь, что позволяет экономить около 40 процентов – благодаря данному алгоритму сжатия в память передаётся меньше информации. Данный шаг также увеличивает и пропускную способность памяти, которая и так превосходит классические решения GDDR5.

Существенно была улучшена и поддержка вычислений на GPU. Теперь линии SIMD могут обмениваться инструкциями для параллельной обработки. Также была улучшена и диспетчеризация задач, а именно разделение арифметических операций между потоковыми процессорами. Новые 16-битные инструкции для чисел с плавающей запятой тоже обеспечивают более эффективную работу вычислений на GPU и обработки мультимедиа. Всё это входит в обновлённый набор инструкций ISA (Instruction Set Architecture).