Страница 2: AMD Radeon R9 290X | Graphics Core Next 2.0

Graphics Core Next 2.0
Graphics Core Next 2.0

Обзорный слайд GPU "Hawaii" позволяет вычленить ключевые спецификации новинки: до 44 блоков Compute Units (CU) с четырьмя SIMD каждый (Single Instruction Multiple Data). В каждом блоке SIMD содержатся 16 потоковых процессоров (АЛУ), что даёт 2.816 потоковых процессоров в общей сложности. Они сгруппированы в четыре так называемых блока шейдерных движков (Shader Engine), к каждым из которых прикреплён геометрический процессор (Geometry Processor), так что вычисления распределяются между четырьмя шейдерными движками. Графический процессор оснащён 2 Мбайт кэш-памяти L2. Внутри блоков СU также используется кэш L1 и блоки регистров разных размеров. Наконец, восемь 64-битных контроллеров памяти обеспечивают 512-битный интерфейс. Ниже мы детально рассмотрим отдельные компоненты.

Graphics Core Next 2.0
Graphics Core Next 2.0

На GPU "Hawaii" может использоваться до четырёх шейдерных движков, каждый из которых содержит 11 блоков Compute Unit. Так что вполне можно ожидать версии "Hawaii" с двумя или тремя шейдерными движками. Пока подобные видеокарты не объявлены, но вполне возможно, что AMD Radeon R9 290 нас чем-то удивит. Внутри каждого шейдерного движка используется геометрический процессор (Geometry Processor) которые, в том числе, отвечают за распределение нагрузки между четырьмя шейдерными движками. Данная функция нацелена больше на сферу GPGPU, до четырёх CU могут совместно использовать кэш инструкций и данных. Кроме того, в зависимости от используемых конвейеров растровых операций, каждый шейдерный движок может задействовать до четырёх блоков рендеринга (Rendering Back-End).

Graphics Core Next 2.0
Graphics Core Next 2.0

Если посмотреть на структуру отдельных блоков CU (Compute Unit), то изменений не так много. На блок CU установлены четыре блока SIMD, которые получают данные от диспетчера (Scheduler). Каждый CU оснащён 16 кбайт кэша L1, четырьмя блоками векторных регистров по 64 кбайт, кэшем локальных данных на 64 кбайт и блоком скалярных регистров на 4 кбайт.

Graphics Core Next 2.0
Graphics Core Next 2.0

AMD доработала процессор команд (Command Processor) и геометрические процессоры (Geometry Processor), что позволило увеличить производительность вычислений геометрии. Здесь мы вновь получаем оптимизации, поскольку принципиально структура не изменилась. AMD заявляет о более высокой эффективности, поскольку снижает объём передаваемых данных с внешних компонентов, что повышает производительность.

Graphics Core Next 2.0
Graphics Core Next 2.0

Четыре потоковых движка получают до четырёх блоков рендеринга (Rendering Back-End), что позволяет использовать, максимум, 16 блоков рендеринга (4 ROP в каждом). Именно по этой причине Radeon R9 290X может похвастаться пропускной способностью растровых конвейеров до 64 Гпиксель/с. Дальнейшие оптимизации кэшей L1 и L2 позволили увеличить ёмкость на 33 процента, а также на 33% внутреннюю пропускную способность. Но в распределении кэшей на блок CU изменений не произошло. В принципе, улучшения можно связать с увеличением числа блоков Compute Unit на кристалле. Суммарная пропускная способность всех кэшей составляет 1 Тбайт/с.

Graphics Core Next 2.0
Graphics Core Next 2.0

Важной особенностью архитектуры "Hawaii" является 512-битный интерфейс памяти GPU. Несмотря на снижение частоты памяти, он позволил AMD поднять пропускную способность памяти до 320 Гбайт/с. Важно отметить, что AMD смогла оптимизировать структуру контроллера памяти на кристалле, что позволило ему занимать меньшую площадь. Это позволило AMD заявить о приросте пропускной способности памяти на квадратный миллиметр, но на конечных пользователях такие изменения вряд ли отразятся.

Graphics Core Next 2.0
Graphics Core Next 2.0

AMD подчеркивает увеличение в новой архитектуре большинства ключевых параметров: повышение числа потоковых процессоров, более широкий интерфейс памяти и двукратное увеличение других характеристик. Повышение площади кристалла вряд ли можно считать позитивным, если только производительность не будет расти прямо пропорционально площади.

Для прироста производительности в играх важно увеличивать пиксельную скорость заполнения. На неё положительно влияют большая пропускная способность памяти, а также большее количество блоков CU и потоковых процессоров, которые выполняют простые арифметические операции.

Graphics Core Next 2.0
Graphics Core Next 2.0

AMD в новых процессорах "Hawaii" внесла ряд изменений, нацеленных на оптимизацию вычислений на GPU. Мы получаем восемь асинхронных вычислительных движков Asynchronous Compute Engines (ACE), которые могут работать независимо. Каждый движок ACE получает очередь, в которой могут храниться до восьми команд. Для ускорения доступа к данным все движки ACE могут напрямую обращаться к кэшу L2. Через два движка DMA возможен доступ и к оперативной памяти компьютера. В данном случае будет полезной высокая пропускная способность 16 Гбайт/с у интерфейса PCI Express 3.0.