Тест и обзор: AMD Radeon RX 480 – новый лидер массового рынка

Опубликовано:

radeon rx480 reference logoAMD представила новую видеокарту Radeon RX 480, первую модель поколения Polaris, которая поступила в нашу тестовую лабораторию. С новым поколением AMD изменила прежний подход, начав не с high-end сегмента, а с массового рынка – именно на средний сегмент позиционируются первые видеокарты Polaris. Ниже вы узнаете все подробности новой архитектуры AMD Polaris, а также изменения по сравнению с предшествующими видеокартами. Конечно, мы приведем результаты тестов.

AMD стала рекламировать архитектуру Polaris довольно рано. Первые сигналы появились в конце 2015 года, когда AMD анонсировала грядущее появление видеокарт, правда, не уточнив дату. Честно говоря, довольно редко производители анонсирую новые модели GPU за полгода до их выхода. В случае Polaris крупиц информации было очень мало, по ним было сложно составить впечатление о производительности новинки. AMD, например, сразу же рассказала о производстве по 14-нм техпроцессу FinFET, правда, без подробностей.

AMD некоторое время активно продвигает высокий динамический диапазон (HDR) для просмотра фотографий и видео, а также для игр. Конечно, его должны поддерживать и мониторы, и интерфейсы. В последнем случае поддерживаются стандарты DisplayPort 1.3/1.4 и HDMI 2.0b. Как раз насчет HDMI AMD подверглась серьезной критике с видеокартами Fury, которые по какой-то причине не поддерживали стандарт HDMI 2.0.

Во время Computex была представлена финальная версия Radeon RX 480. Но и тогда AMD не раскрыла технические спецификации. Сейчас мы восполняем этот пробел.

Технические спецификации AMD Radeon RX 480 в сравнении
Модель AMD Radeon R9 380 NVIDIA GeForce GTX 970 AMD Radeon RX 480
Сайт производителя AMD NVIDIA AMD
Цена от 12,5 тыс. рублей
от 170 евро
от 19,9 тыс. рублей
от 250 евро
18.970 рублей
255,85 евро
Техническая информация
Техпроцесс 28 нм 28 нм 14 нм
GPU Tonga PRO Maxwell (GM204) Polaris 10 XT
Тактовая частота GPU (базовая) - 1.050 МГц 1.120 МГц
Тактовая частота GPU (Boost) 970 МГц 1.178 МГц 1.266 МГц
Частота памяти 1.375 / 1.425 МГц 1.750 МГц 2.000 МГц
Тип памяти GDDR5 GDDR5 GDDR5
Объём памяти 2/4 GB 4 GB 4/8 GB 
Ширина шины памяти 256 бит 224 + 32 бит 256 бит
Пропускная способность памяти 176 / 182,4 Гбайт/с 224 Гбайт/с 256 Гбайт/с
Версия DirectX 12 12 12
Потоковые процессоры 1.792 1.664 2.304
Текстурные блоки 112 104 144
Конвейеры растровых операций (ROP) 32 64 32
Тепловой пакет 190 Вт 145 Вт 150 Вт
SLI/CrossFire CrossFire SLI CrossFire

Поговорим о спецификациях. AMD производит GPU Polaris 10 видеокарты Radeon RX 480 на заводах Globalfoundries по 14-нм техпроцессу FinFET. Впервые AMD установила для GPU базовую частоту, приблизившись к подходу NVIDIA. Базовая частота составляет 1.120 МГц, она является минимумом, на котором будут работать видеокарты. В режиме Boost частота может составлять до 1.266 МГц, причем, в отличие от NVIDIA, это не минимальное гарантированное значение, а максимальное.

У Radeon RX 480 используются 2.304 потоковых процессоров. Об их организации мы поговорим в разделе архитектуры. Кроме 2.304 потоковых процессоров на GPU работают 144 текстурных блока и 32 конвейера растровых операций (ROP). Отметим 4 или 8 Гбайт памяти GDDR5, которая работает на частоте 2.000 МГц. Так что AMD отказалась от использования GDDR5X, как и NVIDIA в случае GeForce GTX 1070. Память GDDR5X пока присутствует только у GeForce GTX 1080. Конечно, появление High Bandwidth Memory вряд ли было разумно ждать у видеокарты с подобным классом цены и производительности.

Рендеринг GPU Polaris 10
Рендеринг GPU Polaris 10

Видеокарта Radeon RX 480 потребляет 150 Вт, из которых 85 Вт относятся к GPU, а остальная мощность – к другим компонентам.

AMD указывает рекомендованную цену 255,85 евро или 18.970 рублей для Radeon RX 480 с 8 Гбайт памяти. Версия с 4 Гбайт памяти обойдется в 214,20 евро или 16.310 рублей.

Технические спецификации линейки AMD Radeon RX
Модель AMD Radeon RX 460 AMD Radeon RX 470 AMD Radeon RX 480
Сайт производителя AMD AMD AMD
Цена - - 18.970 рублей
255,85 евро
Техническая информация
Техпроцесс 14 нм 14 нм 14 нм
GPU Polaris 11 XT Polaris 10 PRO Polaris 10 XT
Тактовая частота GPU (базовая) - - 1.120 МГц
Тактовая частота GPU (Boost) - - 1.266 МГц
Частота памяти 1.750 МГц 1.750 МГц 2.000 МГц
Тип памяти GDDR5 GDDR5 GDDR5
Объём памяти 2/4 GB 4 GB 4/8 GB 
Ширина шины памяти 128 бит 256 бит 256 бит
Пропускная способность памяти 112 Гбайт/с 224 Гбайт/с 256 Гбайт/с
Версия DirectX 12 12 12
Compute Units 14 32 36
Потоковые процессоры 896 2.048 2.304
Текстурные блоки - - 144
Конвейеры растровых операций (ROP) - - 32
Тепловой пакет 75 Вт 110 Вт 150 Вт
ASIC TDP 48 Вт 85 Вт 85 Вт
SLI/CrossFire CrossFire CrossFire CrossFire

Мы привели в таблице известные данные о GPU Radeon RX 470 и 460, полученные нами на Polaris Tech Day. К сожалению, не все подробности пока известны – например, нет тактовых частот. Судя по последним планам, остальные видеокарты линейки RX, а именно Radeon RX 470 и Radeon RX 460, должны появиться в середине июля.

Наша беседа с сотрудниками AMD на Polaris Tech Day позволила узнать несколько любопытных фактов о GPU Polaris. AMD при разработке Polaris особое внимание уделила хорошей программной поддержке и оптимизации программного обеспечения под "железо". Мы спросили, почему AMD не начала со "старшего" чипа Polaris для high-end сегмента, на что получили ответ: high-end чипы имеют смысл только когда программное обеспечение под них адаптировано, на данном этапе развития API это еще не так. То есть программное обеспечение играет весьма существенную роль, поэтому сейчас оценка продуктов AMD может несколько отличаться от ситуации, которая будет через полгода-год. С подобным мы уже сталкивались после выхода Fury. Поэтому программное подразделение Radeon Technology Group сейчас растет сильнее, чем аппаратное.

Конечно, кроме Polaris 10 и 11 AMD могла бы представить и более крупный чип уже сегодня – но компании приходится тщательно просчитывать свои ресурсы. Все же бюджет на исследования и разработки очень ограниченный, да и физически ресурсы AMD не безграничны, чтобы брать более высокий темп разработки.


Сначала хотелось бы вернуться в прошлое, чтобы сравнить предыдущие этапы развития GPU с нынешним шагом. Например, в года 2001 и 2002, когда техпроцесс составлял 180 или 150 нм. Переход с RV100 на R300 стали серьезным шагом по увеличению производительности, площадь чипа почти удвоилась, несмотря на меньший техпроцесс. Мы получили значимые улучшения по архитектуре, вместо 30 млн. транзисторов теперь использовалось 110 млн., вместо 1 блока пиксельных шейдеров – уже 8 блоков. Все это привело к существенному увеличению производительности.

С архитектурой Polaris AMD планирует повторить подобный успех, но компания опирается не только на новую архитектуру, но и многочисленные новые наработки в разных областях. Здесь можно отметить новые стандарты подключения дисплеев, мультимедийные функции, кэши, контроллер памяти и систему управления энергопотреблением.

Архитектура Polaris - Graphics Core Next 4.0
Архитектура Polaris - Graphics Core Next 4.0

С первым поколением архитектуры GCN (Graphic Core Next) AMD получила не только высокую производительность, но и значительное энергопотребление, особенно это касалось Radeon R9 290X и Radeon R9 290, самых быстрых видеокарт нового поколения. С годами AMD добавляла различные оптимизации, и чипы Tonga и Fiji уже хорошо раскрывают потенциал архитектуры, демонстрируя ее возможности.

Архитектура Polaris вновь является серьезным шагом вперед. Здесь можно назвать такие термины, как Primitive Discard Accelerator, Hardware Scheduler или Instruction Pre-Fetch, но без глубокого погружения в архитектуру их суть объяснить сложно. Проще для понимания улучшенная эффективность работы шейдеров, а также функция, увеличившая эффективность всего GPU Polaris: сжатие памяти. NVIDIA применяет цветовую дельта-компрессию еще с первого поколения Maxwell, что позволило эффективно использовать не самые широкие интерфейсы памяти. AMD с новой High Bandwidth Memory у GPU Fiji обошла ограничения пропускной способности памяти с другой стороны, но от сжатия выигрыш тоже будет заметен. Особенно это касается видеокарт без HBM, которая и в 2016 году останется прерогативой high-end GPU.

Архитектура Polaris - Graphics Core Next 4.0
Архитектура Polaris - Graphics Core Next 4.0

Старт Polaris AMD наметила с двумя версиями чипа: Polaris 10 и Polaris 11. Polaris 10 будет использоваться в видеокартах Radeon RX 480 и Radeon RX 470. В случае Radeon RX 480 доступна полная конфигурация GPU. Командный процессор (Graphics Command Processor) работает с двумя аппаратными диспетчерами (Hardware Scheduler, HWS) и четырьмя движками Asynchronous Compute Engines (ACE), которые обеспечивают распределение вычислительных задач. 36 вычислительных блоков CU (Compute Units) содержат 2.304 потоковых процессоров, то есть в каждом CU присутствуют 64 потоковых процессоров (36 x 64). Добавьте сюда 4 геометрических процессора и пиксельную пропускную способность 32 пикселя на такт. Не обошлось без 114 текстурных блоков, 2 Мбайт кэша L2, 576 32-битных блоков load/store и 256-битной шины памяти.

Radeon RX 470 использует тот же GPU Polaris 10, но в урезанном виде. Доступны только 32 блока CU, то есть видеокарта опирается на 2.048 потоковых процессоров. Интерфейс памяти остался 256-битным, но AMD предусмотрела конфигурацию памяти только 4 Гбайт. Частота памяти составляет 1.750 МГц. Типичное энергопотребление – 110 Вт, из которых 85 Вт приходится на GPU.

Архитектура Polaris - Graphics Core Next 4.0
Архитектура Polaris - Graphics Core Next 4.0

Для видеокарты Radeon RX 460 AMD будет использовать GPU Polaris 11. Он опирается на 14 CU, что дает 896 потоковых процессоров. Отметим 64 текстурных блока и 128-битный интерфейс памяти. Кэш L2 урезан до 1 Мбайт по сравнению с GPU Polaris 10. Число 32-битных блоков load/store уменьшено до 256. 2 или 4 Гбайт памяти GDDR5 будут работать на частоте 1.750 МГц. Пропускная способность памяти составляет 112 Гбайт/с. Энергопотребление видеокарты будет на уровне 75 Вт, из которых 48 Вт приходится на чип.

Кроме обновления архитектуры AMD реализовала поддержку нескольких технологий, о которых мы поговорим подробнее.

Primitive Discard Accelerator

Архитектура Polaris - Graphics Core Next 4.0
Архитектура Polaris - Graphics Core Next 4.0

Primitive Discard Accelerator предназначен для предотвращения избыточной тесселяции. Среди всего прочего, AMD ориентируется на некоторые методы GameWorks, которые используют тесселяцию, но при этом выигрывают от особенностей архитектуры GPU NVIDIA, чего нельзя было сказать о видеокартах AMD. Например, при некоторых уровнях тесселяции эффект уже не будет заметен, будет лишь тратиться производительность.

Primitive Discard Accelerator представляет собой фильтр рендеринга, который распознает подобные чрезмерные вычисления и убирает их. Освобожденная вычислительная производительность уходит на то же сглаживание MSAA. Для повышения эффективности работы шейдеров AMD использует новый индекс-кэш для геометрических объектов, который позволяет сохранять данные дольше. В результате данные не придется часто перебрасывать между кэшем и памятью, увеличивается пропускная способность примитивов.

Архитектура Polaris - Graphics Core Next 4.0
Архитектура Polaris - Graphics Core Next 4.0

Еще один способ повышения эффективности архитектуры – улучшенная предварительная выборка инструкций (prefetch). Она позволяет более эффективно заполнять конвейер рендеринга, чтобы в нем было меньше "пузырьков" бездействия. AMD увеличила или оптимизировала кэши и буферы. В частности, здесь важен кэш L2, который повышает эффективность работы с видеопамятью.

У архитектуры GCN 4-го поколения имеется "родная" поддержка FP16 и Int16, в том числе "родные" 16-битные регистры и 16-битный mapping. Данная мера уменьшить энергопотребление и снизить занимаемое пространство/пропускную способность видеопамяти и регистров, поскольку для расчетов FP16 не потребуется занимать ресурсы FP32. Вычисления FP16 важны для графики, приложений фото и видео, а также для глубокого обучения (Deep Learning).

Архитектура Polaris - Graphics Core Next 4.0
Архитектура Polaris - Graphics Core Next 4.0

Новый контроллер памяти GPU Polaris поддерживает GDDR5 с тактовыми частотами до 2.000 МГц. Пропускная способность составляет 256 Гбайт/с. Если сравнивать с предшественником Radeon R9 380, AMD увеличила пропускную способность примерно на 50 процентов.

Но более важна технология сжатия памяти. Как и NVIDIA, AMD добавила новые сценарии сжатия памяти. Технология сжатия особенно важна при использовании узких интерфейсов. 256-битный интерфейс Radeon RX 480 кажется очень узким по сравнению с 512-битным у GPU Hawaii или 4.096-битным у видеокарт с памятью HBM или HBM2 от AMD и NVIDIA. Поэтому AMD желает компенсировать сравнительно узкий интерфейс памяти с помощью технологии цветовой дельта-компрессии (Delta Color Compression, DCC), по крайней мере, в некоторой степени. Технология цветовой дельта-компрессии используется в GPU AMD и NVIDIA на протяжении нескольких поколений. Например, NVIDIA перешла на четвертое поколение технологии сжатия. AMD использовала сжатие с GPU Tonga на видеокартах Radeon R9 295. В последнее время AMD вновь акцентировала реализацию цветовой дельта-компрессии в архитектуре GCN. Важно напомнить, что сжатие осуществляется без потерь. Никакие данные не теряются, разработчики могут использовать данный метод без какой-либо специальной адаптации программного обеспечения.

Технология DCC подразумевает хранение полной информации о базовом пикселе, а окружающие пиксели в матрице 8x8 сохраняются в виде отличий (дельты). Поскольку близко расположенные пиксели обычно мало отличаются по цвету, хранение для них разницы оказывается по объёму информации выгоднее, чем полного значения цвета. Поэтому в случае дельта-компрессии информация о пикселях занимает меньше места в памяти, также достигается экономия пропускной способности памяти. В качестве примера работы технологии можно привести полностью черный и белый блоки, которые будут храниться в памяти как {1.0, 0.0, 0.0, 0.0} или {0.0, 1.0, 1.0, 1.0}. Здесь можно сэкономить ресурсы, сохраняя только 0.0 или 1.0 в качестве значения.

К уже известным сценариям сжатия 2:1 и 1:4 добавляется еще один, а именно 8:1, который обеспечивает еще более сильное сжатие. AMD говорит об увеличении производительности с новым методом на 38%. Конечно, данное значение носит теоретический характер. Оценить на практике влияние цветовой дельта-компрессии сложно, поскольку она выполняется на аппаратном уровне, выключить сжатие может только сама AMD в драйвере. Поэтому приходится довольствоваться тестами, сделанными AMD.

Архитектура Polaris - Graphics Core Next 4.0
Архитектура Polaris - Graphics Core Next 4.0

Конечно, пропускная способность памяти 384 или 320 Гбайт/с у новой видеокарты урезана до 256 Гбайт/с, но благодаря Delta Color Compression и удвоению кэша AMD планирует обеспечить существенный прирост производительности памяти и эффективности. Причем AMD не только увеличила размер кэша, но и оптимизировала его работу. Теперь чтение и запись в кэш осуществляются быстрее, также были ускорены процессы выделения разных областей данных. Все эти меры улучшают эффективность энергопотребления подсистемы памяти и усиливают преимущества DCC.

Asynchronous Compute

Архитектура Polaris - Graphics Core Next 4.0
Архитектура Polaris - Graphics Core Next 4.0

Наличие нескольких тысяч потоковых процессоров дает огромный потенциал производительности. Но разработчики программного и аппаратного обеспечения должны продумать, как наиболее эффективно задействовать имеющиеся ресурсы для выполнения вычислительных задач. Все усложняется еще больше, если к классическим графическим задачам добавить еще и вычисления на GPU. Не все подобные вычисления получается смешивать, чтобы выполнять одновременно.

Поэтому и были придуманы асинхронные шейдеры (Asynchronous Shader), которые призваны облегчить взаимодействие движка, драйверов и аппаратной части, а также улучшить распределение задач. С появлением первых видеокарт на GPU "Hawaii" AMD начала говорить об улучшениях вычислений на GPU благодаря движкам Asynchronous Compute Engines. Впрочем, данные аппаратные блоки присутствовали во всех GPU на архитектуре GCN. Они предназначены для вычислений на GPU, но игры DirectX 12 их тоже могут задействовать.

При рассмотрении архитектуры GPU мы всегда упоминаем отдельные функциональные блоки рассматриваем их работу. Они могут работать независимо друг от друга, но все упирается в процесс рендеринга, который линейный, операции можно представить в виде очереди. Во всех современных архитектурах диспетчер пытается оптимизировать выполнение данных операций, чтобы максимально нагрузить вычислительные ресурсы, но здесь возможности далеко не безграничны.

Архитектура Polaris - Graphics Core Next 4.0
Архитектура Polaris - Graphics Core Next 4.0

С появлением DirectX 12 разработчики получили существенно большие возможности контроля над вычислительными блоками, в том числе и возможность лучшего распределения задач. Но здесь API налагает определенные требования. Современные игры должны разбивать задачи на очереди, которые можно выполнять независимо друг от друга. На примере задачи распределяются по очередям графики, вычислений и копирования. API, в данном случае DirectX 12, затем распределяет очереди по доступным ресурсам GPU.

Подход кажется простым, но на практике он более сложен, поскольку данные отдельные очереди необходимо распределять по свободным ресурсам GPU. AMD описывает данный процесс рендеринга на примере автомобильного трафика, используя перекресток и светофор. Как раз светофор – это диспетчер, который должен распределить процессы по движку рендеринга. Здесь все участники движения имеют равный приоритет. Им приходится ждать, пока освободится ресурс, такая диспетчеризация не самая оптимальная.

Архитектура Polaris - Graphics Core Next 4.0
Архитектура Polaris - Graphics Core Next 4.0

Один из способов улучшить процесс заключается в приоритезации. В таком случае можно задать приоритет некоторым задачам. Например, в случае автомобильного трафика можно остановить синюю очередь, чтобы обработать фиолетовую очередь с более высоким приоритетом – она будет отправлена на рендеринг. Но и здесь приходится переключаться между разными очередями, эффективность не всегда заметно повышается.

И здесь AMD представляет асинхронные вычислительные движки (ACE, Asynchronous Compute Engines). Они позволяют одновременно обрабатывать несколько очередей команд, которые получается более эффективно встраивать в конвейер рендеринга. На примере с автомобильным трафиком использование ACE можно представить как управление каждым транспортным средством в определенном порядке и с нужным интервалом. Если все очереди команд будут поступать хаотично, то мы получим столкновения. Их и предотвращают ACE, помещая команды в очередь. Такой способ позволяет избавиться от пустых мест в очереди на конвейер, более оптимально используя потенциал производительности. Также можно выставлять приоритеты определенным процессам.

Quick Response Queue

Quick Response Queue, которая является частью Asynchronous Shaders или непосредственно связана с этой технологией. QRQ была впервые упомянута AMD около года назад, и тоже в связи с Asynchronous Shaders. Кроме этого, Quick Response Queue работает совместно с Asynchronous Time Warp, о чем мы напишем позднее. Эта функция призвана решить некоторые проблемы вычислений (и расстановки приоритетов), когда речь идет о использовании шлема виртуальной реальности.

Архитектура Polaris - Graphics Core Next 4.0
Архитектура Polaris - Graphics Core Next 4.0

На первом примере AMD показывает работу потоковых процессоров в простом сценарии Pre-Emption. В этом случае графические и другие вычисления выполняются последовательно друг за другом в зависимости от того, какое место они занимают в очереди. Общее время выполнения задач увеличивается из-за нерационального использования ресурсов. Ситуация немного меняется при использовании Asynchronous Shaders. Различные задачи в этом случае могут выполняться одновременно разными потоковыми процессорами. Благодаря этому, общее время вычислений значительно сокращается, но некоторые приоритетные задачи, которые необходимо завершить быстрее, будут выполняться дольше из-за одновременной загрузки потоковых процессоров.

Использование Asynchronous Shaders вместе с QRQ приводит к тому, что критические задачи получают больший приоритет. Поэтому наиболее важным процессам отдается больше ресурсов, и они выполняются быстрее. В итоге общее время вычислений немного увеличивается, но важные процессы выполняются гораздо быстрее, чем при использовании других сценариев.


Важной особенностью нового поколения GPU от AMD и NVIDIA является 14- или 16-нм техпроцесс FinFET. После весьма длительного периода AMD и NVIDIA смогли договориться с контрактными производители чипов, что позволило сопровождать переход на новую архитектуру одновременным переходом на новый техпроцесс. В прошлом такой переход не всегда был гладким. Наверное, именно по этой причине AMD и NVIDIA так долго придерживались 28-нм техпроцесса TSMC. С переходом на 14 нм и FinFET должны проявиться существенные преимущества по энергопотреблению. Наши тесты GeForce GTX 1080 Founders Edition хорошо показывают, что новый техпроцесс может дать серьезное преимущество по эффективности. В случае NVIDIA потенциал оказался весьма хорош.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

Даже с одной архитектурой переход на новый техпроцесс часто очень сложен. Неслучайно Intel перешла на метод "тик-так", чередуя переход на новую архитектуру и на новый техпроцесс. В результате уменьшается риск, что одновременно придется решать проблемы и с новой архитектурой, и с новым техпроцессом. В качестве примера можно привести трудности NVIDIA, возникшие при переходе на архитектуру Fermi вместе с новым техпроцессом. Проблемы возникли с межсоединениями (fabric) на кристалле GPU, которые переставали корректно работать на высоких частотах, из-за чего NVIDIA пришлось переносить выход чипа. В случае AMD переход на новую архитектуру Polaris и новый техпроцесс серьезными проблемами не сопровождался. Пробные образцы чипов Polaris 10 и Polaris 11 были выпущены еще в ноябре и декабре 2015. Сегодня, спустя восемь месяцев, видеокарта вышла на рынок. Кстати, совсем недавно AMD, по всей видимости, получила пробные образцы Vega 10, high-end чипа нового поколения.

NVIDIA для производства GPU продолжает сотрудничать с TSMC и дорабатывать 16-нм техпроцесс FinFET, но пути AMD и TSMC, похоже, разошлись. Партнером по производству GPU стала компания GlobalFoundries с заводом в США, а именно в штате Нью-Йорк. На конференции Polaris Tech Day на сцену поднимались представители Globalfoundries. Будет ли Vega тоже производиться на мощностях Globalfoundries, пока неизвестно.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

AMD уже несколько раз отмечала, что при разработке архитектуры Polaris в фокусе была эффективность и низкое энергопотребление. AMD использовала возможность нового техпроцесса упаковать больше транзисторов на прежнюю или меньшую площадь. Следует учитывать, что при переходе на структуры меньшего размера возникают другие проблемы, например, токи утечки, которые не позволяю добиться удвоения эффективности на практике.

Конечно, производители многие годы работали над тем, чтобы нивелировать данные недостатки. Современные GPU больше не используют одно напряжение для всех блоков. Кристалл разбит на области Multi-voltage Islands с разным напряжением. Конечно, такой подход требует отдельного контроллера напряжения, что приводит к дополнительным тратам. Зато подобные меры позволяют использовать разные частоты для разных областей GPU или даже полностью их выключать. Все это позволяет снизить общее энергопотребление и увеличить эффективность, но напрямую большую производительность из архитектуры не выжимает.

Intel первой начала производить кристаллы по технологии FinFET, которая добавляет 3D-структуру к планарным транзисторам. Эмиттер, коллектор и база выставляются над плоской подложкой, что дает более эффективное управление прохождением тока через транзистор.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

Вроде бы такой подход не кажется логичным, но у FinFET по сравнению с планарными транзисторами имеются существенные преимущества. При производстве разброс характеристик оказывается намного меньше. Меньший разброс позволяет более точно и эффективно управлять отдельными областями или даже транзисторами.

Производство по 14-нм техпроцессу Производство по 14-нм техпроцессу

Производство по 14-нм техпроцессу

AMD видит два преимущества техпроцесса FinFET: меньшее энергопотребление и потенциально более высокая производительность должны увеличить эффективность в 2,5 раза.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

Кроме преимуществ по эффективности переход на меньшие техпроцессы дает и другие плюсы, которые с первого взгляда не видны. Здесь можно упомянуть возможность использования PCB меньшего размера, а также менее мощную/дорогую подсистему питания. Наконец, упаковка GPU тоже может быть меньше, что тоже экономит место на PCB.

Есть еще один эффект, который пока не проявил себя: по крайней мере, "младшие" GPU Polaris 11 получаются намного более тонкими. Упаковка GPU Bonaire имела размер 0,29 x 0,29 дюйма (7,37 мм), в случае Polaris 11 она составит всего 0,245 x 0,245 дюйма (6,22 мм). Но более интересна толщина чипа, которая уменьшилась с 1,9 мм (Bonaire) до 1,5 мм (Polaris 11). Причина кроется в меньшем количестве слоев в упаковке, также у самого кристалла после литографии убирается подложка.

Adaptive Clocking

Как и NVIDIA, AMD в контексте меньшего техпроцесса указывает на сложности с подачей питания на чип.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

Хотя уменьшение техпроцесса позволяет понизить напряжения, подсистема питания все равно должна справляться с довольно высокими токами. Как правило, при включении флуктуации напряжения составляют до 10-15%. При рабочем напряжении 1 В в пиках оно может достигать 1,15 В. Чтобы закрыть этот разброс, производителям приходится поднимать среднее напряжение. Все это приводит к повышению энергопотребления, которое совершенно излишнее. Технология Adaptive Clocking позволяет справиться с этой проблемой, на 25% понизить рост энергопотребления.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

При флуктуации напряжения подсистема питания реагирует следующим образом. Без технологии Adaptive Clocking напряжение остается на номинальном уровне, но с Adaptive Clocking, если напряжение поднимается выше требуемого уровня, с наносекундной задержкой происходит коррекция. Напряжение VDD на одну тысячную секунды снижается, одновременно и частота GPU уменьшается. Затем напряжение и частота возвращаются на рабочий уровень.

Adaptive Voltage & Frequency Scaling (AVFS)

Кроме динамической регулировки и напряжения GPU AMD с архитектурой Polaris реализовала и некоторых другие функции. Среди них - Adaptive Voltage & Frequency Scaling или AVFS.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

AVFS описает метод, при котором учитываются не только напряжения и температуры на разных областях GPU, но и частота. Как правило, GPU по частоте имеет запас 2-3 процента, чтобы покрыть процесс старения GPU. Подобный запас при использовании технологии AVFS уже не требуется, поскольку GPU самостоятельно оценивает свою работу и автономно регулирует рабочие параметры через P-состояния.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

Если тактовые частоты соответствуют значениям по умолчанию, прикладываются только необходимые напряжения, без излишнего повышения. Но технология Adaptive Clocking постоянно пытается выжать более высокие тактовые частоты (конечно, не превышающие максимальный уровень, заявленный для Adaptive Clocking), а технология AVFS пытается выставить рабочие напряжения для указанных частот без излишнего подъема. Таким образом, AMD обеспечивает максимально высокую производительность, пытаясь при этом добиться максимально длительный срока жизни компонентов.

Boot Time Calibration (BTC) и Multi-Bit-Flip-Flops (MBFF)

Третий важный фактор - Boot Time Calibration (BTC). Данная технология уже использовалась AMD в 7-м поколении APU под названием Bristol Ridge, она наглядно показывает, насколько далеко продвинулась AMD по совместной разработке APU и GPU.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

Процедура Boot Time Calibration отслеживает поведение GPU во время загрузки, как правило, в определенных состояниях могут прикладываться более высокие напряжения. Здесь свой вклад вносит Reliability Tracker, также и у VRM имеется погрешность. Целю BTC является снижение энергопотребление при возможности, а также более агрессивное переключение P-состояний.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

Также AMD постаралась решить проблему старения чипов. Приведенные выше технологии не только позволяют чипам работать более экономично, но и дают дополнительную мощность тогда, когда это необходимо.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

Площадь чипа и энергопотребление могут зависеть от технологии multi-bit flip-flops (MBFF), в которой меньшие структуры комбинируются в более крупные по мере необходимости. Это позволяет экономить и площадь чипа, и энергопотребление. В GPU Polaris 10 AMD говорит о 21 млн. подобных элементов flip-flops (11,1 Вт от общего энергопотребления 85 Вт), то есть порядка 15% от общего энергопотребления. В итоге AMD смогла сэкономить около 4-5% от общего энергопотребления чипа.

Производство по 14-нм техпроцессу Производство по 14-нм техпроцессу

Производство по 14-нм техпроцессу

В документе (PDF) китайские разработчики подробно объяснили экономию из-за цепей MBFF. Особое внимание уделено экономии площади чипа, которая достигается благодаря MBFF.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

В вопросах энергопотреблении или эффективности AMD особое внимание уделила интерфейсу памяти. Благодаря цветовой дельта-компрессии и более эффективной работе с кэшем L2 и регистрами AMD смогла увеличить производительность интерфейса памяти, несмотря на уменьшение пропускной способности. Вместе с чипами памяти AMD смогла снизить энергопотребление интерфейса памяти до 58%, что положительно сказывается на эффективности видеокарты в целом.

Производство по 14-нм техпроцессу
Производство по 14-нм техпроцессу

Для архитектуры Polaris AMD говорит об улучшении в 1,7 раз соотношения производительности на ватт из-за перехода на 14-нм техпроцесс. Благодаря улучшениям в самой архитектуре мы получаем улучшение до 2,8 раз. Все эти теоретические преимущества – это хорошо, но вряд ли мы увидим такой же уровень на практике.

GlobalFoundries

На Polaris Tech Day выступили представители Globalfoundries, которые рассказали о проблемах, которые приходилось решать при производстве GPU Polaris. Здесь AMD и Globalfoundries пришлось использовать тот же подход, что и в случае сотрудничества NVIDIA и TSMC. Производство и архитектура должны быть еще сильнее адаптированы друг к другу при переходе на меньшие техпроцессы.

Globalfoundries использовала методику Design Technology Co-Optimization (DTCO). Данный метод предусматривает несколько попеременных шагов между оптимизацией производства и архитектуры GPU. Каждый раз сравниваются результаты производства с требуемыми, после чего вносятся необходимые изменения. Данный процесс повторяется много раз, соответствующие изменения вносятся в технологию производства или архитектуру.

После уменьшения техпроцесса данные шаги многократно повторялись на протяжении последних месяцев. В результате производство по 14-нм техпроцессу FinFET было оптимизировано, оно выдерживает более высокие управляющие токи, транзисторы могут переключаться быстрее, им требуются меньшие напряжения, токи утечки тоже были снижены. Все эти эффекты удалось достигнуть в результате оптимизации.

Если верить GlobalFoundries, производительность была улучшена на 55% при прежней частоте, а энергопотребление было уменьшено на 65%.


TrueAudio Next:

AMD еще с поколения GPU Hawaii добавила на кристалл выделенный ЦСП (DSP), обеспечивающий аппаратную обработку аудио для большего реализма. Но технология TrueAudio так и не смогла выйти на массовый рынок, несмотря на наличие поддержки middleware реализация была только в Thief. Но и там поддержка TrueAudio не стала самым серьезным аргументом в пользу игры. С Polaris AMD решилась на новую попытку, на этот раз преследуя другие цели.

Архитектура Polaris - TrueAudio Next
Архитектура Polaris - TrueAudio Next

Подход TrueAudio Next довольно похож на NVIDIA VRWORKS Audio. Но обе технологии разрабатывались независимо друг от друга. TrueAudio Next является вариантом трассировки лучей для аудио, когда на звуковой сцене представлено множество источников звука и отражающих поверхностей – все это позволяет добиться высокого уровня реализма. Расчет звука выигрывает от поддержки Asynchronous Compute, поскольку соответствующие вычисления будут проводиться одновременно с графическими расчетами.

Архитектура Polaris - TrueAudio Next
Архитектура Polaris - TrueAudio Next

При распределении вычислительных ресурсов AMD может опираться не только на аппаратный диспетчер, через Compute Unit Reservation можно выделить определенное количество CU на нужный процесс. Например, из 36 CU 28 можно отдать на графику, а оставшиеся восемь – на расчеты аудио. Четыре CU по производительности примерно соответствуют 4-ядерному процессору, что позволяет перераспределить на CU часть вычислительных задач.

Разработчики middleware для интерфейсов аудио в играх уже объявили поддержку TrueAudio Next. Теперь остается посмотреть, сколько игр поддержат финальную версию технологии TrueAudio, какие преимущества даст технология. На данный вопрос мы сможем ответить через несколько месяцев.

Архитектура Polaris - Variable Rate Shading
Архитектура Polaris - Variable Rate Shading

Как и в случае NVIDIA, в архитектуре имеется возможность одновременного расчета нескольких viewports. NVIDIA называет данную технологию Simultaneous Multi Projection, AMD выбрала название Variable Rate Shading. Суть технологии такая же, в очках VR сцена должна рассчитываться с учетом особенностей просмотра сцены с направления двух глаз.

NVIDIA для архитектуры Pascal поддерживает до 16 viewports, AMD тоже поддерживает до 16, также задействуются Geometry Shader, что позволяет просчитывать от 2 до 16 viewports за один проход. Variable Rate Shading не является новой технологией для архитектуры Polaris, она уже давно присутствовала в дизайне GCN, хотя и не использовалась.

AFR Frame Pacing:

С помощью технологии Frame Pacing AMD решает проблему, довольно часто встречающуюся в режимах multi-GPU из-за разного времени рендеринга кадров. Frame Pacing подразумевает использование алгоритма, сглаживающего разницу. Изначально технология работала только в играх DirectX 11, после чего она претерпела несколько фаз развития. С поколением Polaris и новыми драйверами Radeon Software AMD добавляет Frame Pacing к DirectX 12 с поддержкой Crossfire.

Архитектура Polaris - Crossfire и AFR Frame PacingАрхитектура Polaris - Crossfire и AFR Frame Pacing

Архитектура Polaris - Crossfire и AFR Frame Pacing

Но у нынешнего драйвера, с которым мы тестировали Radeon RX 480, технология пока не поддерживается. Реализация должна быть похожа на то, что мы уже видели в режиме с одним GPU – добавляется задержка к слишком быстро просчитанным кадрам, чтобы они выводились равномерно.


В первой порции информации об архитектуре Polaris, которой поделилась AMD, фигурировала поддержка выходов DisplayPort 1.3/1.4 и HDMI 2.0b. Ниже мы рассмотрим особые функции и технические подробности нового поколения Polaris вместе с контроллером дисплея.

Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR
Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR

Сразу же следует отметить, что архитектура Polaris совестима с DisplayPort 1.3 HBR3 и DisplayPort 1.4. У обоих стандартов пропускная способность значительно увеличилась по сравнению с предыдущим поколением, ее можно использовать не только для более высоких разрешений, но и для других возможностей дисплеев.

Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDRАрхитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR

Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR

В частности, для игровых мониторов (или для их производителей) важна поддержка у DisplayPort 1.3 дисплеев 4K с разрешением 3840 x 2160 пикселе и 120 Гц. Кроме того, присутствует поддержка FreeSync. Причем FreeSync у таких мониторов будет работать диапазоне от 30 до 120 Гц. Первые модели ожидаются в четвертом квартале 2016.

Стандарт DisplayPort 1.3 также позволяет подключать мониторы 5K одним кабелем. До сих пор требовалось два кабеля DisplayPort, иначе частота кадров не превышала 30 Гц. У стандарта DisplayPort 1.3 в разрешении 5K возможна частота обновления 60 Гц. К концу года на рынке должны появиться соответствующие мониторы.

Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR
Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR

Если взглянуть на поддерживаемые разрешения и частоты обновления, можно заметить поддержку HDR с высокими разрешениями и частотами обновления. В случае 1.920 x 1.080 пикселей она имеется до 240 Гц, но и у мониторов 4K возможна поддержка до 96 Гц.

Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR
Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR

HDR (High Dynamic Range) или высокий динамический диапазон существенно расширяет цветовое пространство монитора. До сих пор производители мониторов фокусировались на разрешении или частоте обновления. HDR добавляет третий фактор, но не менее важный. Первые мониторы HDR, которые появятся позднее в этом году, будут поддерживать цветовое пространство P3 Digital Cinema (желтый треугольник), которое заметно больше стандарта sRGB (синий треугольник). Но в более отдаленной перспективе планируется расширение до цветового охвата Rec. 2020 (красный треугольник). Здесь по сравнению с sRGB цветовое пространство удваивается, мониторы будут выводить 75% оттенков спектра, которые может видеть человеческий глаз.

Конечно, пройдет какое-то время, прежде чем дисплеи HDR начнут доминировать на рынке. Первые мониторы должны появиться в конце года, их цена, как и в случае любых других новых технологий, будет довольно высокой. Еще одна проблема кроется в отсутствии стандартов. Каждый производитель может определять собственный стандарт HDR. Охватываемое цветовое пространство и уровни яркости пока не стандартизированы.

Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR
Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR

Яркость – второе важное преимущество HDR кроме цветового охвата. Здесь мы тоже должны получить существенные улучшения, но все зависит от того, насколько быстро будет распространяться новый стандарт. Стандарта 10-Bit ST 2048 на ближайшие 20 лет должно быть достаточно.

Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR
Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR

Для поддержки новых стандартов дисплеев AMD пришлось доработать конвейер дисплея GPU. Polaris поддерживает 10-битный и 12-битный HDR. В первой реализации мы увидим 10-битный HDR, но уже здесь присутствуют существенные отличия между реализациями HDR. В частности, производители пока не пришли к единому мнению по поводу цветового охвата и яркости.

AMD разработала кадровый буфер и контроллер дисплея с учетом возможностей программирования. Можно перепрограммировать цветовой охват под дисплей без дополнительных задержек. Radeon Photon SDK для HDR обеспечивает соответствующие возможности настройки.

Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR
Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR

На слайде выше приведены поддерживаемые разрешения и частоты обновления. AMD и NVIDIA со стандартами DisplayPort 1.3/1.4 и HDMI 2.0b существенно обогнали средства воспроизведения (телевизоры и мониторы). Пройдет немало времени, прежде чем на рынок выйдут соответствующие модели.

Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDRАрхитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR

Архитектура Polaris - DisplayPort 1.3/1.4, HDMI 2.0b и HDR

AMD уделила внимание не только качеству картинки отображаемого контента, но и функциям кодирования и декодирования. Архитектура Polaris содержит аппаратный кодировщик HEVC и VP9, H.264, MP4 P2 и VC1 в современных версиях с поддержкой разрешения до 4K и 120 fps.


Но достаточно теории, перейдем к рассмотрению видеокарты на архитектуре Polaris. Как обычно, мы проверяем работу видеокарты в реальных условиях в системе ПК под нагрузкой. Позвольте представить первые тесты.

Сравнение температур и тактовых частот
Игра Температура Частота
The Witcher 3: Wild Hunt 87 °C 1.225 МГц
Rise of the Tomb Raider 87 °C 1.225 МГц
Hitman 86 °C 1.266 МГц
Far Cry Primal 87 °C 1.266 МГц
DiRT Rallye 87 °C 1.266 МГц
Anno 2205 86 °C 1.225 МГц
The Division 87 °C 1.266 МГц
Fallout 4 87 °C 1.266 МГц
DOOM 87 °C 1.266 МГц

У видеокарты Radeon R9 290X использовалась технология PowerTune, AMD определяла предельную частоту Boost, но в реальности частота могла быть ниже. С эталонным кулером Radeon R9 290X так и происходило: он не справлялся с охлаждением видеокарты, поэтому максимальная частота наблюдалась непродолжительное время. С видеокартой Radeon R9 Fury X AMD обошла эту проблему благодаря СВО, которая всегда справлялась с охлаждением видеокарты ниже порогового значения. С Radeon Fury Nano мы вновь получили ситуацию, когда максимальная частота GPU 1.000 МГц наблюдалась в редких случаях.

Поэтому мы всегда анализируем поведение видеокарты и частоты под различной нагрузкой. AMD указала базовую частоту 1.120 МГц, в режиме Boost она может увеличиваться до 1.266 МГц, но это отнюдь не гарантирует, что такие частоты мы получим на практике. В наших тестах эталонная Radeon RX 480 часто нагревалась по GPU до 87 °C. Максимальная частота составила 1.225 и 1.266 МГц. Как видим, на практике видеокарта далеко не всегда работает с максимальными частотами Boost.

Скриншот GPU-Z видеокарты AMD Radeon RX 480
Скриншот GPU-Z видеокарты AMD Radeon RX 480

Скриншот GPU-Z подтверждает приведенную выше информацию AMD Radeon RX 480. К сожалению, утилита GPU-Z пока не умеет различать базовую частоту и частоту Boost.


Ниже мы более подробно рассмотрим видеокарту Radeon RX 480 и эталонный кулер.

AMD Radeon RX 480
Длина печатной платы 180 мм
Длина с кулером 240 мм
Толщина 2 слота
Дополнительное питание 1x 6-конт.
Вентиляторы 1x 60 мм
Выходы на дисплей 1x HDMI 2.0b
3x Displayport 1.3/1.4
Пассивная работа вентиляторов в режиме бездействия Нет

Еще по первым спецификациям можно было догадаться, что видеокарта получится компактной – по крайней мере, это касается PCB. К сожалению, видеокарта по какой-то причине не отключает вентилятор в режиме бездействия, хотя такая опция сегодня есть у многих моделей. Но AMD и NVIDIA отказались от выключения вентилятора у своих эталонных дизайнов.

AMD Radeon RX 480
AMD Radeon RX 480

С первого взгляда обращаешь внимание на компактные габариты Radeon RX 480. Длина видеокарты составляет всего 240 мм. По базовому дизайну AMD осталась верна принципам, заложенным с Radeon R9 Fury X. Кожух кулера полностью закрыт. За вентиляцию отвечает только один радиальный вентилятор в задней части видеокарты. С лицевой стороны кожух имеет покрытие soft-touch.

AMD Radeon RX 480
AMD Radeon RX 480

Как можно видеть сзади, непосредственно печатная плата заметно короче 240 мм видеокарты. Ее длина составляет всего 180 мм, радиатор выставляется примерно на 60 мм. AMD в случае Radeon RX 480 отказалась от использования задней пластины. Некоторые партнеры AMD объявили о выпуске видеокарт на эталонном дизайне, но с задней пластины. В остальном задняя сторона PCB не имеет ничего интересного. Можно рассмотреть контактные площадки для дополнительных компонентов, но их природу определить сложно.

AMD Radeon RX 480
AMD Radeon RX 480

Радиальный вентилятор Radeon RX 480 имеет диаметр 60 мм. AMD, как и NVIDIA, продолжает использовать турбину. Она забирает воздух сверху, в области оси вентилятора, после чего проталкивает его через радиатор. Большая часть горячего воздуха выбрасывается наружу корпуса ПК через слотовую заглушку. Конечно, здесь хорошо то, что горячий воздух не накапливается внутри корпуса.

AMD Radeon RX 480
AMD Radeon RX 480

На торце видеокарты рядом со слотовой заглушкой можно видеть обновленный логотип Radeon с новым шрифтом. С лицевой стороны видеокарты приятно отметить покрытие soft-touch. Но пластину можно снять, открутив четыре винта.

AMD Radeon RX 480
AMD Radeon RX 480

AMD указывает типичное энергопотребление Radeon RX 480 на уровне 150 Вт. Поэтому дополнительного 6-контактного гнезда питания будет достаточно, он обеспечивает мощность до 75 Вт. Также через слот PCI Express может подаваться до 75 Вт. Отметим, что непосредственно сам GPU потребляет до 85 Вт, а оставшиеся 65 Вт приходятся на долю остальных компонентов, таких как память. Также AMD дает некоторый запас мощности для разгона, упомянутые 85 Вт можно увеличить на 50% В результате мы получаем до 127,5 Вт для чипа, а на память и остальные компоненты все еще остается 22,5 Вт – конечно, если принимать уровень 150 Вт.

AMD Radeon RX 480
AMD Radeon RX 480

На лицевой стороне видеокарты тоже можно видеть обновленный логотип Radeon с новым шрифтом. В отличие от видеокарт Fury, у Radeon RX 480 он не подсвечивается. В целом, видеокарта выглядит очень темной.

AMD Radeon RX 480
AMD Radeon RX 480

На слотовой заглушке расположены множество вентиляционных отверстий, через которые горячий воздух выбрасывается наружу корпуса ПК. Лишь небольшая часть накапливающегося тепла остается в пределах корпуса ПК. Видеовыходы представлены тремя DisplayPort 1.3/1.4 и одним HDMI 2.0b. AMD полностью отказалась от двухканального DVI, хотя партнеры AMD наверняка продолжат использовать этот старый интерфейс.

AMD Radeon RX 480
AMD Radeon RX 480

Часть свежего воздуха радиальный вентилятор получает из отверстий с обратной стороны видеокарты – здесь AMD воспользовалась выставляющимся кулером. Конечно, AMD могла бы сделать видеокарту еще более компактной.


Продолжим рассмотрение эталонной версии Radeon RX 480:

AMD Radeon RX 480
AMD Radeon RX 480

Сзади PCB, рядом со слотовой заглушкой, можно видеть контакты, которые наверняка относятся к мостику Crossfire. Но AMD активирует поддержку Crossfire на видеокартах Radeon RX 480 без дополнительного мостика, как мы уже видели в случае GPU Hawaii, Tonga и Fiji. Видимо, AMD решила подстраховаться, и пока не стала убирать контактные площадки. Возможно, они оставлены для тестирования на этапе разработки дизайна.

AMD Radeon RX 480
AMD Radeon RX 480

Наклейка сзади видеокарты указывает на модель Radeon RX 480 с 8 Гбайт видеопамяти. Все чипы памяти располагаются с лицевой стороны видеокарты, сзади ничего нет. По центру снимка видны контактные площадки для установки второго VRM-контроллера.

AMD Radeon RX 480
AMD Radeon RX 480

Интересно сравнить размеры видеокарт Radeon RX 480 (сверху) и Radeon Fury Nano (снизу). Конечно, новая видеокарта Polaris сравнительно небольшая, но Radeon Fury Nano наглядно доказывает, что можно получить еще более компактные габариты с high-end GPU и High Bandwidth Memory. Radeon Fury Nano остается самой производительной видеокартой для своих габаритов.

AMD Radeon RX 480
AMD Radeon RX 480

Без кулера видеокарта становится еще более компактной. Как можно видеть, AMD для эталонного дизайна расположила компоненты подсистемы питания между GPU и слотовой заглушкой. Причина кроется в компактных размерах. У более длинных видеокарт подсистема питания обычно сдвинута на дальнюю треть PCB.

AMD Radeon RX 480
AMD Radeon RX 480

Кристалл GPU не дает дополнительных деталей о самом чипе, информация выгравирована на рамке. В левом верхнем углу мы обнаружили только дату производства. Чип носит название Polaris 10 XT, у последующей видеокарты Radeon RX 470 мы наверняка получим Polaris 10 PRO.

AMD Radeon RX 480
AMD Radeon RX 480

AMD использовала чипы памяти Samsung с частотой 2.00 МГц. Они имеют маркировку K4G80325FB-AC25. Чипы емкостью 8 Гбит организованы в конфигурации 32 x 256 Мбит. Упаковка FBGA170 содержит 170 контактов снизу, рабочее напряжение составляет от 1,305 до 1,597 В. По спецификациям чипы могут работать на 2.000 МГц с частотой обновления 0,25 нс.

Таким образом, наш образец Radeon RX 480 содержит восемь чипов емкостью 1 Гбайт. В сумме мы получаем 8 Гбайт видеопамяти. Но, как мы уже упоминали выше, выйдет версия видеокарты с 4 Гбайт памяти. Пока неизвестно, уполовинит ли AMD число чипов, либо выберет в два раза меньшую емкость каждого чипа.

AMD Radeon RX 480
AMD Radeon RX 480

Питание Radeon RX 480 обеспечивают шесть фаз, что для подобной видеокарты кажется весьма значительным количеством. Впрочем, важно не число фаз, а их качество. Мы наверняка получим альтернативные дизайны с большим или меньшим количеством фаз.

AMD Radeon RX 480
AMD Radeon RX 480

Кулер для тепловыделения 150 Вт вряд ли должен быть сложным. В случае Radeon RX 480 AMD выбрала медное основание с покрытием за пределами контактной области GPU. Радиатор изготовлен из алюминия, он проглядывает за медной пластиной основания. Снизу кулер использует дополнительную металлическую пластину, отводящую тепло от чипов памяти и компонентов системы питания.

AMD Radeon RX 480
AMD Radeon RX 480

Еще одна фотография позволяет разглядеть алюминиевый радиатор, располагающийся за медной пластиной основания. Для чипов памяти и других компонентов AMD использовала теплопроводящие прокладки. Контактная площадка GPU снабжена достаточным количеством термопасты.


Для тестов мы использовали Radeon Software Crimson Edition 16.6.2. Данный пакет базируется на тех же принципах, что и драйверы NVIDIA. Уже несколько месяцев пользователи видеокарт AMD своевременно получают обновления драйверов, оптимизированных под игру – чаще всего в день ее выхода. И в будущем подобная практика будет продолжена.

AMD Radeon Software 16.2.2 с видеокартой Radeon RX 480
AMD Radeon Software 16.2.2 с видеокартой Radeon RX 480

В будущем AMD планирует расширить возможности своего пакета, а также предложит программу бета-тестирования пакета Radeon. Такой подход позволит расширить базу пользователей, принимающих участие в бета-тестировании, что поможет лучше отслеживать ошибки.

С новым драйвером у поколения Polaris добавились следующие функции:

WattMan

Наиболее интересной новой функцией можно назвать Wattman. По сути, Wattman представляет собой новую реализацию Overdrive, встроенной утилиты разгона видеокарт Radeon.

AMD Radeon Software 16.2.2 с видеокартой Radeon RX 480
AMD Radeon Software 16.2.2 с видеокартой Radeon RX 480

Через Wattman AMD дает пользователю полное управление GPU – в тех рамках, которые определяет производитель. Основной задачей Wattman является тонкая настройка. С помощью Wattman можно определить напряжения для каждого P-состояния. Доступны и другие настройки, на которых мы остановимся ниже.

Верхняя панель Wattman содержит монитор наиболее важных параметров видеокарты. Среди них – частота GPU и памяти, напряжение GPU, температура GPU и скорость вентилятора. Конечно, эту информацию можно считать и с помощью других утилит, но AMD предоставляет единый и довольно красивый интерфейс через Wattman.

AMD Radeon Software 16.2.2 с видеокартой Radeon RX 480
AMD Radeon Software 16.2.2 с видеокартой Radeon RX 480

Кривая частот/P-состояний:

Самый простой способ разгона заключается в изменении частот для каждого P-состояния, а также уровней напряжения. AMD предлагает восемь P-состояний, которые можно настраивать в утилите. Пользователь может выставить глобальное смещение, которое дает прирост по частоте с шагом 0,5%. Настройки можно выставить для всех приложений или только для выбранных.

Динамическая регулировка частот и напряжений::

Если вы хотите указать напряжение и/или частоту отдельно для каждого P-состояния, подобная возможность в Wattman тоже имеется. Причем память и GPU настраиваются по отдельности и друг на друга не влияют.

Скорость вентилятора:

Пользователь теперь может выставлять минимальную скорость вентилятора. У эталонной версии Radeon RX 480 AMD не предоставляет возможности выключать вентилятор в режиме бездействия. Для работы под нагрузкой можно выставлять целевую скорость, на которой будет работать вентилятор, если температура GPU не превышает температурный порог. Наконец, можно задать частоту GPU, которая не будет превышаться, чтобы система охлаждения оставалась в определенных рабочих рамках.

Управление температурой:

Наконец, температуру GPU можно настраивать более тонко, чем раньше. Можно выставить максимальную температуру, достижение которой приведет к снижению тактовых частот. Но данная функция знакома и по предыдущим поколениям видеокарт. Целевая температура позволяет задать уровень, выше которого будет увеличиваться скорость вентилятора, чтобы сохранять температуру на данном уровне.

Планку по энергопотреблению у Radeon RX 480 можно увеличивать/уменьшать на +/-50%. Но это касается только RX 480, а не Radeon RX 460 или 470. Для разгона мы рекомендуем увеличивать планку Power Limit, после чего вы можете повышать частоты GPU и памяти

Но достаточно теории, позвольте привести видеоролик, показывающий работу Wattman:


Мы обновили тестовый пакет игр и приложений, но аппаратное обеспечение осталось, по большей части, прежним. Чтобы наши тесты максимально соответствовали среднему компьютеру геймера, мы проводили их в закрытом корпусе. Операционная система Windows 10 была установлена на SSD, но игры мы запускали с жесткого диска. Хотя эта деталь на производительность не влияет.

Тестовая конфигурация
Процессор Intel Core i7-3960X 3,3 ГГц, разгон до 3,9 ГГц
Система охлаждения Corsair H110i GT СВО с замкнутным контуром
Материнская плата ASUS P9X97 Deluxe
Оперативная память G.Skill
SSD OCZ Arc 100 240 GB
Блок питания Seasonic Platinum Series 1.000 Вт
Операционная система Windows 10 64 Bit
Корпус Fractal Design Define R5

Наша тестовая система содержит компоненты Intel, ASUS, Fractal Design, Corsair, G.Skill, OCZ и Seasonic. Мы выражаем благодарность всем производителям, предоставившим нам комплектующие!

Мы использовали следующие версии драйверов:

Мы использовали следующие игры и тесты:


Начнем с результатов тестов энергопотребления, уровня шума и температуры.

уровень шума

Бездействие

в дБ(A)
Меньше - лучше

В режиме бездействия с уровнем шума 39,2 дБ(A) видеокарта Radeon RX 480 идет на одном уровне с GeForce GTX 1070 Founders Edition или Radeon R9 Nano. Здесь по поводу новой Polaris нельзя сказать ни ничего хорошего, ни ничего плохого. Конечно, у альтернативных систем охлаждения производители наверняка будут останавливать вентилятор в режиме бездействия. Но с эталонными кулерами ни AMD, ни NVIDIA на такой шаг не пошли.

уровень шума

Нагрузка

в дБ(A)
Меньше - лучше

Чуть лучше ситуация выглядит под нагрузкой, уровень шума 41,2 дБ(A) позволил видеокарте держаться в лидерах. Radeon RX 480 показала результат между альтернативными кулерами Radeon R9 370 и 380, которые уже работали довольно тихо. Впрочем, уровень шума под нагрузкой следует соотносить с производительностью. Поэтому окончательный вердикт Radeon RX 480 мы вынесем на последней странице обзора.

Температура

Бездействие

в градусах Цельсия
Меньше - лучше

В режиме бездействия температура 35 °C находится на вполне безопасном уровне. Поскольку вентилятор продолжает вращаться, температура GPU могла быть и ниже.

Температура

Нагрузка

в градусах Цельсия
Меньше - лучше

Под нагрузкой GPU нагревался до весьма высокой температуры 87 °C. Немало, учитывая предельное значение 90 °C. Вентилятор наращивал обороты до 2.200 об/мин, но при этом оставался довольно тихим. Но 87 °C также означает, что видеокарта работала выше целевой температуры 80 °C.

Энергопотребление (вся система)

Бездействие

в Вт
Меньше - лучше

По энергопотреблению в режиме бездействия каких-либо проблем мы не обнаружили. Но здесь возможностей сэкономить у производителей почти не осталось. Больший вклад в общее энергопотребление системы вносят остальные компоненты. Следует помнить, что мы указываем энергопотребление всего системного блока, а не только видеокарты.

Энергопотребление (вся система)

Нагрузка

в Вт
Меньше - лучше

Под нагрузкой энергопотребление системы составило 302,3 Вт. Так что видеокарта Radeon RX 480 потребляла чуть меньше GeForce GTX 1070 Founders Edition, но в то же время чуть больше Radeon R9 380. Как и в случае уровня шума, окончательные выводы по энергопотреблению мы вынесем на последней странице обзора, когда будет известна производительность.

Энергопотребление (вся система)

бездействие - 2 монитора

в Вт
Меньше - лучше

Проблем с двумя мониторами у Radeon RX 480 не наблюдается. После подключения второго монитора энергопотребление увеличивается незначительно.


Futuremark 3DMark

Тест 3DMark от Futuremark – один из наиболее популярных синтетических тестов, он позволяет удобно сравнивать разные системы или отдельные компоненты. Отдельные режимы (Preset) позволяют оценить различные аспекты работы системы – вплоть до разрешения UltraHD/4K. Тест изначально разрабатывался под DirectX 11, но сегодня 3DMark также позволяет оценить оптимизацию под DirectX 12, анализируя число вызовов Draw calls.

Futuremark 3DMark

Fire Strike

Баллы Futuremark
Больше - лучше

Futuremark 3DMark

Fire Strike Extreme

Баллы Futuremark
Больше - лучше

Futuremark 3DMark

Fire Strike Ultra

Баллы Futuremark
Больше - лучше


Luxmark 3.0

Luxmark 3.0 – тест рендеринга, который опирается на интерфейс OpenCL и широкую аппаратную базу видеокарт. Luxmark разрабатывался в качестве теста определения производительности LuxRender. Для расчета сцены используется LuxRender 2.x API. Результат выдается в семплах в секунду.

Luxmark 3.0

Sala

Баллы
Больше - лучше


GPUPI 2.2

В тесте GPUPI вычисляется число пи через разные интерфейсы. Программы, такие как SuperPi, уже давно используются для оценки вычислительной производительности "железа", возможен расчет через процессоры и видеокарты. Как видно по названию GPUPI, данный тест опирается для расчета на GPU. Мы использовали OpenCL API и вычисляли число пи до 500 млн. или 1 млрд. знаков. GPUPI позволяет удобно ценить 64-битную производительность "железа".

GPUPI 2.0

500M

секунды
Меньше - лучше

GPUPI 2.0

1000M

секунды
Меньше - лучше


The Witcher 3: Wild Hunt

Ролевая игра Ведьмак 3: Дикая охота базируется на книгах и игровом мире известного фантаста Анджея Сапковски. Протагонист Геральт из Ривии открывает средневековый фантастический мир и выполняет разнообразные квесты. Игровой движок был разработан студией CD Projekt Red самостоятельно, в игре используется версия 3. Ролевая игра опирается на открытый мир и устанавливает новые стандарты компьютерной графики.

The Witcher 3

1.920 x 1.080

Кадры в секунду
Больше - лучше

The Witcher 3

2.560 x 1.440

Кадры в секунду
Больше - лучше

The Witcher 3

3.840 x 2.160

Кадры в секунду
Больше - лучше


Rise of the Tomb Raider

Rise of the Tomb Raider

1.920 x 1.080 1xFXAA 16xAF

Кадры в секунду
Больше - лучше

Rise of the Tomb Raider

1.920 x 1.080 2xSSAA 16xAF

Кадры в секунду
Больше - лучше

Rise of the Tomb Raider

2.560 x 1.440 1xFXAA 16xAF

Кадры в секунду
Больше - лучше

Rise of the Tomb Raider

2.560 x 1.440 2xSSAA 16xAF

Кадры в секунду
Больше - лучше

Rise of the Tomb Raider

3.840 x 2.160 1xFXAA 16xAF

Кадры в секунду
Больше - лучше

Rise of the Tomb Raider

3.840 x 2.160 2xSSAA 16xAF

Кадры в секунду
Больше - лучше


Hitman

Hitman

1.920 x 1.080 SMAA 16xAF

Кадры в секунду
Больше - лучше

Hitman

2.560 x 1.440 SMAA 16xAF

Кадры в секунду
Больше - лучше

Hitman

3.860 x 2.160 SMAA 16xAF

Кадры в секунду
Больше - лучше


Far Cry: Primal

Far Cry Primal

1.920 x 1.080 4xMSAA 16xAF

Кадры в секунду
Больше - лучше

Far Cry Primal

2.560 x 1.440 4xMSAA 16xAF

Кадры в секунду
Больше - лучше

Far Cry Primal

3.840 x 2.160 4xMSAA 16xAF

Кадры в секунду
Больше - лучше


DiRt Rally

С игрой Dirt Rally студия разработчиков Codemasters вновь сместила акцент на симуляцию по сравнению с предшественницей. В игре доступны 17 автомобилей, в том числе Audi S1 quattro, Lancia Delta и Ford Fiesta RS WRC, а также 36 трасс в трех уголках мира: Греции, Уэльсе и Монте-Карло. После выхода игры в Steam продолжает появляться дополнительный контент, в том числе Pikes Peak, Rally Deutschland и FIA Rallycross Championship.

DiRt Rally

1.920 x 1.080 1xAA 1xAF

134.2 XX


112 XX
127.9 XX


112 XX
123.1 XX


115 XX
120.7 XX


107 XX
117.9 XX


103 XX
115.5 XX


105 XX
107.2 XX


98 XX
105.3 XX


92 XX
101.5 XX


90 XX
94.3 XX


83 XX
84.7 XX


73 XX
77.9 XX


68 XX
74.1 XX


65 XX
71.3 XX


63 XX
59.2 XX


52 XX
58.2 XX


48 XX
Кадры в секунду
Больше - лучше

DiRt Rally

1.920 x 1.080 4xMSAA 16xAF

117.8 XX


109 XX
117.0 XX


104 XX
105.9 XX


94 XX
103.1 XX


92 XX
101.8 XX


89 XX
97.3 XX


88 XX
83.5 XX


73 XX
80.3 XX


74 XX
75.5 XX


65 XX
74.5 XX


67 XX
61.6 XX


63 XX
60.9 XX


55 XX
50.7 XX


44 XX
50.7 XX


45 XX
47.8 XX


41 XX
Кадры в секунду
Больше - лучше

DiRt Rally

2.560 x 1.440 1xAA 1xAF

106.6 XX


95 XX
104.6 XX


91 XX
95.4 XX


84 XX
94.7 XX


85 XX
88.5 XX


81 XX
86.3 XX


88 XX
79.4 XX


73 XX
78.5 XX


70 XX
69.2 XX


59 XX
61.1 XX


52 XX
55.7 XX


49 XX
54.9 XX


48 XX
50.4 XX


45 XX
41.4 XX


37 XX
41.4 XX


35 XX
Кадры в секунду
Больше - лучше

DiRt Rally

2.560 x 1.440 4xMSAA 16xAF

Кадры в секунду
Больше - лучше

DiRt Rally

3.840 x 2.160 1xAA 1xAF

Кадры в секунду
Больше - лучше

DiRt Rally

3.840 x 2.160 4xMSAA 16xAF