Hardwareluxx > Статьи > Железо > Видеокарты > Тест и обзор: AMD Radeon RX 480 – новый лидер массового рынка

Тест и обзор: AMD Radeon RX 480 – новый лидер массового рынка

Опубликовано: 29.06.2016 в 16:05 Андрей Шиллинг

Страница 3: 14-нм техпроцесс FinFET

Важной особенностью нового поколения GPU от AMD и NVIDIA является 14- или 16-нм техпроцесс FinFET. После весьма длительного периода AMD и NVIDIA смогли договориться с контрактными производители чипов, что позволило сопровождать переход на новую архитектуру одновременным переходом на новый техпроцесс. В прошлом такой переход не всегда был гладким. Наверное, именно по этой причине AMD и NVIDIA так долго придерживались 28-нм техпроцесса TSMC. С переходом на 14 нм и FinFET должны проявиться существенные преимущества по энергопотреблению. Наши тесты GeForce GTX 1080 Founders Edition хорошо показывают, что новый техпроцесс может дать серьезное преимущество по эффективности. В случае NVIDIA потенциал оказался весьма хорош.

Даже с одной архитектурой переход на новый техпроцесс часто очень сложен. Неслучайно Intel перешла на метод "тик-так", чередуя переход на новую архитектуру и на новый техпроцесс. В результате уменьшается риск, что одновременно придется решать проблемы и с новой архитектурой, и с новым техпроцессом. В качестве примера можно привести трудности NVIDIA, возникшие при переходе на архитектуру Fermi вместе с новым техпроцессом. Проблемы возникли с межсоединениями (fabric) на кристалле GPU, которые переставали корректно работать на высоких частотах, из-за чего NVIDIA пришлось переносить выход чипа. В случае AMD переход на новую архитектуру Polaris и новый техпроцесс серьезными проблемами не сопровождался. Пробные образцы чипов Polaris 10 и Polaris 11 были выпущены еще в ноябре и декабре 2015. Сегодня, спустя восемь месяцев, видеокарта вышла на рынок. Кстати, совсем недавно AMD, по всей видимости, получила пробные образцы Vega 10, high-end чипа нового поколения.

NVIDIA для производства GPU продолжает сотрудничать с TSMC и дорабатывать 16-нм техпроцесс FinFET, но пути AMD и TSMC, похоже, разошлись. Партнером по производству GPU стала компания GlobalFoundries с заводом в США, а именно в штате Нью-Йорк. На конференции Polaris Tech Day на сцену поднимались представители Globalfoundries. Будет ли Vega тоже производиться на мощностях Globalfoundries, пока неизвестно.

AMD уже несколько раз отмечала, что при разработке архитектуры Polaris в фокусе была эффективность и низкое энергопотребление. AMD использовала возможность нового техпроцесса упаковать больше транзисторов на прежнюю или меньшую площадь. Следует учитывать, что при переходе на структуры меньшего размера возникают другие проблемы, например, токи утечки, которые не позволяю добиться удвоения эффективности на практике.

Конечно, производители многие годы работали над тем, чтобы нивелировать данные недостатки. Современные GPU больше не используют одно напряжение для всех блоков. Кристалл разбит на области Multi-voltage Islands с разным напряжением. Конечно, такой подход требует отдельного контроллера напряжения, что приводит к дополнительным тратам. Зато подобные меры позволяют использовать разные частоты для разных областей GPU или даже полностью их выключать. Все это позволяет снизить общее энергопотребление и увеличить эффективность, но напрямую большую производительность из архитектуры не выжимает.

Intel первой начала производить кристаллы по технологии FinFET, которая добавляет 3D-структуру к планарным транзисторам. Эмиттер, коллектор и база выставляются над плоской подложкой, что дает более эффективное управление прохождением тока через транзистор.

Вроде бы такой подход не кажется логичным, но у FinFET по сравнению с планарными транзисторами имеются существенные преимущества. При производстве разброс характеристик оказывается намного меньше. Меньший разброс позволяет более точно и эффективно управлять отдельными областями или даже транзисторами.

Производство по 14-нм техпроцессу

AMD видит два преимущества техпроцесса FinFET: меньшее энергопотребление и потенциально более высокая производительность должны увеличить эффективность в 2,5 раза.

Кроме преимуществ по эффективности переход на меньшие техпроцессы дает и другие плюсы, которые с первого взгляда не видны. Здесь можно упомянуть возможность использования PCB меньшего размера, а также менее мощную/дорогую подсистему питания. Наконец, упаковка GPU тоже может быть меньше, что тоже экономит место на PCB.

Есть еще один эффект, который пока не проявил себя: по крайней мере, "младшие" GPU Polaris 11 получаются намного более тонкими. Упаковка GPU Bonaire имела размер 0,29 x 0,29 дюйма (7,37 мм), в случае Polaris 11 она составит всего 0,245 x 0,245 дюйма (6,22 мм). Но более интересна толщина чипа, которая уменьшилась с 1,9 мм (Bonaire) до 1,5 мм (Polaris 11). Причина кроется в меньшем количестве слоев в упаковке, также у самого кристалла после литографии убирается подложка.

Adaptive Clocking

Как и NVIDIA, AMD в контексте меньшего техпроцесса указывает на сложности с подачей питания на чип.

Хотя уменьшение техпроцесса позволяет понизить напряжения, подсистема питания все равно должна справляться с довольно высокими токами. Как правило, при включении флуктуации напряжения составляют до 10-15%. При рабочем напряжении 1 В в пиках оно может достигать 1,15 В. Чтобы закрыть этот разброс, производителям приходится поднимать среднее напряжение. Все это приводит к повышению энергопотребления, которое совершенно излишнее. Технология Adaptive Clocking позволяет справиться с этой проблемой, на 25% понизить рост энергопотребления.

При флуктуации напряжения подсистема питания реагирует следующим образом. Без технологии Adaptive Clocking напряжение остается на номинальном уровне, но с Adaptive Clocking, если напряжение поднимается выше требуемого уровня, с наносекундной задержкой происходит коррекция. Напряжение VDD на одну тысячную секунды снижается, одновременно и частота GPU уменьшается. Затем напряжение и частота возвращаются на рабочий уровень.

Adaptive Voltage & Frequency Scaling (AVFS)

Кроме динамической регулировки и напряжения GPU AMD с архитектурой Polaris реализовала и некоторых другие функции. Среди них - Adaptive Voltage & Frequency Scaling или AVFS.

AVFS описает метод, при котором учитываются не только напряжения и температуры на разных областях GPU, но и частота. Как правило, GPU по частоте имеет запас 2-3 процента, чтобы покрыть процесс старения GPU. Подобный запас при использовании технологии AVFS уже не требуется, поскольку GPU самостоятельно оценивает свою работу и автономно регулирует рабочие параметры через P-состояния.

Если тактовые частоты соответствуют значениям по умолчанию, прикладываются только необходимые напряжения, без излишнего повышения. Но технология Adaptive Clocking постоянно пытается выжать более высокие тактовые частоты (конечно, не превышающие максимальный уровень, заявленный для Adaptive Clocking), а технология AVFS пытается выставить рабочие напряжения для указанных частот без излишнего подъема. Таким образом, AMD обеспечивает максимально высокую производительность, пытаясь при этом добиться максимально длительный срока жизни компонентов.

Boot Time Calibration (BTC) и Multi-Bit-Flip-Flops (MBFF)

Третий важный фактор - Boot Time Calibration (BTC). Данная технология уже использовалась AMD в 7-м поколении APU под названием Bristol Ridge, она наглядно показывает, насколько далеко продвинулась AMD по совместной разработке APU и GPU.

Процедура Boot Time Calibration отслеживает поведение GPU во время загрузки, как правило, в определенных состояниях могут прикладываться более высокие напряжения. Здесь свой вклад вносит Reliability Tracker, также и у VRM имеется погрешность. Целю BTC является снижение энергопотребление при возможности, а также более агрессивное переключение P-состояний.

Также AMD постаралась решить проблему старения чипов. Приведенные выше технологии не только позволяют чипам работать более экономично, но и дают дополнительную мощность тогда, когда это необходимо.

Площадь чипа и энергопотребление могут зависеть от технологии multi-bit flip-flops (MBFF), в которой меньшие структуры комбинируются в более крупные по мере необходимости. Это позволяет экономить и площадь чипа, и энергопотребление. В GPU Polaris 10 AMD говорит о 21 млн. подобных элементов flip-flops (11,1 Вт от общего энергопотребления 85 Вт), то есть порядка 15% от общего энергопотребления. В итоге AMD смогла сэкономить около 4-5% от общего энергопотребления чипа.

Производство по 14-нм техпроцессу

В документе (PDF) китайские разработчики подробно объяснили экономию из-за цепей MBFF. Особое внимание уделено экономии площади чипа, которая достигается благодаря MBFF.

В вопросах энергопотреблении или эффективности AMD особое внимание уделила интерфейсу памяти. Благодаря цветовой дельта-компрессии и более эффективной работе с кэшем L2 и регистрами AMD смогла увеличить производительность интерфейса памяти, несмотря на уменьшение пропускной способности. Вместе с чипами памяти AMD смогла снизить энергопотребление интерфейса памяти до 58%, что положительно сказывается на эффективности видеокарты в целом.

Для архитектуры Polaris AMD говорит об улучшении в 1,7 раз соотношения производительности на ватт из-за перехода на 14-нм техпроцесс. Благодаря улучшениям в самой архитектуре мы получаем улучшение до 2,8 раз. Все эти теоретические преимущества – это хорошо, но вряд ли мы увидим такой же уровень на практике.

GlobalFoundries

На Polaris Tech Day выступили представители Globalfoundries, которые рассказали о проблемах, которые приходилось решать при производстве GPU Polaris. Здесь AMD и Globalfoundries пришлось использовать тот же подход, что и в случае сотрудничества NVIDIA и TSMC. Производство и архитектура должны быть еще сильнее адаптированы друг к другу при переходе на меньшие техпроцессы.

Globalfoundries использовала методику Design Technology Co-Optimization (DTCO). Данный метод предусматривает несколько попеременных шагов между оптимизацией производства и архитектуры GPU. Каждый раз сравниваются результаты производства с требуемыми, после чего вносятся необходимые изменения. Данный процесс повторяется много раз, соответствующие изменения вносятся в технологию производства или архитектуру.

После уменьшения техпроцесса данные шаги многократно повторялись на протяжении последних месяцев. В результате производство по 14-нм техпроцессу FinFET было оптимизировано, оно выдерживает более высокие управляющие токи, транзисторы могут переключаться быстрее, им требуются меньшие напряжения, токи утечки тоже были снижены. Все эти эффекты удалось достигнуть в результате оптимизации.

Если верить GlobalFoundries, производительность была улучшена на 55% при прежней частоте, а энергопотребление было уменьшено на 65%.

<> Архитектура Polaris
TrueAudio Next и AFR Frame Pacing