> > > > AMD представила две первые видеокарты Radeon RX 7000 – RDNA 3 и дизайн чиплетов

AMD представила две первые видеокарты Radeon RX 7000 – RDNA 3 и дизайн чиплетов

Опубликовано:

hardwareluxx news newПод лозунгом "together we advance_gaming" AMD вчера поздно вечером представила Navi 3x GPU на архитектуре RDNA 3. Для AMD осень оказалась жаркой: сначала были представлены процессоры Ryzen 7000 (тест), теперь архитектура RDNA 3 и новое поколение видеокарт Radeon RX, на следующей неделе – процессоры EPYC на ядрах Zen 4, в начале января – новое поколение мобильных процессоров Ryzen.

Но вернемся к видеокартам поколения Radeon RX 7000. Архитектура RDNA 3 обеспечит 50% прирост соотношения производительности на ватт (то есть эффективности). AMD сразу же подчеркнула, что линейка Navi 3x переходит на дизайн чиплетов. В корпусировке установлен центральный кристалл Graphics Chiplet Die (GCD) и несколько кристаллов памяти Memory Chiplet Dies (MCD). GCD производится по 5-нм техпроцессу на мощностях TSMC, а MCD – по 6-нм, тоже на TSMC. Параллели с процессорами Ryzen можно провести не только здесь.

Если верить AMD, дизайн на основе чиплетов улучшает гибкость. Можно сравнительно легко выпустить большое количество маленьких идентичных кристаллов MCD, которые будут комбинироваться с центральным кристаллом GCD в требуемом количестве. Сам GCD может быть в разных стадиях расширения. Площадь GCD составляет 300 мм², а MCD – всего 37,5 мм² для каждого.

Каждый MCD снабжен 16 Мбайт кэша Infinity Cache, поэтому для Navi 31 GPU суммарная емкость составляет 96 Мбайт. Для сравнения: Navi 21 оснащен 128 Мбайт Infinity Cache. Но AMD перешла на второе поколение Infinity Cache, у которого процент попадания выше. Что позволяет компенсировать чуть меньший объем кэша. Один кристалл GCD и шесть MCD дают вместе 58 млрд. транзисторов на суммарной площади 525 мм². AD102 GPU на видеокарте GeForce RTX 4090 содержит 76 млрд. транзисторов на площади 608,3 мм². Но монолитный чип производить сложнее, чем несколько раздельных чиплетов, используемых AMD. В случае видеокарты Radeon RX 7900 XT активны только пять MCD, шестой отключен, но используется как заглушка, чтобы распределять давление кулера.

Центральный GCD подключается к шести кристаллам MCD через интерконнект Infinity Fabric с пропускной способностью 5,3 Тбайт/с. Таким образом, суммарная пропускная способность увеличилась в 2,7 раза. То есть между GDC и каждым MCD пропускная способность – около 900 Гбайт/с. Для корпусировки AMD выбрала 2.5D Elevated Fanout Bridge (EFB), как и в случае Radeon Instinct MI250 – технология была разработана вместе с TSMC и базируется на фирменной корпусировке TSMC. Контроллеры памяти GDDR6 тоже содержатся в MCD. Radeon RX 7900 XTX оснащается 24 Гбайт памяти, Radeon RX 7900 XT – 20 Гбайт.

В отличие от нынешней архитектуры NVIDIA Ada Lovelace, новые видеокарты Radeon поддерживают DisplayPort 2.1. AMD не устает подчеркивать, что даже топовая модель Radeon RX 7900 XTX потребляет всего 355 Вт. И новые разъемы питания здесь попросту не нужны. Обе новых видеокарты оснащены двумя 8-контактными гнездами. Для Radeon RX 7900 XT пиковое энергопотребление составляет 305 Вт.

Первыми на новой архитектуре выйдут видеокарты Radeon RX 7900 XTX и Radeon RX 7900 XT.

Сравнение Navi 3x GPU

Radeon RX 7900 XTX Radeon RX 7900 XT
GPU Navi 31 Navi 31
GCDs 1x 1x
Площадь GCD 300 мм² 300 мм²
MCDs 6x 5x
Площадь MCD 37,5 мм² 37,5 мм²
Число блоков FP32 12.288 10.752
Shader Engines 6 6
Shader Arrays 12 12
Workgroups (WGP) 48 42
Compute Units (CU) 96 84
Игровая частота 2.300 МГц 2.000 МГц
Infinity Cache 96 MB 80 MB
Память GDDR6 GDDR6
Емкость памяти 24 GB 20 GB
Ширина шины памяти 384 бит 320 бит
TDP 355 Вт 305 Вт
Цена 999 долларов США 899 долларов США

Длина эталонных видеокарт AMD составляет 287 мм, толщина – 2,5 слота. AMD здесь тоже решила дистанцироваться от гигантских размеров GeForce RTX 4090.

AMD весьма сдержанно рассказала о производительности. Radeon RX 7900 XTX в разрешении UHD будет до 70% быстрее, чем Radeon RX 6950 XT. Весьма существенные улучшения были сделаны по производительности трассировки лучей. Хотя уровня GeForce RTX 4090 вряд ли стоит ожидать. Здесь AMD больше нацеливается на GeForce RTX 4080, которую NVIDIA представит через пару недель. Конечно, мы подготовим собственные тесты.

Архитектура RDNA 3

Важное изменение архитектуры RDNA 3 коснулось процессоров WGP (Workgroup Processors). Блоки FP32 теперь поддерживают "Dual Issue", то есть выполняют две вычислительных инструкции вместо одной. Но инструкции должны быть идентичны, что часто бывает, когда GPU используется для вычислений. Чтобы максимально раскрывать потенциал параллельного выполнения на уровне инструкций ILP (Instruction Level Parallelism) инструкции wavefront должны быть ориентированы на параллельное выполнение, иначе не все ресурсы будут задействованы. И в идеальном случае вычислительный блок CU (compute unit) сможет выполнять 128 вычислительных инструкций FP32 вместо 64.

Параллелизм на уровне инструкций ILP – сравнительно простой способ увеличения вычислительной производительности. Но здесь многое зависит от возможности дублирования вычислительных инструкций, поскольку только так можно выполнить две инструкции на одном CU. Интересно, насколько велико будет увеличение ILP на практике. У AMD наверняка есть собственные расчеты, но компания пока ими не поделилась.

AMD увеличила регистры VGPR (Vector General-Purpose Registers) на 50%, чтобы более эффективно нагружать вычислительные блоки CU. Каждый блок CU содержит два выделенных ускорителя искусственного интеллекта AI, которые могут быстрее выполнять простые вычисления INT8 и BFLOAT16. Вряд ли эти блоки AI стоит напрямую сравнивать с ядрами Tensor, но AMD заявляет об увеличении соответствующей производительности в 2,7 раза.

Улучшения производительности трассировки лучей связаны с тем, что соответствующие блоки могут рассчитывать на 50% больше лучей на такт. Структура дерева BVH для каждой операции трассировки луча по-прежнему просчитывается на потоковых процессорах. А блоки RT ускоряют, главным образом, операции Ray Box Sorting и Ray Traversal.

Разные частоты фронтальной и задней частей конвейера

Ходили слухи о том, что частота GPU увеличится до 3 ГГц. Но этого не произошло, Radeon RX 7900 XTX работает на 2,3 ГГц. Впрочем, у Navi 3x GPU появилась особая функция: разные частоты для фронтальной и задней частей конвейера. Если потоковые процессоры работают на 2,3 ГГц, фронтальная часть конвейера – 2,5 ГГц.

Фронтальная часть конвейера на высоких частотах положительно сказывается на вычислительной производительности, а потоковые процессоры могут работать медленнее для экономии энергии. Сама AMD указывает, что здесь удалось сэкономить порядка 25% потребляемой мощности.

Помимо аппаратных компонентов, AMD анонсировала новые программные функции. FSR 3 обеспечит дальнейшее увеличение качества картинки, в том числе благодаря использованию временной составляющей. FSR 3 будет доступна геймерам в 2023 году.

В магазинах с 13 декабря

Обе видеокарты появятся в магазинах 13 декабря. За Radeon RX 7900 XTX придется отдать $999, видеокарта Radeon RX 7900 XT будет стоить $899. Цены в рублях неизвестны. Кроме эталонных дизайнов AMD, в этот же день поступят в продажу и альтернативные. К тому времени мы уже будем знать, на что способна GeForce RTX 4080.

Дизайны MBA

Мы смогли посмотреть на эталонные дизайны MBA (Made by AMD). Начнем с Radeon RX 7900 XTX.

Обе видеокарты используют идентичный или очень похожий кулер. Длина видеокарт составляет 287 мм, они занимают по ширине 2,5 слота. AMD несколько раз подчеркнула использование стандартных разъемов питания PCI Express с 8 контактами, а также сравнительно компактные габариты. Конечно, шпилька здесь в сторону NVIDIA.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).

Мы рекомендуем ознакомиться с нашим руководством по выбору видеокарты для разных бюджетов.