> > > > До 12 ядер: ARM представила Cortex-X3 и новые варианты с тремя кластерами

До 12 ядер: ARM представила Cortex-X3 и новые варианты с тремя кластерами

Опубликовано:

armНа конференции TCS 22 ARM анонсировала новые ядра Cortex и GPU для будущих SoC. Самым быстрым высокопроизводительным ядром становится Cortex-X3, также анонсированы и новые эффективные ядра. ARM предложила новые варианты кластеров, позволяющие упаковать в составе SoC до 12 ядер. От наследственной поддержки некоторых архитектур было решено отказаться, а GPU обзавелись аппаратными блоками трассировки лучей.

Cortex-X3 – новое высокопроизводительное ядро ARM, которое работает на 11% быстрее Cortex-X2 при сравнимых тактовых частотах. Вместе с улучшенным техпроцессом прирост производительности удалось увеличить до 25%. Передняя часть конвейера была переработана, что уменьшит время простоя. То есть доступные ресурсы конвейера будут использоваться более эффективно. Кэши L1 и L2 были увеличены на 50% или даже удвоены в случае L2 (с 512 до 1.024 кбайт). Также были увеличены буферы предсказания ветвлений, была улучшена эффективность предсказаний в целом. Кэш микроопераций теперь составляет 1.536 вместо 1.024 записей.

Шире, быстрее, эффективнее – именно так можно описать изменения с новым ядром Cortex-X3.

В тройных кластерах ядра Cortex-A715 обеспечивают максимальную эффективность (производительность в расчете на ватт). ARM и здесь пересмотрела переднюю часть конвейера, улучшив эффективность и предсказание ветвлений. С производительностью на уровне предшественника Cortex-A710 ядра Cortex-A715 будут работать на 20% экономичнее. При прежнем энергопотреблении прирост производительности составит 5%. Что наглядно показывает фокус разработки Cortex-A715. Поддержка AArch32 полностью прекращена, поэтому ядра Cortex-X715 больше не могут выполнять 32-битные приложения. Здесь ARM полностью прекращает поддержку прошлой архитектуры.

«Младшие» ядра обновились незначительно. Cortex-A510 могут сэкономить 4-5% энергопотребления при прежней производительности или будут на 5% быстрее при прежнем энергопотреблении. Других изменений нет.

Произошли некоторые улучшения с интерконнектом Corelink CI-700, который ARM использует для связи кластеров CPU с кэшем System Level Cache (SLC), DSU и GPU.

Теперь поддерживается до 12 ядер, что в полтора раза больше предыдущей high-end конфигурации с 1+3+4 ядрами. ARM рекомендует конфигурации 1+4+4 и 2+2+4 для смартфонов и планшетов. Но также подобными процессорами будут оснащаться ноутбуки и настольные системы. Здесь ARM прогнозирует дизайны 8+4+0, то есть восемь ядер Cortex-X3 в одной SoC.

Immortalis-G715, Mali-G715 и Mali-G615

Новые GPU по-прежнему строятся на архитектуре Valhalla, которая получила некоторые изменения в четвертом поколении. Mali-G715 и Mali-G615 отличаются по количеству потоковых процессоров, в случае Immortalis-G715 эксклюзивно добавлены блоки ускорения трассировки лучей (ray tracing units, RTU), обеспечивающие аппаратное ускорение соответствующих вычислений.

ARM ориентирует SoC с GPU Immortalis-G715 на смартфоны. В фокусе здесь как производительность, так и программная поддержка, хотя пока совместим лишь Vulkan API. В зависимости от IP, который клиент хочет получить от GPU, предлагаются разные варианты расширения по числу потоковых процессоров. Возможны от 10 до 16 кластеров потоковых процессоров с таким же количеством RTU. Кэш L2 разделен на слайсы, объем может составлять до 1 Мбайт.

Mali-G715 может содержать между семью и девятью потоковыми кластерами, но блоков RTU здесь нет. Mali-G615 GPU поддерживает конфигурации от одного до шести потоковых кластеров.

Первые SoC на новых дизайнах будут анонсированы в конце 2022 года. Вероятным клиентом дизайна 12+4+0 с 12 ядрами Cortex X3 будет Qualcomm. Но Mediatek и многие другие компании наверняка перейдут на новые CPU и GPU ARM в 2023 году.

Подписывайтесь на группу Hardwareluxx ВКонтакте и на наш канал в Telegram (@hardwareluxxrussia).