> > > > Прирост IPC 35%: ARM перевела ядра Cortex на Armv9

Прирост IPC 35%: ARM перевела ядра Cortex на Armv9

Опубликовано:

armПосле анонса архитектуры Armv9 и дизайна Neoverse N2 для серверов, сегодня ARM представляет первые ядра Cortex на основе Armv9. ARM со своими разнообразными решениями намерена увеличить долю на рынке. Несколько лет назад на рынке смартфонов и планшетов ARM действительно заняла приличную долю, хотя некоторые производители вносили свои изменения в ядра. AArch64 или ARM64 сегодня является базой почти для всех ультра-мобильных процессоров.

С дизайнами Neoverse ARM успешно расширила сферу применения своих решений. Но поддержка Armv9 на мобильном сегменте как раз отсутствовала. К счастью, ARM теперь представила целостное решение. Новые ядра CPU, новые GPU, новый интерконнект и различные варианты Cortex-M, Ethos-U, Cortex-R и Ethos-N позволяют адаптировать решения ARM под потребности клиентов. Есть возможность интегрировать и сторонние IP.

Новые ядра, представленные сегодня, являются LITTLE Cortex-A510 на смену Cortex-A55, CortexA-710 на смену Cortex-A78 и Cortex-X2, на смену Cortex-X1 в ноутбуках.

Новые ядра Cortex опираются на архитектуру Armv9. В зависимости от того, как новые ядра будут сконфигурированы, можно говорить о разных результатах прироста IPC и эффективности по сравнению с предшественниками. Здесь нет никакого единства.

SoC с новыми ядрами Cortex будут по-прежнему опираться на принцип big.LITTLE, хотя имеется возможность использовать только один тип ядер. Cortex-A510 заменяют Cortex-A55, здесь прирост IPC составляет 35%, эффективность увеличилась на 20% при условии одинакового техпроцесса. Cortex-A510 - младшие эффективные ядра в дизайне big.LITTLE. Напротив, Cortex-A710 являются ядрами big на смену Cortex-A78. Здесь прирост IPC составляет 10% при условии одинакового техпроцесса, увеличение эффективности - 30%. Хорошо видны приоритеты ARM. Для ядер big на первом месте оказалась эффективность, для ядер LITTLE - производительность.

Сравнение ядер Cortex-A5X

Cortex-A510 Cortex-A55
L1 32 kB 32 kB
L2 256 kB (общий для двух ядер) 128 kB
L3 8 MB 4 MB
Сравнение ядер Cortex-A7X

Cortex-A710 Cortex-A78
L1 32 kB 32 kB
L2 512 kB 512 kB
L3 8 MB 4 MB
Сравнение ядер Cortex-X

Cortex-X2 Cortex-X1
L1 64 kB 64 kB
L2 1 MB 1 MB
L3 8 MB 4 MB

На верхнем сегменте ядра Cortex-X2 заменяют Cortex-X1, они обеспечивают на 16% более высокую производительность IPC. ARM дает прирост пиковой производительности +40% по сравнению с процессорами для ноутбуков 2020 года. Для сравнения используется Intel i5-1135G7. До сих пор кластеры могли содержать, максимум, четыре ядра Cortex-X1, но теперь возможна поддержка до восьми Cortex-X2. Тактовые частоты Cortex-X2 будут составлять до 3,5 ГГц, у Cortex-X1 максимум был 3 ГГц.

Благодаря поддержке расширению инструкций SVE2, новые дизайны получат существенный прирост производительности в сценариях машинного обучения.

Для кластеров Armv9 ARM приводит больше результатов. С одним Cortex-X2 в качестве однопоточного производительного ядра, тремя ядрами big Cortex-A710 и четырьмя ядрами LITTLE Cortex-A510 ARM обещает 30% прирост пиковой производительности, 30% увеличение долговременной производительности и 35% прирост эффективности.

Кроме новых ядер Armv9 CPU, были представлены и новые GPU:

Mali-G310, Mali-G510 и Mali-G710 дают двузначное увеличение производительности в процентах, а также работают до 22% экономичнее. В зависимости от конфигурации, варианты Mali имеют разные приоритеты и спецификации. По сравнению с предшественниками новые GPU обеспечивают в два раза больше потоковых процессоров на ядро, что приводит к увеличению производительности само по себе. Но Mali GPU имеют гибкость конфигурации, их можно адаптировать под IP клиентов, причем это касается и числа потоковых процессоров.

К сожалению, ARM пока не публикует технических подробностей GPU. Но прирост производительности должен быть существенным. ARM обещает удвоение производительности в идеальных условиях, что обуславливается удвоением потоковых процессоров на ядро.

Но установить на SoC быстрые ядра CPU и GPU недостаточно. Нужно обеспечить связность, и здесь как раз работают интерконнекты CoreLink CI-700 и CoreLink NI-700. Есть и 8 Мбайт кэша L3, вновь разбитого на слайсы. ARM заявляет о существенном сокращении задержек интерконнекта. ARM обещает снизить энергопотребление и увеличить пропускную способность.

Из-за широкого набора IP ядер CPU и GPU, ARM планирует захватить довольно широкий рынок. Действительно, Cortex CPU и Mali GPU, могут использоваться от ультрапортативных устройств, таких как очки VR, до смартфонов и полноценных ноутбуков. Причем в последнем случае производительность должна быть ничуть не хуже именитых конкурентов AMD и Intel.

Но Armv9 должен оказать существенное влияние и на серверы, о чем мы упоминали несколько раз. Первые серверные процессоры на дизайне Neoverse N2 будут представлены уже в конце 2021, но первые дизайны Cortex и Mali вряд ли выйдут раньше 2022 года. Производство SoC будет осуществляться по 5-нм техпроцессу.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).