Страница 2: Архитектура Cypress Cove и 14-нм техпроцесс

Для Intel архитектура Sunny Cove является первым существенным изменением базовой архитектуры CPU со времен Skylake в 2015 году. Все настольные процессоры Comet Lake-S по-прежнему базируются на Skylake. Изменение архитектуры произошло только с процессорами Rocket Lake-S, хотя они все еще производятся по 14-нм технологии. До сегодняшнего дня, то есть до весны 2021 года, Intel не может справиться с 10-нм техпроцессом.

Впрочем, Sunny Cove была лишь первым шагом. Следующий шаг Intel уже сделала с архитектурой Willow Cove в процессорах Tiger Lake для ноутбуков, которые изготавливаются по улучшенному 10-нм техпроцессу. По крайней мере, с производством мобильных чипов сейчас проблем нет. Хотя выход годных кристаллов не такой высокий, как хотелось бы Intel, несмотря на "10nm SuperFin Technology". Впрочем, хотя бы здесь Intel смогла достичь поставленных целей.

Но с Cypress Cove мы переходим на полностью новую архитектуру. С более широкой передней частью конвейера и более глубокой задней частью.

Intel для Cypress Cove использует 5-wide конвейер с внеочередным выполнением. В нем теперь имеются четыре станции Unified Reservation Stations (RS), что позволяет добиться лучшего параллелизма выполнения инструкций, чем в случае Skylake. Возможно, для предотвращения уязвимостей Spectre, Intel выделила четыре фиксированных порта для AGU (Address Generation Unit). К каждой паре AGU привязан блок чтения/записи (Load/Store). Для вычислений VEC и INT теперь присутствуют дополнительные вычислительные блоки на соответствующих портах. Все эти меры призваны увеличить производительность архитектуры.

Также Cypress Cove поддерживает новые наборы команд ISA. Среди них Vector-AES и SHA-NI, но также и AVX512. Первые два обеспечивают аппаратное ускорение шифрования и дешифровки. В результате мы должны получить ускорение многих алгоритмов криптографии, что как раз соответствует упомянутым Intel оптимизациям под специальные приложения.

В фокусе Rocket Lake-S все же расширения AVX512, поскольку от них существенно выиграют некоторые сценарии:

  • AVX512VPOPCNTDQ: AVX512 Vector Population Count Doubleword and Quadword
  • AVX512VNNI: AVX512 Vector Neural Network Instructions
  • AVX512GFNI: AVX512 Galois Field New Instructions
  • AVX512VAES: AVX512 Vector AES
  • AVX512VBMI2: AVX512 Vector Bit Manipulation, Version 2
  • AVX512BITALG: AVX512 Bit Algorithms
  • AVX512VPCLMULQDQ: AVX512 Vector Vector Carry-less Multiply

В нашем предварительном тесте Core i7-11700K поддержка AVX512, в частности, была заметна в бенчмарке Y-Cruncher.

Благодаря расширению линейного адресного пространства до 57 бит и физического адресного пространства до 52 бит, процессоры на архитектуре Cypress Cove могут адресовать до 4 Тбайт оперативной памяти на сокет. Но данная функция будет актуальна только для процессоров Xeon (Ice Lake-SP).

Произошли изменения в иерархии кэшей. Размер кэша данных L1 увеличился на 50% с 32 до 48 кбайт. Кэш L2 удвоен до 512 кбайт на ядро. Буфер Translation Lookaside Buffer (TLB) увеличился, что позволяет вмещать ему более крупные таблицы адресов. Кэш микроопераций (µOP) тоже вырос.

Сравнение процессоров
  Skylake Sunny Cove Cypress Cove Willow Cove
Кэш данных L1 32 кбайт на ядро 48 кбайт на ядро 48 кбайт на ядро 48 кбайт на ядро
Кэш инструкций L1 32 кбайт на ядро 32 кбайт на ядро 32 кбайт на ядро 32 кбайт на ядро
Кэш L2 256 кбайт на ядро 512 кбайт на ядро 512 кбайт на ядро 1.280 кбайт на ядро
Кэш L2 TLB 1.536 2.048 2.048 2.048
Кэш L3 20 MB на 10 ядер 8 MB на 4 ядра 16 MB на 8 ядер 12 MB на 4 ядра
Кэш µOp 1.500K µOps 2.250K µOps 2.250K µOps -
OoO Window 224 352 352 -
In-Flight Loads 72 128 128 128
In-Flight Stores 56 72 72 72
Контроллер памяти DDR4-2933 DDR4-3200
LPDDR4-3744
DDR4-3200 DDR4-3200
LPDDR4-3744
LPDDR5-5400

Как видим, при переходе со Skylake на Sunny Cove увеличились размеры кэша данных L1 и кэша L2. Емкость кэша данных L1 увеличилась на 50%. С другой стороны, емкость кэша L3 не изменилась. Вся информация о кэшах верна как для Sunny Cove, так и для Cypress Cove.

Intel сделала следующий шаг с архитектурой Willow Cove в процессорах Tiger Lake, но мы увидим их вне ультрамобильного сегмента в виде Alder Lake только в конце года. То есть на настольном сегменте. Здесь размер кэша L2 был более чем удвоен (по сравнению с Cypress/Sunny Cove). Кэш L3 увеличился на 50% на ядро.

Intel также улучшила точность предсказание ветвлений. Интересно, что здесь в архитектуре Skylake как раз наблюдалась уязвимость.

Rocket Lake-S и 14-нм техпроцесс

Intel по-прежнему производит процессоры Rocket Lake-S по 14-нм технологии. В отличие от предшественника Comet Lake S, Intel производит только один кристалл с восемью ядрами и встроенной графикой. То есть при производстве Rocket Lake-S Intel не различает 10-ядерный и 6-ядерный процессоры.

Что касается производства, то возникает вопрос: почему Intel сделала шаг назад по сравнению с десятью ядрами Comet Lake-S, поскольку процессоры Rocket Lake-S предлагают, максимум, восемь ядер. Мы поинтересовались причиной и получили следующий ответ: из-за больших размеров кэшей и увеличения GPU Intel уже не смогла установить на кристалл больше восьми ядер. CPU и GPU все же были разработаны для производства по 10-нм техпроцессу, и в случае 14 нм площадь оказалась заметно больше. Поэтому для Intel оказалось невыгодным производство больше чем восьми ядер.

Мы задали вопрос насчет возможности отказа от встроенной графики и производства чипа с 10 или 12 ядрами Cypress Cove, но здесь Intel привела аргумент в виде разных сценариев использования процессоров Rocket Lake-S. Встроенная графика для большинства геймеров не актуальна, но в сегменте OEM она очень важна, а кристаллы RKL-S будут использоваться не только в игровых системах. Поэтому был выбран дизайн чипа с восемью ядрами и встроенной графикой.

Intel обычно не дает информации о размере кристаллов. Поскольку первый Core i7-11700K уже скальпирован, мы можем определить размер визуально. Корпусировка LGA1200 имеет габариты 37,5 x 37,5 мм, отсюда размеры кристалла составляют 11,37 мм x 23,71 мм, площадь - 269,58 мм².

Сравнение размера чипов
  Площадь Макс. количество ядерЧисло транзисторов
Rocket Lake-S 269,6 мм² 8≈ 6 млрд.
Comet Lake-S 206,1 мм² 10-
Coffee Lake-S (Refresh) 180,3 мм² 8≈ 4 млрд.
Coffee Lake-S 153,6 мм² 6-
Ryzen 5000 (2x CCD + IOD) 286,4 мм² 1610,39 млрд.

Если сравнить с предшественником Comet Lake-S, который имеет площадь 206,1 мм², новый чип с восемью ядрами Cypress Cove увеличился почти на 30%. Следует напомнить, что 11-е поколение Core имеет всего восемь ядер, хотя у предшественника было десять. Но при этом площадь стала больше. Собственно, это одна из причин, почему 10-ядерные модели Rocket Lake S так и не появятся. Кристалл попросту был бы слишком большим.

Удивительно, но Intel решила назвать число транзисторов - 6 млрд. Процессор Ryzen 5800X с восемью ядрами, то есть одним CCD и одним IOD, имеет 6,24 млрд. транзисторов. А два CCD увеличивают число транзисторов до 10,4 млрд., а общую площадь - до 286,4 мм².

Сравнение техпроцессов
  Плотность транзисторов
TSMC 16 нм 28,2 MT/mm²
TSMC 14 нм 52,5 MT/mm²
TSMC 7 нм 91 MT/mm²
TSMC 5 нм ≈ 170 MT/mm²
TSMC 3 нм ≈ 300 MT/mm²
Intel 14 нм 37,5 MT/mm²
Intel 10 нм 101 MT/mm²
Intel 7 нм ≈ от 200 до 250  MT/mm²

Intel по-прежнему опирается на 14-нм техпроцесс, поэтому возникает вопрос о том, насколько компания смогла его улучшить. Одиночные ядра в режиме Boost достигают уровня 5,3 ГГц, а при нагрузке на все ядра - 5,1 ГГц, так что прогресс имеется. Конечно, Intel мало что может сделать с плотностью транзисторов, все же кристалл Rocket Lake-S очень большой - 270 мм². AMD при почти такой же площади упаковала 16 ядер.

Но сравнивать 14-нм техпроцесс Intel с 14-нм техпроцессом TSMC нелегко (то же самое касается сравнения 10 и 10 нм, 7 и 7 нм). Лучше оценивать плотность расположения транзисторов, и здесь 10-нм техпроцесс Intel находится примерно на уровне 7-нм TSMC. Если Intel сможет "срезать угол" с 7-нм техпроцессом в 2022/23 годах, то компания получит большую площадь транзисторов, чем у 5-нм техпроцесса TSMC. Впрочем, и здесь не все так просто, поскольку в каких-то участках чипа транзисторы расположены более плотно, где-то менее плотно, чтобы, например, допустить большие токи и напряжения.

Новые чипсеты, старый сокет

Платформа LGA1200, представленная в конце прошлого года, сама по себе совместима с новыми процессорами Rocket Lake-S. Кроме того, большинство производителей материнских плат уже анонсировали, что с моделями 400 Series (в особенности, на чипсете Z490) они будут поддерживать PCI Express 4.0. Поддержка PCI Express 4.0 - одна из наиболее важных функций новых процессоров. Вместе с тем Intel увеличила число линий PCIe 4.0 CPU с 16 до 20, чтобы можно было напрямую подключать к процессору NVMe SSD кроме видеокарты

Но следует все же быть внимательным к тому, какие именно модели прошлогодних материнских плат были выпущены с поддержкой PCI Express 4.0. Также следует проверять, что имеется слот M.2, подключенный непосредственно к процессору.

Еще одна новая особенность платформы - подключение процессора к чипсету. Теперь используются восемь линий DMI 3.0 вместо четырех - по крайней мере, в случае чипсетов Z590 и H570. Скорость передачи удвоилась до 8 GT/s (7,86 Гбайт/с), что должно устранить "узкое место" по интерфейсу между процессором и чипсетом. Все процессоры Rocket Lake-S поддерживают x8 DMI 3.0, но со стороны чипсета им оснащены только Z590 и H570, а у B560 и H510 такой возможности нет.

Совместимость 10/11-го поколения Core с чипсетами линеек 400/500

Важным аспектом новой платформы и чипсетов является то, что Intel разрешила разгон памяти для всех процессоров и всех чипсетов. Впрочем, у встроенных контроллеров памяти (IMC) процессоров Rocket Lake-S есть ограничения, на которых мы остановимся ниже.

Для большинства геймеров чипсет Z590 будет наиболее интересным вариантом при выборе новой материнской платы LGA1200. 20 линий PCI Express процессора производители материнских плат могут распределять в режимах 1x 16 + 1x 4, 2x 8 + 1x 4 или 1x 8 + 3x 4. Сам чипсет предлагает до 24 линий PCI Express 3.0. Intel пока не реализовала поддержку PCI Express 4.0 на чипсете, в отличие от AMD. Кроме того, чипсет Z590 предлагает до 6x портов SATA, 3x USB 3.2 Gen 2x2, 10x USB 3.2 Gen 2x1, 10x USB 3.2 Gen 1x1 и 14x USB 2.0, а также 2,5G Base-T Ethernet, Wi-Fi 6 и другие функции, включая поддержку Optane Memory, Smart Sound, Rapid Storage и новой Intel Extreme Tuning Utility.

Чипсет H5770 предлагает фиксированную конфигурацию линий PCI Express в виде 1x 16 + 1x 4. Как мы упоминали ранее, для соединения и чипсета здесь тоже используются x8 DMI 3.0. Чипсет предлагает 20x линий PCI Express 3.0 - на четыре меньше, чем в случае Z590. Но есть поддержка до 2x USB 3.2 Gen 2x2, 4x USB 3.2 Gen 2, 8x USB 3.2 Gen 1 и 14 USB 2.0, что тоже меньше. Intel не урезала 6x SATA и 2,5G Base-T Ethernet. Если на материнскую плату установлен соответствующий PHY, поддержка Wi-Fi 6 тоже доступна. Как и другие функции Intel (Rapid Storage, Optane Memory, Smart Sound и т.д.). Но вот разгон процессора на материнских платах с чипсетом H570 не поддерживается.

Третий чипсет, который мы рассмотрим сегодня - B560. Здесь возможности подключения еще сильнее урезаны. Чипсет предлагает только 12 линий PCI Express 3.0, подключение к процессору выполняется через x4 DMI 3.0. По портам USB были принесены новые жертвы, но не по сетевым подключениям.