> > > > IDF2015: архитектура Skylake в деталях

IDF2015: архитектура Skylake в деталях

Опубликовано:

idf2015logoНа IDF 2015 Intel вполне ожидаемо раскрыла подробности новой архитектуры Skylake. Мы уже опубликовали тесты первых процессоров Core i5-6600K и Core i7-6700K – но информацию об архитектуре Intel предоставила позднее.

Intel начала с истории разработки Skylake, причём вектор развития менялся несколько раз. Проект Skylake был запланирован Intel пять лет назад – планировалось представить процессоры для десктопов, классических, легких и тонких ноутбуков. То есть изначально Intel работала над классической обвязкой ввода/вывода для ПК, TDP двух продуктов с разных концов шкалы должен был отличаться в три раза – что нам хорошо знакомо по существующим настольным и мобильным процессорам Intel. Изначально планировалось представить два форм-фактора для ноутбуков и настольных ПК.

Но затем появились ультрабуки и трансформеры 2-в-1, после чего команда разработчиков Skylake решила расширить свои планы. Дистанция TDP между «младшим» и «старшим» продуктами Skylake была увеличена до 20 раз. Процессор выпускается в четырёх форм-факторах, в том числе чтобы удовлетворить требованиям сфер видео и мультимедиа, где требуются на 40-60% менее мощные SoC.

Так что команда дорабатывала ядра и архитектуру с учетом реализации в других форм-факторах, компактных платформах, на маленьких материнских платах – и сценариев энергопотребления при работе от батареи. С другой стороны, приходилось работать над новыми функциями (в частности, функциями безопасности) и графической производительностью. Возможно, все это привело к задержке Skylake, поскольку разработчикам приходилось учитывать противоречивые характеристики и требования на рынке CPU.

skylake1s
Диаграмма процессора Skylake в 4-ядерной версии

Микроархитектура Skylake является новой реализацией архитектуры Core, которая была улучшена в нескольких областях. Intel улучшила кольцевую архитектуру и увеличила пропускную способность кольца. Теперь доступны три варианта расширения графики, каждый с памятью eDRAM и без, они найдут свое применение в будущих CPU. Контроллер памяти тоже был доработан, теперь он поддерживает DDR3 и DDR4. Были пересмотрен многие области PCIe, DisplayPort, чипсета и DMI. Кроме того, Intel добавила ЦСП камеры для планшетов и устройств 2-в-1. Оверклокеров порадуют расширенные возможности разгона.

При разработке Skylake преследовались следующие цели: более высокое количество инструкций за такт и более высокие тактовые частоты, чтобы дать прирост производительности. Также разработчики пытались снизить энергопотребление, усилить функции безопасности и дать больше возможностей конфигурации.

skylake2s
Улучшения в области ядра (фронтальная часть)

Как обычно, на основе Skylake будут выпущены серверные и клиентские решения, Intel значительно улучшила гибкость конфигурации. Однако здесь ситуация не совсем понятная, поскольку Intel пока не говорит о грядущих моделях Xeon.

Изменения в ядрах Skylake

Что касается ядер, Intel оптимизировала фронтальную часть Skylake, интегрировав более мощный блок предсказания ветвлений, более крупный буфер памяти и более быстрый механизм предварительной выборки Prefetch. Буферы внеочередного выполнения (Out of Order Buffers) тоже были увеличены, чтобы обеспечить более высокую степень параллельной обработки. Доработала Intel и исполнительные блоки. Внимание было уделено снижению задержек, увеличению числа блоков и более интеллектуальному механизму выключения в целях экономии энергии.

Чтобы ядра не «голодали» в ожидании данных, Intel улучшила соединения на кристалле. Улучшения в блоке предварительной выборки Prefetch привели к увеличению пропускной способности чтения/записи (Load/Store). Были увеличены буферы Store, Fill и Write-Back, ускорена обработка промахов страниц и промаха кэша L2, который в то же время получил большую пропускную способность. Есть и несколько новых инструкций, касающихся работы с кэшем. Технология Hyper-Threading тоже была улучшена благодаря увеличению кэша и станций резервирования (Reservation Stations).

skylake3s
Изменения в буферах

Новые технологии безопасности

Ещё одна цель при разработке архитектуры Skylake касалась внедрения новых технологий безопасности. Здесь Intel применила две технологии: SGX (Software Guard Extensions Technology) и MPX (Intel Memory Protection Extensions). Технология SGX призвана предотвращать атаки вредоносных программ на специфические области памяти, которые считаются доверенными (Trusted Enclaves). Они не будут доступны даже для функций отладки. Технология MPX защищает от переполнения буфера, которое часто используется для атак. Система проверяет перед обращением в память, не произошло ли превышение границ выделенной памяти, в таком случае доступ блокируется.

Улучшения в сфере энергопотребления

Как и в случае предыдущих поколений Core, Intel не забыла о цели снижения энергопотребления. Архитектура Skylake опирается на современный 14-нм техпроцесс, известный по процессорам Broadwell, но Intel добавила новые технологии, позволяющие снизить энергопотребление на уровне CPU и платформы. На уровне ядра теперь поддерживается полное отключение блоков AVX2, если в коде нет инструкций AVX2. Есть и улучшения, касающиеся специфических функций, например, воспроизведения мультимедиа: Intel добавила аппаратные функции, которые могут работать без нагрузки на ядра, что позволяет экономить энергию. Со стороны графики были внесены оптимизации, улучшающие энергопотребление при работе с дисплеями высокого разрешения. А для младших моделей Skylake была учтена работа в пассивном режиме, то есть без активного охлаждения.

Ещё одна новая функция - Intel "Speed Shift Technology": под ней Intel подразумевает управление рабочими состояниями CPU. На данный момент управление осуществляется через программный слой в операционной системе – через так называемые P-состояния, которые остались в прошлом. Но со стороны операционной системы тоже требуется поддержка, которая пока реализована только под Windows 10. Скажем, для требовательных приложений процессор может работать на высоких тактовых частотах, после чего как можно быстрее возвращаться в режим бездействия. Подобный принцип уже известен по предыдущим процессорам Intel (Hurry Up and Get Idle – HUGI, буквально поторопись и перейди в режим бездействия), теперь он назван Intel «Race to Halt», то есть «гонка до остановки». В некоторых приложениях подобный подход себя не оправдывает, поскольку они постоянно работают с низкой производительностью. Со стороны операционной системы тоже требуется оптимизация, чтобы уменьшить общее энергопотребление.

При добавлении подобных оптимизаций Speed Shift Intel гарантирует, что общая отзывчивость системы не ухудшится. Чтобы уменьшить энергопотребление в режиме бездействия, Intel больше не будет существенно снижать тактовую частоту процессора, поскольку при этом ухудшается отзывчивость. Вместо этого процессор будет проходить через холостые циклы (Duty Cycles), то есть мы получаем своего рода аналог перехода состояний «включен-выключен-включен-выключен», некоторые области могут полностью отключаться. Ещё одно преимущество от подобной аппаратной реализации – отзывчивость процессора существенно улучшается.

Технология SpeedStep, знакомая по старым процессорам и уже ставшая классикой, теперь реализована и для System Agent и подсистемы памяти. Эти области могут снижать тактовые частоты в зависимости от нагрузки.

Чтобы обеспечить лучшее охлаждение системы – или дать возможность OEM-партнерам экономить энергию в тихих системах, имеется возможность считывания температуры поверхности процессора, была улучшена обработка других температурных датчиков. В результате партнеры Intel могут создавать более эффективные решения охлаждения, а проблемы с троттлингом, часто наблюдавшиеся в прошлом, должны быть минимизированы.

Улучшения подсистемы кэширования

Intel улучшила и подсистему кэширования. Пропускная способность кэша последнего уровня была увеличена в два раза благодаря улучшенной обработке промахов. При прежнем уровне энергопотребления была удвоена пропускная способность кольцевой шины. Архитектура кэша eDRAM тоже была улучшена, теперь он может работать в полностью когерентном режиме, не только для графического ядра, но и для устройств ввода/вывода, движка дисплея или других запросов – без дополнительной синхронизации. Все это сдало возможным благодаря тому, что память eDRAM теперь подключается к System Agent, а не через кэш последнего уровня.

Другие оптимизации

Чтобы процессоры можно было эффективно использовать в планшетах, Intel добавила процессор обработки изображений (Image Signal Processor) во всей линейке Skylake, он поддерживает до четырёх камер (две одновременно), каждая с разрешением до 13 МП. Intel встроила ISP напрямую в процессор по соображениям экономии энергии. Кроме того, данный шаг позволяет создавать более компактные решения SoC для планшетов. Как указывают спецификации Intel, камеры могут захватывать видео в режиме 2160p и 30 Гц, либо 1080p и 60 Гц – с низким уровнем энергопотребления и высоким качеством.

Что касается уровня чипсетов, то теперь чипсеты тоже получили возможность менять тактовую частоту и включать троттлинг. Как мы уже отметили в первых тестах, Intel существенно улучшила набор портов ввода/вывода и интерфейсы, будь то PCIe 3.0, NVME или USB 3.0. Подключение чипсета к CPU тоже было улучшено благодаря DMI 3.0, чтобы в системе не возникло новое «узкое место».

Добавьте к этому уже известные функции разгона, которые мы продемонстрировали на примере Core i7-6700K.

Если вы хотите скачать полный PDF презентации, то сделать это можно на соответствующей странице Intel IDF.