Страница 6: Перемены в сравнении с Sandy Bridge
Что касается архитектуры, то по сравнению с Sandy Bridge мы не получили каких-либо изменений, в Ivy Bridge используются знакомые нам технологии:
Ring Bus Cache:
Старые интегрированные графические ядра обычно дают низкий уровень производительности не только из-за того, что для них приходится выделять память из системной памяти ПК. Система получает дальнейшее падение производительности, поскольку CPU и графическому ядру приходится делить вместе такие системные ресурсы, как шину памяти. Хотя бы по той причине интегрированные графические ядра считаются альтернативой только для low-end систем. В процессорах Intel Sandy Bridge мы получили интегрированную графику, которую уже можно вполне нормально использовать - и в процессорах Ivy Bridge она переходит на новый уровень.
Производительность графического решения увеличилась, вероятно, из-за ускорения доступа к памяти: ничего так не может ускорить графическое ядро, как полный доступ к кэшу L3. Но чтобы компенсировать битву за ресурсы, поскольку к кэшу обращаются и вычислительные ядра CPU, Intel пришлось увеличить пропускную способность кэша L3. Это было достигнуто с помощью кольцевой шины.
Как можно видеть по рисунку выше, каждое ядро, графический движок и системный агент являются точками связи с кэшем L3. Всего шина состоит из четырёх компонентов: одного 32-байтного кольца данных (Data Ring), одного кольца запросов (Request Ring), одного кольца подтверждений (Acknowledge Ring) и одного кольца отслеживания (Snoop Ring). Доступ всегда выполняется по кратчайшему пути, но не в каком-либо определенном направлении. Благодаря такому расположению компонентов, новому для архитектуры CPU, Intel не только смогла увеличить пропускную способность, но и снизить задержки кэша. Кроме того, кэш L3 работает на тактовой частоте CPU. Конечно, это дает положительный эффект на производительности графического ядра - но энтузиасты с дискретными видеокартами тоже должны выиграть, поскольку новая архитектура дает преимущество в виде более быстрой работы кэша L3.
Между Sandy Bridge и Ivy Bridge не произошло каких-либо изменений, что подтверждают тесты измерения пропускной способности кэша:
Сравнение задержек кэша:
Ivy Bridge слева, Sandy Bridge справа
Сравнение пропускной способности кэша:
Ivy Bridge слева, Sandy Bridge справа
Конечно, мы наблюдаем некоторые различия, пики и спады, поскольку измерения проводились на активной системе, но заметной разницы между Ivy Bridge и Sandy Bridge нет. Так что задержка кэша и пропускная способность не изменились - вряд ли Intel внесла какие-либо изменения в дизайн.
Turbo Boost 2.0:
Принцип работы технологии Intel Turbo Boost объяснить просто: если не все области процессора используются, то при достаточном охлаждении и резерве по доступному питанию некоторые блоки можно заставить работать быстрее, подняв тактовые частоты. Конечно, при этом увеличивается энергопотребление, да и процессор чуть сильнее нагревается, но и работы он выполняет больше. Следовательно, ваши вычисления могут выполняться чуть быстрее.
Данный принцип актуален только для многоядерных процессоров, поскольку многие приложения по-прежнему работают только на одном ядре и не могут одновременно задействовать все ядра. В таком случае можно повысить эффективность процессора с помощью Turbo Boost - процессор будет работать на один или больше шагов (множителей) быстрее.
С процессорами Sandy Bridge Intel объявила переход на технологию Turbo Boost 2.0, которая базируется на тепловом бюджете. Идея знакома всем, кто когда-либо устанавливал кулер CPU в собственный ПК: после включения ПК металл процессора остаётся холодным, он нагревается только через несколько минут расчетов до определенной температуры. Подобная инерционность охлаждения позволила Intel говорить о дополнительном преимуществе "Dynamic Range Turbo Frequency Limits".
То есть Intel Turbo Boost 2.0 позволяет не только выставить более высокий множитель, который указан в спецификациях, но, в зависимости от бюджета процессора и температуры CPU, поднять тактовую частоту процессора. Процессор может даже выйти за ограничения теплового пакета TDP, но только пока позволяет блок Power Control Unit и все датчики. Когда тепловой бюджет будет полностью исчерпан, кулер нагреется, Intel вернет процессор в обычный режим работы Turbo.
Можно заметить, что в процессорах Ivy Bridge изменилась система выставления ступенек частоты: при полной нагрузке на все ядра процессор Core i7-2700K работает на частоте 3,6 ГГц, то есть на более высокой ступеньке. Когда нагружаются два или три ядра, то частота увеличивается до 3,8 ГГц, а с одним ядром - до 3,9 ГГц. В зависимости от модели процессора данные ступеньки отличаются, но принцип действия вам должен быть понятен. В случае Core i7-3770K ступенька с четырьмя ядрами была поднята до 3,7 ГГц, а с двумя и одним ядром - до 3,9 ГГц.
Как и можно было ожидать, у старших моделей поддерживается технология Hyper-Threading, 256-битные расширения AVX, AES-NI и другие архитектурные улучшения по сравнению с Lynnfield. Как можно видеть, в данном отношении архитектура и ядра не изменились - за исключением некоторых оптимизаций отдельных регистров, которые внесла Intel, чтобы избежать определенных проблем.
Изменились некоторые детали: был добавлен аппаратный генератор случайных чисел, который позволяет сделать ряд алгоритмов более надёжными. Кроме того, Intel добавила режим Supervisor Mode Execution Protection, дополняющий бит NX. Некоторые команды Intel тоже пересмотрела (например, Float16). Впрочем, все это вряд ли способно дать разницу в производительности, да и многие функции уже были реализованы на программном уровне.
Но изменения в области графического процессора оказались весьма существенными, именно они позволили Intel говорить не просто о "тике", а о "тике+". На следующей странице мы детально рассмотрим все изменения.