> > > > Технические подробности памяти HBM: важна не только пропускная способность

Технические подробности памяти HBM: важна не только пропускная способность

Опубликовано:

hbmСо следующими двумя архитектурами GPU нового поколения или "Graphics Core Next" AMD будет фокусироваться на увеличении скорости доступа к памяти. Через несколько недель AMD должна представить GPU "Fiji", который опирается на память с высокой пропускной способностью High-Bandwidth Memory (HBM) 1-го поколения – она обеспечивает пропускную способность 640 Гбайт/с. То есть мы получаем, фактически, удвоение пропускной способности памяти по сравнению с GPU нынешнего поколения, которые оснащаются быстрой памятью GDDR5. Со вторым поколением HBM пропускная способность памяти ещё увеличится и составит более 1 Тбайт/с.

До сих пор остается открытым вопрос, насколько сильно новые видеокарты выиграют от более высокой пропускной способности памяти. В современных архитектурах GPU вопрос подключения памяти не теряет своей актуальности. С видеокартами GeForce GTX 980 (тест и обзор) производитель ограничил интерфейс памяти 256 битами, однако он так и не стал "узким местом". Технология сжатия памяти архитектуры NVIDIA "Maxwell" помогла спасти ситуацию. В случае GeForce GTX Titan X (тест и обзор) с 12 Гбайт видеопамяти решающую роль играет ёмкость, а не подключение. AMD планирует для двух видеокарт "Fiji" более 6 или 8 Гбайт памяти, которые вряд ли будут востребованы в ближайшем будущем. 12 Гбайт у GeForce GTX Titan X мы так и не смогли нагрузить.

Модуль Pascal с HBM (отмечены красным)
Модуль Pascal с HBM (отмечены красным)

Но вернемся к HBM: высокая пропускная способность, бесспорно, один из самых важных факторов, но не единственный. Современные архитектуры GPU оптимизируются под используемую с ними память и её подключение. Поэтому не имеет смысла переводить текущий дизайн GPU на более быструю память HBM, а также делать какие-либо экстраполяции на основе нынешних видеокарт. Потенциальное влияние HBM оценить сложно, как и симулировать имеющимися средствами. AMD и NVIDIA уже сообщили об использовании HBM в грядущих видеокартах, а также раскрыли некоторые детали, которые мы приведем ниже.

1. HBM потребляет меньше энергии

Преимущества памяти High Bandwidth Memory
Преимущества памяти High Bandwidth Memory

При установке памяти вплотную к кристаллу GPU энергопотребление становится критически важным фактором, поскольку от горячих компонентов необходимо отводить тепло. Экономия энергии в данном отношении интересна не столько уменьшением счёта за электричество, сколько возможностью создания новых дизайнов видеокарт или GPU. NVIDIA сравнивает энергопотребление DRAM и HBM, указывая 18-22 пДж/бит в случае DRAM и 6-7 пДж/бит в случае HBM. В результате мы получаем снижение до 33% от изначального энергопотребления.

2. HBM работает с меньшими задержками

Преимущества памяти High Bandwidth Memory
Преимущества памяти High Bandwidth Memory

Кроме пропускной способности памяти важную роль играют и минимально возможные задержки. Наши читатели уже знакомы с данным фактом по таймингам классической памяти. Из-за своей архитектуры HBM может работать с разными частотами и задержками для различных стеков и каналов. Данные тайминги (tRC, tRRD, tRP, tFAW и т.д.) могут выставляться по-разному в зависимости от требований.

3. Single Bank/Cell Refresh HBM:

Преимущества памяти High Bandwidth Memory
Преимущества памяти High Bandwidth Memory

Классическую память DRAM необходимо обновлять через определённые интервалы, чтобы содержимое памяти не исчезло. Как правило, период обновления составляет несколько микросекунд. Поскольку во время обновления памяти никаких других операций выполнять нельзя, мы получаем избыточную нагрузку порядка 5-10% к доступной пропускной способности памяти. Чем больше будет ёмкость памяти, тем больше избыточная нагрузка из-за операций обновления.

Преимущества памяти High Bandwidth Memory
Преимущества памяти High Bandwidth Memory

В памяти HBM контроллер обновляет банки памяти независимо, и операции обновления не требуется выполнять одновременно. Потенциально возможно обновление вплоть до одиночных ячеек, но пока это не востребовано. В любом случае, у технологии отдельного обновления банков Single Bank Refresh имеется большой потенциал в будущем, AMD и NVIDIA продолжат работу над оптимизацией памяти.

4. Гибкая поддержка ECC:

Преимущества памяти High Bandwidth Memory
Преимущества памяти High Bandwidth Memory

Видеокарты AMD и NVIDIA поддерживают память с кодом коррекции ошибок ECC (Error-Correcting Code). В результате битовые ошибки при передаче данных или при хранении её в памяти могут корректироваться. Но данный процесс требует дополнительных вычислительных ресурсов, а также добавляет избыточность к пропускной способности памяти и ёмкости. В случае HBM отдельные стеки памяти могут работать независимо друг от друга, так что для них можно индивидуально указывать, использовать ECC или нет. Например, если GPU оснащается 8 Гбайт памяти, то 4 Гбайт могут быть защищены ECC, а оставшиеся 4 Гбайт – нет. При этом они получат полную пропускную способность 640 Гбайт/с.

5. Разделение командного интерфейса

Преимущества памяти High Bandwidth Memory
Преимущества памяти High Bandwidth Memory

Каждый из 128-битных каналов может не только работать на своей тактовой частоте, но использовать независимый командный интерфейс (Command Interface). Командный интерфейс разделяется на два: "Column Commands" (чтение/ запись) и "Row Commands" (ACT / PRE). Теоретически это позволяет контроллеру памяти более полно использовать доступную пропускную способность команд, увеличивая пропускную способность памяти без передачи большого числа команд. Также и контроллер памяти в GPU теперь можно сделать проще – но к этому вопросу мы ещё вернёмся.

6. HBM требует менее сложного подключения к GPU:

Преимущества памяти High Bandwidth Memory
Преимущества памяти High Bandwidth Memory

Контроллеры памяти в современных GPU опираются на 256- или 384-битный интерфейс памяти, что существенно повышает сложность архитектуры GPU. Но здесь важна не только сложность, но и место установки интерфейса в общем дизайне и особенности производства. В случае HBM мы получаем не только увеличение пропускной способности и производительности – более сложных контроллеров памяти не потребуется. Как раз наоборот, контроллеры памяти можно создавать менее сложные.

Здесь важно физическое подключение – используются уже не контакты упаковки Ball Grid Array (BGA), а связи Through-Silicon Vias (TSV), а также прямые подключения между GPU и памятью на подложке. Поскольку HBM изначально выйдет в конфигурации 2.5D, память будет располагаться на одной подложке с кристаллом GPU.

Для связи с компонентами и интерфейсами за пределами подложки с GPU и памятью по-прежнему будут использоваться контакты BGA.

7. Температура HBM:

Преимущества памяти High Bandwidth Memory
Преимущества памяти High Bandwidth Memory

Уменьшение рабочего напряжения и другие меры HBM позволяют не только уменьшить энергопотребление, но и соответствующим образом снизить тепловыделение. Для этой цели между слоями кристаллов памяти используются теплопередающие слои (Thermal Dummy Bumps), которые облегчают отведение тепла от внутренних слоёв памяти.

Упомянутые выше операции обновления зависят от температуры (чем сильнее нагревается память, тем чаще необходимо выполнять обновление), поэтому у HBM появилась функция Temperature Compensated Self Refresh. Частота операции обновления зависит от текущего диапазона температур. Датчики температуры в памяти измеряют её значение, после чего контроллер оптимизирует операции обновления.

Предварительное заключение

Память с высокой пропускной способностью HBM (High Memory Bandwidth) обеспечивает не только увеличение пропускной способности и ёмкости. HBM даёт разработчикам GPU, а именно AMD и NVIDIA, дополнительные преимущества, которые лежат за поверхностью стандартных спецификаций (пропускной способности и конфигурации памяти). Здесь всплывает много интересных технических деталей, которые производитель памяти и два разработчика GPU наверняка смогут использовать в своих интересах. Так что мы находимся только в самом начале долгого и интересного пути разработки HBM. Пока что тему HBM поднял только SK Hynix в сотрудничестве с AMD и NVIDIA.

Наконец, ещё раз хотелось бы отметить, что экстраполяции или симуляции на современных видеокартах 320-640 Гбайт/с или сравнение 4 GB GDDR5 с 8 GB HBM не имеют особого смысла. Взаимодействие между GPU и памятью намного сложнее, его вряд ли можно описать одной характеристикой. Так что будем дожидаться появления первых видеокарт с HBM на рынке. Между тем AMD и NVIDIA, будем надеяться, более детально опишут преимущества HBM. В данной статье мы поделились известными на данный момент техническими деталями. Как только мы узнаем новые подробности – мы обязательно поделимся ими с нашими читателями.