GTC 2012: Kepler, GK110 и много технических демонстраций

gtc2012 Вчера Джен-Хсенг Хуан (Jen-Hsung Huang) открыл конференцию GTC 2012. Лейтмотивом собственной конференции Nvidia стали вычисления на GPU и интерфейс CUDA. Компания особенно гордится тем фактом, что её вычислительные ускорители на GPU сегодня используются в многочисленных суперкомпьютерах. GPU начинают играть всё более значимую роль и в профессиональной сфере. Впрочем, конечно, помимо нацеленности аппаратного обеспечения на подобную роль, немаловажна и поддержка со стороны программного обеспечения. Распространение CUDA облегчается и тем, что технология бесплатно доступна на различных платформах (Windows, OS X, Linux).

» Fotostrecke

Для игрового рынка компания представила графический процессор "Kepler" в виде GeForce GTX 680 (тест и обзор Hardwareluxx) в середине марта. Конечно, пленарный доклад на GTC во многом был посвящён новым графическим процессорам. Они прекрасно дополнились недавно объявленной видеокартой GeForce GTX 690 (тест и обзор Hardwareluxx). Были показаны некоторые технические демонстрации, включая метод трассировки лучей. Впрочем, Nvidia уже некоторое время работает над вычислением подобных задач на GPU, но только нынешние GPU могут использоваться для вычисления сцен в реальном времени. И здесь подразумеваются не только "твёрдые" материалы, но и также, например, расчет жидкостей. Уже полтора года назад система могла работать с несколькими GPU и поддерживала облако, но NVIDIA решила пойти ещё дальше.

gtc2012-keynote-03

Сегодня компания приоткрыла завесу тайны над связью новой архитектуры GPU и GTC 2012. Новые функции связаны с "Kepler" и HPC (High Performance Computing, высокопроизводительные вычисления) - это SMX (новая архитектура GPU, см. статью о GeForce GTX 680), Hyper-Q и Dynamic Parallelism. SMX содержит оптимизации, обеспечивающие лучшую эффективность энергопотребления. Hyper-Q призвана решить проблему, когда CPU в некоторых ситуациях не успевают снабжать GPU достаточным количеством данных для вычислений. В архитектуре "Fermi", например, используется только одна рабочая очередь, у Kepler же могут использоваться до 32 рабочих очередей. Поддерживается выделение до 32 ядер CPU, без каких-либо дополнительных оптимизаций в программном обеспечении. Dynamic Parallelism распределяет данные и вычисления с большей независимостью. Список очередей больше определяется не CPU, а самими GPU.

gtc2012-keynote-04

Кроме того, NVIDIA представила техническую демонстрацию, показывающую различия между "Fermi" и "Kepler".

Была представлена симуляция с использованием звёзд, которые позволяют оценить поведение миллиарда объектов. Данная симуляция выполнялось на "Fermi". "Kepler" позволяет выполнять симуляцию 10 миллиардов объектов - демонстрировалось столкновение Млечного пути с туманностью Андромеды через 3,8 млрд. лет.

gtc2012-keynote-10

Конечно, на основе архитектуры "Kepler" были представлены и новые продукты: Tesla K10 и Tesla K20. Первый продукт опирается на хорошо знакомый нам GK104, который используется в графических процессорах GeForce GTX 670, 680 и 690, а Tesla K20 будет базироваться на GK110 . Tesla K20 будет выпущен только в 4 квартале 2012 года.

Tesla K10:

2x GK104
745 МГц
4,58 TFLOPs
2x 4 Гбайт памяти GDDR5 (ECC)
2x 160 Гбайт/с пропускная способность памяти
3x более высокая производительность с одинарной точностью по сравнению с Tesla M2090 (Fermi)

Tesla K20:

GK110
7,1 млрд. транзисторов
13 или 14 кластеров SMX
384-битная шина памяти
3x более высокая производительность с двойной точностью по сравнению с Fermi

gtc2012-keynote-11

В будущем NVIDIA представит другие инновации. Как уже говорилось, развитие облачных вычислений продолжится - но уже на основе GPU "Kepler". Немало работы было проведено и в направлении виртуализации GPU, чтобы к одному GPU одновременно могли обращаться несколько пользователей. Сфера применения данной возможности охватывает многие группы продуктов. От классических ПК до планшетов и смартфонов. Принцип виртуализации должен быть вам знаком по виртуальным системам на классических серверах.

gtc2012-keynote-14

Наконец, была продемонстрирована и система GeForce Grid. GeForce Grid сможет переносить полноценную игровую производительность настольных систем на мобильные устройства. В принципе, решения были продемонстрированы уже несколько месяцев назад. К сожалению, подобные решения обладают некоторыми проблемами, включая задержку входа. NVIDIA пытается решить эту проблему с помощью GeForce Grid.

gtc2012-keynote-15

В ближайшие дни NVIDIA планирует провести бесчисленные сессии для программистов и журналистов, предоставив больше деталей о вычислениях на GPU.

Обновления:

По информации сотрудника NVIDIA, GK110 в максимальной версии будет использовать 2880 процессоров CUDA. Они будут располагаться в 15 кластерах SMX по 192 процессора CUDA каждый. В целом, GK110 будет содержать до 7,1 млрд. транзисторов. Но GPU Tesla в версии K20 должен быть реализован не в полной версии, а с 13 или 14 кластерами SMX.

Память подключается по 384-битной шине. Но насчёт объёма памяти Nvidia пока не предоставляет информации. Nvidia планирует вывести видеокарты на основе GK110 на рынок до 2013 года.

Источник: Heise.de