> > > > NVIDIA Tesla K20 и GK110 с 14 кластерами SMX и 2688 ядрами CUDA

NVIDIA Tesla K20 и GK110 с 14 кластерами SMX и 2688 ядрами CUDA

Опубликовано:

nvidiaВ середине октября от поставщика серверных стоек на GPU NVIDIA появилась информация, что Tesla K20 будет базироваться на GK110 с 13 кластерами SMX, каждый со 192 ядрами CUDA. На GTC 2012 NVIDIA упоминала о 2880 ядрах CUDA, то есть полной конфигурации с 15 кластерами SMX. Чуть раньше на этой неделе от Окриджской национальной лаборатории в Теннеси (США) появилась информация о завершении самого производительного суперкомпьютера Titan в мире. Он базируется на 18 688 GPU NVIDIA Tesla K20 и обеспечивает производительность больше 20 петафопов. Команда ресурса Anandtech посетила Titan и узнала ряд любопытных деталей, которые противоречат 13 кластерам SMX GK110, упоминавшимся ранее.

Как оказалось, GPU NVIDIA Tesla K20 оснащаются 2688 ядрами CUDA, то есть содержат 14 кластеров SMX. В общей сложности GPU содержат 7,1 млрд. транзисторов. По тактовой частоте тоже появилась любопытная информация. GPU работает на 732 МГц, а не а 702 МГц. Память GDDR5 установлена в объёме 6144 Мбайт, а не 5120 Мбайт. Вполне очевидно, что конфигурация на 13 или 14 кластерах SMX в GPU "Kepler" от NVIDIA каким-то образом влияет и на подсистему памяти.

Новая информация привела к изменению спецификаций до приведенных в следующей таблице:

GF110 GK104 GK110 в Tesla K20
Техпроцесс 40 нм 28 нм 28 нм
Число транзисторов 3 млрд. 3,54 млрд. 7,1 млрд.
Площадь кристалла 530 мм² 294 мм² Около 600 мм²
TDP 225 Вт 225 Вт 225 Вт
Тактовая частота GPU 772 МГц 1006 МГц 732 МГц
Частота памяти 1000 МГц 1502 МГц 1014 или 1562 МГц
Тип памяти GDDR5 GDDR5 GDDR5
Объём памяти 1536 Мбайт 2048 Мбайт 6144 Мбайт
Ширина шины памяти 384 бит 256 бит 256 или 384 бит
Пропускная способность памяти 192 Гбайт/с 192,2 Гбайт/с 200 Гбайт/с
Потоковые процессоры 512 (1D) 1536 (1D) 2688 (1D)
Текстурные блоки 64 128 240
Кэш L1 64 кбайт 64 кбайт 64 кбайт
Кэш L2 768 кбайт 512 кбайт 1,5 Мбайт
ECC Память и кэш Только память Память и кэш
FP64 1/2 FP32 1/24 FP32 1/3 FP32

С тактовой частотой 705 МГц мы бы получили теоретическую производительность на уровне 3,94 терафлоп с одинарной точностью и 1,31 терафлоп с вычислениями двойной точности (ранее 3,52 и 1,17 TFLOPS). Память работает с пропускной способностью 200 Мбайт/с. Если предположить 384-битную шину, то память GDDR5 должна работать на 1014 МГц. В случае 256-битной шины - на 1562 МГц. В общей сложности Tesla K20 использует 5 Гбайт памяти GDDR5.

Возникают вопросы, как могут появиться разные данные по поводу ядер CUDA. С одной стороны, оба источника могут давать неточную информацию. Но мы предполагаем, что в Окриджской национальной лаборатории всё же знают, какое аппаратное обеспечение у них работает, поэтому мы бы стали прислушиваться, в первую очередь, к данной информации. Пока она не будет опровергнут. Также возможно, что у ранних образцов видеокарт Tesla K20 использовалось 13 кластеров SMX. А для финального продукта NVIDIA выбрала другое число кластеров.

Titan Board
Вычислительная плата Titan: 4x AMD Opteron 6274 + 4x NVIDIA Tesla K20 (фото: Anandtech)

Следует отметить, что GK110 представляет собой дизайн GPU исключительно для профессиональной сферы. Пока неизвестно, будет ли использоваться GPU NVIDIA GK110 для видеокарт потребительского уровня. Если это случится, то информация о вычислительных картах Tesla K20 позволяет предположить характеристики грядущих видеокарт GeForce на GK110.

В начале ноября ожидаются поставки первых карт Tesla K20 по цене 2950 евро. Другие детали, включая Hyper Q и Dynamic Parallelism, мы уже разъясняли раньше.