Hardwareluxx > Новости > Железо > Видеокарты > NVIDIA Tesla K20 и GK110 с 14 кластерами SMX и 2688 ядрами CUDA

NVIDIA Tesla K20 и GK110 с 14 кластерами SMX и 2688 ядрами CUDA

Опубликовано: 31.10.2012 в 15:12 Андрей Шиллинг

nvidia В середине октября от поставщика серверных стоек на GPU NVIDIA появилась информация, что Tesla K20 будет базироваться на GK110 с 13 кластерами SMX, каждый со 192 ядрами CUDA. На GTC 2012 NVIDIA упоминала о 2880 ядрах CUDA, то есть полной конфигурации с 15 кластерами SMX. Чуть раньше на этой неделе от Окриджской национальной лаборатории в Теннеси (США) появилась информация о завершении самого производительного суперкомпьютера Titan в мире. Он базируется на 18 688 GPU NVIDIA Tesla K20 и обеспечивает производительность больше 20 петафопов. Команда ресурса Anandtech посетила Titan и узнала ряд любопытных деталей, которые противоречат 13 кластерам SMX GK110, упоминавшимся ранее.

Как оказалось, GPU NVIDIA Tesla K20 оснащаются 2688 ядрами CUDA, то есть содержат 14 кластеров SMX. В общей сложности GPU содержат 7,1 млрд. транзисторов. По тактовой частоте тоже появилась любопытная информация. GPU работает на 732 МГц, а не а 702 МГц. Память GDDR5 установлена в объёме 6144 Мбайт, а не 5120 Мбайт. Вполне очевидно, что конфигурация на 13 или 14 кластерах SMX в GPU "Kepler" от NVIDIA каким-то образом влияет и на подсистему памяти.

Новая информация привела к изменению спецификаций до приведенных в следующей таблице:

	GF110	GK104	GK110 в Tesla K20
Техпроцесс	40 нм	28 нм	28 нм
Число транзисторов	3 млрд.	3,54 млрд.	7,1 млрд.
Площадь кристалла	530 мм²	294 мм²	Около 600 мм²
TDP	225 Вт	225 Вт	225 Вт
Тактовая частота GPU	772 МГц	1006 МГц	732 МГц
Частота памяти	1000 МГц	1502 МГц	1014 или 1562 МГц
Тип памяти	GDDR5	GDDR5	GDDR5
Объём памяти	1536 Мбайт	2048 Мбайт	6144 Мбайт
Ширина шины памяти	384 бит	256 бит	256 или 384 бит
Пропускная способность памяти	192 Гбайт/с	192,2 Гбайт/с	200 Гбайт/с
Потоковые процессоры	512 (1D)	1536 (1D)	2688 (1D)
Текстурные блоки	64	128	240
Кэш L1	64 кбайт	64 кбайт	64 кбайт
Кэш L2	768 кбайт	512 кбайт	1,5 Мбайт
ECC	Память и кэш	Только память	Память и кэш
FP64	1/2 FP32	1/24 FP32	1/3 FP32

С тактовой частотой 705 МГц мы бы получили теоретическую производительность на уровне 3,94 терафлоп с одинарной точностью и 1,31 терафлоп с вычислениями двойной точности (ранее 3,52 и 1,17 TFLOPS). Память работает с пропускной способностью 200 Мбайт/с. Если предположить 384-битную шину, то память GDDR5 должна работать на 1014 МГц. В случае 256-битной шины - на 1562 МГц. В общей сложности Tesla K20 использует 5 Гбайт памяти GDDR5.

Возникают вопросы, как могут появиться разные данные по поводу ядер CUDA. С одной стороны, оба источника могут давать неточную информацию. Но мы предполагаем, что в Окриджской национальной лаборатории всё же знают, какое аппаратное обеспечение у них работает, поэтому мы бы стали прислушиваться, в первую очередь, к данной информации. Пока она не будет опровергнут. Также возможно, что у ранних образцов видеокарт Tesla K20 использовалось 13 кластеров SMX. А для финального продукта NVIDIA выбрала другое число кластеров.

Titan Board — Вычислительная плата Titan: 4x AMD Opteron 6274 + 4x NVIDIA Tesla K20 (фото: Anandtech)

Следует отметить, что GK110 представляет собой дизайн GPU исключительно для профессиональной сферы. Пока неизвестно, будет ли использоваться GPU NVIDIA GK110 для видеокарт потребительского уровня. Если это случится, то информация о вычислительных картах Tesla K20 позволяет предположить характеристики грядущих видеокарт GeForce на GK110.

В начале ноября ожидаются поставки первых карт Tesla K20 по цене 2950 евро. Другие детали, включая Hyper Q и Dynamic Parallelism, мы уже разъясняли раньше.