> > > > Обнаружен NVIDIA GPU с 7.552 ядрами CUDA (обновление: уже с 7.936 ядрами)

Обнаружен NVIDIA GPU с 7.552 ядрами CUDA (обновление: уже с 7.936 ядрами)

Опубликовано:

nvidia23 марта в Сан-Хосе откроется конференция NVIDIA GPU Technology Conference - конечно, если COVID19 не вмешается. Пленарный доклад на конференции будет посвящен представлению вычислительных ускорителей HPC или карт GPGPU. Они будут опираться на архитектуру Ampere, подробностей которой пока не было представлено.

Пользователь твитера @_rogame обнаружил интересные подробности в базе данных Geekbench, касающиеся ранее неизвестных NVIDIA GPU. Следует отметить, что результаты были внесены где-то в октябре-ноябре прошлого года, но обнаружены они были только сейчас.

GPU опирается на полные 7.552 или 6.912 ядра CUDA (потоковые процессоры). Для сравнения: GeForce RTX 2080 Ti использует 4.352 потоковых процессора, Quadro RTX 6000/8000 - 4.608, а Tesla V100 (with GV100 GPU), номинальный предшественник карт Ampere, до 5.120.

Гипотетический GA100 GPU с 7.552 или 6.912 потоковыми процессорами получит почти на 50% больше данных блоков. Возможно, NVIDIA сохранит структуру с 64 потоковыми процессорами в одном Streaming Multiprocessor (SM), то есть 118 или 108 SM в GPU. Здесь пока можно только гадать, но множитель 64 вполне вероятен.

Остальные параметры тоже неизвестны. Архитектура Volta предлагает 64 блока FP32, 64 INT32 и 32 FP64 на SM. Также имеются восемь ядер Tensor и четыре текстурных блока. Ядра RT появились только в архитектуре Turing. Пока не совсем понятно, будет ли от них польза в сегменте HPC.

В результатах тестов Geekbench приведен объем видеопамяти 24 и 47 Гбайт. Последний вариант 47 Гбайт, скорее всего, соответствует 48 Гбайт, из-за какой-то ошибки объем определен неверно. Видеопамять 48 Гбайт уже встречалась, например, на той же Quadro RTX 8000, но пока неизвестно, идет речь о GDDR6 или HBM2. Память HBM2 может подразумевать 48 Гбайт в шести чипах по 8 Гбайт каждый. С данным количеством чипов интерфейс памяти составляет 6.144 бита. С пропускной способностью 460 Гбайт/с на чип мы получаем в сумме 2,76 Тбайт/с. Но так ли это будет на самом деле - неизвестно.

Информацию о тактовых частотах вряд ли стоит учитывать, поскольку образцы довольно ранние. В случае Tesla V100 мы получаем 1.245 МГц в варианте PCI Express. У Ampere используется техпроцесс 7 нм, поэтому можно ожидать более высоких тактовых частот, нежели заявленные 1.110 МГц.

Next-Gen HPC или GeForce?

Объем памяти подразумевает, что речь идет о чипах Ampere для сегмента HPC. Пока неизвестно, найдут ли они применение в видеокартах GeForce. Слишком мало пока имеется информации.

По техпроцессу можно ожидать 7 или 8 нм. По памяти в сегменте HPC вероятно использование HBM2, видеокарты GeForce обычно оснащаются менее дорогой памятью. Будем надеяться, что на GTC 2020 в конце марта мы получим новые подробности.

Обновление: еще одна модель GPU с 7.936 потоковыми процессорами

В онлайновой базе данных Geekbench был обнаружен еще один GPU, который содержит 124 SM, то есть 7.936 потоковых процессоров. Результаты обнаружил пользователь @W_At_Ar_U. GPU работал на частоте 1,1 ГГц с 32 Гбайт памяти на 1,2 ГГц. Результаты тоже были внесены в октябре прошлого года.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).