MLCommons – консорциум различных производителей, целью которого является предоставление независимых и сопоставимых бенчмарков для оборудования центров обработки данных. Сегодня он опубликовал результаты теста Inference 4.0. В нем дебютировал ускоритель NVIDIA H200, который также основан на архитектуре Hopper и имеет ту же ступень расширения, что и ускоритель NVIDIA H200, но использует 141 ГБ HBM3E вместо 80 ГБ HBM2.
HBM3E будет использоваться во всех...

... читать далее