Самый быстрый суперкомпьютер: Summit достигает производительности 200 PFLOPS

PDFПечатьE-mail

Опубликовано:
Андрей Шиллинг

summitОчередной этап гонки суперкомпьютеров в самом разгаре, и США вновь возглавляет список. Планку подняла Национальная лаборатория Ок-Ридж (Oak Ridge National Laboratory) - суперкомпьютер Summit достиг производительности в 200 PFLOPS в вычислениях FP64 (двойная точность) и 3,3 EFLOPS в смешанной точности, включая INT8. Первый показатель значитально выше, чем 125 PFLOPS у бывшего лидера Sunway Taihu Light.

Summit состоит из 4.608 узлов с жидкостным охлаждением, в которых и находится все оборудование. Это, в свою очередь, по два процессора IBM Power9, каждый из которых располагает 22 ядрами CPU и способнен работать с 88 потоками одновременно. Максимальная частота такого процессора составляет 3,1 ГГц. Каждый сокет также адресует 8 Тбайт памяти DDR4 - всего 75 Пбайт. Каждый сервер оснащен шестью ускорителями Tesla V100 в формате SMX2. Каждый из ускорителей насчитывает по 5.120 потоковых процессоров и по 640 специальных ядер Tensor, которые очень важны особенно в вычислениях INT8. Однако неизвестно, сколько памяти HBM2 использует каждый ускоритель, так как есть версии с 16 или 32 Гбайт VRAM.

Всего компьютер оснащен 27.648 вычислительными ускорителями Tesla V100. Такой компьютер является крайне важным заказом для NVIDIA. Тем не менее, значения 200 PFLOPS и 3.3 EFLOPS являются полностью теоретическими, и будет интересно посмотреть, какое в итоге место займет Summit в списке Top500 суперкомпьютеров, и какие значения будут указаны там. Некоторые тесты опираются исключительно на производительность GPU-ускорителей, а другие учитывают также скорость интерконнекта. Пропускную способность последнего владелец суперкомпьютера не называет, но известно, что процессоры IBM и Tesla V100 соединяются при помощи NVLINK 2.0, а для связи серверов между собой служит InfiniBand Fat Tree.

Summit потребляет до 15 Мегаватт. Реальная производительность также покажет, насколько эффективным окажется подобное решение.