> > > > Tesla запускает один из самых быстрых суперкомпьютеров

Tesla запускает один из самых быстрых суперкомпьютеров

Опубликовано:

tesla motorsНа своей конференции Computer Vision and Pattern Recognition (CVPR) 2021 Tesla раскрыла подобности своего суперкомпьютера. В конце июня список суперкомпьютеров top500 будет обновлен. Но в нем присутствуют только публичные системы, которые используются для научных целей. Однако многие компании строят собственные суперкомпьютеры для внутреннего использования, в том числе это касается и Tesla.

Андрей Карпатый, директор подразделения ИИ в Tesla, представил презентацию и рассказал о третьем, самом последнем кластере суперкомпьютера Tesla. Он состоит из 720 узлов, каждый с восемью GPU-ускорителями NVIDIA A100. Что дает в сумме 5.760 GPU с 80 Гбайт видеопамяти каждый. Однако неизвестно, какие именно процессоры используются в узлах. Вероятно, AMD EPYC, которые могут подключаться к ускорителям A100 через PCI Express 4.0 для быстрого обмена данными. Восемь GPU в каждом узле связаны друг с другом через NVLink.

Благодаря одним только ускорителям A100, система показывает вычислительную производительность 1,8 ExaFLOPS при расчетах FP16. Поскольку потоковые процессоры и ядра Tensor поддерживают вычисления FP64, система показывает здесь тоже приличный результат 56 PFLOPS. В итоге суперкомпьютер Tesla будет среди десяти самых быстрых систем Top500.

Если оставить в стороне чистую вычислительную производительность, 720 узлов работают с 10 Пбайт дисковым пространством на NVMe. Среди прочего, на массив записано порядка 1,5 Пбайт данных для тренировки автомобилей Tesla. Узлы подключены друг к другу интерконнектом с пропускной способностью 640 Тбит/с, что тоже весьма немало. Высокая вычислительная производительность ускорителей A100 должна поддерживаться быстрым интерконнектом и скоростными накопителями.

Честно говоря, частные компании довольно редко могут похвастаться подобными высокопроизводительными суперкомпьютерами. По поводу списка суперкомпьютеров Top500 есть немало критики, поскольку бенчмарк Pinpack в составе тестов уже не имеет прежнего практического значения. Как можно видеть на примере Tesla, мощные суперкомпьютеры сегодня работают в самых разных областях, и вычислительная производительность ИИ становится все более важной.

На презентации обсуждался только один кластер из трех. Так что в распоряжении Tesla есть больше суперкомпьютеров, разве что другие кластеры могут опираться не на самые современные компоненты. Но общая вычислительная производительность Tesla может быть даже выше, чем мы здесь видим. Она нужна для тренировки нейросетей и инференса. Что позволяет Tesla симулировать тестовые заезды автомобилей и улучшать автопилот.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).

Социальные сети

комментарии (0)

Войдите, чтобы оставить комментарий