> > > > Новые GPU RTX для настольных и мобильных рабочих станций

Новые GPU RTX для настольных и мобильных рабочих станций

Опубликовано:

nvidiaПомимо нового процессора ARM для дата-центров под названием Grace и новое поколения Bluefield 3 DPU, NVIDIA представила новые RTX GPU, которые ориентированы на мобильные и настольные рабочие станции.

NVIDIA RTX A6000, единственная видеокарта на Ampere GPU для рабочих станций, представленная в октябре прошлого года, теперь дополняется моделями A4000 и A5000. Все новые GPU построены на ранее вышедших настольных вариантах. Используются хорошо известные GA106, GA104 и GA102 GPU, но частично в отличающихся конфигурациях.

Будут объявлены два настольных решения A4000 и A5000.

Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).

Сравнение видеокарт
  RTX A6000RTX A5000RTX A4000
GPUGA102GA102GA104
Число транзисторов 28 млрд.28 млрд.17,4 млрд.
Техпроцесс 8 нм8 нм8 нм
Площадь кристалла 628,4 мм²628,4 мм²392,5 мм²
Число FP32 ALU 10.7528.1926.144
Число INT32 ALU 5.3764.0963.072
Число SM 846448
Ядра Tensor 336256192
Ядра RT 846448
Производительность FP32 38,7 TFLOPS27,8 TFLOPS19,2 TFLOPS
Производительность RT 75,6 TFLOPS54,2 TFLOPS37,4 TFLOPS
Производительность Tensor 309,7 TFLOPS222,2 TFLOPS153,4 TFLOPS
Емкость памяти 48 GB24 GB16 GB
Тип памяти GDDR6GDDR6GDDR6
Ширина шины памяти 384 бит384 бит256 бит
Пропускная способность памяти 768 Гбайт/с768 Гбайт/с448 Гбайт/с
TDP 300 Вт230 Вт140 Вт
Цена 6.999 евро--

NVIDIA поднимает всю линейку RTX. Видеокарты RTX A5000 позиционируются примерно на уровень RTX 6000 ранее. То же самое касается RTX A4000. Вычислительная производительность FP32 у RTX A5000 более, чем удвоилась, объем памяти увеличился с 16 до 24 Гбайт. Энергопотребление осталось примерно на прежнем уровне. Благодаря более широкому интерфейсу памяти, пропускная способность GDDR6 тоже увеличилась.

Похожую ситуацию мы наблюдаем и с RTX A4000. Однако число вычислительных блоков FP32 увеличилось "всего" на 50%. Конфигурация памяти удвоилась с 8 до 16 Гбайт. Обе видеокарты поддерживают PCI Express 4.0, но только на RTX A5000 есть NVLink, а также поддержка Single Root Input/Output Virtualization (SR-IOV) помимо GPU Passthrough.

Для RTX A5000 NVIDIA предусмотрела кулер с радиальным вентилятором в задней части видеокарты, толщина составляет два слота. Горячий воздух выходит наружу через отверстия в слотовой заглушке, а не остается внутри рабочей станции. У RTX A4000 толщина составляет всего один слот.

Видеокарты RTX A4000 и RTX A6000 должны выйти до конца апреля.

От Ampere до Turing в ноутбуках

На архитектуре Ampere объявлены четыре GPU для рабочих станций, еще два опираются на архитектуру Turing. Ниже представлен обзор:

Сравнение видеокарт
  RTX A2000RTX A3000RTX A4000RTX A5000
GPU GA106GA104GA104GA102
Число транзисторов 12 млрд.
17,4 млрд.17,4 млрд.28 млрд.
Техпроцесс 8 нм8 нм8 нм8 нм
Площадь кристалла 276 мм²
392,5 мм²392,5 мм²628,4 мм²
Число FP32 ALU 2.5604.0965.1206.144
Число INT32 ALU 1.2802.0482.5603.072
Число SM 20324048
Ядра Tensor 80128160192
Ядра RT 20324048
Производительность FP32 9,3 TFLOPS12,8 TFLOPS17,8 TFLOPS21,7 TFLOPS
Производительность RT 18,2 TFLOPS25,0 TFLOPS34,8 TFLOPS75,6 TFLOPS
Производительность Tensor 74,7 TFLOPS102,2 TFLOPS142,5 TFLOPS174,0 TFLOPS
Емкость памяти 4 GB6 GB8 GB16 GB
Тип памяти GDDR6GDDR6GDDR6GDDR6
Ширина шины памяти 128 бит192 бит256 бит256 бит
Пропускная способность памяти 192 Гбайт/с264 Гбайт/с384 Гбайт/с448 Гбайт/с
TDP 35 - 95 Вт60 - 130 Вт80 - 140 Вт80 - 165 Вт

Четыре мобильных RTX GPU используют архитектуру Ampere, здесь NVIDIA решила задействовать весь диапазон от GA106 до GA102. Таким образом, число SM составляет от 20 до 48, вычислительная производительность FP32 от 10 до более 20 TFLOPS. Конфигурация памяти - от 5 до 16 Гбайт. В ноутбуках TDP GPU можно конфигурировать в зависимости от возможностей охлаждения. У младшей модели поддерживается от 35 до 95 Вт, в случае же RTX A5000 диапазон составляет от 80 до 165 Вт.

Также упомянем и два новых Turing GPU для мобильных рабочих станций.

Сравнение видеокарт
  T600T1200
Число FP32 ALU 8961.024
Число INT32 ALU 8961.024
Число SM 1416
Ядра Tensor --
Ядра RT --
Производительность FP32 2,5 TFLOPS3,7 TFLOPS
Производительность RT --
Производительность Tensor --
Емкость памяти 4 GB4 GB
Тип памяти GDDR6GDDR6
Ширина шины памяти 128 бит128 бит
Пропускная способность памяти 160 Гбайт/с192 Гбайт/с
TDP 25 Вт35 - 95 Вт

Оба GPU на основе Turing ориентированы на начальный сегмент, что видно по урезанию функциональных блоков RT и Tensor Core. Объем видеопамяти ограничен всего 4 Гбайт, также и скорость подключения меняется.

Все новые мобильные видеокарты RTX будут доступны в ноутбуках, начиная со второго квартала. Цены будут зависеть от остального оснащения.