На своем пленарном докладе в рамках конференции SIGGRAPH NVIDIA представила первые подробности архитектуры Turing и объявила первые ускорители - три карты Quadro RTX. Анонс игровых видеокарт GeForce ожидается на выставке GamesCom, причем новинки тоже могут базироваться на архитектуре Turing. NVIDIA не говорила об этом на SIGGRAPH, но хэштег #BeForTheGame в социальных сетях говорит сам за себя.
На коротком видеоролике, по крайней мере, был дан ответ насчет названия новой линейки. На скриншотах показаны выдержки из чатов. Можно заметить "RoyTeX", "Not_11"/"Mac-20", "Eight-Tee" и "AlanaT", что явно указывает на "RTX", "GeForce 2080" и "Alan Turing". Все это хорошо сочетается с информацией с представленного минувшей ночью пленарного доклада SIGGRAPH, так что нового поколения видеокарт GeForce ждать осталось недолго.
Конечно, интереснее всего технические подробности. NVIDIA представила три карты Quadro RTX на основе двух вариантов GPU Turing. Увидим ли мы оба чипа в видеокартах GeForce - неизвестно. Скорее всего, младшая версия GPU выйдет в видеокарте GeForce RTX 2080, а несколько позже мы получим и старший GPU в виде GeForce RTX 2080 Ti, например.
На основе известных сведений об архитектуре Turing и представленных ускорителях Quadro RTX мы попытались сравнить технические спецификации с нынешними видеокартами GeForce на архитектуре Pascal. Часть информации можно перенести с Quadro RTX 8000/6000. Однако у нас пока нет части информации о Quadro RTX 5000, что помогло бы прояснить ситуацию.
И вновь мы пытаемся перенести полученную на пленарном докладе информацию на игровые видеокарты. Впрочем, подобное предположение может быть ошибочно, если NVIDIA не пожелает использовать крупный чип Turing для игровых видеокарт. Все же они стоят значительно дешевле игровых ускорителей. Поэтому к информации в таблице стоит отнестись с долей скепсиса, поскольку она лишь теоретически расширяет архитектуру Turing до игрового сегмента GeForce.
Модель | GeForce RTX 2080 Ti | GeForce RTX 2080 | GeForce GTX 1080 Ti | GeForce GTX 1080 | Titan V |
Цена | - | - | 700 евро | 460 евро | 3.100 евро |
Технические спецификации | |||||
---|---|---|---|---|---|
Архитектура GPU | Turing | Turing | Pascal | Pascal | Volta |
GPU | - | - | GP102 | GP104 | GV100 |
Техпроцесс | 12 нм | 12 нм | 16 нм | 16 нм | 12 нм |
Число транзисторов | 18,6 млрд. | ≈ 12,4 млрд. | 12 млрд. | 7,2 млрд. | 21,1 млрд. |
Площадь кристалла | 754 мм² | - | 471 мм² | 314 мм² | 815 мм² |
Потоковые процессоры | 4.608 | 3.072 | 3.584 | 2.560 | 5.120 |
Ядра Tensor | 576 | 384 | - | - | 640 |
Ядра RT | 576 | 384 | - | - | - |
Частота GPU | ≈ 1.730 МГц | ≈ 1.700 МГц | 1.582 МГц | 1.733 МГц | 1.455 МГц |
Память | 12 GB GDDR6 | 8 GB GDDR6 | 11 GB GDDR5X | 8 GB GDDR5X | 12 GB HBM2 |
Интерфейс памяти | 384 бит | 256 бит | 352 бит | 256 бит | 3.072 бит |
Пропускная способность | 672 Гбайт/с | 448 Гбайт/с | 484 Гбайт/с | 320 Гбайт/с | 652,3 Гбайт/с |
Производительность FP16 | 32 TFLOPS | ≈ 21 TFLOPS | - | - | 30 TFLOPS |
Производительность FP32 | 16 TFLOPS | ≈10,5 TFLOPS | 11,2 TFLOPS | 8 TFLOPS | 15 TFLOPS |
Производительность FP64 | - | - | 370 GFLOPS | 260 GFLOPS | 7,5 TFLOPS |
Тензорная производительность | 500 TOPS (INT4) | ≈ 330 TOPS (INT4) | - | - | 120 TOPS (FP16) |
TDP | 250 Вт | 180 Вт | 250 Вт | 180 Вт | 250 Вт |
Пока что мы знаем о двух уровнях архитектуры Turing. Первый с 4.608 потоковыми процессорами, второй с 3.072. Затем идут ядра Tensor и RT, по 576 и 384, соответственно. До сих пор они были не так важны для игровых видеокарт, но все может измениться с поколением Turing и трассировкой лучей в реальном времени. NVIDIA ожидает, что первые игры с поддержкой технологии появятся в следующем году.
Если учесть площадь чипа и сравнить его с GV100 GPU, скорее всего, NVIDIA производит кристаллы по 12-нм техпроцессу на заводах TSMC. Так что о 7-нм техпроцессе пока говорить рано. Что касается тактовых частот, то информации пока тоже не хватает. Но вычислительная производительность, приведенная для Quadro RTX 8000, позволяет теоретически вывести 1.700 МГц. У производных GeForce частота может быть и выше.
Весьма интересен вопрос интерфейса памяти и доступной емкости. Если ориентироваться на спецификации NVIDIA, старшая версия GPU Turing будет оснащаться 384-битным интерфейсом, младший GPU - 256-битным. Если учесть 12 или 8 чипов памяти GDDR6 и частоту 1.750 МГц, мы получаем пропускную способность 672 или 448 Гбайт/с, соответственно. То есть интерфейс памяти работает примерно на 40% быстрее, чем в случае поколения Pascal. Емкость памяти у младшего GPU может быть 8 или 16 Гбайт, мы предполагаем 8 Гбайт. У старшей версии объем может составлять 12 или 24 Гбайт (48 Гбайт в случае Quadro RTX 8000), здесь 12 Гбайт кажутся более реалистичным вариантом.
NVIDIA указывает тепловой пакет Quadro RTX 8000 на уровне 300 Вт, но здесь 30 Вт можно вычест на VirtualLink. Для GeForce RTX 2080 Ti можно ожидать 250 Вт, в случае GeForce RTX 2080 - 180 Вт, что аналогично предшествующим моделям.
NVIDIA приглашает на празднование GeForce Gaming в следующий понедельник, 20 августа, в 19.00 по Москве. Ожидается онлайн-трансляция. Будем надеяться, что тогда мы узнаем подробности GeForce RTX 2080.