Довольно сложно собрать всю информацию перед выходом следующего поколения GPU от AMD. Сам производитель сообщил некоторую техническую информацию, но о ней сложно судить о производительности готовящихся видеокарт Radeon RX Vega.
На прошлой неделе в интервью с одним из топ-менеджеров AMD Доном Волигроски всплыла фраза о том, что «производительность Vega выглядит неплохо на фоне GeForce GTX 1080 Ti и Titan Xp». В оригинале фраза звучит, как "Vega performance compared to the Geforce GTX 1080 Ti and the Titan Xp looks really nice." Вчера в сеть утекли первые результаты тестов в 3DMark, которые вызвали бурные дискуссии.
Но проверенных технических данных как не было, так и нет. С уверенностью можно утверждать только об использовании второго поколения памяти HBM. Но мы не знаем архитектурных подробностей, которые могут указывать на производительность. Да и подробности конфигурации памяти также неизвестны.
Тем не менее, недавно выпущенный патч для Linux открывает совершенно новую информацию. Но в большинстве она лишь подтверждает уже существующие догадки. Патч под названием «[PATCH 048/100] drm/amdgpu: implement GFX 9.0 support» обеспечивает поддержку новых архитектур. В нем есть несколько отсылок к Vega 10 GPU, который считается самым сложным и производительным чипом нового поколения GPU. GFX9, вероятно, является кодовым названием архитектуры Vega или Graphics Core Next 5 (GCN).
В патче можно найти следующие значения:
+ case CHIP_VEGA10:
+ adev->gfx.config.max_shader_engines = 4;
+ adev->gfx.config.max_tile_pipes = 8; //??
+ adev->gfx.config.max_cu_per_sh = 16;
+ adev->gfx.config.max_sh_per_se = 1;
+ adev->gfx.config.max_backends_per_se = 4;
+ adev->gfx.config.max_texture_channel_caches = 16;
+ adev->gfx.config.max_gprs = 256;
+ adev->gfx.config.max_gs_threads = 32;
+ adev->gfx.config.max_hw_contexts = 8;
Vega 10 должна насчитывать 64 ROP и 256 текстурных блоков. Интересны также отсылки к тайловому конвейеру, который позволяет проводить рендеринг изображения несколькими сегментами. Видимо, Vega будет поддерживать эту функцию, тогда как NVIDIA уже сейчас применяет её в чипах Pascal.
Также подтверждаются 4.096 потоковых процессоров, на что указывает четыре шейдерных движка, по 16 блоков CU в каждом и 64 шейдера в блоке (4 x 16 x 64 = 4.096).
Для сравнения перечислим значения для Fiji:
+ case CHIP_FIJI:
+ adev->gfx.config.max_shader_engines = 4;
+ adev->gfx.config.max_tile_pipes = 16;
+ adev->gfx.config.max_cu_per_sh = 16;
+ adev->gfx.config.max_sh_per_se = 1;
+ adev->gfx.config.max_backends_per_se = 4;
+ adev->gfx.config.max_texture_channel_caches = 16;
+ adev->gfx.config.max_gprs = 256;
+ adev->gfx.config.max_gs_threads = 32;
+ adev->gfx.config.max_hw_contexts = 8;
Для наглядности мы составили таблицу, где сравнили hi-end чипы AMD и NVIDIA:
Модель: | GP102 | Fiji | Vega 10 |
Характеристики | |||
---|---|---|---|
Техпроцесс: | 16 нм | 28 нм | 14 нм |
Транзисторы: | 12 млрд. | 8,9 млрд. | 12,8 млрд. |
Базовая частота GPU: | 1.480 МГц | - | - |
Частота GPU (Boost): | 1.582 МГц | 1.050 МГц | 1.200 |
Частота памяти: |
1.375 МГц | 500 МГц | 700 МГц |
Тип памяти: | GDDR5X | HBM1 | HBM2 |
Объем памяти: | 11 Гбайт | 4 Гбайт | 8 Гбайт |
Ширина шины памяти: | 352 бит | 4.096 бит | 2.048 бит |
Пропускная способность: | 484 Гбайт/с | 512 Гбайт/с | 358,4 Гбайт/с |
DirectX: | 12 | 12 | 12 |
Шейдеры: | 3.584 | 4.096 | 4.096 |
Текстурные блоки: | 224 | 256 | 256 |
ROP: | 88 | 64 | 64 |
TDP: | 250 Вт | 275 Вт | - |
Мы дополнили таблицу данными из других источников. Так, количество транзисторов можно вычислить исходя из размера чипа. Техпроцесс Vega 10 будет, вероятно, уменьшен до 14 нм. Размер GPU на изображениях и размер области HBM2 (7,75 мм × 11,87 мм и 91,99 мм²) дают площадь примерно от 520 до 540 мм². Так, Polaris 10 GPU при площади 232 мм² насчитывает 5,7 млрд. транзисторов. То есть Vega 10 размером 540 мм² будет содержать приблизительно 12,8 млрд. транзисторов.
Частота GPU составляет 1.200 МГц, а частота памяти равна 700 МГц, на что указывают данные бенчмарков. При этом пропускная способность составит «всего» 358,4 Гбайт/с. Если это действительно так, то AMD явно будет делать ставку на новую архитектуру памяти.