Hardwareluxx > Новости > Железо > Видеокарты > Патч для Linux открывает новые детали чипа Vega 10

Патч для Linux открывает новые детали чипа Vega 10

Опубликовано: 03.05.2017 в 18:04 Андрей Шиллинг

Довольно сложно собрать всю информацию перед выходом следующего поколения GPU от AMD. Сам производитель сообщил некоторую техническую информацию, но о ней сложно судить о производительности готовящихся видеокарт Radeon RX Vega.

На прошлой неделе в интервью с одним из топ-менеджеров AMD Доном Волигроски всплыла фраза о том, что «производительность Vega выглядит неплохо на фоне GeForce GTX 1080 Ti и Titan Xp». В оригинале фраза звучит, как "Vega performance compared to the Geforce GTX 1080 Ti and the Titan Xp looks really nice." Вчера в сеть утекли первые результаты тестов в 3DMark, которые вызвали бурные дискуссии.

Но проверенных технических данных как не было, так и нет. С уверенностью можно утверждать только об использовании второго поколения памяти HBM. Но мы не знаем архитектурных подробностей, которые могут указывать на производительность. Да и подробности конфигурации памяти также неизвестны.

Тем не менее, недавно выпущенный патч для Linux открывает совершенно новую информацию. Но в большинстве она лишь подтверждает уже существующие догадки. Патч под названием «[PATCH 048/100] drm/amdgpu: implement GFX 9.0 support» обеспечивает поддержку новых архитектур. В нем есть несколько отсылок к Vega 10 GPU, который считается самым сложным и производительным чипом нового поколения GPU. GFX9, вероятно, является кодовым названием архитектуры Vega или Graphics Core Next 5 (GCN).

В патче можно найти следующие значения:

+ case CHIP_VEGA10:
+ adev->gfx.config.max_shader_engines = 4;
+ adev->gfx.config.max_tile_pipes = 8; //??
+ adev->gfx.config.max_cu_per_sh = 16;
+ adev->gfx.config.max_sh_per_se = 1;
+ adev->gfx.config.max_backends_per_se = 4;
+ adev->gfx.config.max_texture_channel_caches = 16;
+ adev->gfx.config.max_gprs = 256;
+ adev->gfx.config.max_gs_threads = 32;
+ adev->gfx.config.max_hw_contexts = 8;

Vega 10 должна насчитывать 64 ROP и 256 текстурных блоков. Интересны также отсылки к тайловому конвейеру, который позволяет проводить рендеринг изображения несколькими сегментами. Видимо, Vega будет поддерживать эту функцию, тогда как NVIDIA уже сейчас применяет её в чипах Pascal.

Также подтверждаются 4.096 потоковых процессоров, на что указывает четыре шейдерных движка, по 16 блоков CU в каждом и 64 шейдера в блоке (4 x 16 x 64 = 4.096).

Для сравнения перечислим значения для Fiji:

+ case CHIP_FIJI:
+ adev->gfx.config.max_shader_engines = 4;
+ adev->gfx.config.max_tile_pipes = 16;
+ adev->gfx.config.max_cu_per_sh = 16;
+ adev->gfx.config.max_sh_per_se = 1;
+ adev->gfx.config.max_backends_per_se = 4;
+ adev->gfx.config.max_texture_channel_caches = 16;
+ adev->gfx.config.max_gprs = 256;
+ adev->gfx.config.max_gs_threads = 32;
+ adev->gfx.config.max_hw_contexts = 8;

Для наглядности мы составили таблицу, где сравнили hi-end чипы AMD и NVIDIA:

Технические данные GPU в сравнении
Характеристики
Модель:	GP102	Fiji	Vega 10
Техпроцесс:	16 нм	28 нм	14 нм
Транзисторы:	12 млрд.	8,9 млрд.	12,8 млрд.
Базовая частота GPU:	1.480 МГц	-	-
Частота GPU (Boost):	1.582 МГц	1.050 МГц	1.200
Частота памяти:	1.375 МГц	500 МГц	700 МГц
Тип памяти:	GDDR5X	HBM1	HBM2
Объем памяти:	11 Гбайт	4 Гбайт	8 Гбайт
Ширина шины памяти:	352 бит	4.096 бит	2.048 бит
Пропускная способность:	484 Гбайт/с	512 Гбайт/с	358,4 Гбайт/с
DirectX:	12	12	12
Шейдеры:	3.584	4.096	4.096
Текстурные блоки:	224	256	256
ROP:	88	64	64
TDP:	250 Вт	275 Вт	-

Мы дополнили таблицу данными из других источников. Так, количество транзисторов можно вычислить исходя из размера чипа. Техпроцесс Vega 10 будет, вероятно, уменьшен до 14 нм. Размер GPU на изображениях и размер области HBM2 (7,75 мм × 11,87 мм и 91,99 мм²) дают площадь примерно от 520 до 540 мм². Так, Polaris 10 GPU при площади 232 мм² насчитывает 5,7 млрд. транзисторов. То есть Vega 10 размером 540 мм² будет содержать приблизительно 12,8 млрд. транзисторов.

Частота GPU составляет 1.200 МГц, а частота памяти равна 700 МГц, на что указывают данные бенчмарков. При этом пропускная способность составит «всего» 358,4 Гбайт/с. Если это действительно так, то AMD явно будет делать ставку на новую архитектуру памяти.