> > > > Патч для Linux открывает новые детали чипа Vega 10

Патч для Linux открывает новые детали чипа Vega 10

Опубликовано:

amd-vega-logoДовольно сложно собрать всю информацию перед выходом следующего поколения GPU от AMD. Сам производитель сообщил некоторую техническую информацию, но о ней сложно судить о производительности готовящихся видеокарт Radeon RX Vega.

На прошлой неделе в интервью с одним из топ-менеджеров AMD Доном Волигроски всплыла фраза о том, что «производительность Vega выглядит неплохо на фоне GeForce GTX 1080 Ti и Titan Xp». В оригинале фраза звучит, как "Vega performance compared to the Geforce GTX 1080 Ti and the Titan Xp looks really nice." Вчера в сеть утекли первые результаты тестов в 3DMark, которые вызвали бурные дискуссии.

Но проверенных технических данных как не было, так и нет. С уверенностью можно утверждать только об использовании второго поколения памяти HBM. Но мы не знаем архитектурных подробностей, которые могут указывать на производительность. Да и подробности конфигурации памяти также неизвестны.

Тем не менее, недавно выпущенный патч для Linux открывает совершенно новую информацию. Но в большинстве она лишь подтверждает уже существующие догадки. Патч под названием «[PATCH 048/100] drm/amdgpu: implement GFX 9.0 support» обеспечивает поддержку новых архитектур. В нем есть несколько отсылок к Vega 10 GPU, который считается самым сложным и производительным чипом нового поколения GPU. GFX9, вероятно, является кодовым названием архитектуры Vega или Graphics Core Next 5 (GCN).

В патче можно найти следующие значения:

+ case CHIP_VEGA10:
+ adev->gfx.config.max_shader_engines = 4;
+ adev->gfx.config.max_tile_pipes = 8; //??
+ adev->gfx.config.max_cu_per_sh = 16;
+ adev->gfx.config.max_sh_per_se = 1;
+ adev->gfx.config.max_backends_per_se = 4;
+ adev->gfx.config.max_texture_channel_caches = 16;
+ adev->gfx.config.max_gprs = 256;
+ adev->gfx.config.max_gs_threads = 32;
+ adev->gfx.config.max_hw_contexts = 8;

Vega 10 должна насчитывать 64 ROP и 256 текстурных блоков. Интересны также отсылки к тайловому конвейеру, который позволяет проводить рендеринг изображения несколькими сегментами. Видимо, Vega будет поддерживать эту функцию, тогда как NVIDIA уже сейчас применяет её в чипах Pascal.

Также подтверждаются 4.096 потоковых процессоров, на что указывает четыре шейдерных движка, по 16 блоков CU в каждом и 64 шейдера в блоке (4 x 16 x 64 = 4.096).

Для сравнения перечислим значения для Fiji:

+ case CHIP_FIJI:
+ adev->gfx.config.max_shader_engines = 4;
+ adev->gfx.config.max_tile_pipes = 16;
+ adev->gfx.config.max_cu_per_sh = 16;
+ adev->gfx.config.max_sh_per_se = 1;
+ adev->gfx.config.max_backends_per_se = 4;
+ adev->gfx.config.max_texture_channel_caches = 16;
+ adev->gfx.config.max_gprs = 256;
+ adev->gfx.config.max_gs_threads = 32;
+ adev->gfx.config.max_hw_contexts = 8;

Для наглядности мы составили таблицу, где сравнили hi-end чипы AMD и NVIDIA:

Технические данные GPU в сравнении
Модель: GP102 Fiji Vega 10
Характеристики
Техпроцесс: 16 нм 28 нм 14 нм
Транзисторы: 12 млрд. 8,9 млрд. 12,8 млрд.
Базовая частота GPU: 1.480 МГц - -
Частота GPU (Boost): 1.582 МГц 1.050 МГц 1.200

Частота памяти:

1.375 МГц 500 МГц 700 МГц
Тип памяти: GDDR5X HBM1 HBM2
Объем памяти: 11 Гбайт 4 Гбайт 8 Гбайт
Ширина шины памяти: 352 бит 4.096 бит 2.048 бит
Пропускная способность: 484 Гбайт/с 512 Гбайт/с 358,4 Гбайт/с
DirectX: 12 12 12
Шейдеры: 3.584 4.096 4.096
Текстурные блоки: 224 256 256
ROP: 88 64 64
TDP: 250 Вт 275 Вт -

Мы дополнили таблицу данными из других источников. Так, количество транзисторов можно вычислить исходя из размера чипа. Техпроцесс Vega 10 будет, вероятно, уменьшен до 14 нм. Размер GPU на изображениях и размер области HBM2 (7,75 мм × 11,87 мм и 91,99 мм²) дают площадь примерно от 520 до 540 мм². Так, Polaris 10 GPU при площади 232 мм² насчитывает 5,7 млрд. транзисторов. То есть Vega 10 размером 540 мм² будет содержать приблизительно 12,8 млрд. транзисторов.

Частота GPU составляет 1.200 МГц, а частота памяти равна 700 МГц, на что указывают данные бенчмарков. При этом пропускная способность составит «всего» 358,4 Гбайт/с. Если это действительно так, то AMD явно будет делать ставку на новую архитектуру памяти.