Страница 2: Тесты приложений для рабочих станций
Мы использовали драйверы NVIDIA Quadro R384 U4, GeForce 388.59 и AMD Radeon Pro Software 17.Q4.1. Мы установили соответствующие программные пакеты, в том числе Radeon ProRenderer для тестов рендеринга, чтобы полностью раскрыть потенциал видеокарт. То же самое касается и программных пакетов NVIDIA.
Luxmark 3.0
Первый тест - Luxmark 3.0, с помощью которого мы оценивали производительность OpenCL. Мы протестировали три пресета, результат выражен в семплах в секунду.
Blender
Второй тест - Blender. Мы использовали популярный бенчмарк Blender, а именно 3D-сцену, предложенную разработчиком. Чтобы Blender использовал для рендеринга GPU, необходимо выбрать в настройках соответствующий пункт. Там же следует выбрать GPU и для вычислений. Кроме того, мы увеличили размер Batch, то есть тайла на поток, с 16 до 256 пикселей. Все это позволит лучше нагружать GPU с несколькими сотнями или даже тысячами потоковых процессоров. Результат выводится в виде времени рендеринга сцены в секундах.
Adobe After Effects
Мы использовали Adobe After Effects для рендеринга заставки 4K с альфа-каналом. Как правило, мы готовим подобную заставку к каждой выставке, после чего используем ее для дальнейших роликов. И шести видеокартам для рабочих станций предстояло выполнить рендеринг заставки. Результат оценивался в виде времени, которое ушло на рендеринг.
V-Ray Benchmark
Продолжим с тестом V-Ray Benchmark. Он представляет собой синтетический бенчмарк Chaosgroup, создателя плагина V-Ray для различных пакетов 3D-рендеринга. Здесь мы вновь оценивали время рендеринга сцены.
Unreal Engine Infiltrator Rendering
Еще один интересный бенчмарк – рендеринг демо Infiltrator на Unreal Engine 4, которое NVIDIA часто использует на своих презентациях. До сих пор рендеринг в реальном времени не представляется возможным. Чтобы собрать все данные и 3D-модели для рендеринга демо в Unreal Engine Editor требуется приличная вычислительная производительность. Мы оценили время выполнения рендеринга.
GPUPI
GPUPI опирается на интерфейс OpenCL для вычисления числа Пи с помощью формулы Бэйли — Боруэйна — Плаффа. Вычисления разделяются на отдельные части, результат выдается в шестнадцатеричном формате. Каждая часть содержит определенную порцию вычислений по формуле BPP (Бэйли — Боруэйна — Плаффа). Таким образом, вычисления можно разбить по сотням или даже тысячам потоковых процессоров GPU. Производительность вычислений очень сильно зависит от скорости расчетов FP64 на GPU.