Страница 6: Graphics Core Next (2)

presentation-16-rs

У линейки Radeon HD 7000 используется движок тесселяции девятого поколения. В движке улучшилось повторное использование данных вершин, была оптимизирована буферизация данных, а также и система кэширования параметров.

presentation-20-rs

В результате движок тесселяции 9 поколения оказывается вплоть до четырех раз быстрее восьмого поколения в семействе Radeon HD 6900. Повышенная производительность будет особенно заметна на высоких уровнях тесселяции (15 и выше). Конечно, выигрыш вы получите только в играх и приложениях, которые используют тесселяцию.

presentation-17-rs

За последние несколько лет Nvidia серьёзно продвинулась в деле использования своих GPU для вычислений. Во-первых, повлияла отличная поддержка со стороны Nvidia, а во вторых и то, что архитектура Fermi была изначально нацелена на вычисления.

AMD прекрасно это осознает, и мы получили достойный ответ вместе с архитектурой "Southern Islands". Помимо уже рассмотренных фундаментальных улучшений архитектуры GCN, AMD ориентировала и другие компоненты GPU на вычисления. Так, в любом GPU "Tahiti" вы обнаружите два движка ACE (Asynchronous Compute Engine). Они работают независимо друг от друга, параллельно с GCP (Graphics Command Processor). Роль двух ACE заключается в максимально эффективном распределении математических операций. Два движка DMA (Direct Memory Access) обеспечивают прямой доступ к памяти без использования CPU. Два движка DMA напрямую связываются с кэшем L2 и двумя ACE. Поэтому данные для расчётов могут предоставляться вычислительным движкам намного быстрее. AMD утверждает о том, что может нагрузить шину PCI Express с пропускной способностью 16 Гбайт/с в обоих направлениях.

presentation-18-rs

AMD указывает производительность на уровне 4,5 терафлопов при работе с операциями с плавающей запятой с одинарной точностью. Что касается двойной точности, то GPU "Tahiti" даёт вычислительную производительность 947 GFLOPS. Для сравнения, у GPU GF110 вычислительная производительность составляет 1,58 терафлопа с одинарной точностью. а GPU Cayman XT давал 2,7 терафлопа с одинарной точностью и 675 GFOPS с двойной точностью. Но всё это, конечно, теоретические показатели, которые не имеют никакого значения, если экосистема не оптимизирована под архитектуру. AMD также обеспечивает поддержку ECC для памяти DRAM и SRAM. Кроме того, чипы "Southern Islands" будут с самого начала поддерживать OpenCL 1.2, DirectCompute 11.1 и C++ AMP. Поэтому в ближайшем времени на рынке можно ожидать появление профессиональных видеокарт FirePro, ориентированных на вычисления.