admin / 19.08.2018

Что такое кэширование шейдеров

AMD Fury X – слишком мало, слишком поздно?

Если бы новый флагманский графический адаптер от AMD появился месяц назад или два, то на фоне конкурентов он выглядел бы намного более впечатляющим, а эффект, который он воспроизвел для компании и бренда Radeon в целом, был бы гораздо более значимым.

Fury X – это действительно великолепный продукт, в центре которого стоит один из, пожалуй, наиболее инновационных графических процессоров, созданных AMD в последние годы. Добавьте к этому новую революционную технологию организации локального видео буфера (High Bandwidth Memory) – инновация, которую в лагере NVIDIA вы не увидите вплоть до следующего года, когда ожидается появление Pascal. Давайте не будем забывать и о довольно оригинальной общей конструкции Fury X – флагманский видеоадаптер имеет нехарактерно скромные для модели подобного класса размеры и стандартно предлагается в комплекте с водяным охлаждением.

Короче – ультимативное искушение для самых заядлых геймеров и энтузиастов. К сожалению, вопреки его впечатляющим техническим характеристикам и не менее впечатляющим результатам, Fury X появился немного поздно и вряд ли получит все внимание, которого в принципе заслуживает.

Быстрый и яростный

Потому что ранее мы уже уделили достаточно внимания чисто теоретической, технической стороне нового поколения видеокарт R300 от AMD – причем дважды (см. и ), в обзоре Fury X мы не будем подробно останавливаться на грубых цифрах. Так или иначе, многих современных геймеров и любителей высокоскоростного аппаратного обеспечения не столь сильно волнует количество потоковых процессоров, которыми располагает их новый графический процессор, или даже тактовая частота его памяти и процессора.

В основном их беспокоит одно: на что способна конкретная модель в конкретных играх и, возможно, в некоторых популярных синтетических тестах (главным образом в эталонном 3D Mark).

Обо всем этом мы поговорим ниже, но прежде несколько слов о самых интересных технических новинках, предлагаемых Fury X.

Еще раз напомню, что наиболее ключевой инженерной инновацией в новой графическом процессоре является так называемая High Bandwidth Memory (HBM). По сути это новый вид видеопамяти или, если быть более точным – новый метод интеграции типичного для всех современных графических адаптеров локального буфера.

Я думаю, вы знаете, что не существует современной видеокарты без собственной видео RAM. Как правило, она быстрее системной оперативной памяти, используемой всеми остальными приложениями, и работает на очень высоких тактовых частотах.

Чем сложнее и реалистичнее становятся современные 3D-приложения (т.е. игры), тем выше требования к объему и скорости локального видео буфера. Сегодня не редко встречаются графические адаптеры с 4, 6, 8 и даже 12 Гб видео RAM!

От этого, однако, возникает проблема – чем большим объемом памяти оснащена видеокарта, тем больше места занимают чипы GDDR памяти на ее печатной плате. В результате, в последнее время мы видим графические адаптеры с длиной 30-35 см и более. Большой объем памяти создает и другие неудобства – например, ограничивает возможности для увеличения пропускной способности шины, которая подключена к графическому процессору. Это со своей стороны ставит ограничение на производительность адаптера в целом.

HBM решает многие из этих проблем элегантным способом. Вместо «разбивки» имеющейся памяти на отдельные чипы, технология НВМ позволяет «слепить» их один с другим в специальный кремниевый «бутерброд». Так видеопамять занимает значительно меньше места (примерно на 95% меньше, чем чипы GDDR идентичного объема), обеспечивает до 3.5 раз более высокую пропускную способность и лучше охлаждается.

Как вы можете видеть, на фоне модели ASUS GeForce GTX 970 Strix, Fury X выглядит меньше и более аккуратно. Кроме того, карта достаточно холодная и тихая – максимальная температура даже после интенсивного тестирования не превышает 55-56 градусов, что, конечно, не является заслугой только нового типа памяти. AMD «схитрили» и вместо традиционного воздушного охлаждения оборудовали Fury X компактным водяным охлаждением.

Оно поддерживает температуру низкой, но создает слегка завышенные ожидания от фактических рабочих параметров карты – особенно относительно моделей, основанных на том же графическом чипе, но разработанных партнерами AMD, как Sapphire Tech, например. Они оснащены более или менее классическим воздушным охлаждением и, вероятно, будут предлагаться по более привлекательным ценам, но их рабочая температура будет выше.

Видимый минус по сравнению с прямыми конкурентами со стороны Maxwell-базируемых адаптеров от NVIDIA связан с количеством энергии, которое потребляет Fury X – 294 Вт. Этот показатель является достаточно высоким, особенно если сопоставить его с потребностями GeForce GTX 970 (154 Вт), GTX 980 (171 Вт) или даже GTX 980 Ti (250 Вт).

Драйверы следующего поколения

Не секрет, что одной из наиболее серьезных «ахиллесовых пят» почти всего семейства Radeon с незапамятных времен остается драйверная поддержка. С годами графические адаптеры с брендом AMD создали себе доброе имя аппаратных и отвратительное чисто с программной точки зрения продуктов.

С поколением R300 компания явно намерена устранить эту слабость и новое поколение драйверов Catalyst включает в себя ряд функций, которых поклонники Radeon ждали достаточно давно. Всего есть три ключевых инновации, которые представляют действительно серьезный интерес для геймеров: Frame Rate Target Control (FRTC), Virtual Super Resolution (VSR) и поддержка технологии AMD FreeSync.

Вкратце о каждой из них:

Frame Rate Target Control (FRTC) – функция, позволяющая фиксировать количество кадров в секунду в большинстве DirectX 10 и 11 игровых заглавий на определенном уровне. Хотите знать, какой смысл в подобной опции, когда сообщество поклонников компьютерных игр традиционно хотят обратное – т.е. как можно больше кадров в секунду?

Смыслом является оптимизация. В сочетании с графическим адаптером высокого класса (которым Fury X бесспорно является) многие современные игры выдают действительно серьезное количество кадров в секунду – особенно при наиболее популярном в настоящее время разрешении Full HD. Видеокарта, как Fury X, например, даже при более высоком разрешении типа QHD (2560×1440) с легкостью достигает более 130 fps при максимальных настройках.

Это не просто много – это излишне много, особенно на ЖК-дисплеях с частотой обновления 60 Гц. С помощью Frame Rate Target Control вы можете ограничить количество fps, например, до 60 кадров в секунду – показатель, который общепринято считается оптимальным. Преимущество этого заключается в том, что ваша карта не будет работать «на полной скорости» и генерировать лишний шум и тепло, чтобы дать вам скорость, которая на практике не нужна для комфортной игры.

Virtual Super Resolution (VSR) является ответом AMD на Dynamic Super Resolution от NVIDIA. По существу речь идет об идентичной технологии с другим именем. С ее помощью вы можете принудить видеокарту «рисовать» каждый кадр в более высоком разрешении, чем предлагает ваш дисплей. Цель этой сложной процедуры заключается в дополнительном повышении качества изображения – более тонкие детали и эффект, аналогичный тому, который достигается путем активации так называемого полноэкранного сглаживания (anti-aliasing).

Наконец — поддержка FreeSync — технология адаптивной синхронизации, разработанная AMD. О принципах, на которых она строится, мы уже говорили, а польза от нее заключается в обеспечении плавной игры даже при меньшем количестве кадров в секунду – намного ниже «магического» оптимума 60 fps.

Конечно, каждая из этих трех функций доступна для всех адаптеров поколения R300, как и для моделей предыдущего поколения, которые их поддерживают. Однако на практике наибольшую выгоду из них смогут извлечь владельцы видеокарт высокого и самого высокого класса (R390X, Fury, Fury X) – особенно в отношении Frame Rate Target Control и Virtual Super Resolution.

На практике

После очень подробного и технического введения давайте перейдем к самой интересной части обзора и проверим, что представляет собой Fury X на практике.

Мы протестировали адаптер на PC со следующей конфигурацией:

  • Процессор: Intel Core i5-3570K – 3.4GHz
  • Материнская плата: ASRock Z77 Extreme3
  • Оперативная память: Corsair 12GB DDR3 1600MHz
  • Диск: SSD Samsung 830 Pro 128GB

Для всех тестовых заглавий использовалось разрешение 4K (для карты такого класса просто обидно ставить Full HD или ниже) и максимальный уровень графических настроек.

Вот, что показали тесты.

В Shadow of Mordor при разрешении 3840 х 2160 пикселей и Ultra-настройках среднее количество кадров в секунду, которое достиг Fury X, составило чуть больше 37.

В принципе любой результат выше 40 fps означает сравнительно гладкую и комфортную игру. Конечно, чем ближе к границе 60 кадров в секунду, тем лучше, но все же не забывайте два важных момента: в нашем случае использовалось разрешение 4К и сравнительно слабый процессор, который несколько ограничивает видеокарту и не позволяет ей раскрыть весь свой потенциал.

Пойдя на компромисс, т.е. снизив настройки графики с Utra до Very High, мы получили скачок 55 кадров секунду – идеальный показатель для комфортной игры. И еще раз напомню, что речь идет о разрешении в четыре раза выше, чем Full HD!

Схожая ситуация и с Tomb Raider. При уровне настроек Ultimate и разрешении 4К Fury X показал результат 44 кадра в секунду с активированной технологией для реалистичной визуализации волос TressFX и 52 кадра без нее. Результаты встроенного теста Dragon Age: Inquisition еще интереснее: при уровне графики Ultra и разрешении 4К адаптер достигает 67 кадров в секунду! Конечно, в этом есть и заслуга технологии Mantle от AMD, для использования которой движок игры был специально оптимизирован.

Мы проверили Fury X и в популярном 3D Mark. На фоне остальных результатов в реальных играх было ясно, что в этом синтетическом тесте карта не разочарует. 11346 очков – достижение, которое лучше, чем 90% всех результатов, сохраненных в базе Futuremark. И на 2000 пунктов выше уровня настольного геймерского PC высокого класса, отвечающего требованиям для работы с комплектом виртуальной реальности типа Oculus Rift.

В заключение

Максимальная производительность. Довольно много интересных инновационных технологий – как на аппаратном, так и на программном (драйверном) уровне. Тихий и холодный во время работы. Удивительно компактные размеры для графического адаптера подобного класса. AMD Fury X обладает всеми необходимыми качествами победителя. К сожалению, есть одно большое НО, которое носит имя GeForce GTX 980 Ti. Конкурент от NVIDIA доступен практически по той же цене, но при этом быстрее, прохладнее и менее жадный на энергию. Кроме того, на нашем рынке, например, модели на основе GTX 980 Ti уже доступны, в то время как адаптеры Fury X в исполнении ключевых партнеров AMD (Sapphire, Power Color, Asus, Gigabyte) только ожидаются.

Все это приводит нас к выводу, который мы сделали еще в начале обзора: AMD Fury X является отличным, смелым шагом вперед для компании, но слишком запоздалым и недостаточным.

Настройка видеокарты Nvidia для игр

Мы с вами сегодня и поговорим о повышении быстродействия видеокарты за счет ее детальной настройки.

Итак, для того, чтобы попасть в меню управления видеодрайвером, кликайте правой кнопкой мыши по любому месту на рабочем столе и выбирайте в открывшемся меню «Панель управления Nvidia».

После чего, в открывшемся окне переходите во вкладку «Управление параметрами 3D»

.

Здесь мы с вами и будем настраивать различные параметры, влияющие на отображение 3D картинки в играх. Не трудно понять, что для получения максимальной производительности видеокарты придется сильно порезать изображение в плане качества, так что будьте к этому готовы.

Итак, первый пункт CUDA – графические процессоры. Здесь представлен список видеопроцессоров, один из которых вы можете выбрать, и он будет использоваться приложениями CUDA. CUDA (Compute Unified Device Architecture) – это архитектура параллельных вычислений использующаяся всеми современными графическими процессорами для увеличения вычислительной производительности.

Следующий пункт DSR — Плавность мы пропускаем, потому что он является частью настройки пункта «DSR — Степень”, а его в свою очередь нужно отключать и сейчас я объясню почему

.

DSR (Dynamic Super Resolution) – технология позволяющая рассчитывать картинку в играх в более высоком разрешении, а затем масштабирующая полученный результат до разрешения вашего монитора. Для того чтобы вы поняли для чего эта технология вообще была придумана и почему она не нужна нам для получения максимальной производительности, я попробую привести пример. Наверняка вы часто замечали в играх, что мелкие детали, такие как трава и листва очень часто мерцают или рябят при движении. Связано это с тем, что, чем меньше разрешение, тем меньше число точек выборки для отображения мелких деталей. Технология DSR позволяет это исправить за счет увеличения числа точек (чем больше разрешение, тем больше число точек выборки). Надеюсь, так будет понятно. В условиях максимальной производительности эта технология нам не интересна так, как затрачивает довольно много системных ресурсов. Ну а с отключенной технологией DSR, настройка плавности, о которой я писал чуть выше, становится невозможна. В общем, отключаем и идем дальше.

Далее идет антизотропная фильтрация. Антизотропная фильтрация – алгоритм компьютерной графики, созданный для улучшения качества текстур, находящихся под наклоном относительно камеры. То есть при использовании данной технологии текстуры в играх становятся более четкие. Если сравнивать антизотропную фильтрацию со своими предшественниками, а именно с билинейной и трилинейной фильтрациями, то антизотропная является самой прожорливой с точки зрения потребления памяти видеокарты. Данный пункт имеется только одну настройку – выбор коэффициента фильтрации. Не трудно догадаться, что данную функцию необходимо отключать

.

Следующий пункт – Вертикальный синхроимпульс. Это синхронизация изображения с частотой развертки монитора. Если включить данный параметр, то можно добиться максимально плавного геймплея (убираются разрывы изображения при резких поворотах камеры), однако зачастую возникают просадки кадров ниже частоты развертки монитора. Для получения максимального количества кадров в секунду данный параметр лучше отключить

.

Заранее подготовленные кадры виртуальной реальности. Функция для очков виртуальной реальности нам не интересна, так как VR еще далека до повседневного использования обычных геймеров. Оставляем по умолчанию – использовать настройку 3D приложения.

Затенение фонового освещения. Делает сцены более реалистичными за счет смягчения интенсивности окружающего освещения поверхностей, которые затенены находящимися рядом объектами. Функция работает не во всех играх и очень требовательна к ресурсам. Поэтому сносим ее к цифровой матери.

Кэширование шейдеров. При включении данной функции центральный процессор сохраняет скомпилированные для графического процессора шейдеры на диск. Если этот шейдер понадобится еще раз, то GPU возьмет его прямо с диска, не заставляя CPU проводить повторную компиляцию данного шейдера. Не трудно догадаться, что если отключить этот параметр, то производительность упадет

Максимальное количество заранее подготовленных кадров. Количество кадров, которое может подготовить ЦП перед их обработкой графическим процессором. Чем выше значение, тем лучше.

Многокадровое сглаживание (MFAA). Одна из технологий сглаживания используемая для устранения «зубчатости” на краях изображений. Любая технология сглаживания (SSAA, FXAA) очень требовательна к графическому процессору (вопрос лишь в степени прожорливости). Выключаем.

Потоковая оптимизация. Благодаря включению этой функции приложение может задействовать сразу несколько ЦП. В случае, если старое приложение работает некорректно попробуй поставить режим «Авто” или же вовсе отключить эту функцию.

Режим управления электропитанием. Возможно два варианта – адаптивный режим и режим максимальной производительности. Во время адаптивного режима энергопотребление зависит напрямую от степени загрузки ГП. Этот режим в основном нужен для снижения энергопотребления. Во время режима максимальной производительности, как не трудно догадаться, поддерживается максимально возможный уровень производительности и энергопотребления независимо от степени загрузки ГП. Ставим второй.

Сглаживание – FXAA, Сглаживание – гамма-коррекция, Сглаживание – параметры, Сглаживание – прозрачность, Сглаживание — режим. Про сглаживание я уже писал чуть выше. Выключаем всё.

Тройная буферизация. Разновидность двойной буферизации; метод вывода изображения, позволяющий избежать или уменьшить количество артефактов (искажение изображения). Если говорить простыми словами, то увеличивает производительность. НО! Работает эта штука только в паре с вертикальной синхронизацией, которую, как вы помните, мы до этого отключили. Поэтому этот параметр тоже отключаем, он для нас бесполезен

Ускорение нескольких дисплеев/смешанных ГП. Настройка определяет дополнительные параметры для OpenGL при использовании нескольких дисплеев и нескольких видеокарт. Один дисплей – режим однодисплейной производительности соответственно. Два и более – многодиспленая производительность (или же режим совместимости в случае возникновения некорректной работы приложений). Две и более видеокарты – режим совместимости

Фильтрация текстур – антизотропная оптимизация фильтрации. Включение опции приведет к небольшому ухудшению картинки и увеличению производительности, что нам как раз и нужно

Фильтрация текстур – качество. Позволяет управлять технологией Intellisample. Это технология предназначена для улучшения качества сглаживания сцен с частично прозрачными текстурами. Выкручиваем на минимум, то есть ставим режим высокой производительности.

Фильтрация текстур – отрицательное отклонение уровня детализации. Технология позволяющая изображать текстуры в приложениях более контрастно.

Для повышения производительности рекомендуется включить

Фильтрация текстур – трилинейная оптимизация. Включение данной опции позволяет драйверу снижать качество трилинейной фильтрации для повышения производительности.

На этом настройка видеодрайвера Nvidia на производительность подошла к концу. После всех проделанных операций прирост кадров в секунду вас сильно обрадует. Тесты я специально не стал прикреплять, потому что эффективность настройки напрямую зависит от модели видеокарты. Кому-то настройка принесет те недостающие 10-15 FPS, а кому-то 30-40. На этом я с вами прощаюсь и желаю покорения всех виртуальных вершин!

FILED UNDER : Железо

Submit a Comment

Must be required * marked fields.

:*
:*