admin / 08.12.2018

А10 5800к характеристики

Процессор AMD A10-5800K

Исследуем производительность процессорной части старшего APU на кристалле Trinity

Как только весной появились мобильные процессоры семейства AMD Trinity, так сразу же многие пользователи начали обратный отсчет — в ожидании настольных моделей. Почему? Причины очевидны: при всей своей привлекательности APU Llano выглядели временным решением, поскольку использовали старую процессорную архитектуру, восходящую корнями еще к К7 прошлого тысячелетия. Разумеется, в очередной раз модернизированную, однако запас ее возможных модификаций иссяк уже давно, о чем мы писали в первой статье о Bulldozer. Впрочем, дебют новой архитектуры оказался не слишком убедительным, но ведь в Trinity применяется уже обновленный ее вариант. А для создания APU новые модули подходят несколько лучше, чем старые ядра, поскольку каждый модуль компактнее пары ядер (а «атлоновские» ядра приходится брать именно в таком минимальном количестве — из-за их однопоточности), и при этом вполне может угнаться за ними при многопоточной нагрузке. Да и однопоточная утилизирует модуль в несколько большей степени — «простаивает» не половина ресурсов, а меньшая их часть, что усугубляется еще и разными тактовыми частотами (для К10 критичны уже 3,5 ГГц, а Bulldozer и иже с ним рассчитаны на 4 ГГц и более). В общем, нельзя сказать, что Trinity в обязательном порядке будут всегда лучше старших Llano (хотя бы из-за уменьшения количества векторных блоков, коих ранее было столько же, сколько ядер, а теперь столько же, сколько модулей, т. е. вдвое меньше), однако в массовых приложениях производительность новых процессоров должна быть более высокой.

Но одной лишь процессорной частью дело не ограничивается. Графика Llano — тоже не слишком новое решение, относящееся к 2009 году. Тем более, заранее о его адаптации к встраиванию особо никто не позаботился, а вот «Northern Islands» делалась во многом с оглядкой на APU. Опять же, немаловажным ее нововведением является блок AVC (Accelerated Video Converter), предназначенный для быстрого транскодирования видео. Понятно, что уши его (равно как и аналогичной технологии NVEnc у второго из двух выживших на рынке дискретных видеокарт игроков) растут из успеха Intel Quick Sync, но… Тут как раз немаловажно то, что со временем технология вернулась туда, откуда вышла. И где ее применение весьма актуально: системы с дискретной графикой, как правило, снабжаются и мощными центральными процессорами, да и на экономию электроэнергии при наличии отдельного GPU рассчитывать особо не приходится (ввиду повышенной прожорливости последних), а вот для интегрированных решений (особенно в паре с недорогими процессорами и/или в компактных системах) нормальных альтернатив аппаратному транскодированию не придумано. А ведь по мере роста рынков планшетов и смартфонов эти задачи становятся все более и более нужными все большему количеству пользователей.

Впрочем, графика будет темой одной (или даже не одной) из следующих статей — сегодня мы лишь вкратце упомянули наиболее важные моменты. Да и по процессорной составляющей тоже — просто потому, что у нас на сайте уже была опубликована прекрасная статья, посвященная мобильной версии Trinity, а настольная внутренне от нее не отличается. Правда, внешне она отличается конструктивным исполнением, о чем в упомянутой статье, естественно, ничего не сказано. Что ж — рассмотрим и этот аспект.

Как уже наверняка известно многим нашим постоянным читателям, настольные Trinity предназначены для Socket FM2, т. е. они полностью несовместимы ни с Llano (те используют похожий FM1), ни с остальными процессорами AMD (Socket AM3/AM3+). В сетевых обсуждениях многие склонны были считать смену платформы недостатком новых процессоров. Но так ли это? Конечно, AMD постаралась нас приучить к бережному сохранению преемственности между платформами, однако так ли это важно (особенно в бюджетном секторе)? Правильно выбранный компьютер прослужит владельцу никак не меньше трех-четырех лет, а за это время устареет все. Ну, можно сейчас «воткнуть» Phenom II в плату с AM2+, купленную три года назад — и что? Для современных приложений купленной тогда памяти может оказаться мало, а докупать сейчас DDR2 дороже и сложнее, чем «переехать» на другую платформу. В какой-то степени, конечно, пострадали покупатели компьютеров с платами под FM1 — им апгрейд процессора точно не светит, независимо от выгодности или невыгодности. C другой стороны, еще неизвестно, что произойдет к тому моменту, когда он им понадобится: старшие A6 и A8 — это четырехъядерные процессоры с частотами около 3 ГГц, а в мире до сих пор есть куча задач, с которыми справляются и Athlon II X2. Соответственно, есть и владельцы компьютеров на базе последних, так что кому продать старую платформу при апгрейде — найдется 🙂

А вот тем, кто будет покупать компьютер сейчас, наоборот — повезло. Ведь фактически, судя по планам AMD, FM2 — это всерьез и надолго. Во всяком случае, никуда не делись планы перевести в это исполнение и топовые четырехмодульные процессоры без графики — просто их пришлось немного отложить. Да и APU есть куда развивать, причем их ассортимент уже на старте не слишком уступает накопившемуся за время жизни FM1. И более разнообразен тоже. Для новой платформы компания сразу предложила четыре модели с разблокированными множителями, причем две из них одномодульные, а одна — и вовсе без интегрированной графики. При этом большинство устройств укладывается в TDP 65 Вт — для FM1 такие официально тоже были, но свободно приобрести до сих пор можно разве что весьма специфический A6-3500, а все остальное на корню скупают крупные сборщики систем. За это, конечно, следует благодарить не только архитектурные изменения, но и уже более-менее отлаженный процесс производства (все те же 32 нм, где основные шишки были набиты как раз при выращивании процессоров предыдущих поколений), но в конечном итоге не так уж это важно.

Таким образом, выдержав драматическую паузу, AMD выпустила большое количество новых процессоров. Действительно новых, а не просто творчески переработанных старых. Или вообще не переработанных, а просто с увеличенной частотой. Сейчас все иначе — в новых APU и CPU-часть новая (и разнообразная), и GPU совсем иные. GPU не относятся к самой модной ныне серии «Southern Islands», конечно, но архитектура GCN пока используется лишь для части рынка дискретной графики, так что в APU придет не слишком скоро — скорее всего, не ранее освоения новых техпроцессов, поскольку 32 нм для данной сферы применения «жирноват». А вот перевод APU на техпроцесс 28 нм (ныне используемый как раз для дискретных GPU), который ожидается в следующем году — в самый раз. Заодно и процессорную составляющую можно будет ускорить, т. е. как минимум один потенциальный уровень модернизации у FM2 есть.

Но и до следующего года нам есть что тестировать. К этому мы с сегодняшнего дня и приступим, традиционно начав с процессорной составляющей нового семейства. Точнее — старшего его представителя.

Конфигурация тестовых стендов

Процессор A10-5800K A8-3870K FX-4170
Название ядра Trinity Llano Zambezi
Технология пр-ва 32 нм 32 нм 32 нм
Частота ядра std/max, ГГц 3,8/4,2 3,0 4,2/4,3
Кол-во ядер/потоков вычислений 4/4 4/4 4/4
Кэш L1 (сумм.), I/D, КБ 128/64 256/256 128/64
Кэш L2, КБ 2×2048 4×1024 2×2048
Кэш L3, МиБ 8
Частота UnCore, ГГц 2,2
Оперативная память 2×DDR3-1866 2×DDR3-1866 2×DDR3-1866
Видеоядро Radeon HD 7660D Radeon HD 6550D
Сокет FM2 FM1 AM3+
TDP 100 Вт 100 Вт 125 Вт
Цена $111(65) Н/Д(0) Н/Д(0)

Главный герой — A10-5800K: на данный момент лучший из настольных Trinity. С кем его имеет смысл сравнивать? Очевидно, что без флагмана для FM1 — A8-3870K — обойтись никак нельзя. Равно как и без FX-4170: те же самые два «строительных» модуля с частотой выше 4 ГГц. Частота у последнего всегда, впрочем, выше, т. е. «пол» 4170 равен «потолку» 5800К (как видите, Turbo Core в новом поколении APU используется всегда и, кстати, для всего, в то время как в Llano частота динамически менялась только у процессорных ядер и только в моделях с TDP 65 Вт). Зато и TDP у одного лишь процессора FX-4170 на 25% выше, чем у целого APU (т. е. 100 Вт здесь — на все три компонента: CPU, GPU и контроллер PCIe). Но это предыдущее поколение архитектуры. Но сдобренное немалым количеством L3. Так что поглядим, что и где перевесит.

Кстати, о кэшах. Как видите, суммарная (во избежание лишней путаницы из-за хитрой «бульдозерной» схемы мы решили перейти к ней) емкость кэш-памяти первого уровня у новых процессоров AMD уменьшилась при формально равном числе ядер: было по 256К инструкций и данных, а стало 128К инструкций и всего 64К данных. Более того, теперь даже Intel по этому параметру впереди: четырехъядерные Core имеют по 128К и того, и другого. Впрочем, поскольку напрямую с двухмодульными процессорами конкурируют двухъядерные, в этом ничего страшного нет 🙂 Емкость полноскоростного L2 не изменилась, но если ранее на один поток вычислений приходился лишь 1 МиБ (в лучшем случае, которым и являются старшие Llano), то теперь «удельная кэшевооруженность» удвоилась. А вот L3 в Trinity, как и в Llano, нет вообще — слишком дорогое удовольствие, поскольку кэш-память занимает много места, а оно здесь для GPU нужно. У процессоров для AM3+, наоборот, кэша L3 много, причем пусть и медленного, но совсем общего, что в ряде приложений может сказаться. И если FX первого поколения уступают Trinity архитектурно (по производительности как ядер, так и L2), то второе в этом плане идентично новинке. К чему это мы? К тому, что FM2 (в отличие от FM1) точек пересечения с AM3+ иметь не будет: даже FX-4300 по ТТХ окажется чуть выше, чем 5800К, так что общий уровень энтропии в ассортименте AMD с осени это года понизится. Практически, после сокращения поставок и «вымывания» из торговых сетей Athlon II и Phenom II, платформы разделятся четко: ниже среднего уровня — FM2, выше — пока AM3+. Но уже со следующего поколения, как и было сказано в начале статьи, платформы сольются в одну, и станет ею как раз FM2.

Процессор Core i3-2100 Core i3-3240 Core i5-680
Название ядра Sandy Bridge DC Ivy Bridge DC Clarkdale
Технология пр-ва 32 нм 22 нм 32/45 нм
Частота ядра std/max, ГГц 3,1 3,4 3,6/3,87
Кол-во ядер/потоков вычислений 2/4 2/4 2/4
Кэш L1, I/D, КБ 64/64 64/64 64/64
Кэш L2, КБ 2×256 2×256 2×256
Кэш L3, МиБ 3 3 4
Частота UnCore, ГГц 3,1 3,4 2,4
Оперативная память 2×DDR3-1333 2×DDR3-1600 2×DDR3-1333
Видеоядро HDG 2000 HDG 2500 HDG
Сокет LGA1155 LGA1155 LGA1156
TDP 65 Вт 55 Вт 73 Вт
Цена $239(на 11.01.16) $145(33) Н/Д(2)

Обойтись без хотя бы одного процессора Intel мы, естественно, тоже не могли, поэтому решили взять несколько. Основным защитником цветов этой команды по понятным причинам будет Core i3-3240 — на данный момент старший двухъядерный Ivy Bridge. Формально он двухъядерный, но реально — четырехпоточный благодаря Hyper-Threading. Он несколько дороже других участников, но i3-3220 мы пока не тестировали, да и важнее, все же, качественное, а не количественное соотношение. Тем более, что мы сегодня тестируем лишь часть A10-5800K, не затрагивая его графическую составляющую, которая, в общем-то, интереснее с практической точки зрения. А для ориентира в чисто процессорных гонках нам небольшая разница в цене не помеха — просто при необходимости на нее стоит делать поправку, и все. Для тех, кому хочется чего-нибудь медленного из стана Intel, мы добавили и Core i3-2100 — прошлогоднюю модель, уже фактически снятую с производства, зато очень хорошо и всесторонне за время жизни изученную.

Поразмыслив немного, мы решили добавить к списку еще и Intel Core i5-680 — самый быстрый из семейства Clarkdale. Ну и что, что совсем старый? Идеологически он схож с тремя процессорами из получившейся четверки, а частота у него до сих максимальная из всех двухъядерных моделей Intel, что делает его сравнение с «бульдозерной» линейкой интересным.

Тестирование

Традиционно, мы разбиваем все тесты на некоторое количество групп и приводим на диаграммах средний результат по группе тестов/приложений (детально с методикой тестирования вы можете ознакомиться в отдельной статье). Результаты на диаграммах приведены в баллах, за 100 баллов принята производительность референсной тестовой системы iXBT.com образца 2011 года. Основывается она на процессоре AMD Athlon II X4 620, ну а объем памяти (8 ГБ) и видеокарта (NVIDIA GeForce GTX 570 1280 МБ в исполнении Palit) являются стандартными для всех тестирований «основной линейки» и могут меняться только в рамках специальных исследований. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде.

Интерактивная работа в трёхмерных пакетах

Рывок «бриджей» в этой группе — давно свершившийся факт (уже почти два года как), так что любопытным здесь являются два соотношения: во-первых, новая архитектура AMD при прочих равных нередко вполне сравнима с первым поколением Core, а вот старая — медленнее. Да, конечно, при разгоне Llano до 3,5 ГГц можно выйти на тот же уровень производительности, но для этого кристалла такие частоты близки к предельным. A10-5800K и FX-4170 же работали в штатном режиме, и вполне возможно, что из них удастся «выжать» и еще немножко. Ну и, опять же, эта сфера применения для старших Llano крайне неудобна — фактически, задействуется от силы полпроцессора. А вот у двухъядерных Intel или двухмодульных AMD впустую пропадает куда меньше ресурсов.

Финальный рендеринг трёхмерных сцен

Но иногда модулям ресурсов как раз не хватает, с чем мы тоже уже не раз сталкивались. Меньшее число векторных блоков приводит к тому, что 5800К и 4170 отстают от 3870К, а меньшая их эффективность — к проигрышу аналогичным по устройству процессорам Intel. Впрочем, как видите, высокие частоты позволяют им проиграть Llano не так много — куда меньше, чем был выигрыш в предыдущей группе тестов. Частоты же позволяют обойти и некоторые низкочастотные Core i3 — типа исторического 2100. И что еще стоит запомнить: несмотря на формально более низкие частоты, 5800К обогнал 4170, т. е. процессорные ядра в нем действительно улучшились.

Упаковка и распаковка

Тот случай, где FX-4170 недосягаем — все-таки суммарная емкость кэш-памяти более 12 МиБ (как у шестиядерных Core i7, например). А на почетном третьем месте — A10-5800K, причем с результатом аккурат между Core i3-2100 и i3-3240. Если быть абсолютно точным, то результат практически на уровне Core i3-2120 — всего на 1 балл ниже. A8-3870K же здесь проигрывает всем. И не только среди участников тестирования — на самом деле его результат даже немного ниже, чем у Core i3-560. Откуда такой разительный отрыв нового поколения APU от старого? А давайте вспомним, каковы входящие в группу подтесты. Упаковка в 7-Zip — целочисленная многопоточная нагрузка: с ней «строительные» модули справляются не хуже стандартных ядер, а частота у них выше. Упаковка в WinRAR — два потока: половинка Llano простаивает, включая и столь нужную кэш-память. Тесты на распаковку — вообще однопоточные, со всеми вытекающими: здесь «играют» разница в частоте плюс всего 1 МиБ кэш-памяти на поток в A8-3870K против 2 МиБ в A10-5800K. В общем, разница принципиальная. На самом деле, если продолжать сравнение со старыми процессорами, то A10-5800K в этом тесте даже почти догнал Core i5-750!

Кодирование аудио

А теперь от прорывов переходим к поражениям: A8-3870K в сегодняшнем тестировании — единственный процессор с настоящими четырьмя ядрами, а не их имитацией. Впрочем, как и в рендеринге, отставание A10-5800K от него невелико, зато всех остальных участников тестирования новичок обогнал. Включая и FX-4170 — хотя, повторимся, с последним процессором 5800K схож архитектурно и работает на чуть более низкой тактовой частоте.

Компиляция

Еще один случай, когда лучшим оказывается настоящий четырехъядерник: фактор числа ядер даже гигантскому кэшу FX-4170 перебить не удается. Но мы не склонны считать тест глобальным поражением A10-5800K: третье место он разделил с лучшим из современных Core i3, а это не так уж и мало.

Математические и инженерные расчёты

И вновь A8-3870K отстал всерьез и надолго, а 5800K при меньшей частоте чуть-чуть обошел FX-4170. Единственное, что портит праздник — до процессоров Intel далеко (разве что Core i3 первого поколения медленнее), но в этом плане мы ничего другого априори не ожидали.

Растровая графика

Равно как и здесь: у новичка опять уровень Core i3-560. Ну и ладно — все равно чуть-чуть обошли FX-4170, а непосредственный предшественник фактически «уничтожен».

Векторная графика

Как мы уже установили, эта группа программ «недолюбливает» «строительные» модули во всех их проявлениях, что, однако, не помешало A10-5800K опередить A8-3870K. С одной стороны, видали мы уже и больше, с другой — тоже неплохо.

Кодирование видео

Казалось бы, недостаток векторных блоков должен был сказаться и здесь, но, как мы убедились еще тестируя FX-8150, не сказывается. Хотя от Core i3-3240 и FX-4170 наш главный герой отстал, но в этом нет ничего страшного: во-первых, он все же быстрее A8-3870K, а во-вторых — в точности равен Core i3-2130, который еще несколько месяцев назад был самым быстрым в семействе.

Офисное ПО

Бо́льшая часть тестов однопоточная, так что на диаграмме нет ничего нового: разгром Llano, небольшое превосходство над FX-4170 и отставание от процессоров Intel — это мы уже не раз видели. На самом деле, уже в третий раз A10-5800K оказался на одном уровне с Core i3-560 — да, конечно, это очень старый процессор, причем «нижне-среднего» сегмента, но… A8-3870К и до этого уровня в штатном режиме далеко.

Java

Еще один случай, когда четыре «настоящих» ядра лучше любых технологий увеличения многопоточности, что для JVM давно привычно и знакомо. Но, как и выше, это не позволяет A8-3870K (который в этом тесте вообще самый быстрый) слишком уж заметно опередить A10-5800K. Результат последнего — на уровне Core i3 второго поколения, что не так уж и мало.

Игры

Любые APU AMD — процессоры с первоочередным игровым назначением: иначе нет смысла гоняться за слишком уж производительной интегрированной графикой. Но, опять же, наиболее важны их игровые способности как раз без дискретного GPU (или в режиме Dual Graphics). С другой стороны, на этом кристалле будут и Athlon X4, а таковой вполне может оказаться компаньоном карты уровня GTX 570, а то и выше. И, в общем и целом, его скорее всего хватит — как видите, почти все участники сегодняшнего тестирования «живут» на одном уровне производительности, а выделяется только Core i3-3240. A10-5800K, впрочем, предпоследний в группе, но ведь A8-3870K вообще на последнем месте 🙂

Многозадачное окружение

Ничего неожиданного — эти результаты можно было предугадать заранее. В частности, то, что победителем окажется A8-3870K: из шести участвующих в тестировании процессоров только в нем четыре настоящих ядра. Однозначный аутсайдер — Core i5-680, у которого высокая частота ядер неспособна скомпенсировать медлительную кэш-память. И т. д. и т. п. A10-5800K в итоге занял четвертое место: угнаться за FX-4170 не дало отсутствие L3, но вот в группу Core i3 второго и третьего поколения (причем в верхнюю ее часть) новому процессору вклиниться удалось.

Итого

Как и можно было предположить заранее, переход от ядер к «ядрам» того же количества в некоторых случаях понизил производительность сравнительно с предшественником. Но не сильно — эффект в значительной степени скомпенсирован выросшими тактовыми частотами и прочими улучшениями. Кстати, иногда они производительность как раз немного повышают, так что эти случаи уравновешивают друг друга. А вот те варианты нагрузки, где A10-5800K намного опережает A8-3870K, обходятся без своих антиподов, т. е. ни одного случая, чтоб 3870К заметно обогнал 5800К, нам не встретилось. С закономерным конечным результатом: почти 10% прироста общей производительности новичка.

Причины понятны: в «суровом» многопоточном коде хороши настоящие ядра, но вот при меньшем количестве потоков вычислений процессоры «классической» архитектуры неэффективны из-за того, что немалая часть дорогостоящих ресурсов попросту простаивает. Запускаем на том же A8-3870K однопоточное приложение — и получаем загрузку ядер и кэш-памяти на 25%. А вот у A10-5800K будет задействована хотя бы половина кэша и, грубо говоря, процентов 40 вычислительных ресурсов, т. е. эффективность использования транзисторов при однопоточной нагрузке у него в полтора-два раза выше. Соответственно, учитывая то, что в массовом ПО (а на профессиональные сферы применения APU и не ориентированы изначально) до сих пор используется лишь один-два потока вычислений, новая процессорная архитектура работает оптимальнее.

10% — много это или мало? С одной стороны, не очень много. С другой же — это средняя разница (т. е. с учетом и, скажем так, несколько атипичного для сферы применения APU ПО), причем, как было показано выше, в некоторых группах тестов прирост составляет и вполне весомые 20%. Кроме того, CPU — не главная составляющая APU, а лишь одна из двух. Новый процессор недаром относится к семейству A10: это тема одной из ближайших отдельных статей, но вкратце можем сказать, что графическое ядро тоже стало на 20% мощнее, чем в A8. При этом, несмотря на тот же процесс производства, Trinity не будут заметно дороже Llano. Да, площадь кристалла увеличилась с 228 до 246 мм², но это менее 10%. Кроме того, Llano был первенцем 32-нанометрового техпроцесса GlobalFoundries, так что выход годных кристаллов долгое время оставлял желать много лучшего. Теперь же эта проблема исправлена, да и в AMD не зря сделали анонс Trinity двухэтапным: первые несколько месяцев во избежание дефицита поставлялись только мобильные APU, и лишь сейчас к ним добавились настольные. В общем, замена предыдущего поколения новым вполне оправдана и будет, скорее всего, относительно безболезненной.

Что же касается конкуренции APU с другими процессорами (как самой AMD, так и Intel), то здесь каких-либо существенных изменений не произошло. Да, A10-5800K по интегральной производительности сумел сравняться с Core i3-2100, но в глобальном смысле это никак не скажется на соперничестве с Intel по нескольким причинам. Во-первых, 5800К — самый мощный процессор для FM2, а i3-2100 — самый слабый Core i3 второго поколения, давно уже существующий в ассортименте компании лишь номинально: ныне по той же цене отгружаются 2120 и 3220. Во-вторых, возможность маневрирования ценой у Intel на порядок больше: двухъядерные Sandy Bridge (и, в особенности, Ivy Bridge) имеют в разы более низкую себестоимость. Да и четырехъядерные модели Core несколько дешевле в производстве, а с ними процессорную часть Trinity сравнивать вообще нет смысла. В-третьих, и уровень требований к системам охлаждения разный: APU по-прежнему оперируют тепловым пакетом в 100 Вт — против 65, 55 и даже 35 (Core i3-3240T, например, тоже аналогичный 2100 по производительности) ватт. В общем, основным критерием раздела по-прежнему остается графика. Нужен мощный (относительно) интегрированный GPU? Имеет смысл обратить внимание на FM2. Не нужен? Очень может быть, что предпочтительнее окажутся другие платформы. Athlon X4, впрочем, могут оказаться интересными и для покупателей дискретки, но надо еще на их цены взглянуть, прежде чем делать выводы.

Аналогичным образом складывается картина и в противостоянии FM2 и AM3+. На данный момент, конечно, A10-5800K выглядит на фоне FX-4170 очень хорошо: у него ниже потребление (даже с учетом наличия встроенной графики), но производительность, несмотря на более низкие тактовые частоты и отсутствие L3, сравнимая. Однако достигается это за счет архитектурных улучшений, и при сравнении с серией FX-43хх этого преимущества уже не будет. Зато все преимущества нынешних FX останутся на месте, т. е. две платформы будут четко разделяться по производительности — даже в двухмодульной конфигурации, являющейся единственной точкой пересечения FM2 и AM3+. Таким образом, и здесь основным (и практически единственным) стимулом к приобретению именно платформы FM2 остается качество интегрированной графики, а не какие-либо другие ее особенности. (За исключением, разве что, более высокой степени интеграции, но это актуально для крупных производителей, а вовсе не для отдельных пользователей.)

В общем, подводим краткий итог. Платформа Virgo (именно так она официально называется) является отличной заменой Lynx (настольные Llano) в том же сегменте рынка. Глобальных последствий ее выход пока иметь не будет (разве что в бюджетном секторе — поскольку Athlon для АМ3 постепенно исчезают, а для АМ3+ не планируются). Возможны небольшие локальные сдвиги — просто за счет увеличения привлекательности APU, — но по-прежнему сами по себе эти устройства AMD нужны тогда и только тогда, когда планируется задействовать оба компонента: и CPU, и GPU. Ну а поскольку первый нужен везде и всюду, то, соответственно, «упираемся» во второй: его высокая (для интегрированной графики) мощность должна быть необходимой и достаточной для решаемых задач. А насколько широк сегмент рынка, для которого новый A10 выглядит привлекательно, мы попробуем оценить в следующих статьях.

Благодарим компании Corsair, Palit, «Ф-Центр» и «Юлмарт»
за помощь в комплектации тестовых стендов

Обзор и тестирование процессора AMD A10-5800K

Октябрь этого года по праву можно назвать «месяцем AMD». Ведь именно в этот промежуток времени всемирно известная компания AMD запланировала представление двух новых серий процессоров. И если чипы под кодовым названием Vishera для платформы Socket AM3+ еще в ожидании своего «звездного часа», то новое поколение APU Trinity для настольных систем уже увидело свет и предстало перед публикой.

Знакомство со вторым поколением APU Trinity для ПК мы проведем на примере самого мощного процессора из этой серии – AMD A10-5800K. Но начнем мы, пожалуй, не с него, а с особенностей архитектуры новых процессоров.

Вообще понятие APU не новое и уже прочно засело в лексиконе многих пользователей. Для тех же, кто не следит за состоянием IT-рынка, напомним, что APU (Accelerated Processing Unit) представляет собой процессор со встроенным мощным графическим ядром. В первую очередь такая концепция была привлекательна производителям ноутбуков и нетбуков, позволяя увеличить возможности мобильных решений. По достоинству были оценены и гибридные процессоры для настольных компьютеров. Эти APU нам известны под названием Llano, работающие на платформе Socket FM1. Следующим шагом в развитии гибридных процессоров стало поколение APU Trinity и платформа Socket FM2, возможности которых мы рассмотрим сегодня.

По сути, структура APU предполагает наличие трех основных компонентов: процессорный вычислительный блок, интегрированное графическое видеоядро и объединённый северный мост. Данная концепция применялась и на первом поколении гибридных процессоров от AMD для настольных систем – APU Llano, и новые APU Trinity фактически ничем не отличаются в этом плане.

В максимальной конфигурации процессоры Trinity могут включать до четырех х86-ядер. Причем сам вычислительный блок основан на новой архитектуре Piledriver, которая является дальнейшим развитием архитектуры Bulldozer. Здесь, как и в APU Llano, применяется еще «старый» 32-нанометровый техпроцесс. Но по сравнению с предыдущим поколением гибридных процессоров, площадь кристалла APU Trinity увеличилась до 246 кв. мм (в APU Llano она равнялась 228 кв. мм). Это в свою очередь позволило увеличить количество транзисторов до 1,3 миллиарда. По заявлению AMD видеоядро, интегрированное в чип Trinity, соответствует поколению видеокарт AMD Radeon HD 7000.

Вверху представлена схема четырехъядерного процессора Trinity. Как видим, почти половину кристалла занимает встроенное видеоядро, имеющее такую же архитектуру, как и семейство графических процессоров AMD Nothern Islands. Отдельным блоком представлен объединенный северный мост, который является связующим звеном для других компонентов чипа. В качестве вычислительного блока используются все те же, так называемые «двухъядерные модули», каждый из которых содержит по два вычислительных устройства, способных обрабатывать по два потока данных одновременно. При этом двухъядерные модели APU Trinity будут укомплектованы одним таким модулем, а четырехъядерные – соответственно двумя. Для связи с внешними устройствами используется 24 линии PCI Express.

Из нововведений отметим наличие нового двухканального контроллера памяти и блока кодирования видео AMD HD Media Accelerator. Также стоит упомянуть о поддержке интерфейсов HDMI, DisplayPort 1.2 и DVI.

Но, безусловно, главной «изюминкой» в APU Trinity является использование новой архитектуры Piledriver, которая представляет собой модернизированную версию Bulldozer. Давайте разберемся, какие изменения присутствуют в новой архитектуре.

Во-первых, улучшен блок предсказания переходов – устройство, определяющее направление ветвлений (предсказывающее, будет ли выполнен условный переход) в исполняемой программе. Во-вторых, улучшены планировщики целочисленных (Int Scheduler) и вещественных (FPU Scheduler) исполнительных устройств. Основная задача этих планировщиков заключается в том, чтобы распределять команды по исполнительным блокам по мере их готовности.

Из других особенностей стоит отметить повышенную эффективность работы с кэш-памятью второго уровня, увеличенный объем буфера L1 TLB, поддержку новых инструкций F16C и FMA3, а также увеличение скорости выполнения некоторых базовых процессорных инструкций, таких как INT/FP divide, SYSCALL/SYSRET.

Как видим, разница в архитектурах Piledriver и Bulldozer довольно заметна, но насколько она повлияет на производительность, посмотрим по результатам тестирования.

Естественно мы не могли обойти стороной встроенное графическое ядро, которое имеет кодовое название Devastator. Тем более основная ставка AMD, сделанная на свои гибридные процессоры, заключается именно в возможностях интегрированного видеоядра.

Графическое ядро Devastator основано на архитектуре VLIW4, не смотря на то, что на более раннем APU Llano использовалось ядро с архитектурой VLIW5. Насколько такой ход оправдан, мы узнаем немного позже во время тестирования. Сейчас же просто приведем некоторые сравнительные цифры для четырехъядерных гибридных процессоров разных поколений:

§ число вычислительных блоков в видеоядре APU Trinity 384 против 400 в APU Llano;

§ рабочая частота графического ядра APU Trinity 800 МГц против 600 МГц в APU Llano.

Видеоядро Devastator полноценно поддерживает DirectX 11, OpenCL 1.1 и DirectCompute 11. Кроме того, благодаря использованию технологии Eyefinity имеется возможность подключения четырех устройств вывода изображения. Также в APU Trinity реализована функция Dual Graphics, которая позволяет объединять мощности интегрированного и дискретного видео.

Ну что ж, наверное, не будем больше томить читателей описанием технической стороны новых APU Trinity, а предложим непосредственно взглянуть на их результаты работы, как говорится «в деле». Для этого воспользуемся презентационными материалами, предоставленными компанией AMD.

Естественно конкурентом AMD на рынке процессоров является Intel. Поэтому неудивительно, что для сравнения были взяты модели именно этой компании. Здесь вы видите использование возможностей OpenCL на практике. Особенно разница заметна при работе с графикой.

Из этого слайда можно убедиться, что использование встроенного видеоядра на архитектуре VLIW4 было вполне оправданным ходом с технологической точки зрения. Прирост 37% в программе для тестирования видеоускорителей 3DMark 11 говорит сам за себя.

Понятно, что многих потребителей в первую очередь будет интересовать производительность не в синтетических тестах, а в реальных игровых приложениях. Эта подборка слайдов демонстрирует прирост быстродействия в некоторых популярных играх. Особенно интересными являются результаты сравнения APU Trinity со связкой Intel Core i5-3450 + NVIDIA GeForce GT 630 2 GB DDR3 (дискретная видеокарта). Последний слайд дает четкое представление о преимуществе работы в режиме Dual Graphics.

Выше приведена демонстрация использования технологии Eyefinity. С выходом операционной системы Windows 8, где реализована поддержка нового интерфейса Metro, технология Eyefinity станет еще актуальнее.

Модельный ряд

На данный момент серия процессоров Trinity представлена пока что шестью моделями. Как и в случае с APU Llano, производитель разделил новые гибридные процессоры на классы в зависимости от их производительности. Семейство процессоров Trinity для персональных компьютеров, а также некоторые их характеристики, выглядят следующим образом:

Модель APU

A10-5800K

A10-5700

A8-5600K

A8-5500

A6-5400K

A4-5300

Марка AMD Radeon

HD 7660D

HD 7660D

HD 7560D

HD 7560D

HD 7540D

HD 7480D

Тепловой пакет (TDP), Вт

100

65

100

65

65

65

К-во процессорных ядер

4

4

4

4

2

2

Тактовая частота процессора (макс/базовая), ГГц

4,2 / 3,8

4,0 / 3,4

3,9 / 3,6

3,7 / 3,2

3,8 / 3,6

3,6 / 3,4

Число ядер AMD Radeon

384

384

256

256

192

128

Тактовая частота GPU, МГц

800

760

760

760

760

724

Объем кэш-памяти второго уровня (L2), МБ

4

4

4

4

1

1

Максимальная скорость поддерживаемой памяти DDR3, МГц

1866

1866

1866

1866

1866

1600

Рекомендованная розничная цена, дол

122

122

101

101

67

53

Флагманская серия А10 представлена двумя моделями А10-5800К и А10-5700, архитектурных различий между ними нет, оба содержат 4 ядра и 384 потоковых процессора. Разница состоит лишь в том, что первый процессор имеет повышенную тактовую частоту, как вычислительного модуля, так и видеоядра, а также имеет разблокированный множитель. Это в свою очередь привело и к различному тепловому пакету у этих двух моделей.

Что касается процессоров класса А8, к которым относятся модели А8-5600К и А8-5500, то здесь изменения коснулись в основном графической части. Процессоры сохранили все те же 4 ядра, только немного была снижена частота их работы по сравнению с APU A10. Так же, как и во флагманской серии А10, здесь один процессор ориентирован на разгон и имеет разблокированный множитель, а второй — на работу в тихих мультимедийных системах с пониженным тепловыделением 65 Вт.

Замыкают модельный ряд процессоры А6-5400К и А4-5300. Оба APU содержат по 2 ядра, при этом общий объем кеш-памяти второго уровня понизился до 1 МБ. Количество шейдерных процессоров графического ядра также уменьшено.

Внешний вид и упаковка

Ну а теперь самое время перейти непосредственно к тестированию одного из процессоров нового поколения Trinity – AMD A10-5800K. К нам в тестовую лабораторию попал tray-вариант процессора, поэтому описание упаковки и системы охлаждения сделать трудно. Сразу перейдем к внешнему виду самого APU.

Внешне процессор абсолютно ничем не отличается от своего предшественника, изготовленного для платформы Socket FM1. На теплораспределительной крышке процессора находится маркировка и название страны-производителя, в данном случае Малайзия.

Тыльная сторона процессора серии Llano (Socket FM1)

Тыльная сторона процессора серии Trinity (Socket FM2)

Как видим, тыльная сторона APU Trinity отличается от тыльной стороны APU Llano. И если разное количество процессорных «ножек» визуально не заметно (904 в APU Trinity против 905 в APU Llano), то иное расположение «ключей» все же бросается в глаза. Поэтому процессоры под платформы Socket FM1 и Socket FM2 не имеют совместимости.

То есть переход на новое поколение гибридных процессоров, фактически вынуждает менять и материнскую плату, причем в её основе не обязательно должен быть новый чипсет AMD A85X, а могут использоваться и уже хорошо знакомые менее дорогие AMD A75 и A55. Предвидя негодование некоторых пользователей по этому поводу, компания AMD заявила, что следующее поколение APU будет основано на том же процессорном разъеме Socket FM2.

Спецификация

Модель

AMD A10-5800K

Маркировка

AD580KW0A44HJ

Процессорный разъем

Socket FM2

Тактовая частота (номинальная), МГц

3800

Максимальная тактовая частота с Turbo Core 3.0, МГц

4200

Множитель

38

Частота шины, МГц

100

Объем кэш-памяти первого уровня L1, КБ

2х64 (память инструкций)

4х16 (память данных)

Объем кэш-памяти второго уровня L2, КБ

2×2048

Объем кэш-памяти третьего уровня L3, КБ

Ядро

Trinity

Количество ядер/потоков

4/4

Поддержка инструкций

MMX, SSE, SSE2, SSE3, SSE4, SSE4A, x86-64, AMD-V, AES, AVX, XOP

Напряжение питания, В

0,825 — 1,475

Рассеиваемая мощность, Вт

100

Критическая температура, °C

74

Техпроцесс

32 нм

Поддержка технологий

Dual Graphics

UVD3

Turbo Core 3.0

PowerNow!

Eyefinity

Встроенный контролер памяти

Максимальный объем памяти, ГБ

64

Типы памяти

DDR3 (частота до 1866 МГц)

Число каналов памяти

2

Встроенное графическое ядро Radeon HD 7660D

Потоковые процессоры

384

SIMD

6

Текстурные блоки

24

Модули растеризации

8

Тактовая частота GPU, МГц

800

Поддержка инструкций

DirectX 11 (Tessellation, ShaderModel 5.0)

DirectCompute 11

OpenCL 1.1

Программа CPU-Z подтверждает информацию, написанную выше в таблице. Как видим, в обычном режиме работы тактовая частота AMD A10-5800K равняется 3800 МГц, при этом номинальное напряжение составляет 1,464 В.

В режиме динамического повышения частоты или просто «авторазгона» с использованием технологии Turbo Core 3.0, скорость процессора увеличивается до отметки 4200 МГц.

Кэш-память AMD A10-5800K распределяется следующим образом. Кэш-память первого уровня L1: по 16 КБ на каждое из 4 ядер выделяется для данных с 4-мя каналами ассоциативности, при этом для инструкций имеется 64 КБ на каждый двухъядерный модуль (напомним, в четырехъядерном процессоре их 2) с 2-мя каналами ассоциативности. Кэш-память второго уровня L2: по 2 МБ на каждый двухъядерный модуль процессора с 16-ю каналами ассоциативности. Кэш-память третьего уровня L3 отсутствует.

Контроллер памяти DDR3 работает в двухканальном режиме и способен поддерживать оперативную память вплоть до DDR3-1866 МГц.

Спецификация графического ядра полностью подтверждается утилитой GPU-Z. Как мы уже говорили выше, Radeon HD 7660D имеет в наличии 384 шейдерных блока и работает на частоте 800 МГц.

При тестировании использовался Стенд для тестирования Процессоров №1
Выберите с чем хотите сравнить AMD APU A10-5800K

Как видим, внедрение новой архитектуры Piledriver позволило процессору AMD A10-5800K выступать во многих тестах на равных с AMD FX-4170, основанным на более старой архитектуре Bulldozer. Но в некоторых приложениях APU из семейства Trinity все же отстает от своего аналога AMD FX-4170 в среднем на 10-15 процентов. Но здесь стоит вспомнить тот факт, что номинальная частота AMD A10-5800K составляет 3,8 ГГц против 4,2 ГГц у AMD FX-4170, так что в пересчете на такт, производительность процессоров будет приблизительно равна. Также не нужно забывать, что процессор AMD FX-4170 имеет еще 8 МБ кэш-памяти третьего уровня, которая отсутствует у AMD A10-5800K.

Если же сравнивать AMD А10-5800К с APU предыдущего поколения Llano AMD А8-3850, то здесь заметен некоторый прирост производительности, правда, не такой большой, как мы ожидали. Что касается сравнения быстродействия AMD А10-5800К с процессором из лагеря конкурентов, то в вычислительных приложениях наблюдается примерный паритет, ну а в играх архитектура Sandy Bridge, а значит и Ivy Bridge, все-таки показывает лучшие результаты, чем Piledriver.

Анализ производительности графического ядра Radeon HD 7660D

В первой части, посвященной общему знакомству с серией APU Trinity, было продемонстрировано ряд слайдов, в которых приводились графики производительности в разных игровых приложениях. Мы также решили проверить, на что способно встроенное видеоядро Devastator, проведя серию соответствующих тестов. В качестве оппонентов выступали APU предыдущего поколения Llano и процессоры от компании Intel. Чтобы свести к минимуму влияние оперативной памяти на итоговые результаты, ее скорость была поднята до 1866 МГц.

Как видим, графическое ядро AMD Radeon HD 7660D во всех приложениях оказалось быстрее видеоядра APU предыдущего поколения Llano AMD A8-3850. Это и не удивительно, так как, во-первых, графическое ядро APU Trinity имеет частоту 800 МГц против 600 МГц у APU Llano, а во-вторых, сказывается оптимизация архитектуры VLIW4.

В некоторых приложениях прирост производительности составил всего 10-15 процентов. Это как раз тот случай, когда ограничивающим фактором становится пропускная способность шины памяти, плюс ограниченные возможности вычислительного блока APU.

В общем же, интегрированное видеоядро нового поколения гибридных процессоров APU Trinity полностью оправдало ожидания компании AMD, да и потребителей, наверное, тоже. Также не будем забывать о возможности объединения встроенного графического ядра с дискретным видеоускорителем в режиме Dual Graphics, что еще больше увеличит производительность всей системы в игровых приложениях.

Разгон

Как уже упоминалось выше, новое поколение APU построено на архитектуре Piledriver, которая является, по сути, доработанной архитектурой Bulldozer. Отсюда соответственно и высокие номинальные частоты работы процессоров серии Trinity. Архитектура Bulldozer позволяла процессорам AMD серии FX достигать частот порядка 4800 МГц при хорошем охлаждении. Так что есть надежда, что у новой архитектуры Piledriver разгонный потенциал будет как минимум не хуже. Хотя сразу стоит оговориться, что гибридные процессоры достигают меньших результатов при разгоне из-за наличия в них встроенного графического ядра.

Мы без проблем разогнали APU AMD А10-5800К до частоты 4500 МГц, при этом напряжение, подаваемое на процессор, равнялось 1,456 В. Разгон производился путем поднятия процессорного множителя до значения х45. Стоит отметить, что компания AMD заявляет о возможности разгона APU Trinity до частот порядка 6500 МГц при условии применения экстремальных способов охлаждения, таких как жидкий азот.

С результатами измерений производительности вследствие разгона AMD А10-5800К до частоты 4500 МГц предлагаем ознакомиться в таблице, поданной ниже:

Средний прирост производительности в разгоне составил 6,2%. Самыми чувствительными к разгону оказались приложения, где присутствуют вычислительные задачи, но и там прирост производительности был в пределах 10-12%. В целом же, полученные результаты можно считать достаточно скромными. Даже APU предыдущего поколения Llano AMD A8-3850 показал в серии аналогичных тестов средний прирост производительности около 12,6%.

Анализ энергоэффективности

Одной из не менее интересных характеристик также является и энергоэффективность системы.

Наименование

Простой, Вт

LinX, Вт

EVEREST 5.0, Вт

AMD APU A10-5800K

55

139

125

Intel Core i7-3770K

59

129

104

Intel Core i5-2500K

59

139

116

AMD Phenom II X4 980

77

210

221

AMD Phenom II X6 1100T

74

232

251

Intel Core i7-2600K

58

142

118

Intel Core i7-2700K

59

153

127

AMD FX-8150

80

218

208

Intel Core i5-2550k

59

142

117

Intel Сore i5-3550

58

122

103

Intel Core i7-3820

70

191

148

Intel Core i7-3930K

79

233

177

AMD FX-4170

75

167

151

AMD APU A8-3850

58

168

148

Как видим, использование новой архитектуры Piledriver, на которой основан APU AMD А10-5800К, сделало его более энергоэффективным по сравнению с процессорами, построенными на архитектуре Bulldozer. Также благоприятно сказалось на снижении энергопотребления и отсутствие кэш-памяти третьего уровня. Таким образом, процессор AMD А10-5800К оказался значительно «прохладнее» своего аналога на платформе Socket AM3+ — AMD FX-4170. В сравнении с предыдущим поколением гибридных процессоров Llano, APU Trinity AMD А10-5800К также продемонстрировал лучшие результаты, не смотря на большую номинальную частоту.

Замеры энергопотребления процессора AMD А10-5800К в режиме работы без внешней видеокарты представлены в следующей таблице:

Простой, Вт

34

При максимальной нагрузке на GPU,Вт

81

При максимальной нагрузке на FPU,Вт

108

При одновременной нагрузке на GPU и FPU,Вт

145

Выводы

Сегодня мы познакомились со вторым поколением гибридных процессоров для настольных систем под кодовым названием Trinity. Новые APU Trinity сильно отличаются от предыдущей серии APU Llano. В первую очередь вычислительный блок APU Trinity основан на новой архитектуре Piledriver, которая является дальнейшим развитием архитектуры Bulldozer. Внедрение новой архитектуры позволило немного прибавить в производительности по сравнению с процессорами поколения Llano, а также заметно увеличить энергоэффективность системы при сравнительно большой частоте.

Более ощутимые результаты смогло продемонстрировать новое встроенное графическое ядро под названием Devastator. Оно основано на более современной архитектуре VLIW4 и в ряде тестов заметно опережает видеоядро с более ранней архитектурой VLIW5. Также не будем забывать о возможности объединения встроенного графического ядра с дискретным видеоускорителем в режиме Dual Graphics, что еще больше увеличит производительность всей системы в игровых приложениях. А учитывая наличие полноценной поддержки DirectX 11, OpenCL 1.1 и DirectCompute 11, интегрированное видеоядро позволит APU Trinity почти на равных соперничать со связкой Intel Core i5-3450 + NVIDIA GeForce GT 630 с 2 ГБ DDR3. Вообще, что касается компании Intel, то она получила достойного конкурента для платформы Sandy Bridge в лице второго поколения гибридных процессоров Trinity.

Одним из минусов новых APU является несовместимость с процессорным разъемом Socket FM1. Поэтому переход на новую платформу Socket FM2 «потянет» за собой и смену материнской платы, что подразумевает дополнительные расходы. Раз уж коснулись вопроса стоимости, то скажем, что рекомендованные цены на APU Trinity модельного ряда A10/A8/A6/A4 довольно демократичные и соответствуют ценам на процессоры предыдущего поколения APU Llano на старте продаж. К недостаткам APU Trinity также можно отнести наличие контролера памяти с поддержкой модулей, скорость работы которых не превышает 1866 МГц, и небольшой прирост производительности системы после разгона процессора.

Но все же, плюсов у нового поколения гибридных процессоров Trinity значительно больше чем минусов. И можно сказать, что компания AMD не прогадала, делая ставку на платформу Socket FM2, как на универсальное решение для персональных компьютеров.

Сергей Мещанчук

Выражаем благодарность компании Biostar Microtech за предоставленные для тестирования процессор и материнскую плату BIOSTAR Hi-Fi A85X.

Выражаем благодарность компаниям ASUS, Biostar, GIGABYTE, Kingston, Noctua, Sea Sonic, Scythe, VIZO за предоставленное для тестового стенда оборудование.

опубликовано 15-10-2012

Статья прочитана 146146 раз(а)

FILED UNDER : Железо

Submit a Comment

Must be required * marked fields.

:*
:*