«Спасибо за помощь, камрад!» Ускоряем игровой ПК на базе процессора AMD Ryzen

    Привет, Гиктаймс! Мы продолжаем изучать взаимодействие Ryzen с оперативной памятью. Сегодня займемся практическими исследованиями и ответим на все главные вопросы.

    Давно известно, что AMD Ryzen с медленной и быстрой «оперативкой» — это две совершенно разные в плане производительности системы. Давайте определим, какая DDR4-память лучше всего подходит игровым ПК на базе «красных» процессоров.



    Именно сейчас можно смело сказать: процессоры Ryzen удались. AMD выпустила хорошие решения, которые действительно конкурируют с чипами Intel. Интересно, что возродившаяся конкуренция повлияла и на действия, предпринимаемые главным соперником «красных», — компанией Intel. Поэтому в 2018 году, скорее всего, среднестатистический современный игровой компьютер будет собран на базе 6- или 8-ядерного CPU (Ryzen или Coffee Lake) c DDR4-памятью.



    Особенности игровой платформы AMD AM4


    На сегодняшний день для платформы AMD AM4, которая поддерживает процессоры Ryzen 3, Ryzen 5 и Ryzen 7, предусмотрено несколько чипсетов: A320, B350 и X370. Главной ее особенностью, несомненно, является тот факт, что высокочастотная оперативная память поддерживается всеми материнскими платами без исключения — от самых дешевых до самых дорогих устройств. И этим надо пользоваться.

    Двухканальный контроллер памяти DDR4, встроенный непосредственно в центральный процессор, поддерживает ОЗУ стандартов DDR4-2133, DDR4-2400 и DDR4-2666. Но есть один нюанс: работа на частоте 2666 МГц и выше возможна только для одноранговых модулей при условии их установки по одной планке в каждом канале.



    В то же время, начиная с версии микрокода AGESA 1.0.0.6, материнские платы для чипов Ryzen поддерживают оперативную память с эффективной частотой вплоть до 4000 МГц. Когда-нибудь мы будем вспоминать этот стандарт с улыбкой на лице и думать, какими же медленными были компьютеры в тем времена, но сейчас, на закате 2017 года, наиболее оптимальными (в том числе и в плане цены) вариантами смотрятся киты ОЗУ, работающие в диапазоне частот 2666-3200 МГц. Именно с такими наборами памяти процессоры Ryzen проявляют свои лучшие качества. Об этом говорит сама AMD. Об этом говорят производители материнских плат.



    Надо понимать, что рекомендации — это всего лишь рекомендации. Никто не запрещает использовать и более быстрые комплекты ОЗУ вместе с платформой AM4. Например, наш комплект памяти Kingston HyperX Predator HX433C16PB3K2/16 великолепно работает вместе с Ryzen. Используя материнскую плату ASUS ROG Crosshair VI Extreme, нам даже удалось «завести» этот набор ОЗУ на эффективной частоте 3466 МГц, не изменяя напряжения и таймингов.



    Хочется того или нет, но высокочастотная оперативная память потихоньку становится неотъемлемой частью любого производительного ПК. Особенно, если этот компьютер собран на базе компонентов AMD Ryzen. Некоторые важные характеристики архитектуры Zen, применяемой в процессорах Ryzen, описаны в этой статье.

    Во-первых, у чипов Ryzen очень медленно работает TLB-буфер. Во-вторых, частота работы встроенного северного моста Data Fabric жестко привязана к частоте работы оперативной памяти. Для лучшей синхронизации в Ryzen он всегда работает на частоте вдвое ниже эффективной частоты памяти. Получается, если в компьютере используется комплект оперативной памяти DDR4-2133, то Data Fabric работает на частоте 1066 МГц. Северный мост является одним из самых главных компонентов процессора Ryzen, так как именно он отвечает за взаимодействие CCX (CPU Complex) — кластеров, в которых размещены ядра и кеш. Чем меньше частота Data Fabric — тем хуже межъядерное взаимодействие в кристалле.



    На сегодняшний день абсолютное большинство приложений используют несколько потоков, поэтому ускорение работы северного моста в процессорах Ryzen положительно сказывается в задачах любого рода — в том числе и в играх. Надо понимать, что AMD сама позиционирует платформу AM4 как игровую. Современные игры спокойно задействуют больше четырех потоков, а потому использование быстрой ОЗУ положительно сказывается на количестве FPS. К тому же все Ryzen-чипы — будь то четырехъядерные Ryzen 3, шестиядерные Ryzen 5 или восьмиядерные Ryzen 7 — оснащены двумя кластерами CCX, а потому использование высокочастотной оперативной памяти положительно скажется на быстродействии всех моделей без исключения. Пруфы предоставлены далее в статье.



    Тестирование


    Для проведения нашего небольшого эксперимента использовался стенд с процессором AMD Ryzen 7 1700, разогнанным до 3,9 ГГц, набором памяти Kingston HyperX Predator HX433C16PB3K2/16 и видеокартой NVIDIA GeForce GTX 1080. Кит ОЗУ запускался со следующими настройками:

    • DDR4-2133 — тайминги 12-12-12-32, 14-14-14-34, 16-16-16-36 и 18-18-18-38;
    • DDR4-2400 — тайминги 12-12-12-32, 14-14-14-34, 16-16-16-36 и 18-18-18-38;
    • DDR4-2666 — тайминги 14-14-14-34, 16-16-16-36 и 18-18-18-38;
    • DDR4-2933 — тайминги 16-16-16-36 и 18-18-18-38;
    • DDR4-3200 — тайминги 16-16-16-36 и 18-18-18-38;
    • DDR4-3333 — тайминги 16-18-18-36 (XMP-профиль комплекта).



    В стенде использовалась операционная система Windows 10 x64 Pro. Все игры запускались в разрешении Full HD с использованием пресета качества графики «Высокое» и отключенным сглаживанием. На графиках указан минимальный и средний FPS, замеренный при помощи программы FRAPS.

    Основная тема заметки — игры, но давайте для большей наглядности добавим результаты тестирования в бенчмарках x265 и CINEBENCH R15. Как видите, увеличение частоты ОЗУ несколько ускоряет выполнение этих задач. Например, при переходе с DDR4-2133 до DDR4-3200 система при рендеринге в анимационном пакете CINEMA 4D стала быстрее на 3% при задержках CL16. В бенчмарке x265 наблюдается точно такая же ситуация. Вообще большой прирост производительности виден в таких задачах, которым необходимы большие объемы данных. К ним относятся архиваторы и графические редакторы. В этих приложениях разница между системами с разной «оперативной» может достигать 6-10 процентов.



    Все, расходимся? Как бы не так! В играх наблюдается более интересная ситуация, особенно если в системе установлена производительная игровая видеокарта. Например, в GTA V, если сравнить систему с памятью DDR4-2133 CL16 с системой с DDR4-3200 CL16, наблюдается разница в 14% и 22% в среднем и минимальном FPS соответственно. Приличная разница, согласитесь.

    Обратите внимание, какие просадки минимального фреймрейта появились в Battlefield 1 при использовании низкочастотной памяти с высокими таймингами (CL16, CL18). Вывод напрашивается сам: хотите комфортно играть в многопользовательские шутеры и избегать лагов в самые ответственные моменты — используйте хотя бы комплект ОЗУ DDR4-2666.

    Задержки памяти тоже заметно влияют на производительность в играх, поэтому нельзя не учитывать этот момент. Однако на графиках видно, что в ряде случаев прибавка частоты ОЗУ работает эффективнее снижения таймингов.

    Идеальный вариант для систем на базе чипов AMD Ryzen — это использование высокочастотной памяти с задержками не выше CL17/CL18.







    Если в систему установить менее производительные четырехъядерный процессор Ryzen 5 1400, так же разогнанный до 3,9 ГГц, то вместе с видеокартой GeForce GTX 1080 эффект процессорозависимости будет наблюдаться заметно сильнее. Смотрите сами: система с DDR4-2133 уступает компьютеру с DDR4-3200 при одинаковых таймингах целых 15% в GTA V. В «Ведьмак 3» эта разница достигает 21%, а в «Assassin’s Creed: Истоки» — 23%. Получается, что игровым ПК с более бюджетными процессорами Ryzen использование высокочастотной ОЗУ даже важнее, так как нагрузка на ядра и кеш увеличивается.







    *Во всех режимах использовалась память с таймингами 16-18-18-36.

    Выводы


    Надеемся, наш мини-эксперимент наглядно показал, что при сборке игрового ПК на базе платформы AMD AM4 и процессоров Ryzen в частности нельзя пренебрегать таким компонентов, как оперативная память. Даже в бюджетные системы необходимо устанавливать комплекты, работающие хотя бы на частоте 2666 МГц. Если же вы хотите получить максимум от своего игрового компьютера, то вам потребуется набор DDR4-3000+. Как видите, все очень просто.

    Дальше будет ещё круче! Подписывайтесь и оставайтесь с нами!

    Для получения дополнительной информации о продукции Kingston и HyperX обращайтесь на официальный сайт компании.
    Kingston Technology 116,47
    Компания
    Поделиться публикацией
    Комментарии 41
    • +1
      Хорошо, уже что-то читал похожее на
      стороннем ресурсе
      икзибит
      .
      Теперь бы еще про Intel найти похожие исследования.
      P.S. Впервые задумался о приобретении АМД системы.
      • +1
        Эх, молодежжж :)
        Мы в свое время только на АМД и сидели, после P-3 я сменил 3 амд-платформы прежде чем на интел вернулся. Это был core 2 duo который к тому времени подешевел и стал массовым, народным.
        • +1
          У Intel-а нет такой сильной привязки к скорости памяти. Имею i5-6600+DDR4 2666. Через XMP профиль работает нормально на 3200. Для себя специально тестировал. В синтетике разница примерно 10%. В играх разницы не вижу совсем, даже по FPS.
        • 0
          Интересно что мешает двухканальной работе с DDR4-4000? И появится ли эта возможность в будущем?
          • +1

            Может имеете в виду "Dual Rank"? Одноканальный режим тут вообще нигде не рассматривается.

            • 0
              Двухканальный контроллер памяти DDR4, встроенный непосредственно в центральный процессор, поддерживает ОЗУ стандартов DDR4-2133, DDR4-2400 и DDR4-2666. Но есть один нюанс: работа на частоте 2666 МГц и выше возможна только для одноранговых модулей при условии их установки по одной планке в каждом канале.

              Я об этом
              • +1
                при условии их установки по одной планке в каждом канале.
                — и где тут об одноканальном режиме?

                а почему так — дык банальная емкость входных цепей чипов памяти.
                • 0
                  Читаем еще раз, для одноранговых модулей.
                  У двухранговых модулей при том же объеме в 2 раза больше микросхем памяти, чем у одноранговых.
                  • +1
                    это какбы понятно. и не факт что микросхем больше (1Rx8 и 2Rx16 будут иметь такое же кол-во микросхем), тут на одной линии данных больше микросхем висит.

                    но комментатор выше почему-то спрашивал об одноканальном режиме. про который никто и полслова не говорил.
                    • +1
                      Про одноканальный режим не говорилось, главное чтобы в каждом канале(из 2х) было по одной одноранговой планке, иначе контроллеру памяти становится плохо от нагрузки.
          • 0
            Не знаю в тему ли, но я всегда заказывал память «для АМД», просто потому что дешевле.
            • +1
              Не совсем в тему. Тут речь о том, какие лучше подбирать частоты (а кроме того, стоит обращать внимание на производителя чипов) у памяти DDR4, которая предназначена для работы как на AMD, так и на платформе Intel. Вы же имеете в виду самопальную китайскую память, сделанную из чипов, сдутых с б/у планок, которая на Intel не заводится из-за того, что заточена под контроллер памяти AMD.

              Интегрированный контроллер памяти процессоров AMD поддерживает адресацию с использованием 11-разрядных столбцов и размером страницы 16 Кбит. Стандартные контроллеры памяти, встречающиеся в составе других платформ, используют 10-разрядные столбцы и размер страницы 8 Кбит.


              Причём с какого-то момента (по-моему, начиная с сокета FM2) такая память уже не работает даже на AMD.
            • +3
              Погоняйте вычислительную гидродинамику с разной памятью — всё-таки Ryzen больше всего годится именно для научных расчётов.
              • +1
                «у чипов Ryzen очень медленно работает TLB-буфер». Погуглил что такое TLB-буфер: TLB — это специализированный кэш центрального процессора, используемый для ускорения трансляции адреса виртуальной памяти в адрес физической памяти. Получается, это кэш-память. Но как кэш-память может работать медленно, если она функционирует на частоте процессора? Поясните, пожалуйста. Или может я что-то не так понял. Буду благодарен.
                • 0
                  Это другой кеш. Он не для данных, а для адресов. И отдельные части процессора могут работать на разных частотах, как быстрее, так и медленнее самого ядра (ядер). Тактироваться они так же могут по разному.
                  • 0

                    Сам TLB работает быстро, он транслирует виртуальные адреса в физические. Точнее L1 TLB работает очень быстро (1 такт?), но он очень небольшой (64 записи, одна запись описывает трансляцию одной страницы — чаще всего — 4КБ), его промахи попадают в L2 TLB, который уже медленнее (8 тактов), зато 1.5 тыс записей (физически такое количество записей сложно/невозможно адресовать за 1 такт высокой частоты).
                    Медленно обрабатываются промахи в (L2) TLB, когда TLU-блок процессора начинает хождение по таблице (дереву) страниц. В замерах http://www.7-cpu.com/cpu/Zen.html на разных размерах страниц заметно:
                    2 MB pages (32-bit)
                    2MB Data TLB L1: 64 items. full assoc. Miss Penalty = 8 cycles. Parallel miss:? cycles per access
                    2MB Data TLB L2: 1536 items. 2-way?. Miss Penalty =? cycles. Parallel miss:? cycles per access
                    4 KB pages mode (64-bit)


                    Data TLB L1: 64 items. full assoc. Miss penalty = 8 cycles. Parallel miss: 1 cycle per access
                    Data TLB L2: 1536 items. 8-way?. Miss penalty = 34? cycles. Parallel miss: 18? cycles per access (read from L3)
                    PDE cache =? items. Miss penalty =? cycles.


                      Size        Latency       Increase   Description
                    
                      32 K     4                           
                      64 K    11                       7   + 13 (L2)        
                     128 K    14                       3   
                     256 K    16                       2
                     512 K    20                       4   + 8 (L1 TLB miss)
                       1 M    35                      15   + 23 (L3)
                       2 M    42                       7
                       4 M    45                       3    
                       8 M    63 +  5 ns      18 +  5 ns   + 34 ? (L2 TLB miss)
                      16 M    72 + 48 ns       9 + 43 ns   + 90 ns (RAM)
                      32 M    82 + 70 ns      10 + 22 ns
                      64 M    87 + 81 ns       5 + 11 ns
                     128 M    97 + 86 ns      10 +  5 ns   
                     256 M   109 + 88 ns      10 +  2 ns
                     512 M   113 + 89 ns       4 +  1 ns
                    1024 M   125 + 90 ns      12 +  1 ns
                    

                    TLB работает на частоте процессорного ядра, оба D TLB находятся "рядом" (перед/параллельно) с L1 кэшем данных (попадание в L1 Tlb и L1d занимает в сумме 4 такта) — https://images.anandtech.com/doci/10591/HC28.AMD.11.png (I TLB — перед L1 кэшем инструкций — https://images.anandtech.com/doci/11170/AMD%20Ryzen%20Tech%20Day%20-%20Architecture%20Keynote-07%20-%20Copy%20%282%29.jpg; иллюстрации AMD из Anand 11170)

                  • 0
                    а почему нет тестов с модулями других производителей??
                    • +1
                      Потому что это блог компании.
                      • –2
                        Понимаю Ваш намек, но я хотел помягче спросить и имел ввиду — почему эта компания не производила тестов с другими модулями памяти других производителей? Есть модули, в разы лучше и компания не хочет рекламировать себя в друном свете? Желательно чтобы кто-то из компании ответил.
                    • +7
                      А давайте уже будем честны?
                      • +3
                        Как можно говорить о чесности, когда у вас снизу полосочки не с одного места начинаются. ;)
                        Ну а если серьезно, то похоже до широкой общественности инженеров начинает доходить тот простой факт, что узким горлышком в развитии производительности пк, давно стала оперативная память и вместо того чтобы изобретать ацкие костыли: ddr, тайминги и тд. Переходили на новые принципы оперативной памяти: mram, sram или что то другое.
                        Пора завязывать с кондесаторами!!!

                        • –1
                          да не вопрос, только готовы ли вы покупать SRAM по цене на порядок больше DRAM? т.к. 1 ячейка DRAM — 1 транзистор, 1 ячейка SRAM — 12 что ли.
                          • –1
                            1 ячейка DRAM — конденцатор, который просто держит заряд, да он дешев. НО его долго заряжать (ну в тех скоростях), его надо перезаряжать 50 раз в секунду, когда его читаешь его снова надо перезарядить, он может сам рязрядиться и многое многое, костылей там ппц.
                            1 якейка SRAM — 4 транзистора, могут работать на скорости проца, но кушают энергию как чугунный мост и очень большой процент брака, что делает их дорогими. Но если силы направить в эту сторону, то можно отладить и удешевить тех процесс, это я вам как инженер технолог говорю (на которого учился, но не работаю). Пример SSD сначала они были безумно дороги, а сейчас уже флешь память практически везде.
                        • +1
                          Во-во, даже где-то на хабре была статья про аццкую силу такой вот инфографики
                        • 0

                          Подумывал апгрейднуть свой Core 2 Quad на Ryzen, но с каждой статьёй про Ryzen тут я всё больше склоняюсь к мысли подождать ещё с полгода и взять потом Intel.

                          • 0
                            у меня тоже такие мысли (правда сижу на ddr3 i5-3470)
                            Но вот цена (2*8gbb ddr4 от 170евро убивает напрочь мысли о апгрейде)
                            16гиг это минимум на сегодня
                            • 0
                              А с чего это память в два раза выросла за год?
                          • 0
                            Как быстрая память поможет медленному TLB я так и не понял.
                            TLB хранит отображение виртуальных страниц в физические. Когда берётся страница для которой не был сделан перерасчет (или к ней давно не обращались и она выброшена из буфера) происходит TLB-промах (TLB-miss), во время которого рассчитывается новое отображение для страницы. Допустим в райзене TLB медленный, то что может сделать быстрая память? Ускорить рассчет нового отображения? О_о
                            • –3
                              вот сейчас бы в 2017 серьезно рассматривать амд вместо процессора
                              • +2
                                С выходом Ryzen — вполне себе достойный вариант
                              • 0
                                *Во всех режимах использовалась память с таймингами 16-18-18-36.

                                А нет ли результатов с другими таймингами, как для Ryzen 7? То, что разница в min FPS для DDR4-2400 12-12-12-32 и DDR4-3333 в большинстве протестированых игр укладывается примерно в 5% (кроме Ведмака и Battlefield, где разница больше, но при этом в разную сторону) — для Ryzen 5 тоже верно?
                                • 0
                                  У меня была проблема с Rayzen 5 и Hyper X — система работала, но постоянно через минут 5 сваливалась в BSOD. Тайминги прописаны, биос тоже последний прошит был. В даташите совместимости модель памяти была прописана почти до последнего знака, не совпадало только количество планок в ките, у меня был кит 2 по 8Гб, а в ДШ прописан 4 по 8Гб и цвет — у меня черный, в ДШ — красный. Спасло только одно — опускание напряжения питания до 1.23В, хотя память может работать почти до 3х вольт нормально.
                                  • +1
                                    На трех вольтах от нее должны были остаться угольки, это же не sdram
                                    • 0
                                      Вы правы, мой косяк, 1,3 Вольта. Память HX430C15PB3K2/16. Но суть та же, пока не снизил напряжение сваливалась в синий экран, хотя, по логике, если она есть в списке поддерживаемых материнкой, то сама должна была выбрать не то чтобы наилучше по производительности, но хотя бы оптимальное по работоспособности напряжение.
                                      • +1
                                        а это вопросы к производителю памяти.
                                        лично у меня от кингстона не особо приятные впечатления. уже обжигался на ам2+/ам3 — память типа работает, но в мемтесте раз в сутки проскакивает ошибка (единичная, но по одному и тому же адресу), итог — компиляция больших проектов валится, в myisam таблицы пишется мусор и т.п.
                                        причем — некоторые планки глючат если их 2 на канал, некоторые — даже если одна на канал стоит, некоторые — работают стабильно.
                                        сменил на кингстон с ЕСС — ни одного MCE с correctable/uncorrectable error за годы. т.е. могут же нормальные чипы ставить туда, где ошибки заметны… но — не хотят…

                                        впрочем, у других производителей тоже не все гладко было на ам2+/ам3.
                                  • 0
                                    А почему кингстон не делает память на трушных самсунговских чипах B-die, которые лучше всего подходят для райзенов? На оверклокерах немало людей кто и дуалранки стабильно на 3333 гоняет. Сам перешел на райзен летом, в целом доволен и даже память на чипах xynix m-die на 3200 в итоге завел, правда не без плясок с бубном, но т.т.т работает без нареканий
                                    • 0
                                      На КДПВ, я так понимаю, Кингстон должен ассоциироваться именно с Гагариным?
                                      • 0

                                        Я сам долго мозги пудрил из за частоты оперативы для рузена 1600, пока не наткнулся на интересную статью. http://forum.asrock.com/forum_posts.asp?TID=4963&title=ryzen-ram-frequency-and-gaming
                                        Поэтому я решил не переплачивать и поставил пару планок крушал балистикс спорт и разогнал их до 2800.

                                        • 0
                                          На AMD, надо с помощью bclk подбираться к заветным гигагерцам.
                                          Тогда результат будет впечатляющим.
                                          (в статье приведен пример «кукурузного» ускорения)
                                          (в статье вообще нет полезной информации об ускорении платформы AMD)
                                          • 0
                                            Во-вторых, частота работы встроенного северного моста Data Fabric жестко привязана к частоте работы оперативной памяти. Для лучшей синхронизации в Ryzen он всегда работает на частоте вдвое ниже эффективной частоты памяти. Получается, если в компьютере используется комплект оперативной памяти DDR4-2133, то Data Fabric работает на частоте 1066 МГц.

                                            память DDR — Double Data Rate — т.е. у неё частота, как и у Data Fabric — те же 1066МГц (и они работают в синхрнном режиме), а 2133 получает по повышению и понижению несущей частоты.
                                            • +1
                                              а 2133 получает по повышению и понижению несущей частоты

                                              называется «работа по фронту и срезу синхроимпульса»

                                            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                            Самое читаемое
                                            Интересные публикации