AMD представила процессоры Ryzen 7



    22 февраля 2017 года компания AMD официально представила семейство десктопных процессоров Ryzen. Те самые процессоры, которые должны наконец-то сделать AMD снова конкурентоспособной с Intel во всех рыночных сегментах, в том числе hi-end. Прошлое поколение процессоров Bulldozer во многом стало разочарованием и ограничилось преимущественно использованием в недорогих конфигурациях low-end. Технические характеристики новых чипов дают основания для осторожного оптимизма: AMD удалось добиться увеличения на 52% количества исполняемых машинных инструкций за такт (перевыполнена цель Zen в 40%). При этом восемь ядер и цена от $329 до $499. Это ставит Ryzen в один ряд с лучшими процессорами Intel.

    Семейство Ryzen большое, но первыми появятся в продаже самые высокопроизводительные чипы Ryzen 7. Все они с восемью ядрами, 16 потоками и поддержкой одновременной многозадачности.

    Линейка Ryzen 7 представлена тремя процессорами.

    • Ryzen 7 1800X: 8C/16T, 3,6 ГГц базовая частота, 4,0 ГГц турбо, 95 Вт, $499
    • Ryzen 7 1700X: 8C/16T, 3,4 ГГц базовая частота, 3,8 ГГц турбо, 95 Вт, $399
    • Ryzen 7 1700: 8C/16T, 3,0 ГГц базовая частота, 3,7 ГГц турбо, до 65 Вт, $329

    Топовая микросхема Ryzen 7 1800X стоимостью $499 должна конкурировать с процессором Intel Core i7-6900K стоимостью $1089-$1109. Согласно тестам производительности AMD, у этих процессоров примерно одинаковые результаты в однопоточных задачах. В многопоточных задачах Ryzen 7 1800X имеет преимущество.

    Тесты проводились в бенчмарке Cinebench. В однопоточных задачах процессоры показали одинаковый результат 162. В многопоточных у Ryzen 7 1800X — результат 1601, что на 9% больше, чем у Core i7-6900K.



    В сравнении наиболее мощных процессоров AMD и Intel первая имеет фору по частоте: базовая частота 3,6 ГГц против 3,2 ГГц у Core i7-6900K. В режиме турбо у них одинаковая частота 4,0 ГГц. Если тесты проводились на базовой частоте, то AMD может уступать Intel по показателю производительности на мегагерц. Но для большинства пользователей важен конечный результат, а не теоретические показатели. То есть реальная производительность и цена. По обоим этим показателям Ryzen 7 1800X превосходит Core i7-6900K, если верить AMD.

    Ryzen 7 1800X сейчас является самым быстрым 8-ядерным процессором на рынке, заявляет AMD. Похожие, бенчмарки Ryzen из недавней утечки были близки к реальным цифрам.

    Второй процессор из представленной линейки Ryzen 7 1700X ($399) в многоядерном бенчмарке Cinebench показывает результат 1537, то есть на 4% больше, чем у Core i7-6900K ($1089).



    В конце концов, третий процессор Ryzen 7 1700 с энергопотреблением до 65 Вт показывает в многоядерном тесте Cinebench результат 1410 баллов. AMD сравнивает его с результатом Core i7 7700K, который продаётся примерно по такой же цене $339, но Ryzen 7 1700 обходит его по производительности на 46%.



    Ryzen 7 1700 позиционируется как самый экономичный 8-ядерный процессор на рынке, при этом значительно превосходящий по производительности процессоры Intel той же ценовой категории. Ryzen 7 1700 идёт в комплекте с тихим кулером Wraith Spire, который работает на 32 дБ. Так что он будет значительно тише, чем два более мощных брата по линейке.

    В реальной задаче по кодированию видео в тесте Handbrake процессор Ryzen 7 1700 справился с задачей за 61,8 с, а Core i7 7700K — за 71,8 с.


    В 2009 году Федеральная торговая комиссия признала, что тесты Cinebench дают нечестное преимущество Intel в сравнении с процессорами AMD, поскольку используют оптимизации компилятора Intel

    Как и у Intel, в окончательном виде линейка Ryzen будет состоять из трёх семейств: премиальные процессоры Ryzen 7, среднеуровневые Ryzen 5 и самые дешёвые Ryzen 3. Сейчас представлены только самые производительные и дорогие, два остальных семейства выйдут позже в течение года, AMD не называет точные даты.


    Ryzen 7

    Новые процессоры уже доступны для предзаказа. Поставки начнутся 2 марта 2017 года. AMD планирует не допустить никакого дефицита: микросхем будет в избытке, также как обещают обильный выбор материнских плат на любой вкус. ASRock, Asus, Biostar, Gigabyte и MSI должны выпустить 82 разных модели материнских плат на платформе AM4 с чипсетами AMD X370 и B350. В самое ближайшее время в продаже появятся топовые геймерские десктопы, собраненые и оптимизированные для игр на платформе Ryzen (а во втором квартале выйдет ещё мощный видеоускоритель Radeon Vega, что только добавит всем счастья).


    Radeon Vega

    Демонстрация AMD Ryzen + Radeon Vega

    Если AMD сдержит все обещания, то на рынок десктопных процессоров может опять вернуться конкуренция AMD и Intel. Возможно, с ценовыми войнами, как в старые добрые времена. Это отличная новость для всех в мире, кроме сотрудников и акционеров компании Intel.

    Сейчас предзаказы на микросхемы и компьютеры с процессорами Ryzen открыты у 180 розничных магазинов и интеграторов.

    По мнению некоторых аналитиков, AMD специально растягивает анонсы во времени, чтобы оставить поле для тактического манёвра и нанести более сильный ущерб конкуренту. В то же время, у Intel тоже есть варианты для ответных действий. В первую очередь, это снижение цен на свои процессоры.
    Поделиться публикацией
    Реклама помогает поддерживать и развивать наши сервисы

    Подробнее
    Реклама
    Комментарии 360
    • +6
      Я уже ощущаю зуд в районе кошелька, очень уж хочется воплотить наконец-то одну давнюю задумку. С Интел выходило бы дороговато, а с АМД жаба может и ослабить железную хватку на горле.
      • +6
        я уже поощущал жжение в другом районе, я недавно воплотил наконец-то одну давнюю задумку как раз с Интел.
        • +4
          Сразу видно, что жаба у вас более слабая, сильно не душит. Моя — как Карелин :)
        • +8
          Компьютер по цене процессора Интелimage
          • 0
            А гроб белый сколько стоит?
            • 0

              это Eclipse – P400 или P400S (Silent Edition)
              гугл говорит что в районе $80

        • +3
          Хоть и сторонник AMD но всё время поражаюсь их логике, они постоянно сравнивают свою новую линейку с текущей линейкой Intel. И как обычно Intel выпускает новую линейку лучше. Почему не думать о перспективе и не сделать линейку с большим запасом мощности((
          • +5
            Если бы они так могли сделать — с удовольствием бы выпустили. Но на самом деле в ближайших новых линейках Intel ожидаются только 6 ядер в десктопном сегменте на Coffee Lake и Skylake-X для High-end, и Skylake-X скорее всего будет процентов на 5-10 (и это оптимистичные оценки!) быстрее Broadwell-E на равной частоте.
            • 0
              С учетом что за 4 предыдущих поколения они смогли из себя выдавить только около +20% (при одинаковом кол-ве ядер и частоте) скорости, то ничего кроме опускания цен на 6-ядерные камни до вменяемого уровня от них ожидать не стоит.
              • 0
                на самом деле неизвестно что интел может. у них просто стимула не было повышать производительность сильнее. так… слегка стимулировать граждан к покупкам. а вот теперь, если amd не сядет в лужу как в прошлый раз, мы и посмотрим что у intel есть в загашнике…
                • 0
                  На мой взгляд, начиная с Ivy Bridge, Intel занималась оптимизацией энергопотребления (и неплохо в этом продвинулась) и улучшением GPU (вроде бы тоже, мне трудно судить).
                  • 0
                    Можно и так сказать — для серверов и ноутбуков основной прогресс в энергоэффективность ушел (вычисления / 1 Вт мощности).
                    Для десктопов и ноутбуков — во строенную графику, которая сожрала большую часть прибавившихся за счет перехода на новые тех. процессы количества транзисторов.
                    В 6м поколении (skylake) даже в i7 графическая часть занимает уже больше площади кристалла и транзисторного бюджета, чем собственно сам процессор.
                    image

                    По графике прирост и правда очень солидный — от полной убогости в первых поколениях, до вполне приличного низкобюджетного решения.

                    Правда все-равно далеко до возможностей любых полноценных видеокарт. И даже все-еще отстают от встроенных графических модулей конкурента (гибридных APU от AMD)
                    • –1
                      В 6м поколении (skylake) даже в i7 графическая часть занимает уже больше площади кристалла и транзисторного бюджета, чем собственно сам процессор.


                      И лично мне это совсем не понятно. Абсолютное большинство людей вообще не пользуется встроенной графикой на i5/i7 какой бы хорошей она не была, лучше бы это место отдали под доп. ядра, а графику оставили в low-end и мобильных решениях. Надеюсь после пинка от амд до них эта мысль дойдет.
                      • +1

                        зачастую интегрированная графика используется в том случае, если компьютер собирается постепенно, когда денег нет на сборку всего и сразу, интеграшка дает возможность использовать компьютер хоть как-то, не дожидаясь покупки нормальной видеокарты

                        • 0
                          Или для офисов и другой работы, когда в навернутые игрушки играть вообще в принципе не предполагается.
                          Для работы современных встроенных видеоблоков более чем хватает.

                          Последние лет 5 в офис новые машины исключительно со встройками покупаем — либо APU от AMD либо реже i3(пару штук), ну и директору один i7 купили, хотя по большому счету он там и не нужен.

                          Единственная претензия к Intel, в том, что они поленились отдельный вариант без встроек выпустить и те кого дохлые встройки не устраивают но нужен мощный процессор (чтобы дополнить его мощной же видеокартой) по сути вынуждены переплачивать за не нужную им почти половину процессора.

                          У AMD все стройно и логично. Устраивает слабая графика и нужно сэкономить купив бюджетное решение 2в1? Вот вам APU. Нужен мощный процессор и при этом не переплачивать за графический блок, которым все-равно не будете пользоваться т.к. к достаточно мощному ЦП в комплекте пологается и полноценная видеокарта?
                          Вот вам FX серия (а теперь Ryzen)
                        • 0
                          Есть 2011 без графики, но прирост там не сказать, что космический.
                          • +1
                            Ну там хотя бы количество ядер увеличилось. На что и ушли дополнительные транзисторы появившиеся за счет перехода на новые тех.процессы, вместо спускания их на встроенную графику в массовых решениях.

                            Что дает хороший прирост в ПО которое умеет полноценно много вычислительных потоков использовать.
                          • 0
                            Абсолютное большинство как раз пользуется встроенной графикой, поэтому у Intel первое место на рынке графических процессоров.
                • +1
                  Ну а как сравнивать что-то с будущей линейкой, ее же нет. Да и запас, судя по всему, есть. Процессоры, похоже, очень быстрые будут, даже если Intel прилично улучшит следующее поколение, Рязань все равно должна остаться конкурентноспособной в текущем виде, а потом и ее улучшить можно будет дальше. Главное для AMD, имхо, начать продавать дорогие процессоры, чтобы было больше денег на R&D
                  • +4
                    Вы не учли того, что красные безнадёжно остали на много лет со своими FX, ставшими в наши дни объектами поклонения у широких масс с бюджетом 100$ на всю сборку, включая стол, стул и периферию.

                    Чтобы смотреть в завтрашний день, надо хотя бы очутиться в сегодняшнем. Ryzen в кои-то веки даёт красным вернуть позиции хоть как-то. Первое поколение наконец поступает в продажу, а там и не за горами прямая дорога в будущее, всё в их руках.
                    • +2
                      AMD серьзёно отстала от Intel с выпуском Sandy Bridge 6 лет назад. С тех пор рост производительности процессоров Intel сильно замедлился — 5-10% на поколение, а это очень медленно. Возможно, причиной было доминирующее положение.

                      Сейчас же AMD удалось догнать процессоры Intel по производительности. Производительность одного ядра Ryzen, конечно, не дотягивает до Skylake, но уже немного превышает Sandy Bridge. Очень надеюсь, что это приведёт к полноценной конкуренции и более быстрому росту производительности процессоров.
                      • 0
                        вы статью читали? на картинки смотрели? с чего вы взяли, что skylake быстрее ryzen?
                        • +1
                          с чего вы взяли, что skylake быстрее ryzen?

                          Производительность одного ядра Ryzen, конечно, не дотягивает до Skylake, но уже немного превышает Sandy Bridge. Но AMD опять берёт верх числом ядер.

                          Я уже довольно много статей почитал, и доверия они у меня не вызвали — пока что всё вилами по воде писано, но в большинстве случаев i7 6900K оказывался быстрее. Нужно ждать официального релиза и честных тестов.
                          • 0
                            да, посчитал, действительно выходит 200 против 240 скайлейка, грустняво, но цена всё равно хороша.
                            • +1
                              Делить результат на кол-во ядер в тесте, который далеко не идеально масштабируется с ростом кол-ва вычислительных потоков бестолковое занятие. Да еще на процессорах с весьма сильно отличающимися частотами работы (i7 7700k 4.2/4.5 ГГц, R7 1800X 3.6/4.0 ГГц).
                              Тут надо прогонять тесты на высокочастном варианте R3 или R5 с 4/6 ядрами, чтобы корректно сравнивать с 4х ядерными Skylake без экстраполяций.

                              А пока видно, что при одинаковом кол-ве ядер и частоте скорость получается примерно на уровне 5-6 поколений iCore, а до Skylake если и не дотягивает, то совсем немножко.
                              Даже если эти 200/240 взять, то это ~20% разницы по скорости на 1 ядро при ~15% разницы по рабочей частоте.
                    • НЛО прилетело и опубликовало эту надпись здесь
                      • +2
                        Согласен. Хоть и сам поклонник Intel, но пинка им дать давно как пора! Надеюсь, возрождение AMD, как производителя конкурентоспособных процессоров, этот пинок им обеспечит.
                      • +1
                        Ну если следующее поколение процессоров intel даст прирост производительности такой же как два прошлых, то Ryzen все-равно в игре.
                        • 0
                          Без повышения частоты производительность на поток дешево расти не будет.
                          Сейчас есть только два варианта существенного роста — «идеальный кеш» и «идеальные предсказания». А для этого нужен большой объем памяти рядом с ядром, загрузка алгоритмов в кеш-контроллер и BPU, реализация суперспекулятивности, когда иногда обе ветки выполняются одновременно, но на разных ядрах.
                          • +1
                            Можно просто увеличить параллелизм внутри одного ядра — увеличить кол-во исполняющих блоков и пропускную способность декодера инструкций, вместо простого увеличения количества одинаковых ядер.

                            Но это потребует разработки ядра практически с нуля, а не умеренного тюнинга уже существующей архитектуры типа добавки кэша или подкручивания предсказателя переходов.

                            AMD на это решилась и практически в один прыжок ликвидировала отставание от лидера, который до этого 5 лет постепенно уходил в отрыв 6 раз подряд оптимизируя одну и ту же базовую архитектуру iCore вместо разработки новой.

                            Так же как когда-то сама Intel решилась закопать бабушку выкинуть NetBurst на свалку и сделала огромный скачок с переходом на Core.

                            Забавно как компании в очередной раз поменялись ролями.
                            • 0
                              Я уже думал про дополнительные исполнительные блоки. Рост может быть только в очень специфичных задачах. Так что не подходит.
                              Лучше уж сделать как в Power8. Его ядро можно представить как два, которые на однопоточной нагрузке объединяются. Тем самым увеличивается количество доступных ФУ.
                              Заголовок спойлера
                              Most instructions (except for branches and condition register logical
                              instructions) are processed through the Unified Issue Queue (UniQueue),
                              which consists of two symmetric halves (UQ0 and UQ1).

                              There are also two copies of the general-purpose (GPR0 and
                              GPR1) and vector-scalar (VSR0 and VSR1) physical register files. One copy is
                              used by instructions processed through UQ0 while the other copy is for
                              instructions processed through UQ1.

                              The fixed-point, floating-point, vector, load and load-store pipelines are
                              similarly split into two sets (FX0, FP0, VSX0, VMX0, L0, LS0 in one set, and
                              FX1, FP1, VSX1, VMX1, L1, LS1 in the other set) and each set is associated
                              with one UniQueue half.

                              In ST mode, the two physical copies of the GPR and VSR have identical
                              contents. Instructions from the thread can be dispatched to either one of the
                              UniQueue halves (UQ0 or UQ1). Load balance across the two UniQueue
                              halves is maintained by dispatching alternate instructions of a given type to
                              alternating UniQueue halves.


                              In the SMT modes (SMT2, SMT4, SMT8), the two copies of the GPR and VSR
                              have different contents. The threads are split into two thread sets and each
                              thread set is restricted to using only one UniQueue half and associated
                              registers and execution pipelines.


                              С декодером проблем нет.

                              Вот моделирование для 16-wide issue processor с идеальным кешем, идеальным предсказанием:

                              image
                              • –2
                                Ещё немного и вы Hyper-Threading заново изобретёте.
                                • +1
                                  HT увеличивает многопоточную производительность. А я про однопоточную.
                                  • –3
                                    Его ядро можно представить как два, которые на однопоточной нагрузке объединяются.

                                    Ну так вы только что описали HT.

                                    • 0
                                      Нет, это не HT.
                                      При on/off HT количество доступных исполняющих устройств на поток не меняется.
                                      Я же пишу про HT наоборот, когда поток может получить доступ к ресурсам второго ядра.
                                      • –1
                                        При on/off HT количество доступных исполняющих устройств на поток не меняется

                                        Это почему же? При включённом HT два потока, выполняющиеся на одном ядре, вынуждены пользоваться общими ресурсами ядра. Поэтому при включении HT количество доступных ресурсов уменьшается пропорционально загрузке.

                                        • +3
                                          Мне нужно было написать "возможно доступных исполняющих устройств".
                                          Так как HT не меняет их количество.

                                          Еще раз. Я писал про производительность НА ПОТОК.
                                          Человек предложил повысить количество ФУ. Но это мало что даст, т.к. очень мало задач требует большего числа ФУ, да и это редко является узкой частью из-за промахов кеша и ложных предсказаний. И раздувать ядро ради нескольких процентов в некоторых задачах как-то глупо.
                                          Вот я и предложил сделать тесно связанные ядра, чтобы на ОДИН ПОТОК можно было использовать ресурсы второго ядра.
                                          Это и есть «HT наоборот», когда два ядра обрабатывают один поток для увеличения ОДНОПОТОЧНОЙ производительности.
                                          Когда как HT делит часть ресурсов одного ядра, чтобы загрузить их по максимуму для увеличения МНОГОПОТОЧНОЙ производительности.
                                          • 0
                                            Это и есть «HT наоборот», когда два ядра обрабатывают один поток для увеличения ОДНОПОТОЧНОЙ производительности.
                                            Когда как HT делит часть ресурсов одного ядра, чтобы загрузить их по максимуму для увеличения МНОГОПОТОЧНОЙ производительности.

                                            Принципиальной разницы между этими решениями нет. В обоих случаях имеем логические ядра с разделяемыми ресурсами.

                                            • 0
                                              Разница в цене, так как она имеет нелинейную зависимость от сложности ядра.
                                              И вот тут пара простых ядер намного дешевле, чем одно суперядро.
                                              Да и для многих задач не нужны большие ядра.
                                              Так что это только на бумаге 1+1 = 2 и 2/2 = 1
                                              • 0
                                                Пара простых ядер будет медленнее чем одно сложное. Пример — Atom, в котором применили простые ядра (насколько я помню без поддержки суперскалярности). Как результат — значительная потеря производительности.
                                                • 0
                                                  В атомах главная проблема (по крайней мере в старых, за новыми не следил) был отказ от out-of-order execution (внеочередного исполнения команд)

                                                  Из-за чего ФУ часто по долгу простаивали — в ожидании подгрузки данных из памяти (или в лучшем случае кэша) или завершения предыдущего вычисления из которого нужно использовать результат как входные данные следующего.
                                                  • 0
                                                    Так OoE (иначе называемая суперскалярность) и есть одна из главных сложностей в современном ядре. Отказ от OoE — цена за упрощение ядра.
                                            • +1
                                              Если можно ускорить обработку одного потока, то можно просто сделать более мощное ядро, а потом его разделить как HT. Возможно сейчас нет возможности улучшить производительность в однопоточном режиме, по-моему такой возможности давно особо нет, так мелкие улучшения но ни каких капитальных революций. Собственно потому и начали в свое время внедрять два ядра и стимулировать софт к многопоточности.
                                              • +1

                                                А если ядер больше двух? И еще всякая дерготня через apic бегает? Опрашивать планировщиком, а не схлопнулись ли у нас ядра? А то некоторые процедуры бывают весьма time-critical, их нельзя вешать на "временно отсутствующее" ядро, чьи ФУ отданы другому.
                                                Значит, надо сразу делать матрицы регистров, ИУ, декодеров, предсказателей, ВВ, программно конструировать цепочки ИУ и работать на архитектуре с условным выполнением инструкций. Итого вырисовывается какой-то arm-asic grid, причем сильно смахивающий на видеокарту.
                                                Зато можно будет для множества нетребовательных задач расхлопнуться до decoders/2 логических процессоров, а для жесткой векторной арифметики хоть почти все узлы отдать одному логическому процу, оставив минимум под систему. Заработало ядро — затребовало из пула ресурсы, закончило обработку — отдало все ресурсы обратно в общий пул. Осталось еще beamVM портануть прямо на железо, и вот он — мега-SoC будущего, который захватит мир.
                                                Правда, до того миру надо будет сильно упереться в пределы горизонтального масштабирования, которые пока что все еще удается отодвигать. Ну и схожего эффекта можно достичь и другими, не столь экстравагантными, способами.

                                                • +1
                                                  Какие несколько %? Самый кардинальные скачки в эффективности процессорных архитектур как раз и происходили только при увеличение кол-ва ФУ в ядре и увеличении пропускной способности декодера x86 в микроинструкции.

                                                  1й принципиальный скачок — переход к суперскалярной архитектуре в Pentium после 8086-486х. До этого в ядре было только по одному ФУ каждого типа и декодер способный выдавать по 1 инструкции/такт.
                                                  С Pentium декодер расширился до 2инструкций/такт и часть ФУ в удвоенном количестве.

                                                  2й скачок P6 с добавлением ФУ и расширением декодера до 3 инструкций/такт. Так же ввода SIMD (тоже больше ФУ в ядре)
                                                  Следующий скачок скорости — Core с еще большим количеством ФУ на ядро и декодером на 4 инструкции/такт. Который за счет этого превосходил как NetBurst так и конкутирующие K8 и K10 от AMD у которых декодер и ФУ были разработаны под 3 инструкции/такт.

                                                  У АМД ядра бульдозеров (FX серия) получились такими слабыми опять же из-за этого: часть ФУ разделена между 2мя ядрами, а производительность декодера только 2 инструкции/такт. В результате огромное отставание в однопоточной нагрузке от конкурента

                                                  AMD ZEN — отказ от узких 2/такт декодеров и разделяемых ФУ, полноценный декодер на 4 инструкции/такт как у iCore (+ до 2 иструкций из кэша уже декодированных). И сразу в один прыжок догнали Intel.
                                                  • –1
                                                    Я правильно понимаю что от этого будет выигрышный только если эти 4 инструкции не зависят друг от друга? Тогда их можно распараллелить на несколько ФУ. Но фактически если сделать всех ФУ х2 и 2 инструкции за такт, то получаем 2 полноценных ядра + систему авто распараллеливания. Если же не все ФУ удвоены, а только самые востребованные то выходит экономия кремния. Если же отдавать эти дополнительные ФУ как виртуальное ядро, то даем возможность параллелить не только автоматически но и разработчикам.

                                                    И идея НТ наоборот заключается в том, чтоб взять 4 ядра с их 4 инструкции за такт и доп ФУ и эмулировать одно ядро на 16 инструкций за такт и кучей ФУ?
                                                    Если да, то мне кажется что это не сработает, наверное мало где бывает так чтоб по 16 независимых команды шли постоянно. Наверняка есть определенный предел мощности декодера, после которого идут или промахи предсказания ветвлений или просто ожидание результатов постоянное.

                                                    Может по этому они и стали делать реальные ядра, да еще и отдавать ресурсы по НТ, что уперлись в этот предел. И дальше нужно уже просить разработчиков нормально параллелить код, а не пробовать делать это автоматом налету.

                                                    А что если пробовать это все делать на уровне компилятора, находить такие не связанные инструкции и помечать их особым образом как те, что можно выполнять одновременно. Тогда можно отказаться от сложных декодеров, системы предсказания ветвлений. Правда хз как при этом сохранять контекст каждого микро потока…

                                                    Ладно, тема сложная, пускай специалисты лучше думают :)
                                                    • +1
                                                      Не обязательно не связанные. Сейчас все приличные ядра выполняют инструкции вообще не в том порядке в котором они записаны в программе (Внеочередное исполнение)
                                                      Поэтому когда попадаются инструкции зависящие по цепочке друг от друга, то все такие зависимые кроме первой «встают на паузу» и идут на исполнение по мере получения результата от предыдущей, а остальные ФУ в это время просто загружаются другими инструкциями — не зависящими друг от друга или для которых предыдущие от которых они зависели уже посчитаны.
                                                      Проблемы начинаются только когда таких взаимозависимых инструкций очень много — большая часть кода из таких состоит и из-за этого в пределах кэша инструкций уже не остается независимых, которые можно отправить на ФУ.

                                                      Смысл HT — прикинуться дополнительным ядром и взять 2й поток на тоже самое физическое ядро. Как раз чтобы загружать множественные ФУ внутри одного мощного ядра в моменты, когда они простаивают из-за того, что все ближайшие не связанные друг с другом инструкции уже обсчитаны и нужно ждать пока будут готовы данные предыдущих. Или в моменты когда дожидаемся подгрузки данных из памяти и ФУ простаивают по этой причине (например неправильное предсказание перехода — данные из памяти заранее не погрузились и инструкция будет десятки тактов ждать данных из основной памяти).

                                                      HT позволят подхватить инструкций из другого потока, которые почти гарантированно не будут зависеть от результатов инструкций в основном потоке. Т.к. либо относятся вообще к другом приложению, либо к другой задаче внутри одного приложения. Или же даже если это много потоков по обработке той же задачи в одном и том же приложении, но тогда программист должен был об распараллеливании сам подумать и как-то его реализовать.

                                                      Т.е. HT это источник независимых инструкций, позволяющий снизить простои ФУ.
                                                      В результате польза от него не очень большая и сильно варьирует от приложения от нескольких десятков % выигрыша и вплоть до отрицательных значений, когда итоговая скорость наоборот немного снижается. Если код и так хорошо на ФУ раскидывается и их загрузка близка к максимальной, то HT лишь увеличивает «накладные расходы» на работу с 2мя потоками вместо одного.

                                                      Идея свалить все на программистов — пусть у них голова об этом болит как расстреливать вычисления, совсем не новая. Примерно то что вы описали есть в архитектуре VLIW
                                                      Пробовали уже много раз, но как говорится «не взлетело».

                                                      Отказ от наращивания мощности ядра и вместо этого простое их тиражирование, которым занимались оба лидера последние годы — по сути другой подход к тому же. Пусть там программисты думают, как свое ПО на кучу независимых потоков разложить, а мы будем просто копировать одинаковые ядра вместо разработки новых более мощных/эффективных.

                                                      Но если используемый алгоритм и обрабатываемые данные позволяют их эффективно раскладывать на неограниченное количество независимых потоков, то с подобной работой намного лучше справятся вообще GPU, которые имеют просто гигантское преимущество на подобных задачах — скорость современных процессоров и близко не стояла.

                                                      А от CPU хочется все-таки как можно большей скорости выполнения последовательного кода.
                                                      • 0
                                                        Ясно, подскажите, может знаете как на это реагирует график загрузки ядер в винде? Я замечаю что четные ядра загружены постоянно, а нечетные редко (вот примерно так http://c2n.me/3HSzsXK) Я думал что-это как раз связанно с тем, что нечетные ядра не настоящие, и их загрузить получается не всегда.
                                                        Но вот например компиляция проекта или запуск хрома с парой сотен вкладок загружают все ядра по полной. Можно это считать эффективным использованием НТ? Или нужно только делать вкл\выкл и замерять время?

                                                        В свое время я запускал одинаковые виртуалки с одинаковой нагрузкой на разном железе. На старых двуядерных системах я мог запустить только две. На 6 ядерном феноме — 6 виртуалок. А на 3770 10 штук. Я всегда считал это доказательством эффективности НТ в бытовых задачах. Я не прав?
                                                        • +1
                                                          Просто если ОС видит, что реально нагруженных потоков работой меньше чем логических ядер, то для максимальной скорости работы правильно и эффективно будет поместить по одному такому потоку на каждое физическое ядро, а виртуальные HT ядра оставить не используемыми или повесить на них какие-нибудь слабо нагруженные потоки.

                                                          Это оптимизация по скорости на уровне ОС. 2 потока на 2х разных физических ядрах разумеется будут работать намного быстрее, чем эти же 2 потока попавшие в одно физическое ядро через HT.
                                                          Внутреннюю загрузку ФУ внутри ядра ОС не видит, в обоих случаях будет отображаться 100% загрузка, только реальная скорость во 2м случае (2 потока попали в одно физ. ядро) будет намного ниже.

                                                          С виртуалками обычно вообще объем памяти критическое ограничение. Больше ядер конечно не помешает, но в плане увеличения скорости их работы, а не самой возможности их использовать.
                                                        • +1
                                                          Но если используемый алгоритм и обрабатываемые данные позволяют их эффективно раскладывать на неограниченное количество независимых потоков, то с подобной работой намного лучше справятся вообще GPU

                                                          Во-первых, GPU вроде как весьма проседают на бранчинге (хотя, может, уже и нет).
                                                          Во-вторых, писать под них существенно сложнее. Нельзя просто взять и собрать имеющийся код на плюсах, скажем, под GPU, тогда как параллелить грамотно написанный код куда проще.
                                                      • +1
                                                        AMD ZEN — отказ от узких 2/такт декодеров и разделяемых ФУ, полноценный декодер на 4 инструкции/такт как у iCore (+ до 2 иструкций из кэша уже декодированных). И сразу в один прыжок догнали Intel.

                                                        Но, к сожалению, не перегнали. Скорее, только достигли уровня Sandy Bridge.
                                                        Например, FPU: у AMD был один FPU на 2 ядра, стало два 128-битных FPU на ядро. У Intel же уже с Haswell имеется по два 256-битных FPU на ядро. То есть могут оказаться задачи, в которых Zen в 8 потоков будет работать со скоростью 4-ядерника Intel.

                                                        • 0
                                                          Было 2 128 битных FMAC на модуль (при этом делимых между 2 ядрами) работающих с плавающей запятой, стало 2 256-битных FMAC в каждом ядре.
                                                          Все как у самых современных Intel
                                                          image

                                                          Там только какие-то сложности с реализацией AVX инструкций, из-за чего по 2 AVX 256 битных за такт по какой-то причине не может выполнять.
                                                          • 0
                                                            Было 2 128 битных FMAC на модуль (при этом делимых между 2 ядрами) работающих с плавающей запятой, стало 2 256-битных FMAC в каждом ядре.
                                                            Все как у самых современных Intel

                                                            Данная диаграмма датируется весной 2015 года и не соответствует действительности. В обзорах последнего месяца указывается, что блоки AVX в Zen будут 128-битные. Возможно, в Zen+ они станут полноценным.

                                                            • 0
                                                              Как-таковых блоков AVX там нет вовсе. AVX это набор инструкций, которые каким-то образом по усмотрению разработчика процессора транслируются на универсальные исполнительные устройства
                                                              На новых схемах архитектуры Zen 4 блока по работе с плавающей точкой + 4 блока с целочисленными данными в каждом ядре.

                                                              Видимо какие-то ограничения в трансляции, когда 2 AVX-256 инструкции нельзя одновременно исполнить на этих 4 блоках за 1 такт.
                                                              А вот до 4х других инструкций для данных с плавающей точкой за такт — можно.
                                                          • 0
                                                            Не дописал. 2 256 бит AVX за такт оно не может, но судя по описаниям например может одну AVX + 2 других инструкции с плавающей запятой (SSE или х87) за один такт.

                                                            А целочисленных ФУ 4 штуки 128 битных на каждое ядро (против 2 на ядро в бульдозерах)
                                                            • +1
                                                              То есть могут оказаться задачи, в которых Zen в 8 потоков будет работать со скоростью 4-ядерника Intel.

                                                              1. Такой код нужно на ГПУ исполнять.
                                                              2. Иначе, скорей всего, производительность упрется в память, а еще и про другие инструкции не стоит забывать. Так что про разницу в 2 раза на реальных задачах для CPU я слабо верю.
                                                              • +1
                                                                1. У кода на GPU есть недостаток: его ещё нужно написать. Не для каждой задачи это целесообразно делать.
                                                                2. Да, текущие тесты показывают, что разницы нет. Может быть, в определённых синтетических сценариях она и будет — не знаю.

                                                                Я думаю, стоит дождаться выхода официальной документации на процессоры, а не гадать.

                                                              • +1
                                                                Тут появилось время и почитал поподробнее об архитектуре. Да, тут правы — FPU блоков вообще 4х128 бит, но не универсальных. 2 сумматора и 2 для умножения. Такой набор способен выполнить за 1 такт:
                                                                — до 8 обычных х87 инструкций с плавающей точной для 64 бит данных, в реальности до 6/такт, т.к больше через диспетчер не пролезет
                                                                — до 4 отдельных SIMD инструкций над 128 бит данными, но не более 2х одного типа
                                                                — 2 комбинированных инструкции умножения+сложения (fused multiply-add = FMA) над 128 бит данными
                                                                — до 2 простых AVX/AVX-2 инструкции над 256 бит данными если они разного типа
                                                                — 1 одну сложную (fused) AVX-256 инструкцию

                                                                В плане исполнительных блоков с плавающей точкой это уровень Ivy Bridge, 3го поколения iCore.
                                                                Начиная с Haswell по FPU части iCore помощнее. Но вот 2х кратного преимущества там не получается.
                                                                Вообще преимущество будет только на хорошо оптимизированном коде использующим сплошной поток из AVX-256 или FMA3 инструкций(что достижимо в основном в систетике, а не реальных приложениях).
                                                                При использовании обычного кода из х87 и SSE x инструкций пользы от большего кол-ва исполнительных блоков Haswell нет — через декодеры и диспетчер нужное количество инструкций просто не пролезет, чтобы их все загрузить работой.

                                                                На подобном хорошо оптимизированном коде из чистого AVX-256, которые полностью загружают 2 FMA256 блока ядра Haswell, тот начинает включать «анти буст/анти турбо» — не просто вырубает любой буст по частоте, но начинает сбрасывать частоты ниже базовой и троттлить из-за того что эти блоки в нем жрут слишком много энергии и слишком сильно греются. В некоторых материнских платах даже появилась настройка отдельного множителя — до какой частоты притормаживать если плотный AVX код идет.
                                                                Т.е. 2 сложных 256 бит инструкции за такт Haswell тоже выполнять не может как и Zen. Ну формально может, но только на частотах даже ниже базовой.

                                                                Преимущество на хорошо оптимизированном специализированном коде все-равно остается (т.к. 2 инструкции/такт на сниженной частоте все-равно лучше чем 1/такт на высокой частоте), но не 2х кратное.
                                                                • +2
                                                                  Вообще преимущество будет только на хорошо оптимизированном коде использующим сплошной поток из AVX-256 или FMA3 инструкций(что достижимо в основном в систетике, а не реальных приложениях).

                                                                  Обычная свёртка в обработке изображений или линейная алгебра — это и есть сплошной поток FMA. Другое дело, когда код написан без использования векторных операций, тогда преимущество Intel в виде большего количества вычислительных блоков действительно теряется.


                                                                  На подобном хорошо оптимизированном коде из чистого AVX-256, которые полностью загружают 2 FMA256 блока ядра Haswell, тот начинает включать «анти буст/анти турбо» — не просто вырубает любой буст по частоте, но начинает сбрасывать частоты ниже базовой и троттлить из-за того что эти блоки в нем жрут слишком много энергии и слишком сильно греются.

                                                                  Неужели всё настолько ужасно? Мой Sandy Bridge (32 нм, 4 ядра, по одному AVX256 блоку на сложение и умножение) с довольно сильным разгоном не уходит в тротлинг под максимальной вычислительной нагрузкой. Неужели снижение техпроцесса с 32 нм до 14 нм так и не привело к значительному снижению тепловыделения?

                                                                  • 0
                                                                    Я не знаю пофиксили ли это в самых последних итерациях iCore (SkyLake и Kaby Lake), которые делаются по 14 нм технологии.

                                                                    А вот в Haswell и Broadwell где удвоенное количество FPU блоков впервые появилось было довольно плохо. Особенно в Haswell который молча начинал по частотам скакать, хотя вроде еще предельная температура (100 гр) не достигнута и вроде бы охлаждение справляется.
                                                                    В Broadwell это более явно сделали и дали возможность регулировать — задавать отдельно частоты для работы под AVX и во всех других режимах. Но все-равно вполне обычное дело скачок в +15-20 градусов при задействовании AVX по сравнению с полной нагрузкой всех ядер обычным кодом на той же частоте. Настройку ввели, чтобы можно было выставить гибридный режим — скажем с AVX работаем на 3.5 ГГц, а все остальное время на 4+ ГГц.

                                                                    Если правильно понимаю там главная проблема не столько общая потребляемая мощность и выделение тепла, как то что они приходятся на очень маленький/компактный вычислительный FPU блок. Тепло не успевает распределятся по кристаллу(теплопроводность же не бесконечная), схемы мониторинга и управления сбрасывают частоты, чтобы не допустить локального перегрева.

                                                                    И в этом плане новые тех.процессы без изменения архитектуры (если просто отмасштабировать ту же схему на новые производственный нормы) могут даже несколько хуже сделать, т.к. потребление энергии на работу одиночного транзистора снижается меньше чем уменьшается занимаемая им площадь. В результате удельные потребление энергии/нагрев (на 1 мкм2 площади активного выч. блока) наоборот немного увеличиваются.
                                                              • 0
                                                                А вы на Интел гляньте с 2010 года. Ядро все сложнее, ROB раздули, планировщик раздули, а однопоточная производительность очень слабо растет.
                                                                Только сильно увеличили многопоточную.
                                                                • +1
                                                                  У меня в соседнем окне предельно тупая однопоточная задача на i7-3930K @ 4.2 ГГц считается в более чем два раза медленнее, чем та же задача на неразогнанном i7-6700 @ 3.4 ГГц.

                                                                  Правда, в ещё одном окне есть ещё одна задача, в которой выигрыш — процентов 25 хорошо если.
                                                        • +1
                                                          Это наоборот.
                                                • 0
                                                  Ну так у Intel и число ядер не растет уже лет 7 не растет.
                                                  • 0
                                                    Ещё как растет. В 2012 было максимум 8 ядер, а в конце 2014 стало 18 ядер.
                                                    • +2
                                                      На серверах — возможно. А на десктопах i7 заморозились.
                                                      • 0
                                                        2011 сокет выпускают все кому не лень и во всех возможных форм-факторах можно хоть в тайваньский инвин ставить. А есть ещё Workstation где двухпроцессорные мамки стоят.

                                                        У нас на работе недавно только купили в КБ xeon 10 ядерный, до этого брали им 6 ядерные, для них это обычные компьютеры (и да корпуса inwin), на них cтоит windows 7 и solidwork
                                                      • 0
                                                        Правда там нюанс есть, было 8 ядер по 3.1 ггц, стало 18 по 2.3 ггц. Это рост в 1.6 раза.
                                                        Сейчас 24 по 2.4, это рост в 2.3 раза.
                                                        В начале 2011 было 6 по 3.47 ггц Тогда выходит что за 7 лет прирост 2.77 раза.
                                                        Конечно такие подсчеты не учитывают разных архитектурных улучшений, тем не менее «грубая производительность» выросла за 7 лет не так уж и сильно.
                                                        На десктопе за это время перешли от 4 по 3.33 к 10 по 3. Это прирост 2.25 раза.
                                                        Т.е. примерно одинаково с серверным сегментом.
                                                        И это логично, т.к. единственный сдерживающий фактор это охлаждение. 3770 на частоте 4 ггц уже очень сложно охлаждается мега двойным башенным куллером, а у него всего 95вт. Чем охлаждать 140-160 вт в режиме турбо я даже не знаю.
                                                        • 0
                                                          Но самое главное desktop это всего лишь компьютер на столе на котором ты работаешь, а сервер это компьютер к которому подключаются клиенты. И эти понятия на прямую вообще не сравниваются в плане железа.
                                                          • +1
                                                            А чеще даже не работаешь, а скролишь вебстраничку которой конечно нужно 8 ядер по 3.2
                                                • –4
                                                  А смьісл? Они ж прежде всего коммерческая компания, их цель — заработать больше денег. Поєтому и вьіпускают в таком порядке для получения максимальной прибьіли, а не с целью абстрактной победьі над конкурентом.
                                                  • 0
                                                    Вот я тоже думаю у интела в загашнике еще много чего припасено. Как только амд выводит очередной «кипятильник», они ловко и непринужденно выводят совсем чуть более дорогого, но более быстрого в реальной жизни конкурента. И аэмдэшный «прорыв» оказывается отбит.

                                                    А вот о чем почему-то никто не говорит. На работе разработчики Android жаловались, что эмулятор андроида работает только на интеле, ибо амэдэ эту виртализацию аппаратно не поддеживает
                                                    • +1
                                                      > кипятильник
                                                      А ничего, что амдшный проц 95 Вт и при этом обходит интеловский на 140 Вт?

                                                      > эмулятор андроида работает только на интеле, ибо амэдэ эту виртализацию аппаратно не поддеживает
                                                      Ложь и провокация, виртуализация поддерживается и прекрасно работает, самолично пользовался андроидом с виртуализацией на процессоре FX.
                                                  • +2
                                                    Мне кажется они специально взяли перерыв, в то время как линейки Интел показывают почти нулевой прирост производительности в реальных задачах. Сейчас если интел и выпустит что-то на 5-10% быстрее, или даже на 20% быстрее то все равно это не стоит +100% к цене. 8 ядер и 16 потоков на частоте 4 ГГЦ с поддержкой ECC памяти это просто нечем крыть кроме цены, я думаю мне такой системы хватит лет 5-7.
                                                    Сейчас у меня 3770К, 4 ядра на 4.1 ГГЦ и без ECC, аргументов купить комп на новой линейке интела нет ни каких.

                                                    Еще больше ядер — не нужно (пока), поддержку не существующих списков команд добавить нельзя, запас может быть только по частоте, а он зависит от тех процесса. Пока у них видимо нет сл тех процесса, а ждать его появления уже опасно.
                                                    • +1
                                                      Сейчас у меня 3770К, 4 ядра на 4.1 ГГЦ и без ECC, аргументов купить комп на новой линейке интела нет ни каких.

                                                      У меня 2600K @ 4.5 GHz, причём с отключенным HT (4 ядра/4 потока) — в моих задачах включение HT не только не приводит к росту, но даже снижает производительность.

                                                      Конечно, мне очень хочется 6900K — он бы дал прирост около ~3 раз для моих задач, но я, скорее всего, сделаю апгрейд на AMD в итоге.
                                                      • +1
                                                        А это какие у вас задачи такие? А то у меня 3930k, и я оценивают потенциальный прирост процентов в 20-30.
                                                        • +1
                                                          Обработка изображений, линейная алгебра. Задачи очень хорошо масштабируются по ядрам.
                                                          Поэтому ожидаю двукратный пророст от роста числа ядер + 20-25% прирост производительности на ядро, итого около 2.5 раз.Также появится возможность использования AVX2.

                                                          Ещё есть надежда, что SMT (аналог Hyper-Threading от AMD) даст небольшой прирост в производительности. Хотя здесь я настроен скептически: у Ryzen нет лишних блоков обработки FP, поэтому что в 8 потоков, что в 16 скорость вычислений будет, скорее всего, одинакова.
                                                          • 0
                                                            Ух ё, я как-то пропустил, что у 6900k ажно восемь ядер. Тогда это имеет смысл, да.

                                                            А так у меня-то тоже линейная алгебра всякая, псевдообратные там считать, Левенберга-Марквардта прогонять, всякое такое. Опыт показывает, что оно всё в основном упирается в память.
                                                            • 0
                                                              Так у вас и так 4 канала на память, а ели понадобятся ядра можно xeon недорогой на ebay взять. (Xeon E5-2695V2 12ядер, 30мб кэша HT, бу по 250$ продают)
                                                              Амд такого пока предложить не может.
                                                              • 0
                                                                А смысла в этих 12 ядрах, если у него частота 2.4 ГГц, а мой 3930k стабильно работает на 4.2? Прирост получится несерьёзным.

                                                                Вот двухголовую систему из таких процов собрать было бы интересно, но сколько стоят соответствующие матери?
                                                                • 0
                                                                  Я гипотетически, вдруг они вам понадобятся.
                                                                  • 0
                                                                    Ну, представляется разумным оценивать суммарную производительность как произведение частоты ядра на количество ядер. С небольшим предпочтением пусть чуть менее суммарно производительных процессоров, но с более быстрыми ядрами (не все нагрузки параллелятся).
                                                                  • 0
                                                                    двухголовые 1366 китайцы сливают дешевле 200 включая доставку.
                                                                    • 0
                                                                      А где посмотреть примеры того, что они продают? А то я в этом ничего не понимаю, только совсем базовые вещи слышал.
                                                                      • 0
                                                                        https://www.aliexpress.com/wholesale?SearchText=1366+dual
                                                                    • 0
                                                                      Зачем ему 1133, если у него 2011?
                                                                    • 0
                                                                      в БУ-шном виде серверное оборудование очень дешево
                                                                      • +1
                                                                        Сравнимо с ценой двух процессоров.
                                                                      • 0
                                                                        И, кроме того, я как-то понял, что никогда не задавался вопросом, как именно работают эти четыре канала?

                                                                        Например, если у меня в памяти лежит кусок данных относительно подряд, с которым работает одно-единственное ядро, по идее, скорость обмена с памятью выше «одноканальной» не поднимется?
                                                                        • +1
                                                                          Многоканальный доступ означает, что процессор может одновременно работать с несколькими модулями памяти.

                                                                          у меня в памяти лежит кусок данных относительно подряд

                                                                          При многоканальном доступе данные размазаны по модулям (interleaving), так что при последовательном доступе будут задействованы все модули, и многоканальный доступ будет эффективен.
                                                                          • 0
                                                                            В очевидно ограниченной по памяти задаче (и vtune говорит, что у меня всё упирается в шину памяти) я получаю на своём DDR3-1600 примерно 10 с небольшим гигабайт/с, что близко к теоретическому пределу для одноканального режима. Как можно проверить, собственно, многоканальный доступ у меня или нет?
                                                                            • 0

                                                                              Да, ~10 Gb/s — это соответствует одноканальному режиму работы.
                                                                              Окончательно в этом можно убедиться, посмотрев на данные, выдаваемые CPU-Z.

                                                                              • 0
                                                                                Осталось вкорячить CPU-Z на эти мои линуксы :)

                                                                                dmidecode про interleaved data depth говорит unknown.
                                                                                • 0
                                                                                  dmidecode про interleaved data depth говорит unknown.

                                                                                  Странно. Впрочем, пока я его не обновил — мне он тоже ничего не выдавал.

                                                                                  • 0
                                                                                    Ну, у меня вроде тоже последняя из доступных в генте версий. Страннота.
                                                                              • 0
                                                                                cpu-z на вкладке memory показывает, а как установить правильно память смотрите руководство от материнки
                                                                                • 0
                                                                                  Восемь одинаковых плашек во всех восьми слотах матери.
                                                                          • +1
                                                                            Серверные 12(на ядрах примерно как у Phemom II) и 16(примерно как у FX) ядерные камни у АМД уже очень давно были. И тоже на ебэй недорого за б/у встречаются.

                                                                            Еще года 3-4 назад знакомые 4х сосетную машину на б.у. серверных камнях от AMD собирали с 48 рабочими ядрами в итоге.
                                                                    • 0
                                                                      Да, тоже интересно как можно ожидать 3х кратный прирост, если основное преимущество это 8 ядер против 4, а масштабирование на количество ядер в самом лучшем случае линейное.

                                                                      По частоте скорее всего это будет шаг назад (для 6900K 4.5 ГГц это почти нереально достичь без экстрима). Ну а обновленная архитектура даст только 10-30% прибавки в зависимости от задачи.
                                                                    • +1
                                                                      к слову, разйзен умеет в ecc.
                                                                      • +3

                                                                        Все эти новости о поддержке ECC начались с того, что в спецификациях материнской платы нашли "совместимость" с модулем памяти ECC, про реальную реализацию ECC в процессоре данных нет. В обсуждении https://community.amd.com/thread/210870 заметили спецификации сходных плат, в которых честно указано, что модуль с 9 чипами памяти поставить можно (ECC и неECC DIMMы pin-совместимы), память заработает, но суммы ECC никто ни считать, ни исправлять не будет — http://www.gigabyte.us/Motherboard/GA-AX370-GAMING-5-rev-10#sp (AMD X370)


                                                                        "Support for ECC Un-buffered DIMM 1Rx8/2Rx8 memory modules (operate in non-ECC mode)"


                                                                        Работающий ECC увеличивает задержки примерно на такт (для каждого запроса требуется подсчитать код и, в случае чтения, может потребоваться инверсия одного из битов при получении признака ошибки), хотя и слабо влияет на реальную производительность.
                                                                        Ранее корпорация AMD включала обычный SECDED ECC в некоторые десктопные продукты, но оставляла для серверных платформ более продвинутые варианты кодов, например:
                                                                        Athlon 64, 2004 "2.4.2 Memory Controller… ECC checking with single-bit correction and double-bit detection • Chip Kill ECC allows single symbol correction and double symbol detection (Server/Workstation products only)";
                                                                        16h G-Series SOC 2012, FT3 "Integrated Memory Controller… FT3 package… Supports ECC";
                                                                        16h AMD Sempron, 2014 "FS1b package… Supports ECC"
                                                                        16h A-Series Mobile "FT3 package… Supports ECC"
                                                                        10h AMD Phenom II, 2010 "Integrated Memory Controller .."


                                                                        В то же время ECC не включался в ряд встраиваемых APU, например 15h… Embedded R-Series, 2012 "Integrated Memory Controller", 15h A-Series APU 2012 "Integrated Memory Controller" — без ECC.


                                                                        Точная информация будет через несколько недель с публикацией спецификаций на процессоры и чипсеты (поиск site:support.amd.com "family 17h"). Сейчас есть только предположения, хотя определенный код для F17 уже добавлен в ядро Linux: http://lxr.free-electrons.com/source/drivers/edac/amd64_edac.c?v=4.10#L2192, есть некоторая информация в истории этого файла: https://github.com/torvalds/linux/commits/master/drivers/edac/amd64_edac.c, например отказ включать ECC если он выключен (или не поддерживается) в BIOS "Forcing ECC on is not recommended on newer systems. Please enable ECC in BIOS".

                                                                        • +1

                                                                          Одно из изданий (STH) спросило на AMD Tech Day in San Francisco представителей AMD, ожидается ли анонс односокетных Zen/Ryzen с поддержкой ECC и получило ответ, что AMD не анонсирует таких продуктов при запуске Ryzen.


                                                                          https://www.reddit.com/r/Amd/comments/5vpp40/no_ecc_support_in_any_of_the_currently_announced/https://www.servethehome.com/amd-ryzen-7-parts-available-for-pre-order-now/ "AMD RYZEN 7 PARTS AVAILABLE FOR PRE-ORDER NOW!" — PATRICK KENNEDY FEBRUARY 22, 2017


                                                                          We did ask about a potential single socket Ryzen/ Zen part with ECC memory support and were told that AMD was not announcing such a product at this time alongside the Ryzen/ Zen launch.
                                                                          • +1
                                                                            Спасибо за это сообщение, хотя признаюсь честно, оно вызвали у меня негативные эмоции. :( А так хотелось ECC за вменяемые деньги… Буду надеяться АМД выпустит серверные версии за вменяемые деньги.
                                                                            • 0

                                                                              http://www.anandtech.com/print/11170/the-amd-zen-and-ryzen-7-review-a-deep-dive-on-1800x-1700x-and-1700 The AMD Zen and Ryzen 7 Review: A Deep Dive on 1800X, 1700X and 1700 — March 2, 2017 9:00 AM EST


                                                                              At this time AMD is not announcing any Pro parts, although it was confirmed to be that there are plans to continue the Pro line of CPUs with Ryzen to be launched at a later time.… A side note on ECC: given the design of Naples and the fact that it should be supporting ECC, this means that the base memory controller in the silicon should be able to support ECC. We know that it is disabled for the consumer parts, but nothing has been said regarding the Pro parts.… For our testing… 1800X, 1700X and 1700… At present, ECC is not supported.
                                                                              • +2

                                                                                В мегатреде AMA (3 марта 2017)
                                                                                https://www.reddit.com/r/Amd/comments/5x4hxu/we_are_amd_creators_of_athlon_radeon_and_other/
                                                                                ответили на вопрос о ECC в Ryzen (поддержка есть, включается в BIOS если было реализовано поставщиком материнской платы, работоспособность ECC не гарантируется — не валидировалась в продуктах для "геймеров"):
                                                                                https://www.reddit.com/r/Amd/comments/5x4hxu/we_are_amd_creators_of_athlon_radeon_and_other/def5ayl/


                                                                                whatever0601: Could you speak to ECC being disabled in these CPUs?
                                                                                AMD_Robert Technical Marketing[S]: ECC is not disabled. It works, but not validated for our consumer client platform.
                                                                                nagvx: What does "validated" mean in this context? What sort of stumbling-block does that represent to those who want ECC? Will it still be possible to build ECC-enabled servers with consumer-grade (and consumer-price-range) hardware on the Ryzen platform? There are a significant portion of users who want ECC for their NAS/Homelab setups.
                                                                                AMD_james Product Manager: Validated means run it through server/workstation grade testing. For the first Ryzen processors, focused on the prosumer / gaming market, this feature is enabled and working but not validated by AMD. You should not have issues creating a whitebox homelab or NAS with ECC memory enabled.
                                                                                ShermanLiu: So the Ryzen has full ECC support, if I install a ECC memory, it would work in ECC mode, not non-ECC mode?
                                                                                AMD_james Product Manager: yes, if you enable ECC support in the BIOS so check with the MB feature list before you buy.
                                                                                tolga9009: Thank you for the answer! So, the AM4 platform / socket theoretically has everything to fully support ECC and it's only up to mainboard manufacturers. Is that correct?
                                                                                AMD_Robert Technical Marketing[S]: Bingo.…
                                                                                AMD_james Product Manager: RDIMM will likely not be supported. UDIMM ECC will work.…
                                                                                TheRealHellBENder: I asked Asrock per mail and they answered that their B350 boards would operate in non-ECC mode
                                                                                AMD_james Product Manager: Thanks for letting me know. I'll check with the MB makers and see if we can get consistent.
                                                                                ParticleCannon: Speaking of prosumer features, is AMD-VI/IOMMU in?
                                                                                AMD_james Product Manager: yes
                                                                                tolga9009: I've seen IOMMU entries in ASRock and ASUS BIOSes. It's disabled by default, but you can enable it. So, it's in there. But I haven't seen any hands-on tests so far.

                                                                                https://www.reddit.com/r/Amd/comments/5x4hxu/we_are_amd_creators_of_athlon_radeon_and_other/def58sv/


                                                                                Minkipunk: Hello AMD! This question is a very short one. Do Ryzen CPUs support ECC Memory, yes or no? ;)
                                                                                AMD_LisaSu CEO of AMD: Yes they do!
                                                                                drchoi212x: do they support ECC-REG memory as well?
                                                                                AMD_james Product Manager: ECC-REG — No, registered or buffered memory is not supported.
                                                                            • 0
                                                                              спасибо за развёрнутый ответ.
                                                                              • 0

                                                                                Этот патч также несколько интересен своей историей. Принят патч с сообщением: http://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/commit/?id=044e7a414be9ba20826e5fd482214686193fe7b6


                                                                                EDAC, amd64: Don't force-enable ECC checking on newer systems
                                                                                It's not recommended for the OS to try and force-enable ECC checking.
                                                                                This is considered a firmware task since it includes memory training,
                                                                                etc, so don't change ECC settings on Fam17h or newer systems and inform
                                                                                the user.
                                                                                -       amd64_warn("Forcing ECC on!\n");
                                                                                +       if (boot_cpu_data.x86 >= 0x17) {
                                                                                +           amd64_warn("Forcing ECC on is not recommended on newer systems. Please enable ECC in BIOS.");
                                                                                +           goto err_enable;
                                                                                +       } else
                                                                                +           amd64_warn("Forcing ECC on!\n");

                                                                                В предыдущей версии патча https://www.spinics.net/lists/linux-edac/msg06912.html "[PATCH 07/17] EDAC/amd64: Don't try to force ECC settings on newer systems" просто не включали ECC даже по ecc_enable_override=1 и не выдавали каких-либо сообщений:


                                                                                +   /* Don't try to enable DRAM ECC from Linux on newer systems. */
                                                                                +   if (boot_cpu_data.x86 >= 0x17)
                                                                                +       return;

                                                                                На что было указано: https://www.spinics.net/lists/linux-edac/msg06931.html "Add… along with a pr_info()
                                                                                explaining to the user why we're not going to force-enable ECC."


                                                                                Вся серия патчей AMD Fam17h EDAC — https://www.spinics.net/lists/linux-edac/msg06905.html
                                                                                Поиск патчей в ядре по строке "17h" http://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/log/?qt=grep&q=17h (в частности, год назад там заметили раннее кодовое обозначение "AMD Zeppelin (Family 17h, Model 00h)")

                                                                          • 0
                                                                            AMD — мощный аутсайдер
                                                                          • 0
                                                                            В реальной задаче по кодированию видео в тесте Handbrake процессор Ryzen 7 1700 справился с задачей за 61,8 с, а Core i7 7700K — за 71,8 с. И это несмотря на то, что скорость кодирования видео с аппаратной поддержкой всегда считалась сильной стороной процессоров Intel.

                                                                            С вероятностью 95% кодирование осуществлялось программно, а не аппаратно.
                                                                            • 0

                                                                              типичная ализарщина. Аппаратное кодирование видео (QuickSync и т.п.) — сильная сторона интеловской интегрированной графики, собственно процессоры тут не при чем.

                                                                              • +1
                                                                                Так ведь процессора тестировали. Помнится по обзорам у «аппаратных» решений качество хуже, не на много, но хуже.
                                                                                • +1
                                                                                  да, только сравнивали топовые процессоры, которые ни у амд, ни у интел не имеют встройки.
                                                                                  • +1
                                                                                    Разумеется программно. Было бы очень затруднительно тестировать ее аппаратно с учетом того, что у всех сравниваемых процессоров (кроме i7-7700K) встроенных блоков для работы с графикой нет вообще.

                                                                                    Laney1
                                                                                  • +4

                                                                                    в процессорах Intel честный AVX2 (а в следующем поколении обещают AVX-512) плюс есть аппаратная поддержка транзакционной памяти (TSX). Учитываются ли в бенчмарках эти фичи, отсутствующие в Ryzen? Подозреваю что нет

                                                                                    • +2
                                                                                      Я думаю, что основной массе пользователей это не критично. С другой стороны осталось всего ничего и ютуб будет завалет реальными тестами/обзорами. Ну и цена. Вот то что может сыграть злую шутку с супер навороченными и технологичными процами интела
                                                                                      • +1
                                                                                        Реальные тесты уже не за горами. А по поводу AVX2, насколько я понял, спаривание блоков для их выполнения, это всё равно быстрее, чем компиляция кода просто под AVX, так что спасибо АМД за то, что поддерживает AVX2 хотя бы так, чем никак.
                                                                                        • 0
                                                                                          А еще 4 канала памяти и больше линий PCI. И получаем проц+мать по космической цене.
                                                                                          Но многим ли это нужно?
                                                                                          • +1
                                                                                            А какая разница, как реализован AVX? Для программиста важны характеристики latency и throughput. Но факт в том, что у Ryzen вычислительных блоков тупо меньше, чем у Skylake. Поэтому Skylake теоретически может за единицу времени выполнить больше команд AVX.

                                                                                            А вот что действительно плохо, так это 2-канальная память даже у 8-ядерника. У меня на Sandy Bridge часто бывает, что уже пары потоков достаточно, чтобы упереться в скорость памяти. Пример задачи: посчитать норму длинного вектора: 1 чтение, 1 умножение, 1 сложение на 8 элементов (32 байта). При скорости памяти 20 гбайт/сек получается всего 625 миллионов итераций в секунду на весь процессор, а между SSE и AVX-версиями алгоритма разницы нет никакой.

                                                                                            Приходится оптимизировать алгоритмы, добиваясь группировки данных в кэше и даже увеличивая вычисления за счёт уменьшения количества доступа к памяти. Так что я не удивлён тем, что инструкции AVX у AMD менее производительны, чем у Skylake: при двухканальной памяти при большом количестве ядер высокая производительность AVX просто не нужна. А AVX512 и подавно не нужен.
                                                                                            • –1
                                                                                              А скорость памяти вы не учитываете?
                                                                                          • 0
                                                                                            CPU-Z
                                                                                            image

                                                                                            еще к свежим утечкам: "Ryzen 7 1800X, разогнанный до 5.2 Ghz, установил рекорд Cinebench R15 — 2449."

                                                                                            • НЛО прилетело и опубликовало эту надпись здесь
                                                                                              • +9
                                                                                                Очевидно же: 5.1449 => 5.145 => 5.15 => 5.2 ;) Вот 6, похоже, ника не получить…
                                                                                                • 0
                                                                                                  То, что вы сделали похоже на математический «развод» =), но так делать нельзя или точнее — так делать неверно. Округлять округлённое число — это увеличивать погрешность. Определитесь вначале до какого разряда хотите округлить, а потом округляйте, используя правила из школьного учебника. То есть решили округлить до десятых — отбрасываем цифры с сотых, учитывая что сотый разряд является 4, то округление происходит без усиления, то получаем 5,1 либо если до второго знака, то 5,14. Так будет правильно.
                                                                                                  • +7
                                                                                                    По-моему очевидно, что у товарища выше это был сарказм. Там даже скобочка есть :-)
                                                                                                    • 0
                                                                                                      Там не просто скобочка, там еще и точка с запятой!
                                                                                                  • 0

                                                                                                    .

                                                                                                    • +1
                                                                                                      Вот 6, похоже, ника не получить…

                                                                                                      Ну это смотря как округлять… опытный маркетолог и так может ;)
                                                                                                      5.1449.ceil
                                                                                                      res0: Double = 6.0
                                                                                                      
                                                                                                      • –1
                                                                                                        зато можно сразу округлить до 10Ггц :)
                                                                                                  • 0
                                                                                                    Я тоже ждал, когда-же анонсируют.
                                                                                                    На русских оверклоках его ласково именуют «Рыжень» или «Рязань» :D

                                                                                                    Я не очень люблю AMD еще с тех времен, когда были вечные проблемы с дровами и т.д., однако десктоп на AMDx2 у меня был — ничего плохого сказать не могу.

                                                                                                    Однозначно было-бы отлично, если бы на рынок вернулась конкуренция, ибо Intel последнее время совсем обнаглел :)

                                                                                                    Единственное, чего я опасаюсь — как бы не было того, что господа из AMD сравнивали мощность процов с текущей линейкой Intel, а ведь следующая уже вот-вот на подходе. И она может переплюнуть Рязань запросто — запас очень небольшой.

                                                                                                    Но на самом деле тесты — это синтетика, она с реальностью далеко не всегда пересекается, поглядим, что геймеры напишут, а дальше уже будет понятно, что брать.
                                                                                                    • 0
                                                                                                      думаю запас по цене достаточно основательный.
                                                                                                      • 0
                                                                                                        да, это реально конкурентное преимущество, согласен
                                                                                                        • +2
                                                                                                          Это первое, а второе — никаких оснований ожидать чего-либо большего стандартных 5-10% от следующей линейки Интела нет. То есть даже если и переплюнет, то очень ненамного.
                                                                                                          Если же говорить о реальном прогрессе — 6-ядерники в массовом сегменте — то это не раньше 18 года. И все равно у AMD уже 8-ядерники там же.
                                                                                                    • 0