0,0
рейтинг
10 июня 2014 в 15:06

Рейтинг процессоров по методике CoreMark из песочницы

Подбирая новый десктоп столкнулся с хаосом различных оценок быстродействия системы. И вроде бы всем давно известно, что связку компонентов следует подбирать по принципу «морского конвоя» — общая скорость конвоя определяется самым медленным кораблём, коими выступают скорость обмена между блоками CPU, RAM и прослойке в виде чипсетов. Однако в связи с очень крутыми переменами на процессорном фронте для меня всё не так объективно, и наибольшой объём непонимания я ассоциирую именно с процессорными кристаллами. С одной стороны рынок идёт вслед за серверами, многопоточностью и увеличением количества ядер, в разы увеличиваются частоты обмена между компонентами, с другой стороны софт медленно оптимизируется под многопроцессорность, исключение составляют лишь математические и инженерные пакеты, реально способные загрузить все ядра целиком. За последние 5 лет изменилась сама архитектура рядового десктопного процессора, хотя шина данных и не преодолела 64 бит, поколение Intell Haswell обрело высокопроизводительную кольцевую шину, после конвейера и HT её я лично считаю новым витком эволюции центральных микропроцессоров на платформе PC, что в купе с переориентацией производителей на Green Technology и низкое потребление должно наконец привести рынок к новым высокопродуктивным и энергоэффективным решениям. Вот о последних мне и хотелось бы услышать от пользователей Хабра, как у наиболее осведомлённой аудитории.

По следующей ссылке, ведущей на страницу с рейтингом процессоров, приведён один интересующий меня комментарий. Дословная цитата:
«В интернете множество таблиц со сравнительными характеристиками процессоров. Но очень тяжело найти таблицы сравнивающие архитектуры. Есть такой редко применяемый параметр DMIPS/MHz. Этот параметр показывает удельную производительность за один такт. Такой параметр позволяет понять чья архитектура является самой эффективной и имеет лучшие шансы. Например процессоры основанные на ядрах ARM сравнивают именно в удельной производительности. И в удельной производительности они лучше чем процессоры Intel. Это означает, что если Samsung сделает процессор с ядром ARM для очередного iPhone по самой современной технологии 22 нм, то у них получится процессор с характеристиками лучше чем самые современные процессоры Intel. Второй важный параметр для сравнения архитектур это производительность DMIPS/Ватт. Позволяет оценить энергопотребление архитектуры. Чем меньше требует электроэнергии процессор тем больше у него шансов к использования в мобильных (телефоны, планшеты) или наоборот в сверхбольших системах (суперкомпьютеры). Было бы очень приятно, если бы хоть одно интернет СМИ сделало обширную таблицу по старым и новым архитектурам различных (не только Intel, AMD или ARM) процессоров.»

Согласитесь, количество электроэнергии в мире жёстко лимитировано количеством электростанций, которые вводятся в эксплуатацию не так уж и часто, рост тарифов на электроэнергию наблюдатся повсеместно, а объём микропроцессоров на руках у населения и в собственности предприятий растёт лавинообразно. Наиболее ярко выражают общую ситуацию дата-центры, в которых стоимость основных фондов в виде парка серверов невелика по сравнению с общими затратами на питание стоек и функционирование систем охлаждения. Отсюда закономерно возникает необходимость вывода адекватного рейтинга процессоров с поправкой на TDP/Mhz для рядовых потребителей без необходимости лазить в каждый даташит в отдельности и тратить время. Другое дело, по секрету между нами, потребители редко смотрят на TDP. Только т-с-с…

Что же мне остаётся, на какой процессор мне ориентироваться? Для начала неплохо бы взглянуть на общий рейтинг ВСЕХ мейнстримовых решений на рынке, ну или почти всех. Приступим. Как ясно из заголовка, я воспользовался базой CoreMark. Предварительно стоит зарегистрироваться, можно пройти эту процедуру по ходу скачивания самих исходников теста:

image

Затем, выбрав вендоры,

image

можно лицезреть вот такие славные таблички (особое внимание прошу обратить на количество потоков):

image

image

image

Попутно я оценил Atom N455, распаковав высланные исходники теста coremark_v1.0.tgz и набрав для 2-х потоков в консоли make PORT_DIR=linux XCFLAGS="-g -DMULTITHREAD=2 -DUSE_FORK=1". Результат в 4500 вполне точно вписался в общую картину. Подробная информация о тесте.

Теперь мне оставалось только поискать инфо о текущих флагманах десктопов:
Мощные процессоры 2014 года и условный рейтинг производительности (в редакции dxdigitals.info):

Intel Core i7-4765T 50,4
Intel Core i5-4670K 56,7
Intel Core i5-4670 57,2
Intel Core i7-4770T 59,7
Intel Core i7-3770S 63,1
Intel Core i7-3820 63,8
AMD FX-9370 64,5
Intel Xeon E3-1240 V2 65,4
Intel Core i7-3770 66,2
Intel Core i7-3770K 67,3
Intel Core i7-4820K 67,4
AMD FX-9590 68,5
Intel Core i7-4771 69,7
Intel Core i7-4770 72,4
Intel Core i7-4770K 72,5
Intel Core i7-3930K 87,5
Intel Core i7-3970X 94,2

А также учесть TDP:

image

Итоги: нынешняя ситуация с рейтингами выглядит довольно однобоко и лично меня совершенно не устраивает. Вместо кучки раскиданных в Интернет страниц хотелось бы увидеть совмещение в одной итоговой таблице общей цифры производительности, энергетической эффективности и удельной отдачи от суммы покупки. Но пока производители и маркетологи темнят приходится изобретать велосипед. Очень бы хотелось увидеть в Ваших комментариях иную точку зрения и таки лицезреть данную таблицу вживую. Спасибо за внимание.
Алексей Казанцев @Kazancev
карма
5,0
рейтинг 0,0
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое

Комментарии (14)

  • +3
    «общей цифры производительности» — это что? Число перемолотых бит в секунду?
    • –3
      Надеюсь Вы имели в виду ГигаБит или ТераБит? Тогда да, а в битах меня не устраивает)
      • +2
        Есть алгоритм1, который на вход получает 256 бит и на выходе дает 256 бит. Он выполняется на одном процессоре за 1 секунду. На другом процессоре такой же алгоритм1 выполняется за 0.2 секунды. А на третьем процессоре другой алгоритм2 (256 на входе/выходе) выполняется за 10 секунд. Внезапно самый быстрый — третий процессор, потому что алгоритм2 содержит 1000 преобразований как в алгоритме 1. Но перемножит матрицы быстрее первый, у него специальная команда есть. Второй же будет бвыстрее всего считать графику и AES/RC4. Что надо указать в вашей «общей производительности»?
        • –1
          Вы затронули вопросы оптимизации под конкретную архитектуру и задачу. Это задача программиста и его программного продукта. Но как Вы оцените массово весь зоопарк на всех платформах? В качестве адекватной альтернативы нам предложили простой и изящный тест, код которого целиком уместится в кэше, а оттранслировать его возможно под всё, что имеет сишный компилятор. Никто не спорит, что компьютерная оптимизация шла и идёт по трём фронтам: железо, физика и алгоритмы. Первые два не одно и тоже, потому как ламповые компы не есть транзисторные, а транзисторы — это прошлый век в физике, посвятившей себя квантам. Я же прошу заметить о величине производительности на объём затраченной энергии.
          • 0
            Вы оперируете некоторой «производительностью», которая разная у разных камней на разных задачах и пытаетесь привести это к каким-то общим цифрам?
            • 0
              Давайте для начала подразделим «камни» на задачи, для которых они предназначены. Если я выбираю PC, то смотрю на некую среднюю величину производительности, измеренную популярными тестами в баллах, процентах от неких эталонов прошлого, в конце концов я могу замерить секундомером решение одной и той же задачи без перекомпилирования на разных машинах. Если Вы говорите о видеопроцессорах и ширине потока видеоданных, который может он способен обработать, то и рассматривайте подобные его классу «камни». Третьему же будут интересны сигнальные процессоры, и у него будут свои методики выбора лучшего. Но мне то что делать с персоналкой? Всунуть ноги без тапочек в системник и пригласить туда же кота погреться?
              • +2
                Тесты показывают только скорость выполнения тестового кода. На каком основании перемножение матриц, а не вычисление SHA1 — мера производительности?
                • 0
                  Ну вот где, где к примеру в ANSYS алгоритмы, заточенные на расшифровку SHA всё время работы программы? Научный софт как раз таки и будет ворочать матрицами направо и налево.
                  • +2
                    То есть основание для выбора тестового кода — произвольное. О какой тогда объективности может идти речь?
                    • 0
                      А кто сказал, что среднестатистическая машина всегда занята только подбором паролей? И так ли донельзя оптимизирован под архитектуру программный код приложений? И выбор тестового кода вовсе на произволен.
              • 0
                Я только сейчас осознал, для чего навешивать на корпус светящиеся ленты — оно жутко напоминает средневековый камин, и греет так же.
  • +2
    Всегда для этих целей использовал www.cpubenchmark.net/ Например, так.
    Теоретически, еще на nix.ru есть результаты тестов, но там мало данных.
    • +1
      Поступаю аналогично, если нужны просто средние по больнице попугаи — смотрю индекс в этой таблице.
      Если выбирается ПК под конкретные задачи — смотрю тесты в этих задачах.
      www.cpubenchmark.net очень удобен для оценки выигрыша от апгрейда, если попугаев в 3-4 раза больше- пользователь это ощутит моментально и есть смысл апгрейдить. Если всего раза в полтора-два, то может и не заметить :-)
      Например удивился, что есть смысл менять старые двуядерные Pentium D 3ГГц на современные celeron 1037U 1.7ГГц, выигрыш раза в 3 в попугаях, не говоря о компактности, тишине и потреблении :-)

      • 0
        Оффтоп: рекомендую присмотреться к Celeron J1900 :) производительнее и холоднее

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.