Пользователь
0,0
рейтинг
2 сентября 2010 в 18:28

Хабрахабр: немного статистики и альтернативный топ топиков

Я заметил, что текущий топ хабрахабра содержит малое количество полезных материалов. Вообще, как оценивают материал? Люди ставлят плюс/минус, потому что:
  1. Хотят поощрить автора за написание хороших топиков
  2. Хотят отблагодарить автора за написание сиюминутной новости/интересной картинки
  3. Хотят выплеснуть свое настроение на чужом топике
Вполне очевидно, что такая система голосования не всегда будет поощрять хорошие топики и не всегда в топе будут только хорошие и полезные статьи.
Но у каждой статьи есть еще два иных показателя: количество человек, занесших статью в избранное (коротко — фавориты) и количество комментариев. Очевидно, что первый показатель определяет полезность статьи, а второй — насколько тема затронула умы хабралюдей.
Мне показалось, что альтернативные варианты топа будут очень интересны остальным людям. Вообще, было бы хорошо, если бы такую фичу сделали, разработчики, но…

Итак, я проанализировал 72% топиков хабра (остальные были закрыты/недоступны/удалены) и составил альтернативный топ. Под катом парочка рисунков и ссылки на страницы альтернативного топа.


Статистика

Для начала маленькая статистика по видам топиков и размещения в различных типах блога:


Ну и картинка, позволяющая оценить работу всеми любимого Ализара:


Топ-20 авторов по количеству написанных топиков

  1. alizar
  2. Tylerskald
  3. julia
  4. skazala
  5. XaocCPS
  6. Mordatyj
  7. DileSoft
  8. Tigger
  9. Mio
  10. BBSoD
  11. Mithgol
  12. Shapelez
  13. Shpankov
  14. Deniskin
  15. Boomburum
  16. Sunnybear
  17. NaFigator
  18. umputun
  19. Shoohurt
  20. gameboyhippo

Альтернативный топ

Итак, собственно альтернативный топ. Он представлен в виде нескольких страниц, подозрительно похожих на хабр (но с соответствующей пометкой).Если есть проблемы с сайтом, то альтернативный топ можно будет посмотреть, скачав архив. Также для особо любознательных я приготовил коллекцию ссылок на остальные статьи из топа (но без названий, просто айдишниками): упорядоченный сборник ссылок.

* Хочу сказать, что статистика и топ может содержать неправильные данные из-за следующих причин: выпуск статьи задержался, общие технические проблемы.
@nsinreal
карма
9,5
рейтинг 0,0
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое

Комментарии (36)

  • +3
    А сделайте такую статистику: максимум переходов по топику-ссылке.
  • НЛО прилетело и опубликовало эту надпись здесь
    • +3
      что на хабре много веб-разработчиков?
      • НЛО прилетело и опубликовало эту надпись здесь
        • 0
          Та же картина кстати при просмотре топиков, которые были самое большое количество раз занесены в «Избранное» — направленность исключительно прикладная для веб-разработок.
      • 0
        Возможно, что это также значит, что на хабре сравнительно малое количество образцово-показательных полезных топиков о обычных языках программирования (не нацеленных на веб-разработку).
        Хотя да, количество веб-разработчиков зашкаливает очень сильно.
  • +12
    Меня поразил этот топик: habrahabr.ru/blogs/webdev/30023/
    789 закладок и только 7 плюсов.
    • +4
      каждый занес в закладки: пригодится — возможно. полезно — пока нет -> плюса нет
      • +1
        И еще вариант: статью увидели после того, как она была доступна для голосования/статью зафаворитило большое количество отхабренных.
    • 0
      да, что то себе в «за корма» накидали, а автора не отблагодарили…
    • 0
      Да, обидно. А труда в статью, возможно, немало было вложено.
      Я, к примеру, когда статья идет мне в закладки, всегда ее плюсую.
    • 0
      приподнял парню карму
  • +9
    Первые 2 автора по количеству топиков — белорусы :) Вот почему байнет медленно развивается — все на хабре :)
  • –1
    я, например, ни 1 топик не заношу в избранное, потому что у меня стоит десктопный рсс-агрегатор с возможностью сохранения записей в архив. и вот там-то уже у меня статей дофигища.
  • +3
    В принципе, ожидаемо. В топе фаворитов топики-списки и топики-сборники, в топе комментариев раздача халявы и холивар.
    Однако спасибо за интересную статистику и необычный подход. Нашел для себя несколько полезных и непрочитанных постов.
  • +6
    наконец-то кто-то вместо нытья «какой-такой плохой топ на хабре» взял да и сделал свой! Спасибо.
  • +3
    Вот объясните, как десятиуровневый срач в комментариях, причем зачастую не по теме, может служить показателем, насколько топик задел умы людей? К тому же, бывают статьи, невероятно интересные, полезные, классные, вкусные и так далее, в которых мало комментариев, зато много плюсов и «звездочек». Разве это говорит о том, что они не затронули умы? Я чего-то не понимаю.

    А альтернативный топ интересен.
    • +1
      Если много комментариев, то там в основном не умы затронуло, а инвайты раздают. Халява, сэр :)
  • +1
    задел, но не обязательно «умы» :)
    • 0
      Давайте промолчим о том, что именно он задел.
  • 0
    а может rss сделаете?
  • 0
    А допилите плиз остальные статьи из топов названиями, а то кликать «а про что же это, а вдруг интересно» тяжко, открываются то тяжелющие страницы с кучей комментов.
  • 0
    из последнего графика следует, что на хабре — каждый 25-ый — это alizar! Я боюсь!
  • 0
    По каждому топику сейчас часто разворачивается обширная дискуссия, но такое количество комментариев читать невозможно. Однако, в этой дискуссии могут быть очень интересные комментарии.

    Хорошо бы в топике видеть блок хотя бы 5 комментариев с наибольшим рейтингом, наверху отдельным блоком.

    Так же можно сделать сортировку комментариев по рейтингу.
    Таким образом можно будет читать только самые интересные комментарии.

    Я думаю многие буду ЗА такой функционал.

    На youtube такой блок есть. Правда там показывается всего 2 лучших комментария — мало.
    • 0
      5 комментариев с наибольшим рейтингом
      Как правило, они просто содержат какое-либо острое, злободневное высказывание, которое нравится людям :)
      • 0
        ну его и хочется прочитать, что из 100 комментариев понравилось.
  • 0
    Счел свой труд на Хабре бесполезным :) :(
  • +1
    Какие инструменты использовались для сбора обработки статистических данных?
    • 0
      Вы не поверите, но я использовал:
      • cmd.exe — для проверки работы
      • wget.exe — для скачивания файлов
      • find.exe — для анализа файлов
      • парочка самодельных батников
      • OpenOffice.Calc — для анализа данных (сортировка по колонке)
  • +1
    а как вы узнали сколько человеков занесли статью в избранное?
    • 0
      Скачал все статьи и вырезал необходимые части html-кода в полуавтоматическом режиме (см. справа у звездочки цифры — это и есть нужное нам число).

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.