Пользователь
0,0
рейтинг
14 июля 2011 в 15:32

Илья Дронов: как LiveJournal борется со спамом

На вопросы хабралюдей и ЖЖ-юзеров отвечает Илья Дронов, директор по развитию продуктов SUP. Почти все вопросы интервью — о плохом качестве работы Livejournal, засилье спама и отсутствии нужного функционала.

— Почему вы так плохо боретесь со спамом? Если дать людям возможность самим банить пользователей, будет гораздо проще и лучше всем. Или, например, можно банить по IP.
— На данный момент у пользователей уже есть возможности банить других пользователей в своем журнале, но это обходится роботами путём заведения большого количества аккаунтов и использования правила «один комментарий на один дневник». Недавно мы расширили эту возможность путём распространения подобного списка на всех взаимных друзей: если несколько ваших взаимных друзей забанят конкретного пользователя за спам, то этот пользователь вреда вам уже принести не сможет. Естественно, это касается только бана за спам.

Что касается IP-адреса — такой механизм уже имеется и доступен членам Конфликтной комиссии, но мы стараемся его применять как можно реже по двум причинам: 1) IP-адрес сменить очень просто, так как публичных прокси-серверов очень много; 2) велика вероятность заблокировать IP-адрес какого-нибудь публичного IP, с которого в LiveJournal заходит множество обычных пользователей. Не говоря уже о том, что есть страны, в которых LiveJournal закрыт, и они просто вынуждены пользоваться подобными системами.

— Когда можно будет удалять все записи из дневника? С возможностью выбора, конечно, например, расставить галочки и стереть сразу сто записей?
— К сожалению, сейчас нельзя удалять записи через «список» инструментами самого сервиса. Скорее всего, это доступно через сторонние приложения, так как такая возможность предоставлена в API. Я вас услышал, мы добавим такую опцию на страницу редактирования журнала (http://www.livejournal.com/editjournal.bml) в одном из следующих релизов.

— Не секрет, что некоторые функции вы внедряете только для кириллических пользователей. Вы специально хотите, чтобы к ним подключались как можно больше? В чем разница между кириллическими и некириллическими юзерами?
— Это связано с различным восприятием LiveJournal в разных регионах и странах. Например, в кириллическом сегменте существует понятие рейтинга пользователей и записей, LiveJournal воспринимается как площадка, которая позволяет выступить во всеуслышание или поделиться чем-нибудь с как можно большим количеством людей. Совсем другое дело в США: у них дневники — это сугубо личное пространство для друзей (хоть и ведут они их публично), и появление в комментариях незнакомых пользователей порой вызывает у пользователей неоднозначные реакции. Поэтому у них гораздо больший вес имеют сообщества.

Само понятие «кириллические сервисы» — дань истории, мы собираемся от него отказаться в будущем, заменим привязкой к региону проживания. То есть часть функциональности и промоутируемый контент будут зависеть от того, какую страну нахождения вы выберете у себя в профиле.

— У меня LiveJournal постоянно тормозит, комментарии приходят с опозданием. Вы планируете это исправлять?
— Мы работаем над этим постоянно, основных причин медленной работы можно выделить две.
Во-первых, проблемы с каналом связи. Все сервера LiveJournal находятся в США, и скорость отдачи данных (при том, что сам LiveJournal в среднем генерирует страницы сильно менее, чем за секунду) сильно зависит от их загруженности или сбоях на них. Во-вторых, резко возросший трафик на сервера в связи с наступлением каких-либо событий — как позитивных, так и негативных. Все вышеперечисленные проблемы мы решаем и постоянно работаем над увеличением запаса мощности. За последние несколько лет трафик только вырос — мы всё ещё живы и продолжаем расти. Это доказывает, что мы работаем над решением проблем, просто не все пользователи это замечают.

— Я не подписан на кириллические сервисы и спама у меня нет...
— Спам не зависит от подписки на кириллические сервисы, здесь другая причина. Возможно, это особый режим работы комментариев либо вы не достаточно популярный пользователь. Да, спамеры нынче очень избирательны.

— Что-нибудь будет изменено в дизайне LiveJournal? Кошмарный дизайн, просто кошмарный!
— Изменено будет всё и в ближайшее время.

— Спам на руку СУПу? Почему вы не боретесь с ним?
— Спам не может быть на руку компании по двум причинам: во-первых, он даёт бесполезную нагрузку на наши сервера и, во-вторых, раздражает пользователей. Мы боремся со спамом, просто методы, которые мы применяем, имеют несколько отсроченный, но гораздо более сильный эффект.

— Весь спам зачастую содержит одну и ту же ссылку, с точностью до параметров. Неужели так трудно убивать эту нечисть на взлёте?
— Заблокировать одну ссылку легко, но за ней последует вторая. Заблокируем вторую — последует третья и так далее до бесконечности, пока ссылки просто не начнут оборачивать сокращениями, что приведет к усложнению борьбы с ними. На самом деле спам со ссылкой бывает двух типов — SEO и трафик. Узким горлом первого типа является видимость подобных ссылок для поисковых систем, для второго — охват аудитории. Оба они перекрываются скрытием комментариев, что означает отсутствие эффективности и приводит к отсутствию выгоды распространения такого спама. Я понимаю, что следы этого спама по-прежнему раздражают владельцев дневников мусором в комментариях, но и эту проблему мы недавно решили, внедрив специальный раздел подозрительных комментариев, где их можно удалять разом.

— Мне кажется, что ваш топ работает некорректно. Существуют разнообразные «нелегальные» методики, накрутки посещений за деньги, и люди так могут проталкивать непопулярные и неинтересные людям записи. Если сортировать топ «по просмотрам» и «по посетителям», то посты сортируются за последний день, если же мы нажмем сортировать «по оценке», то по какой-то причине появится топ полученных оценок за все время работы LiveJournal. Выходит, что позитивные или негативные «оценки» ни на что не влияют?
— Оценки на данный момент действительно не влияют на рейтинг, за исключением того, что вы можете отсортировать по ним как по отдельной сущности. Мы уже внедрили множество механизмов защиты от накруток и постоянно их развиваем, и вскоре планируем ввести еще несколько — они позволят пользователям влиять на попадание в топ, который, следовательно, станет менее зависим от посещаемости — которую, как вы верно заметили, можно купить.

— Как избавиться от френдоспамеров? Жутко бесят.
— Защита от масс-френдинга была внедрена за несколько дней до Нового года, вы все еще его замечаете? Если да, то свяжитесь со мной, пожалуйста, чтобы мы могли обнаружить утечки и недостатки алгоритма. Можно оставить комментарий в моём журнале igrick.livejournal.com или написать мне личное сообщение.

— Друг часто пишет записи задним числом (через semagic), то есть не желая писать сразу все записи на один день, раскидывает их по датам описываемых событий. И эти записи в ленте друзей никак не отображаются, они там вообще не появляются никогда. Почему так происходит и как это исправить?
— Френдлента сортируется по пользовательским датам (то есть не по дате создания записи, а по дате, указанной в записи) — так положено. Мы сейчас прорабатываем механизм, который позволит выводить во френдленту посты по дате создания, равно как и возможность создавать отложенные записи.

— Почему бы не внести домены служб для сокращенной записи URL в ЖЖ-шный «чёрный» список, чтобы эта пакость не мелькала в сообщениях и комментариях?
— Потому что их используют и нормальные пользователи, а также различного рода интеграции с Twitter — как наши, «родные», так и сторонние.

— Зачем вы врубили LJTimes всем? Бета-версии обычно предлагают попробовать, а не навязывают.
— На самом деле и в первой версии, до внедрения отключения отображения полностью, была возможность убрать LJTimes путём сворачивания его в минимальное состояние. Пользователи зачастую консервативны и сперва принимают нововведения «в штыки» — сейчас мы находим очень много положительных отзывов об LJTimes, многие в первое время отключившие кириллические сервисы, включили их вновь чуть позже.

— Когда у вас нововведения будут нормальные, значимые? Интеграция с Фейсбуком и Твиттером больше со стороны Фейсбука и Твиттера, в Фейсбуке можно чёрта лысого интегрировать, ЖЖ тут не сильно отличился, например, API ЖЖ я не знаю. Я уж молчу, что вам 11 лет, а вы на старом коде до сих пор, за это время можно было корабль космический построить!
— Да, сервису более 11 лет, но не стоит забывать, что компании SUP Media он принадлежит 4 года. В LiveJournal есть и API и всё необходимое, чтобы интегрировать как LiveJournal к себе, так и что-то в LiveJournal. Об этом мало кто знает, но мы не планируем это промоутировать, пока не сделаем этот продукт понятным для большой аудитории. Что касается «значимых нововведений» — это всегда субъективный взгляд, для кого-то одни нововведения значимы, для кого-то они же не имеют никакого смысла. Всем сразу не угодишь, но у нас большие планы, думаю, каждый найдёт в них что-то интересное лично для себя.

— В коде LiveJournal остались фрагменты, написанные Фитцпатриком?
— Да, и достаточно много.

— Сколько разработчиков в штате компании? Сколько из них работает над движком LiveJournal?
— В компании более 50 разработчиков, над LiveJournal сейчас работает около 20, включая ServerSide, JavaScript и HTML.

— Почему такая большая текучка кадров? Складывается впечатление, что каждые два-три года разработкой LiveJournal занимаются уже новые люди.
— В LiveJournal нет большой текучки кадров, наоборот, большинство разработчиков работают в компании продолжительное время.

— На каких направлениях планируется сосредоточиться при переделке движка? Какие самые кардинальные изменения будут сделаны в ближайшие годы?
— В основном, на архитектуре, именно она является наиболее узким местом системы — текущая просто не рассчитана на существующую динамику роста. Из самых кардинальных я бы отметил интерфейс сервиса, так как он будет наиболее заметным изменением для пользователей.

— Можно ли назвать LiveJournal сервисом Веб 2.0? Насколько активно в нем используются Ajax, HTML5?
— С каждым месяцем мы всё больше и больше используем AJAX, но назвать LiveJournal Веб 2.0 сервисом всё ещё нельзя.

Справка
Илья Дронов, директор по развитию продуктов SUP. Окончил МИРЭА (Московский государственный институт радиотехники, электроники и автоматики), факультет вычислительных машин и систем. Работает в области интернет-разработок и программирования с 1999 года, За это время возглавлял компанию, создающую веб-решения для малого и среднего бизнеса, а также руководил отделом интернет-разработок компании «Ренессанс-страхование».
Хабриель @habriel
карма
183,3
рейтинг 0,0
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое

Комментарии (7)

  • 0
    По поводу дизайна уже который год обещаниями кормят. Неужели жж не может нанять хорошего дизайнера? На дворе уже 2011-й, а стиль оформления «привет из 2000-х».
  • +2
    удивительно, что не спросили о продаже супом акаунтов замороженных или даже умерших (!!) пользователей.
    к слову о спаме и его «невыгодности» супу.
  • +1
    Если говорить об архитектуре сайта и сравнивать с WEB 2.0, то ЖЖ — совок.
  • +2
    Одни отговорки: «Да, к сожалению, не стоит забывать, что на данный момент на самом деле мы работаем, что касается, в ближайшее время.»
  • +3
    краткий пересказ ответа на заголовок топика — «Никак»
  • 0
    Чтобы бороться со спамом, необходимы программисты, требуется отдел аналитики, а самое главное — воля к борьбе. Ничего из этого у СУПа нет.

    Просто так написать набор фильтров по ключевым словам невозможно; неэффективность этого подхода мы все видим в текущем ЖЖ, где комментарий со вполне себе невинной ссылкой считается спамерским.

    Из опыта развития системы антиспама Рамблера можно утверждать, что стоимость избавления ЖЖ от фекальных масс будет составлять от 3-х человеколет разработки. Кроме того, даже очень хорошая система антиспама не является панацеей, и все равно придется держать собственный штат аналитиков. Иными словами, процесс этот комплексный, разовыми вложениями не решаемый. Готов ли ЖЖ на такие траты, я не знаю, это пусть г-н Дронов выясняет.

    Что до прикрутки сторонних решений, то и с этим тоже будут определенные проблемы, прежде всего связанные с дурацким TOS ЖЖ.
  • 0
    промоутировать — моя русская языка. Есть слово продвигать. А переделку дизайна ждём, надоел совкоремонт, хочется евроремонта.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.