Как стать автором
Обновить

Хабраинтервью с Максимом Мозулем (Русская Википедия)

Время на прочтение8 мин
Количество просмотров1.3K
На вопросы хабрааудитории отвечает Максим Мозуль, один из самых активных авторов русской Википедии (участник Wind), по совместительству занимающий пост администратора и бюрократа Русской Википедии, а также представляющий пресс-службу.

Какие серверы и интернет-каналы используются Википедией, сколько стоит один средний стандартный сервер и поддержание канала для него, на сколько такого сервера хватает (сколько процентов от текущей ёмкости и мощности обеспечивается одним таким сервером)?

К сожалению, мне не удалось найти точную информацию, однако хотя бы примерно я постараюсь ответить. Всего для проектов Фонда используется около 300 серверов, около 100 из них работают в режиме кэширования, на них запущен Squid. Ещё около 100 являются веб-серверами, на которых работает Apache. Около 20 используются для баз данных MySQL, остальные используются для поиска, работы с изображениями и тому подобного. Доступна схема работы серверов фонда. Общая стоимость хостинга по состоянию на 2009 год, в соответствии с годовым отчётом, составляет 822.000 долларов.

Какое у вас образование?

В Киеве учил химическую инженерию и компьютерную химию в Киевском политехническом институте, в Германии год слушал лекции по политологии, психологии и социологии в Эрлангенском университете, затем учил информатику в Техническом университете Мюнхена, перешел на кафедру компьютерной лингвистики в университете Людвига-Максимилиана, где преподаёт профессор Гюнтнер, в фирме которого я работаю, сейчас заканчиваю там магистратуру параллельно работе.

Расскажите немного о себе: когда приехали в Германию какие языки программирования используете ежедневно?

Два разных вопроса в одном. Сначала чуть-чуть о себе. Родился на Украине в городе Волчанске, откуда был увезён, когда мне было полтора года, в пригород Киева Бровары, где и жил до приезда в Германию в 1996 году, В Германии жил в нескольких городах, но с 2001 года живу в Мюнхене, который за последние девять лет действительно полюбил. С детства интересовался разного рода общими знаниями, играю в «Что? Где? Когда?», капитан мюнхенской команды «Тёмный лес».

Теперь о языках программирования: На работе в основном использую Perl и PHP, а также базы данных: MySQL и MatchMaker.

Что движет вами тратить столько времени на Википедию? Насколько понимаю, работа бесплатна?

Наверное, в первую очередь ощущение, что делаешь что-то полезное для людей (Википедия уже несколько лет является для очень многих основным источником информации). К тому же, это просто интересно. Занимаясь Википедией, всегда узнаешь что-то новое.

Википедия — стремительно растущий проект, который живёт за счёт пожертвований, но не имеет никакого дохода. Ко всему этому заметил в Википедии рост медийного разнообразия (видео, графики и т.д.). Как всё это будет финансироваться дальше? Будет ли иметь Википедия свой предел?

На данный момент Фонду Викимедия удаётся содержать Википедию и другие проекты за счёт пожертвований. В рамках стратегического планирования будущего Фонда существуют предложения по финансированию, например, за счёт рекламы, однако, решение о переходе на подобного рода финансирование пока что никто не принимал. Мне кажется, что, по крайней мере в ближайшем будущем, будет достаточно частных и корпоративных спонсоров для того, чтоб Википедия и далее оставалась свободной от рекламы.

Насколько плотно авторы статей из разных стран сотрудничают между собой? И сотрудничают ли вообще?

Тут есть два аспекта. С одной стороны, существует сотрудничество между разными языковыми проектами, когда авторы, например, русской Википедии, помогают в работе над украинской Википедией и наоборот, с другой стороны, существует сотрудничество людей из разных стран, работающих в одном и том же языковом проекте. Оба вида сотрудничества достаточно развиты, значительное количество участников работает не только в своём родном языковом разделе, но и в других. Особенно это заметно на примере Википедий на международных языках, таких как английский или русский. В русском разделе Википедии, например, работают люди, живущие по всему миру, в том числе и те, для кого русский не является родным. Один из самых активных участников и администраторов русской Википедии — житель Саксонии, выучивший русский язык во время учёбы в России.

Вы должны знать несколько языков, как минимум немецкий и русский, и почти наверняка английский. Значит видите, чем отличаются русские статьи от немецких и английских. Собственно вопрос: чем отличаются русские статьи? Есть какая-то национальная русская черта, которая прослеживается через статьи?

Статьи английской и немецкой Википедий долго служили примером для русской, поэтому во многом они похожи друг на друга. В последнее время, кстати, вполне может случиться, что статьи русской Википедии по определённым темам могут быть даже более полными, чем в английской, поскольку в русской Википедии, по аналогии с немецкой, действуют достаточно жёсткие правила относительно минимального объёма статей. Конечно, в русском разделе вполне можно встретить статьи, написанные исходя из российских или советских реалий или отражающих российскую или советскую точку зрения. Подобные явления, однако, можно встретить и в немецкой или английской Википедиях. В соответствии с принципом нейтральной точки зрения, являющимся одним из основных принципов Википедии, такие отклонения от нейтральной позиции должны повсеместно искореняться. К сожалению, работа по приведению всех статей Википедии к нейтральной точке зрения ещё далеко не завершена и является очень нелёгким делом.

В немецкой Википедии, в отличие от русской или английской, практически нет статей, созданных роботами.

Планируется ли организация взаимодействия с академическими организациями России (Академия наук, Университеты) для пополнения узкоспециализированных статей?

Речь об этом неоднократно шла, но каких-то конкретных планов пока нет.

Планируется ли привлечение в качестве экспертов, научных сотрудников профильных академий и институтов?

Нет, пока нет никаких конкретных планов в этой области.

Имеется ли клиентская часть к набору и редактированию статей, работающая без постоянного подключения к Интернет?

Да, такие программы существуют, один из примеров — плагин для Eclipse, позволяющий создавать и редактировать статьи без доступа к интернету.

Что вы думаете о Луркморе? Какие отношения с его авторами?

Лично я считаю, что Луркмор отлично заполняет свою нишу как энциклопедия мемов и сам использую его в этих целях. В этом смысле Луркмор хорошо дополняет Википедию, где многие современные мемы не могут быть описаны по причине отсутствия энциклопедической значимости и/или авторитетных источников. В самой Википедии отношение к проекту неоднозначное, он занесён в спам-лист по причине периодического спама в разных статьях, однако, громких конфликтов в последнее время вокруг Луркмора не было.

Сколько в среднем статей добавляется ежедневно? Как известно, авторами некоторых статей являются не люди, а роботы, то есть статьи генерируются специальным образом. Например, шаблонно забиты статьи о космических объектах. Не рано ли праздновать 500.000? Сколько из этого количества создано людьми?

В последнее время в день, с учётом удалений, создаётся порядка 400 статей. Статей, откровенно созданных ботами и не доработанных людьми, вроде статей об космических объектах, сейчас в Википедии 7610. Однако, на основе содержания других Википедий, прежде всего немецкой, были автоматически сгенерированы статьи о многих населённых пунктах. Например, статья об немецком населённом пункте Кохель ам Зее. В создании таких статей участвовало значительное количество участников, которые вычитывали названия статей, проверяли результаты работы бота, а потом дополняли некоторые статьи, поэтому их нельзя назвать созданными полностью автоматически, хотя и написанными людьми эти статьи тоже не назовёшь. Таких статей в Википедии не менее 50 тысяч, но над ними, в отличие от большинства статей о космических объектах, всё же работают люди, постепенно улучшая и дополняя их содержание. К тому же, эти статьи действительно представляют ценность для читателя, снабжая его хотя бы минимальной информацией о том или ином насёленном пункте и предоставляя ссылки на, вероятно, более полные статьи на других языках.

До недавнего времени статьи писались только особой кастой «википедиков», неугодные им статьи удалялись и блокировались, а авторы банились. Но за последние примерно полгода-год многие забаненные статьи были восстановлены. Вопрос: что, как и почему поменялось в русской Википедии?

Практически ничего не изменилось. Возможно, удалённые статьи просто были грамотно переписаны заново.

Интерфейс редактирования статьи когда-нибудь станет таким, чтобы простому читателю хотелось исправить неточность?

В самое ближайшее время запланирован переход на новую тему оформления, интерфейс редактирования в которой должен стать несколько более удобным. Впрочем, надо признать, что без знания викиразметки и там обойтись не удастся.

Понимаю, что может быть вы и не осведомлены настолько, но нет ли у вас возможности пролить свет на то, куда уходят собранные от сообщества миллионы?

В соответствии с годовым отчётом Фонда, в основном на зарплаты работникам, поддерживающим техническую инфраструктуру, и на содержание серверов.

Почему Википедии жалко места на серверах на «несущественную» информацию? Именно наличие в Википедии такого понятия как несущественность отбивает желание что-либо туда писать. Не то чтобы я не могу написать ничего существенного, но сидеть и гадать как мой труд оценят администраторы и интересна ли им тема не хочется, а хочется в меру умения лаконично представляя и форматируя, выложить всё по теме, что знаешь и можешь оформить в логически-состоятельный вид. Хочется чтобы Википедия была постоянно растущей централизованной базой всех объективных знаний человечества за исключением подробностей из личной жизни «звёзд» и т.п. Расскажите, почему нельзя писать о «несущественных» вещах?

Это действительно интересная проблема, по поводу которой есть разные точки зрения в том числе и среди самого сообществе википедистов. Чтоб понять, почему в Википедии вообще существуют «несущественные темы», нужно учесть, что Википедия изначально создаётся именно как энциклопедия. Это значит, что в Википедии существуют определённые ограничения на размещение информации. Например, в Википедии недопустимы оригинальные исследования, т.е. новые теории, которые ещё нигде не опубликованы и не признаны научным сообществом. Исходя из этого определяется, что же является существенным, на языке Википедии — значимым. В общем случае значимым является то, о чём существуют публикации в независимых от объекта авторитетных источниках. Это важно в том числе и потому, что любая информация в Википедии должна быть проверяема, т.е. должна подтверждаться авторитетными источниками. Иначе ведь каждый сможет написать в Википедию любую информацию и не будет никакой возможности проверить её достоверность. А одной из заявленных целей Википедии является создание именно полной и точной (достоверной) энциклопедии. Таким образом, размещение информации об объектах, не описанных в авторитетных источниках, противоречит этой заявленной цели Википедии. Для определённых тем существуют также дополнительные критерии значимости, целью которых является предотвращение использования Википедии для целей, с созданием энциклопедии не связанных, например для самопиара.

Будут ли когда-нибудь цитаты из Википедии считаться в качестве достоверных источников информации? Сталкивался с тем, что преподаватели считают неприемлемым использование материалов Википедии в студенческих работах.

Мы стремимся к этому. В будущем планируется введение выверенных версий статей, в которых вся информация будет проверена на соответствие с указанными источниками.

Что бы вы хотели изменить в Википедии?

Мне бы хотелось, в первую очередь, чтоб сообщество Википедии было максимально безконфликтным. Больше всего работе над проектом мешают именно конфликты между участниками.

Как вы видите Википедию через 10 лет?

Я надеюсь, что через десять лет значительная часть статей Википедии будет выверена и Википедия будет считаться легитимным авторитетным источником. Что работа в проекте будет ориентирована в первую очередь на качество и проверяемость контента, а не на его количество.
Теги:
Хабы:
+27
Комментарии73

Публикации

Истории

Ближайшие события

Weekend Offer в AliExpress
Дата20 – 21 апреля
Время10:00 – 20:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн