Как стать автором
Обновить

Информация с Яндекс.Субботника

Время на прочтение 5 мин
Количество просмотров 743
Постараюсь без всяких эмоций рассказать что я узнал на семинаре Яндекса 18 апреля.

Сначала выводы, а затем подробнее о каждом докладе.

Выводы:

Я не пожалел, что съездил на семинар. Задал интересующие вопросы и получил ответы. Из-за докладов ездить не стоит, но стоит ездить для возможности задать важные вопросы в перерывах. Люди были все адекватные.

Фотографий не будет. На первом же снимке в помещении вспышка посадила аккумуляторы, а запасные я забыл. Закон Мерфи в действии. ;-)

Лошадь тут не просто так, о ней я пишу в конце статьи.

Далее: описание и выводы по каждому докладу, пожелания организаторам.



1. Поиск по сайту средствами Яндекса

Богдан Гаркушин

Вводный доклад для тех, кто вообще не знает какие средства поиска по сайту есть у Яндекса. Доклад в принципе неплохой, но не к месту. Подавляющее большинство пришедших были вебмастера, опытные вебмастера и тому подобные квалифицированные люди, которые прекрасно знают как Яндекс может искать по сайту. Потому они пришли. Это и показали вопросы: все заданные вопросы были по специфическим моментам Яндекс.XML, Яндекс.Server никак не упоминаемым в докладе.

Из доклада я узнал:
  • Что сейчас Яндекс оценивает интернет в 60—70 Тб. Три года назад Гугль говорил, что у них 20 Тб. Хорошо согласуется, экспоненциальный рост.
  • Яндекс.Server как плохо искал на английском так и не будет улучшаться в обозримом будущем.
Я ехал именно из-за этого доклада. Доклад оказался просто потерей 45 минут, но я задал интересующие вопросы в перерыве и получил ответы, спасибо Богдан.

Информация: 1
Полезность: 2
(получил бы пятёрки на какой-нибудь обзорно-рекламной конференции)




2. Сервис проверки орфографии

Алексей Байтин, Алексей Осипов

Представили бета-версию проверки орфографии. Всячески хвалили её и ругали конкурентов в лучших традициях буржуйских презентаций. (Всё как у людей ;-) Из рекламы, как побочный продукт, можно было извлечь информацию об основных функциях и характеристиках сервиса.

Я узнал, что:
  • Есть проверка русского и английского одновременно.
  • Большой словарь, Яндекс выкупил/лицензировал словарь Орфо (который использует Микрософт в Ворде) и развивает его, хотя пока незначительно.
  • Сейчас (пока бета) стоит ограничение объёма проверяемого текста в 1500 символов (с вариациями).
Показывали прототип на TinyMCE (такой встраиваемый в страницу редактор на жаваСкрипте).
Подумываю: а не применить ли эту проверку орфографии и TinyMCE в своих проектах.

Информация: 3 (хотя доклад изрядно растянут)
Полезность: 4 (самый полезный доклад)




3. Умные подсказки при поиске по сайту

Артём Ворожцов

Анонс технологии Яндекса для загрузки и показа результатов поиска в то же время, когда пользователь печатает запрос; как сейчас подгружаются варианты поисковых запросов.

Технология не просто сырая, а очень сырая; по-моему: пре-альфа. Все это поняли.
Я не вводил в оценках докладов параметр «качество презентации», но это был самый провальный доклад. Докладчик изрядно волновался (единственный из всех), хотя в перерыве вполне свободно общался с народом. Ничего страшного, опыта наберётся. Но волнение докладчика было не самое плохое. Сама технология энтузиазма не вызвала. Самый усыпляющий доклад. Народ немного проснулся на картинках и прототипе, из вежливости поспрашивал. Но кроме того в докладе было полно грубых смысловых ошибок. (Пример: предложение убрать кнопку «Найти».)

Информации практически не получил (анонс запомнил), только несколько идей возникло по поводу жаваСкрипта.

Информация: 2
Полезность: 1




4. Алгоритм поиска фраз в документах

Дмитрий Агафонов

Единственый не рекламный и самый технический доклад. Есть задача: для какой-то веб страницы подобрать ключевые слова (и соответственно объявления) Яндекс.Директа, Яндекс.Маркета. Дмитрий рассказал общую суть основного алгоритма (разреженный интервал поиска). Не просто рассказал, а довольно хорошо, в картинках, долго разжевывал. Только у меня сложилось впечатление, что из всего зала доклад поняли человек пять.

Я узнал, что:
  • В директе + маркете 3—4 млн фраз.
  • 120 млн вебстраниц, где они установлены.
  • Ограничение на работу алгоритма 20 мс.
  • (ну, и сам алгорим, разумеется)
Это был самый интересный и в то же время абсолютно бесполезный доклад. Приведённый алгоритм может быть интересен программистам или студентам, а использовать его вряд ли доведётся, только если возникнет подобная задача. Если вы отличаете ++k от k++, то качайте видео, когда выложат, занимательный доклад, самый стоящий, чтобы скачать и посмотреть.

Информация: 5
Полезность: 1 (самый бесполезный)




5. Как работает поиск по блогам

Антон Волнухин, Роман Иванов

Рекламно-просветительский доклад про поиск по блогам. Довольно качественный и наиболее соответствовал аудитории. В программке было написано «как устроен поиск по блогам», но про внутреннее устройство поиска как раз не говорилось, доклад на самом деле о том как работает поиск по блогам: с какими интервалами индексирует, кто попадает в топ, с какими блогосервисами какие соглашения.

Я узнал, что:
  • У Яндекса соглашение с ЖЖ (и другими): как только вы опубликовали чего, ЖЖ извещает Яндекс, и поиск по блогам индексирует новую публикацию.
  • Если публикация один раз попала в открытый доступ, то она сохранится в поиске по блогам сколько бы вы не делали её закрытой. (Если уж очень надо сделать закрытой, то пишите в поддержку поиска по блогам)
  • В блогах 1 миллиард публикаций, это 1/5 всего рунета, но сами публикации очень маленькие.
  • Из одного блога только одна запись может быть в топе.
  • Топ обновляется каждые 20 мин.
  • Публикации не старше 8 часов имеют удвоенный рейтинг.
  • Как только публикация попадает на главную она начинает терять (расходывать) рейтинг каждый час.
  • Коментарии Хабра поиск по блогам индексирует, а сами статьи — нет.
Информация: 3
(информации было вроде бы не мало, но на поверку она вся какая-то мелкая и малозначительная)
Полезность: 2




Пожелания организаторам

  1. Очень хотелось бы разделения семинара на пару-тройку более узконаправленных (targeting):
    • Для вебмастера. Этот семинар предполагался же для вебмастера? Ну, и вот. Сделали бы первый доклад конкретно для вебмастера. Как лучше всего применять (best practices), масштабирование, нетривиальные примеры (о которых как раз и спрашивали на перерыве). И остальные доклады такими же.
    • Технический. Аналог Google tech talks. Четвёртый доклад замечательный, подходит (немного расширить и углубить). Ну, и посмотрите Google tech talks по-моему у них хороший формат. 1-2 крупных выступления, не целый день.
    • Для человека, принимающего решения. (Технического директора, директора, начальника отдела и т.п.) С этой точки зрения меня интересует какие проблемы решает технология, когда и на каких условиях я смогу её использовать. Идеальным примером тут считаю семинар IBM для директоров. 15—20 мин доклады, без воды, всё по делу (но с долей рекламы, разумеется), 3 часа.
  2. У всех буржуйских презентаций есть обязательный слайд про планы. Вот в следующем квартале мы сделаем это, через полгода это, через год это. (Roadmap) Вы будете смеяться, но он нужен. Чтобы принимать решение по технологии, нужно знать примерно когда и что будет.




Off-topic

  1. Меня приятно удивила маленькая задержка начала семинара, всего 4 минуты.
    № доклада Задержка начала (мин)
    1 4
    2 4
    3 5
    4 16
    5 6
    Зато везде были задержки, и в этом ничего хорошего.


  2. Может какая особо тёмная туча нашла на солнце, но когда я ехал, что туда, что обратно, я не видел указателя на Яндекс. Весь район застроен отнотипными старыми зданиями красного кирпича. Какое выбрать — неизвестно. Стрелочки на воротах видны только с пары метров.
    Если бы я не знал, что на входе должны стоять лошади — то опоздал бы. Приехал за 5 минут до начала.

    (Предания гласят, что двух лошадей купил директор Яндекса на благотворительном аукционе и с тех пор они охраняют ворота)

    Как вы в Яндексе относитесь к идее разместить огромными буквами на крыше слово Яндекс? Реально упростит навигацию, ну и реклама.
    (А у Рамблера есть огромные синие буквы)


  3. Когда случились неполадки перед четвёртым докладом, ведущему Тимуру, а также Антону Волнухину и Роману Иванову пришлось четверть часа развлекать публику со сцены. К ним присоединился ещё один сотрудник, в зале раздались приглушенные возгласы: «Бобук. Бобук!»
    Я не знал что такое бобук, но подумал, что это какой-то знаменитый блогер. Так и оказалось. С аудио уклоном. Бобук = псевдоним Григория Бакунова. В общении после докладов оставил впечатление адекватного человека.

    Я узнал кто такой Бобук.


Заключение

Спасибо ребятам за доклады и организаторам.
Теги:
Хабы:
+3
Комментарии 3
Комментарии Комментарии 3

Публикации

Истории

Ближайшие события

Московский туристический хакатон
Дата 23 марта – 7 апреля
Место
Москва Онлайн
Геймтон «DatsEdenSpace» от DatsTeam
Дата 5 – 6 апреля
Время 17:00 – 20:00
Место
Онлайн
PG Bootcamp 2024
Дата 16 апреля
Время 09:30 – 21:00
Место
Минск Онлайн
EvaConf 2024
Дата 16 апреля
Время 11:00 – 16:00
Место
Москва Онлайн