Пользователь
0,0
рейтинг
29 сентября 2013 в 12:14

Google представил новый поисковый алгоритм Hummingbird

На пресс-конференции посвящённой 15-летию Google был представлен новый поисковый алгоритм, который получил имя Hummingbird — «Колибри». Название должно символизировать точность и быстроту его работы. Представители компании сообщили, что изменения были внесены в поисковой движок еще месяц назад и охватывают 90% поисковых запросов, но объявление о переходе на новый поисковый алгоритм Hummingbird было решено приурочить к 15-й годовщине Google.



Пресс-конференция состоялась в гараже, где 15 лет назад Сергей Брин и Ларри Пейдж заложили основы будущего поискового гиганта.



Амит Сингал, руководитель отдела разработки поисковой системы, сказал, что это обновление поискового алгоритма, возможно, наиболее кардинальное с 2001 года, когда он начинал свою деятельность в компании. Предыдущее крупное обновление поискового движка Caffeine было направлено в первую очередь на увеличение скорости индексации информации, а не на обработку собранной информации. Hummingbird обрабатывает запросы не столько по ключевым словам, но и по их смыслу. Благодаря этому пользователи смогут делать более длинные и сложные запросы.



Необходимость изменения поиска в Google объясняют изменением самых запросов от пользователей. Если ранее поисковые запросы формулировались в виде коротких фраз с большим числом ключевых слов, то теперь многие поисковые запросы — обычные фразы разговорной речи, порой достаточно длинные и сложные.

Вторая причина, которая обусловила необходимость ввода нового поискового алгоритма — развитие голосового поиска. «Помните, как выглядел поиск в 1998 году? Вы садились, включали громоздкий компьютер, подключались к интернету через dial-up, вводили какие-то ключевые слова и получали 10 ссылок на сайты, которые содержали эти слова. Мир так изменился с того времени: в онлайне миллиарды людей, интернет увеличился в геометрической прогрессии, и теперь вы можете задать любой вопрос на мощном гаджете, который помещается в вашем кармане», — отметил Сингал.

Тамар Иегошуа, вице-президент по исследованиям, продемонстрировала возможности нового поискового алгоритма понимать сопряженные запросы. Она предлагает Google открыть фотографии Эйфелевой башни, и сразу же после этого, не уточняя, о чём идёт речь, задаёт вопросы «Какой она высоты?», «Когда она была построена?», «Покажи мне фотографии строительства». Затем она представила результаты использования голосового поиска Google для поиска информации о художниках-импрессионистах. Фрагмент видеопрезентации можно увидеть здесь



К сожалению, нет возможности сравнить результаты поисковой выдачи «до» и «после» введения нового поискового алгоритма. Хотя, Google приводит несколько примеров.
Так, по запросу «acid reflux prescription» (кислотный рефлюкс рецепт) раньше предлагался список медикаментов, которые могли быть бесполезными пользователям, искавшим общую информацию о лечении и вообще информацию о необходимости принимать лекарства. Новый алгоритм предлагает эту статью, которая в данном случае будет полезней.
Запрос «pay your bills through citizens bank and trust bank» (оплата ваших счетов через Citizens Bank и Trust Bank) раньше приводил пользователей на главную страницу Citizens Bank, а сейчас по этому запросу выводится страница для оплаты счетов.
Результатом запроса «pizza hut calories per slice» (калорийность ломтика Pizza Hut) были страницы похожие на эту, утверждает Google. Сейчас же вы можете получить ответ напрямую от Pizza Hut.

Не может ли случиться так, что с новым алгоритмом поиска Google стал хуже?
Вот какой ответ был получен на этот вопрос: «Почти наверняка — нет. И хотя мы не можем утверждать, что поиск Google стал лучше, но мы знаем, что Hummingbird — если он действительно использовался на протяжении прошлого месяца — не вызвал волну недовольства со стороны пользователей или жалоб, что результаты поиска Google ухудшились. Люди жалуются, когда становится хуже, но они часто не замечают улучшений»

Подробнее здесь:
Fifteen years on—and we’re just getting started
FAQ: All About The New Google “Hummingbird” Algorithm
Google Reveals “Hummingbird” Search Algorithm, Other Changes At 15th Birthday Event
Google unveils major upgrade to search algorithm
Ирина @IrinaInina
карма
65,2
рейтинг 0,0
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое

Комментарии (62)

  • +9
    Тамар Иегошуа, вице-президент по исследованиям, продемонстрировала возможности нового поискового алгоритма понимать сопряженные запросы. Она предлагает Google открыть фотографии Эйфелевой башни, и сразу же после этого, не уточняя, о чём идёт речь, задаёт вопросы «Какой она высоты?», «Когда она была построена?», «Покажи мне фотографии строительства».

    У меня это не получилось.
    • 0
      Об этом запросе о Эйфелевой башне говорится в двух последних источниках.
      Полного видео презентации не нашла, только тот отрывок, что в посте, в нём только последние кадры о башне.
      Думаю, те запросы действительно были продемонстрированы журналистам.
      Но у меня они тоже не сработали.
      Два варианта: или нужно использовать голосовой поиск. Проверила в Google Chrome — нет, не работает.
      Или новый поисковый алгоритм вводится в первую очередь на территории Соединённых Штатов (есть и такая версия).

      • +1
        Последняя версия самая правдоподобная. По крайней мере, изменения для gmail выкатывали частями.
        • 0
          С территории Штатов тоже не работает, по крайней мере сейчас.
          • +2
            На каком языке были запросы?
            • 0
              На английском.
              • +1
                Здесь перечень вопросов, которые были заданы на пресс-конференции при помощи голосового поиска
                Show me pictures of the Eiffel Tower
                How tall is it
                When was it built
                Show me pictures of the construction
                Результат последнего запроса выглядел так (скрин с экрана).
                Не могли бы вы проверить, какой результат получится у вас по этим запросам?
          • 0
            У меня сработало. Нашел картинки Эйфелевой башни («Show me images of Eiffel Tower»), затем спросил какой она высоты («What height is it?»).

            Правда, с моим акцентом получилось следующее — Эйфелеву башню поняло сразу, не поняло «высоту» и вместо height дало мне определение слова tight.

            При последующих запросах стабильно выдавало картинки сотовых башен («cell tower») — и только после того, как я сказал «Eiffel tower in Paris» оно поняло меня правильно.

            При втором поиске выдало «Using previous search Undo»

            В выдаче первым линком — статья в ВИки, высота написана в примере текста со страницы.
  • +15
    Если ранее поисковые запросы формулировались в виде коротких фраз с большим числом ключевых слов, то теперь многие поисковые запросы — обычные фразы разговорной речи, порой достаточно длинные и сложные.


    Вот, вот. Совсем гуглить разучились ;-) И что-то мне подсказывает, что таким людям даже новый алгоритм не поможет — в статье описаны вполне разумные вопросы, которые тоже надо уметь задать. А то, что некоторые вбивают в поиск даже человек порой понять не в состоянии, особенно учитывая сложность русского языка. Хочешь полноценно пользоваться инструментом — учись делать это правильно.
    • +10
      Раньше люди подстраивались под поисковик, стараясь облегчить ему работу. Сейчас поисковик подстраивается под пользователей, пытающихся разговаривать с ним как с человеком.

      Плохо, что нет возможности сравнить разные алгоритмы поиска. Неизвестно, как будет новый алгоритм обрабатывать запросы, правильные с точки зрения теории поиска по ключевым словам. Не будет ли он пытаться связать их между собой? И не придётся ли учиться обращаться к нему «обычными фразами разговорной речи, достаточно длинными и сложными», для того, чтобы он нас понял.
      • +10
        Во-во, как бы нам, привыкшим искать по ключевым словам, не пришлось переучиваться. Сделали бы настройку что-ли, типа «умный поиск» (для всех), и «тупой поиск» (для гиков) :)
        • +4
          Я бы не скзал, что «тупой» поиск — это хорошо или это супергиковски. Поиск по ключевым словам — просто попытка угадать, что будет на странице, которая вам нужна. Гораздо лучше общаться с компьютером по-человечески, на мой взгляд, когда вы не гадаете, а говорите, что вам надо, а компьютер это понимает. Тогда и всякие трюки с напихиванием на страницу слов для заманивания пользователей частично утратят силу.
          • +2
            Поиск по ключевым словам — просто попытка угадать, что будет на странице, которая вам нужна.

            Не всегда. Часто поиск по ключевым словам означает «выдай мне страницу, где есть все эти слова, а дальше я сам разберусь». И попытка понять смысл фразы не то, что машиной, а даже человеком, не знакомым с вашей проблемой, приведёт к фейлу.

            Разумеется это касается чего-то узкоспециализированного, общие вопросы (как в примере в топике) проще задавать обычным языком.
        • +1
          Ну, сейчас есть всякие site:, inurl: и прочие. Если сделают какой-нибудь keywords:, то никаких проблем не вижу.
          • +3
            Да как бы не убрали эти операторы вообще, от них же всего можно ожидать…
  • +9
    Скоро, видимо, навык «гуглинга» станет совершенно бесполезным. В некоторой степени даже жаль.
    • –3
      Да уж — только хотела статью об этом написать и на тебе — не надо уже. Пойду посплю.
  • +22
    По факту, поиск стал хуже. imho.

    То что я раньше находил сразу, теперь приходится искать действительно через очень длинные запросы в кавычках.
    • +5
      Согласна. То-то я уже месяц не могу ничего быстро найти и чувствую себя тупицей.
    • +2
      Весь последний месяц я продолжал спрашивать гугл коротким набором ключевых слов и что-то не заметил ухудшения выдачи. С чего вы решили, что запросы теперь придётся писать длинными и что-то перестанет находиться сразу?
    • 0
      Что самое поганое, поисковики не воспринимают фразы в «французских кавычках-ёлочках». Им подавай фразы в программистских "дюймах", и все тут. Бред :)

      Но раздражать стало только после того, как я поставил себе альтернативную раскладку и приучился ставить по поводу и без повода длинные тире и французские кавычки :))

      p.s. А хабр дюймы в текстах автозаменяет на ёлочки :)
    • +1
      Согласен. Хотя бывают просветы. Мне гугл однажды выдал первой (!) ссылку на stackoverflow по запросу на русском языке (!) причем на странице нигде не было надписей, что гугл его перевел перед поиском, как обычно бывает. Но это скорее исключение из правил…

      Я регулярно ищу на нескольких сайтах тексты по ключевым словам. И сохраняю их — вдруг пригодятся позже? Так вот, ранее сохраненные тексты (несколько лет назад) — я больше не могу найти ни по каким ключевым словам. При этом на самом сайте они есть и даже урл у них тот же.
      • 0
        Это не исключение. Наоборот тоже работает. Вот вам пример, только что заскриншотил:
        Скрытый текст
        image


        Обратите внимание, на странице ни одного слова «pinout», как и в исходном коде страницы (мало ли, какие теги не заметил). Так что гугл нормально научился переводить термины, и выдавать корректные результаты на родном языке.
        • 0
          Нет-нет, было немного другое, там был абсолютно нейтральный запрос чисто на русском, без упоминания языков или уникальных слов/терминов. Гугл мне нашел страницу название которой совпадало с моим запросом, только на английском. А все остальные результаты были уже на русском, если я правильно помню.
          Запрос, к сожалению, уже не помню, если не забуду — попробую завтра его в истории браузера на работе поискать.
          Но, вообщем-то, это все равно не спасает, общее качество поиска упало сильно как раз примерно с момента когда "+слово" убрали.

          P.S.: а здесь он скорее всего привязался к слову ATMEGA8 и подтянул историю поиска. Результат наверняка посещался уже? Да даже если и нет — история сильно влияет последнее время. Я при поиске уже даже не уточняю функцию из какого языка программирования мне надо — гугл уже изначально мне результаты для php дает. Раньше, когда я больше с C# работал — давал для C#
          • 0
            Не, на этой странице не был (запрос бессмысленный, информация есть в даташите), но вот что у меня персонализация поиска включена — это может повлиять.

            Честно говоря качество поиска меня устраивает полностью, но напрягает, что ты не можешь его контролировать.
            • 0
              лично у меня нет проблем пока я ищу что-то связанное с программированием (если искать на английском) — как правило 100% релевантный результат есть на первой странице или до него можно добраться доп. запросом. Но запросы общего вида — тут уже когда как повезет.
            • +1
              вот тот самый запрос

              первая ссылка у меня сюда
              • 0
                Интересно :)
            • 0
              Чтобы контролировать качество поиска, приходите работать в Google :)
    • 0
      Вот и я тоже заметил, что некоторые запросы стали выдавать совсем не то, что ожидал. Для эксперимента пару раз попробовал повторить запрос в Яндексе — там ответ более ожидаемый, так что теперь если Google ничего не нашел, пробую ещё в Яндексе. Обычно помогает.
  • +31
    Знаете что было лучше? Лучше был алгоритм который был пять лет назад, без этих автоматических синонимов (которые плевать хотели на семантику), без автоматического выкидывания 90% запроса, с плюсиком и кавычечками которые работали. Но неверный путь уже выбран и даже если усовершенствовать существующее, то всё равно существующий алгоритм будет не сильно полезнее предыдущего.
    • +2
      Для общих запросов все эти синонимы, переводы, разворачивание сокращений и прочее — в большинстве случаев удобны, по-моему.

      Для технических, программистских вопросов — печаль. Действительно, приходится каждое слово брать в кавычки и выстраивать какие-то ужасные конструкции.

      В частности, я так и не нашёл аналога старого +word. Гугл предлагает использовать кавычки "word", что обычно убеждает поисковик, что мне это слово нужно обязательно, но ведь это ограничивает словоформы.
      • 0
        А можно привести примеры запросов, где без плюса плохо?
    • +3
      Добавлю что если бы у гугла была возможность выбирать алгоритм в настройках (в т.ч. и пятилетней давности) — все были бы довольны. Но маргинальный пользователь — не человек и его мнение учитываться не должно.
      • +1
        А вы свои продукты тоже создаёте с возможностью настройки?
        • +1
          те которые в рамках опенсорцв для людей пишу — обязательно. А те что на работе для биэнесв — там не я решаю.
      • +3
        Зато мы можем выбрать поисковую систему вместе с алгоритмом.

        Рекомендую DuckDuckGo — они хотят того же, чего и вы: предсказуемые результаты поиска без «поискового пузыря». Плюс удобные сокращения для перенаправления запроса на специализированные сайты.

        Но вот качество поиска и объём базы у них хромают
        • +1
          Именно его на данный момент и использую, спасибо.
        • +1
          Отличная штука, да. Я как-то искал одно художественное произведение, много лет назад забыл и автора его и название, а вот сейчас захотелось найти и перечитать. А в памяти засели только пара фраз и больше ничего. Как ни извращался в гугле — ничего. Дакдакгоу выдал именно то, что нужно на первой же странице.
        • 0
          Рекомендую DuckDuckGo

          Тут стоит сразу уточнить, чьи поисковые движки он использует. Например, Яндекс.
  • –23
    «поиска в Goggle»? может вы имели ввиду Google, исправьте пожалуйста.
    • +22
      Вот ошибку уже исправили, а ваш комментарий будет тут вечно. В личку такое пишут.
      • +1
        Ну, ещё может прилететь НЛО.
      • +7
        В личку нужно ещё добираться через лишние клики, а потом проводить представление себя и причины своего обращения
        Ей-богу, не пойму, почему Хабр не хочет сделать механизм оповещения об ошибках согласно уже де-факто стандарту в Рунете: выделяешь блок текста и Ctrl+Enter. И пусть это сообщение шлётся автору хоть в личку, хоть куда угодно.
        • 0
          Ну а использовать комментарии к статьи для информирования об ошибках это вообще за гранью добра и зла. Зачем отнимать время у будущих читателей?

          А что касается вашей идеи, попробуйте отправьте как предложение администрации. Хотя возможно они не хотят создавать лишнюю нагрузку на сервера. Или не хотят искажать «авторский стиль».
          • 0
            Интересно, насколько нагрузка на сервер от предложенной схемы выше, чем при классическом подходе через личку. Что-то мне говорит, что на генерацию и раздачу всех попутных страниц они тратят на порядок больше вычислительных мощностей и трафика, чем тратили бы тут.

            Про комментарии согласен, но то что ими продолжают пользоваться, несмотря на отлавливаемые минусы — говорит о том, что классический метод не универсален. Среди людей, занимающихся городским благоустройством, популярна такая поговорка: «Как узнать, где проложить пешеходную дорожку? Дождитесь, когда выпадет снег, и посмотрите, где будут протоптаны тропинки». Так и здесь: очевидно, что личка — не лучший выход.
            • 0
              Интересно, насколько нагрузка на сервер от предложенной схемы выше, чем при классическом подходе через личку.

              Тем, что предложенный механизм упрощает информирование, следовательно при чтении статьи, каждый будет клацать Ctrl+Enter, а после каждого информирования автор будет апдейтить топик.

              А еще добавить, что скорей всего механизм будет работать не только для авторизованных пользователей, но и для всех читателей Хабра, что еще увеличит количество исправлений.
            • 0
              По поводу лички уточню. Сообщение в личку пришло ещё до того как появился комментарий. На момент его добавления ошибку уже исправила, за предупреждение поблагодарила.
              Не знаю как это сообщение сказалось на нагрузке на сервер. Надеюсь, два сообщения в несколько слов не стали для него особой проблемой.
              • 0
                Да вы что, вы же хабр повесили на 10 минут!!! :)
          • 0
            > А что касается вашей идеи, попробуйте отправьте как предложение администрации.
            Предлагали тысячу раз уже много лет. Воз и ныне там. Наверное, слишком сложный механизм для внедрения. Я бы предложил внедрить механизм быстрой отправки в личку из поста. Но и сейчас нужно всего два щелчка. Разве что добавить отсылку к публикации.
    • +3
      Прошу прощения, не заметила. Уже исправила.
      Не в порядке оправдания, просто вспомнилось. Правильное с точки зрения грамматики название должно выглядеть так :)



  • +1
    Верный ответ в 90% случаев зависит от умения задать верный вопрос. Кроме того прагматик внутри меня, говорит, что «Санкт-Петербург год переименования» формулировать, писать, и анализировать поисковой системе, проще, чем запрос «В каком же году был переиминован Санкт-Петербург». Хотя бы потому, что алгоритм всеравно упроситит запрос до первоночальной формы.
    На правах собственного мнения.
    • 0
      Не думаю, что Гугл разучится понимать первую фразу.
  • +5
    Гугл сейчас очень и очень крут. Круче Яндекса в понимании смысла запроса и желания пользователя. За последний год были случаи, когда он ставил на 3-5 место в выдаче страницы, не содержащие ни оного слова из запроса, но действительно отвечавшие на мой вопрос. Яндекс в таких случаях, пока не закончатся страницы с совпадениями по словам, такой результат не выведет.
  • +1
    Означает ли это что сеошники для гугла станут бесполезны с линкбилдингом и ключевиками, а теги keywords и H1 канут в лету?
    • +2
      Задачи сео меняются в течение всего времени существования поисковиков. Keywords давно не влияют на ранжирование и сеошники забыли этот инструмент, используя другие.
  • +5
    Верните поиск по ключевым словам. Пожалуйста. Хотя бы как опцию. Хотя бы через танцы с cookies. Хоть как-нибудь. Невозможно же пользоваться этими омерзительными угадывателями мыслей!
  • +3
    а я думал, отчего Google последний месяц так плохо картинки стал искать. Часто изу фото новых смартфонов, и теперь их не найти ни в Яндексе, ни в гугле. Вот любой. Samsung Note 3, iPhone 5s, Meizu MX3 — поищите в картинках. Не найдете официальных картинок и фото, найдете тучу концептов, которые публиковались слухами ранее, и которые вообще не являются этими устройствами. Раньше только Яндекс таким греил, теперь вот и гугль (
  • 0
    я правильно понимаю, что после двух запросов:

    1. открыть фотографии Эйфелевой башни
    2. порно онлайн

    оно мне покажет салоны «красоты» и фото «красоток» около башни, выдаст адреса «салонов» и их координаты по GPS, а так же проложит мне удобный маршрут от того места где меня запеленгует, и забронирует мне «столик», с учетом моих «предпочтений» по предыдущему серфингу «известных» сайтов?

    охренеть! дайте две!
  • 0
    «раньше приводил пользователей на главную страницу Citizens Bank, а сейчас по этому запросу выводится страница для оплаты счетов.»
    Похоже, двигаются в том же направлении, что и Яндекс с их островами — пытаются распознать, когда в запросе поиск информации, а когда — поиск решения какой-то задачи.
  • 0
    > Люди жалуются, когда становится хуже…
    Интересно, куда же можно пожаловаться в гугл? Все в ту же поисковую строку? :)
  • 0
    Есть много способов, помимо того чтобы нажаловаться вот прямо тут в комментах:

    0. можно сделать это прямо на хабре
    1. можно писать в специальный форум
    2. можно в твиттер
    3. или в G+
    4. ну и внизу страницы с результатами поиска есть ссылка «отправить отзыв»

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.