Пользователь
0,0
рейтинг
30 марта 2012 в 02:12

Гугл использует reCaptcha для распознавания названий улиц и номеров домов

Последнее время многие пользователи стали замечать reCaptcha с кусками фотографий, содержащих номера домов, названия улиц и даже дорожные знаки.



Представитель Google подтвердил, что они проводят эксперименты над людьми по улучшению качества своей БД информации об адресах и предприятиях с помощью распознавания фотографий Street View.
По результатам этих бесчеловечных опытов будет принято решение по использованию reCaptcha для других задач.

Небольшая коллекция таких капч, собранная пользователем форума blackhatworld.com:


(кликабельно)
Иван @coolspot
карма
59,2
рейтинг 0,0
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое

Комментарии (63)

  • –7
    Как бы задумка интересная. Вот зачем? Есть уже готовые карты с названиями улиц и домов. Если с распознаванием текста старинных книг я понимаю и поддерживаю, то это думаю немного перебор. ИМХО.
    • +5
      Почти на всех картах в интернете мой дом 99, хотя на самом деле 101 :). Но не думаю что они затеяли все это ради 0.1% погрешности.
      • +21
        Измените номер своего дома в OpenStreetMap — и Вы даже не заметите, как это перекочует во все остальные карты.
        Я как-то, в порыве неизвестного мне доселе чувства — начал рисовать маленькие дорожки вокруг домов в своем дворе в OSM… Также я исправил кривизну некоторых других дорожек, потому что мне показалось, что авторы (рисовавшие вероятно по спутниковым снимкам) неверно отобразили действительность (ну или фотка была кривая. На Bing'e, кстати, север Москвы снят под углом, поэтому видимо все объекты оказались смещены).
        В общем, теперь эти дорожки и несчастная трансформаторная будка, которую я дорисовал, есть на всех популярных картах.
        • +2
          Можно один-два примера?
          • +4
            Вообще, честно говоря, кроме личного примера я больше не могу ничего привести, но и напрямую указывать место своего проживания в данный момент мне не хочется тупо не желательно. Так что, пардон, не буду. Вот так вот всё некрасиво, да. Извиняйте уж…
            Единственное, что могу добавить — на картах Google, которыми я в основном пользуюсь — эти дорожки появились совсем недавно, хотя рисовал я их ещё летом.
        • +2
          OpenStreetMap это помоему единственное место где мой дом и так правильно прописан :)
  • 0
    Собственно — давно известно.
    Только вот нужно ли было подтверждение гугла, для того чтобы убедиться,
    что он так заполняет базу распознанных вещей? :)
    Вот бы поюзать все это хозяйство: начиная от базы,
    заканчивая мощностями — для своих экспериментов…

    Обращение к сотрудникам Гугла
    Не планирует ли гугл выдать общие API\Cloud мощности, для доступа
    к этим базам и созданию своих собственных алгоритмов?
    • +1
      В топике по ссылке рассказывается о классическом применении reCaptcha — для распознания книг (Stop SPAM. Read books.). Теперь же они принялись не только за книги. =)
  • –11
    По моему это не сложно проверить, вводя рандом числа.
  • +5
    сотни миллионов работают на гугл бесплатно?) клева)
    • +1
      Вас никто не заставляет вводить капчу, можете не работать, если убеждения не позволяют.

      P.S. Прошу прощения, если воспринял слишком серьёзно.
      • 0
        Не всегда есть альтернатива… а насчет «никто не заставляет» — обычно, все же, заставляют, потому что капча вводится не просто так, а для получения доступа к чему-либо…
        • 0
          Во-о-от, я к чему и клоню. Нужен доступ к чему либо?
          Тут есть несколько вариантов.
          1. Вводим капчу
          2. Ищем в других источниках, либо если речь о сервисах, то аналоги.
          3. Отказываемся от пользования капчей, со всеми вытекающими

          Получается довольно радикально, хотим комментировать на Хабре? — нужно вводить капчу, других вариантов нет. Но тут нужно вернуться к началу дискуссии, кто-то заставляет это делать?
          • –1
            мир не черно-белый, а револьвер не единственный способ принуждения…
          • 0
            Вы можете вводить только одну часть капчи, которая уже распознана и дополнительно усложнена.
  • НЛО прилетело и опубликовало эту надпись здесь
    • +10
      И зарегистрироваться на всех сайтах мира, и проиндексировать весь закрытый контент.
  • +3
    А как гугл узнает, что распознано правильно? Или я не догоняю…
    • НЛО прилетело и опубликовало эту надпись здесь
    • 0
      15-20 подтвержденных значений на однку капчу?
      • +2
        При таких масштабах и распространнености, думаю 15-20… тысяч даже)
        • 0
          Где то я читал что нужно всего два одинаковых ответа от двух юзеров.
          • 0
            то есть первый не проходит? %)
            • +4
              из двух слов в рекапче можно вводить только одно, которое генерируется. Второе, из книги или как теперь, из StreetView, спокойно можно игнорировать
              • 0
                Слова постоянно меняются местами и никогда не знаешь, какое из двух сгенерированное.
                Но вероятностью 50% повезет)
                • +1
                  Это очень легко определить — сгенерированное слово всегда одним и тем же шрифтом, а подставное — разными.
    • 0
      Я где-то читал, что обычно в запросе выдается 2 слова. На одно из них гугл уже знает ответ, а второе вводится пользователем. Т.е, скорее всего, бОльший вес имеет слово, которое гугл уже знает.
      • 0
        Достаточно ввести только слово с кляксой, а второе забить, вбив что угодно.
  • –3
    До 1 апреля ещё 2 дня. Но кто из них начал шутить первым?
  • +10
    Половина домов в России получит номера в виде известного слова из трех букв
    • –3
      С нетерпением ждем капчи от гугла =)
    • 0
      На половине домов в России так размещены адресные таблички, что они уже имеют номер из трёх букв.
  • –10
    Бред какой-то. Философия капчи подразумевает что запрашиваемая сторона знает правильный ответ, а если гугла выдает нераспознанные картинки, то можно вводить в ответ все что угодно.
    • +2
      Ну будьте внимательным, правая часть картинки — по-прежнему текст, известный гуглу и являющийся контрольным!
      • +2
        Не всё IT сообщество вводит капчу полностью, а только контрольный текст )
        • +7
          а смысл, экономия 1 секунды? почему не помочь распознать пару букв книги, мне не западло поработать бесплатно в течение 2-3 секунд в день…
          • +3
            Это выросли те, кто окна бил в детстве и ломал снеговиков. С той лишь разницей, что мозг остался на прежнем уровне. Ничего удивительного.
          • –3
            Да это в какой-то мере протест
            1) reCapcha в 2 раза длиннее стандартной
            2) меня не мотивирует делать работу результаты которой я не могу оценить
            3) такое отношение к пользователям можно воспринимать как принудительную эксплуатацию труда, прибыль с которой имеет Google
        • +2
          Кстати, не все люди айтишники. Большинство не знает, как работает рекапча и вводят оба слова, причём очень стараются не ошибиться. А хорошие айтишники будут вводить качественно, как раз потому, что знают, как это работает и зачем.
  • –4
    В левой части капчи всегда ввожу белиберду, так просто быстрее.
    • +3
      Можно вводить только одно слово.
  • +2
    По результатам этих бесчеловечных опытов будет принято решение по использованию reCaptcha для других задач.

    image
    • +5
      image
  • –5
    не навижу reCaptcha, имхо самая ужасная для понимания каптча, приходится несколько раз обновить текст что бы понять что же там написано.
    • +7
      ROBOT!!!
      • –4
        как раз наоборот, распознать reCaptcha в 100% случаях только google боту под силу
    • +3
      Достаточно распознать «приблизительно».
    • 0
      Имхо, такая простая по сравнению с хабровской.
      • 0
        Как по мне — так местная легче, да и короче :)
  • 0
    Интересно, что же дальше. Распознавание лиц и предметов с фотографий?
    • +1
      Я бы предложил распознавание эмоций. Так google сможет научить своих роботов лучше понимать людей.

      P.S. Да, то, что google делает роботов, и они уже среди нас берём за априори.
    • 0
      Они будут решать уравнение вселенной, вот что мне попалось, однажды.
      image
      • +4
        что-то не вставляются…
        image
        • 0
    • 0
      Распознавание лиц с фотографий у гугла работает года эдак с 2006-го.
      Советую ознакомиться с сервисом и их программой Picasa
  • +7
    Так-то лучше!

    image
    • –1
      Это же моя машина! Они следят за мной! #параноя
  • +3
    На снимках Street View еще много интересного.
    Ждем распознавание паролей на стикерах, приклеенных к мониторам в окнах.
  • 0
    ReCaptcha проработала чуть больше года, если примерно прикинуть сколько всего было введено картинок пользователями и «китайцами» сервисов типа anticaptcha, то можно предположить цифру где то в 10 миллиардов распознанных слов.
    В мире 130 миллионов книг, из них порядка ~10 миллионов должны быть трудно читаемы софтом, да даже если взять все 130кк книг, я думаю процент слов которые для гугла распознать сложно довольна мал.

    То есть теоретически просто кончились книжки.
  • 0
    www.solvemedia.com/ — идеи капчи уже вошли в коммерческое использование. Название бренда, идею из видео-ролика и так далее.

    Где-то пробегал российский старт-ап на эту тему.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.