Пользователь
0,0
рейтинг
16 сентября 2009 в 21:04

Google покупает reCAPTCHA

image
Известный и популярный проект reCAPTCHA совмещает в себе сервис генерации капчи и распознавание элементов текста неподдающихся электронному определению для оцифровки материалов из разных источников. Сервис предлагал бесплатную реализацию капчи для сайтов в интернет, а пользователи, вводя такую капчу, помогали хорошему делу оцифровки старых материалов.

Теперь сервис куплен Google. Очевидно, что сервис будет использован компанией для поддержки их собственного проекта оцифровки разнообразных текстовых материалов.

via mashable.com/2009/09/16/google-acquires-recaptcha
Владимир @XaocCPS
карма
769,8
рейтинг 0,0
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое

Комментарии (76)

  • +13
    поясните плиз дураку — если они не могли гарантированно распознать текст, то как они проверят капчу?
    • 0
      Меня это тоже интересует ) И насчет старых материалов — неужели они все были настолько плохого качества, что подошли для капчи? )
    • +44
      ввыводится два поля: одно гарантированно известное, другое — нераспознанное. Несколько пользователей вводят данные. Авторизация проводится только по первому полю, поэтому ошибки во втором — допустимы. В случае, когда несколько пользователей одинаково распознали неизвестное слово (количество я точно не знаю), то принимается что слово опознано. Возможно, потом проводится ручная валидация.

      Подробнее на wiki конечно, если вам там не забанили.
      • +3
        Спасибо, несколько раз бывало что точно неправильно вводил, а мне засчитывали, удивлялся, почему так :)
      • НЛО прилетело и опубликовало эту надпись здесь
        • –5
          про ручную валидацию никто и не говорил
          • НЛО прилетело и опубликовало эту надпись здесь
          • 0
            Ну всё-всё, вижу, что ошибся.
    • +2
      Там же два слова — одно из них нераспознанное, а другое распознанное. Человеку нужно ввести оба слова. Которое из них контрольное, он не знает.
      • –5
        Знает, это очевидно. Одно слово сгенерированно компьютером, другое отсканированное из книги. Невооруженным глазом видно.
        • +3
          Часто видно, но не всегда. Когда видно, удаётся обмануть, вводя вместо слова из книги «левые» символы, не ломая глаз.
          • +4
            Сервис от этого совершенно не страдает. Все эти левые символы в конечном итоге признаются мусором, а несколько адекватных людей, не пожалевших трех секунд времени достаточно быстро распознают это слово.
            • +4
              Ну встречаются и интересные варианты вроде этого:

              Тут и самый адекватный человек схитрит))
              • +7
                Не вроде не такая уж и большая проблема написать «393¾. errs» или «393 3/4. errs» :)
                • 0
                  пройдет и просто errs
              • +1
                Ну, тут ясно, что не распознано первое выражение и валидация проходит по второму слову.
              • +1
                ЗВЗ Зч :)
              • НЛО прилетело и опубликовало эту надпись здесь
                • +6
                  ▲▲ hewitt
                  • +1
                    Мне тоже hewitt гораздо сложнее прочитать чем треугольнички. :) Думаю hewitt и есть слово которое не удалось распознать компьютеру. :)
        • НЛО прилетело и опубликовало эту надпись здесь
    • 0
      Именно поэтому зачастую возможно вместо предполагаемого слова (а то и двух), как правило незачёркнутого, написать абы что.
  • НЛО прилетело и опубликовало эту надпись здесь
    • +1
      И захватывает галактику?
      • 0
        Google.Internet.com
        • НЛО прилетело и опубликовало эту надпись здесь
          • +27
            internet.com.google
            • НЛО прилетело и опубликовало эту надпись здесь
            • –3
              тогда уж так:
              google.just.google
              • НЛО прилетело и опубликовало эту надпись здесь
                • НЛО прилетело и опубликовало эту надпись здесь
            • НЛО прилетело и опубликовало эту надпись здесь
            • –1
              гугл везде:

              $ ping internet
              PING internet (127.0.0.1) 56(84) bytes of data.
              64 bytes from gw-in-f100.google.com (127.0.0.1): icmp_seq=1 ttl=53 time=1 ms
              64 bytes from gw-in-f100.google.com (127.0.0.1): icmp_seq=2 ttl=53 time=1 ms
          • –1
            internet.com.google
  • +2
    Главное, что они свой Ad в эту капчу не встраивали, и всем будет хорошо :)
    • +7
      Низко мыслите. Google хоть раз покупал что-то, просто чтобы вставить туда свою рекламу?
      • +1
        Для этой цели Гуглу уже давно можно никого не покупать — все равно чаще всего вставляют именно их рекламу.
      • 0
        YouTube!
        • +8


          • +2
            P.S. И не говорите, что реклама подбирается по ключевым словам!
          • НЛО прилетело и опубликовало эту надпись здесь
          • +1
            Порнореклама в рунете — это полный П
            Бывает, ищешь что-нибудь по работе, кусок кода или что-нибудь с серваком, гугл выдаёт сайт, заходишь, там на самом деле есть нужное решение, но в окружении порнобаннеров :(

            Я сам на них внимания не обращаю уже лет семь, но вот коллеги могут неправильно понять
            • +4
              adblock? proxomitron? imglikeopera (показывать изображения только сэтого же сайта)?
      • –3
        В конечном счете все что покупает или использует Google — для вставления туда своей рекламы. Вы все еще верите, что он озабочен всеобщим счастьем?
        • +3
          А почему нет? Если все рады, да еще кто-то платит деньги, а кто-то получает. Это же прекрасно!
  • –26
    Фууу, reCAPTCHA — самая противная и неудобная капча. Это будет катастрофа, если гугл введет ее у себя (впрочем, сомневаюсь что покупается для этого). Это единственный вид капчи, где мне очень часто приходится нажимать на «обновить картинку».
    • +16
      попробуйте перелогиниться тут
      • +2
        ну, хабрахабровская каптча не пример для подражания =)
        зато, reCAPTCHA удобна тем, что много модулей разных CMS используют api reCAPTCHA. Ну, и ещё и довольно адекватная система с генерацией — редко выпадает не распознаваемый «мусор». хотя бывает иногда легче обновить картинку, чем ввести что там написано. Ещё понравилось, что работает и без js через фрейм.
        Плюс, таких сервисов в интернете не так много. По крайней мере настолько раскрученных и популярных у разработчиков сторонних систем.
      • НЛО прилетело и опубликовало эту надпись здесь
      • 0
        ЕМНИП на хабре поменяли капчу после того как появился топик о распознавании этой самой хабровской капчи =)
    • 0
      Минусы, минусы, минусы…
      Похоже всем нравится reCAPTCHA.
      Лично я всегда плююсь, когда приходится иметь с ней дело, потому что очень, очень часто выпадают слова, которые совершенно невозможно и человеку распознать. Капча, в которой приходится часто менять картинку — плохая капча.
      • 0
        долговато вас не было ((=
  • +11
    Такие факты про reCAPTCHA узнал только сейчас.
    Идея гениальная, не мудрено, что ею заинтересовался гугл. Получается, что книгу могут оцифровать все пользователи интернета, даже не подозревая об этом.
    • –3
      А не легче бы было ее программно распознать, а не бить на слова и подсовывать пользователям? Хотя сама идея канечно очень интересная!
      • 0
        Распознаются то, что невозможно распознать программно.

        Чаще всего это старые книги, газеты, слова на сгибах страниц и т.д.
        • –2
          Бедные мы! Вот попадется что-нибудь на сгибе, выжжено, помято и порвато. слава Богу, что не обязательно правильно ввести.
          • 0
            Обычно вполне читаемый текст на рекапче. Думаю, процентов 90 пользователи распознают — это уже хорошо.

            А остаток уже вручную вычитывать будут, по контексту подбирая.
  • 0
    Надеюсь, русский прикрутят, а то рунету подсовывать на распознавание английские слова было как-то не айс.
    • +1
      сейчас часто reCAPTCHA превращается в квест:
      «если не знаете английского (или не знаете перевод), то найдите на клавиатуре похожие латинские символы и попробуйте их вбить =) не вникая в смысл введённого».
      • НЛО прилетело и опубликовало эту надпись здесь
        • 0
          Есть смысл, есть.
  • НЛО прилетело и опубликовало эту надпись здесь
  • +4
    Самая нормальна каптча в инете. На многих сайтах такая каптча стоит, что и человек с пятого раза не разберет.
  • –1
    Спрашивал в другом топике, но там тишина. Кто нибудь использовал эту каптчу? Если да, какие впечатления? И вообще насколько устойчивы каптчи данного типа?
    • +4
      [irony]белые буквы на белом фоне — очень устойчивая каптча :)[/irony]
      а так по вашей сылке пустота
      • 0
        Действительно пустота :) Чепуха какая-то. Сегодня днем, по ссылке, была довольно интересная каптча. Ссылка отсюда. В двух словах: дано три рисунка, на одном из них нужно обвести линией указанный объект(ы). Как я понимаю, разновидность этой каптчи.
        • 0
          это же здец какой-то… у меня получилось пройти один раз из 20.
          очень устойчивая капча, однозначно
          что там вообще делать надо? обводить просто так? или обязательно треугольниками?
        • +1
          а если нарисовано 5 женщин и сказано «обведите всех женщин» — это всех вместе или по-отдельности? убил бы таких капче-делателей
          • 0
            По-отдельности. Выделять треугольником, вроде, не обязательно. Интересно, сколько нужно рисунков, чтобы каптча была более-менее устойчивой к взлому.
  • –6
    Жаль в рекапче закончился лулзогенератор, когда первое слово вводится как «fuck», а второе уже честно. Теперь определять какое слово нам подсунули на скан, а какое на капчу, стало трудно (раньше капчаслово было зачеркнуто).
  • 0
    А кто что вводит, когда видит опечатку в рекаптче? Т.е. была в книге опечатка, к примеру keybaord, полезнее будет вводить как отсканировано, или всё-таки keyboard?
    • +4
      Я думаю, следует вводить с опечаткой. А то дойдёт до абсурда: мне слово не нравится, мне английская грамматика не нравится, ещё что-нибудь не нравится. И в итоге начнут оцифровывать «Капитал», а получат «Майн кампф» :)
  • +1
    Вы же в курсе, что в рекаптче можно не вводить цифры и пробелы?
  • 0
    books.google.com/
    ну вот, вероятно, для этого и купили.
  • 0
    Как каптчу подключить к флешу?
  • +1
    Люди, объясните, что это значит «Шахиджанян вернулся, хлопаем в ладоши )))»?

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.