Google покупает reCAPTCHA

    image
    Известный и популярный проект reCAPTCHA совмещает в себе сервис генерации капчи и распознавание элементов текста неподдающихся электронному определению для оцифровки материалов из разных источников. Сервис предлагал бесплатную реализацию капчи для сайтов в интернет, а пользователи, вводя такую капчу, помогали хорошему делу оцифровки старых материалов.

    Теперь сервис куплен Google. Очевидно, что сервис будет использован компанией для поддержки их собственного проекта оцифровки разнообразных текстовых материалов.

    via mashable.com/2009/09/16/google-acquires-recaptcha
    Поделиться публикацией
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама
    Комментарии 76
    • +13
      поясните плиз дураку — если они не могли гарантированно распознать текст, то как они проверят капчу?
      • 0
        Меня это тоже интересует ) И насчет старых материалов — неужели они все были настолько плохого качества, что подошли для капчи? )
        • +44
          ввыводится два поля: одно гарантированно известное, другое — нераспознанное. Несколько пользователей вводят данные. Авторизация проводится только по первому полю, поэтому ошибки во втором — допустимы. В случае, когда несколько пользователей одинаково распознали неизвестное слово (количество я точно не знаю), то принимается что слово опознано. Возможно, потом проводится ручная валидация.

          Подробнее на wiki конечно, если вам там не забанили.
          • +3
            Спасибо, несколько раз бывало что точно неправильно вводил, а мне засчитывали, удивлялся, почему так :)
            • НЛО прилетело и опубликовало эту надпись здесь
              • –5
                про ручную валидацию никто и не говорил
                • НЛО прилетело и опубликовало эту надпись здесь
                  • Ну всё-всё, вижу, что ошибся.
              • +2
                Там же два слова — одно из них нераспознанное, а другое распознанное. Человеку нужно ввести оба слова. Которое из них контрольное, он не знает.
                • –5
                  Знает, это очевидно. Одно слово сгенерированно компьютером, другое отсканированное из книги. Невооруженным глазом видно.
                  • +3
                    Часто видно, но не всегда. Когда видно, удаётся обмануть, вводя вместо слова из книги «левые» символы, не ломая глаз.
                    • +4
                      Сервис от этого совершенно не страдает. Все эти левые символы в конечном итоге признаются мусором, а несколько адекватных людей, не пожалевших трех секунд времени достаточно быстро распознают это слово.
                      • +4
                        Ну встречаются и интересные варианты вроде этого:

                        Тут и самый адекватный человек схитрит))
                        • +7
                          Не вроде не такая уж и большая проблема написать «393¾. errs» или «393 3/4. errs» :)
                          • 0
                            пройдет и просто errs
                          • +1
                            Ну, тут ясно, что не распознано первое выражение и валидация проходит по второму слову.
                            • +1
                              ЗВЗ Зч :)
                              • НЛО прилетело и опубликовало эту надпись здесь
                                • +6
                                  ▲▲ hewitt
                                  • +1
                                    Мне тоже hewitt гораздо сложнее прочитать чем треугольнички. :) Думаю hewitt и есть слово которое не удалось распознать компьютеру. :)
                          • НЛО прилетело и опубликовало эту надпись здесь
                        • 0
                          Именно поэтому зачастую возможно вместо предполагаемого слова (а то и двух), как правило незачёркнутого, написать абы что.
                        • НЛО прилетело и опубликовало эту надпись здесь
                          • +1
                            И захватывает галактику?
                            • 0
                              Google.Internet.com
                              • НЛО прилетело и опубликовало эту надпись здесь
                                • +27
                                  internet.com.google
                                  • НЛО прилетело и опубликовало эту надпись здесь
                                    • –3
                                      тогда уж так:
                                      google.just.google
                                      • НЛО прилетело и опубликовало эту надпись здесь
                                        • НЛО прилетело и опубликовало эту надпись здесь
                                      • НЛО прилетело и опубликовало эту надпись здесь
                                        • –1
                                          гугл везде:

                                          $ ping internet
                                          PING internet (127.0.0.1) 56(84) bytes of data.
                                          64 bytes from gw-in-f100.google.com (127.0.0.1): icmp_seq=1 ttl=53 time=1 ms
                                          64 bytes from gw-in-f100.google.com (127.0.0.1): icmp_seq=2 ttl=53 time=1 ms
                                        • –1
                                          internet.com.google
                                  • +2
                                    Главное, что они свой Ad в эту капчу не встраивали, и всем будет хорошо :)
                                    • +7
                                      Низко мыслите. Google хоть раз покупал что-то, просто чтобы вставить туда свою рекламу?
                                      • +1
                                        Для этой цели Гуглу уже давно можно никого не покупать — все равно чаще всего вставляют именно их рекламу.
                                        • 0
                                          YouTube!
                                          • +8


                                            • +2
                                              P.S. И не говорите, что реклама подбирается по ключевым словам!
                                              • НЛО прилетело и опубликовало эту надпись здесь
                                                • +1
                                                  Порнореклама в рунете — это полный П
                                                  Бывает, ищешь что-нибудь по работе, кусок кода или что-нибудь с серваком, гугл выдаёт сайт, заходишь, там на самом деле есть нужное решение, но в окружении порнобаннеров :(

                                                  Я сам на них внимания не обращаю уже лет семь, но вот коллеги могут неправильно понять
                                                  • +4
                                                    adblock? proxomitron? imglikeopera (показывать изображения только сэтого же сайта)?
                                              • –3
                                                В конечном счете все что покупает или использует Google — для вставления туда своей рекламы. Вы все еще верите, что он озабочен всеобщим счастьем?
                                                • +3
                                                  А почему нет? Если все рады, да еще кто-то платит деньги, а кто-то получает. Это же прекрасно!
                                            • –26
                                              Фууу, reCAPTCHA — самая противная и неудобная капча. Это будет катастрофа, если гугл введет ее у себя (впрочем, сомневаюсь что покупается для этого). Это единственный вид капчи, где мне очень часто приходится нажимать на «обновить картинку».
                                              • +16
                                                попробуйте перелогиниться тут
                                                • +2
                                                  ну, хабрахабровская каптча не пример для подражания =)
                                                  зато, reCAPTCHA удобна тем, что много модулей разных CMS используют api reCAPTCHA. Ну, и ещё и довольно адекватная система с генерацией — редко выпадает не распознаваемый «мусор». хотя бывает иногда легче обновить картинку, чем ввести что там написано. Ещё понравилось, что работает и без js через фрейм.
                                                  Плюс, таких сервисов в интернете не так много. По крайней мере настолько раскрученных и популярных у разработчиков сторонних систем.
                                                  • НЛО прилетело и опубликовало эту надпись здесь
                                                    • 0
                                                      ЕМНИП на хабре поменяли капчу после того как появился топик о распознавании этой самой хабровской капчи =)
                                                    • 0
                                                      Минусы, минусы, минусы…
                                                      Похоже всем нравится reCAPTCHA.
                                                      Лично я всегда плююсь, когда приходится иметь с ней дело, потому что очень, очень часто выпадают слова, которые совершенно невозможно и человеку распознать. Капча, в которой приходится часто менять картинку — плохая капча.
                                                  • +11
                                                    Такие факты про reCAPTCHA узнал только сейчас.
                                                    Идея гениальная, не мудрено, что ею заинтересовался гугл. Получается, что книгу могут оцифровать все пользователи интернета, даже не подозревая об этом.
                                                    • –3
                                                      А не легче бы было ее программно распознать, а не бить на слова и подсовывать пользователям? Хотя сама идея канечно очень интересная!
                                                      • 0
                                                        Распознаются то, что невозможно распознать программно.

                                                        Чаще всего это старые книги, газеты, слова на сгибах страниц и т.д.
                                                        • –2
                                                          Бедные мы! Вот попадется что-нибудь на сгибе, выжжено, помято и порвато. слава Богу, что не обязательно правильно ввести.
                                                          • 0
                                                            Обычно вполне читаемый текст на рекапче. Думаю, процентов 90 пользователи распознают — это уже хорошо.

                                                            А остаток уже вручную вычитывать будут, по контексту подбирая.
                                                    • 0
                                                      Надеюсь, русский прикрутят, а то рунету подсовывать на распознавание английские слова было как-то не айс.
                                                      • +1
                                                        сейчас часто reCAPTCHA превращается в квест:
                                                        «если не знаете английского (или не знаете перевод), то найдите на клавиатуре похожие латинские символы и попробуйте их вбить =) не вникая в смысл введённого».
                                                        • НЛО прилетело и опубликовало эту надпись здесь
                                                          • 0
                                                            Есть смысл, есть.
                                                      • НЛО прилетело и опубликовало эту надпись здесь
                                                        • +4
                                                          Самая нормальна каптча в инете. На многих сайтах такая каптча стоит, что и человек с пятого раза не разберет.
                                                          • –1
                                                            Спрашивал в другом топике, но там тишина. Кто нибудь использовал эту каптчу? Если да, какие впечатления? И вообще насколько устойчивы каптчи данного типа?
                                                            • +4
                                                              [irony]белые буквы на белом фоне — очень устойчивая каптча :)[/irony]
                                                              а так по вашей сылке пустота
                                                              • 0
                                                                Действительно пустота :) Чепуха какая-то. Сегодня днем, по ссылке, была довольно интересная каптча. Ссылка отсюда. В двух словах: дано три рисунка, на одном из них нужно обвести линией указанный объект(ы). Как я понимаю, разновидность этой каптчи.
                                                                • 0
                                                                  это же здец какой-то… у меня получилось пройти один раз из 20.
                                                                  очень устойчивая капча, однозначно
                                                                  что там вообще делать надо? обводить просто так? или обязательно треугольниками?
                                                                  • +1
                                                                    а если нарисовано 5 женщин и сказано «обведите всех женщин» — это всех вместе или по-отдельности? убил бы таких капче-делателей
                                                                    • 0
                                                                      По-отдельности. Выделять треугольником, вроде, не обязательно. Интересно, сколько нужно рисунков, чтобы каптча была более-менее устойчивой к взлому.
                                                              • –6
                                                                Жаль в рекапче закончился лулзогенератор, когда первое слово вводится как «fuck», а второе уже честно. Теперь определять какое слово нам подсунули на скан, а какое на капчу, стало трудно (раньше капчаслово было зачеркнуто).
                                                                • 0
                                                                  А кто что вводит, когда видит опечатку в рекаптче? Т.е. была в книге опечатка, к примеру keybaord, полезнее будет вводить как отсканировано, или всё-таки keyboard?
                                                                  • +4
                                                                    Я думаю, следует вводить с опечаткой. А то дойдёт до абсурда: мне слово не нравится, мне английская грамматика не нравится, ещё что-нибудь не нравится. И в итоге начнут оцифровывать «Капитал», а получат «Майн кампф» :)
                                                                  • +1
                                                                    Вы же в курсе, что в рекаптче можно не вводить цифры и пробелы?
                                                                    • 0
                                                                      books.google.com/
                                                                      ну вот, вероятно, для этого и купили.
                                                                      • 0
                                                                        Как каптчу подключить к флешу?
                                                                        • +1
                                                                          Люди, объясните, что это значит «Шахиджанян вернулся, хлопаем в ладоши )))»?

                                                                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.