Автоматическое распознавание голоса

    В конце этой недели Google представит ASR (automatic speech recognition — пер. 'автоматическое распознавание речи') технологию для YouTube. Она даст возможность создавать титры для видеороликов автоматически. В этой технологии используются алгоритмы из Google Voice, которые, к сожалению, на данном этапе не совершенны, но они будут улучшены со временем.

    Кроме этого запускается автотайминг титров, который позволит значительно упростить ручное написание титров для роликов в YouTube. Все что будет необходимо, это создать текстовый файл со всеми словами из видео и ASR технология самостоятельно определит, когда сказаны слова и сгенерирует титры.



    Стоит отметить, что эта функциональность будет поддерживать пока только английский язык.

    Источник
    Поделиться публикацией
    Похожие публикации
    Реклама помогает поддерживать и развивать наши сервисы

    Подробнее
    Реклама
    Комментарии 21
    • +3
      Гугл, купи всёлисделал.ру, пожалуйста и прикрути эту фичу на русском. *молитва*
      • +3
        Революционная технология.
        Если, конечно, будет работать подобающе.
        • НЛО прилетело и опубликовало эту надпись здесь
        • +1
          Прикрутить к этому переводчик и будет просто шикарно!
          • 0
            так переводчик есть, смотрите до конца
            • +4
              переведенный текст пропускаем через text-to-speech голосом Володарского и ностальгируем :-)
            • +1
              Это же прекрасно. Даже без русского. Английских субтитров очень частенько не хватает.
              • 0
                Я бы и без русских субтитров обошелся. Русский и без этого понимаю (а где не понимаю — там вряд ли автоматика правильно всё сделает), а вот английский зачастую не так просто без текстового дублирования осилить.
              • +1
                а потом они предложат добровольцам поправить фразу. если в ней была сделана ошибка… и таким образом со временем получат на 99% рабочую систему…
                • +1
                  ютубо-капча? Раньше книги оцифровывали, теперь ролики будем отекстовывать?
                • +7
                  Слабослышащие и глухие люди обрадуются!!! Наконец-то хоть что-то о чем и мечтали…

                  { У меня самого тугоухость с большой потерей — до 80%. Вот так то… Если смотреть какое-то видео, то только с субтитрами. }
                  • 0
                    И переводов титров на русский появится больше. Так как не придется переводчикам транскрибировать текст.
                    Отличное нововведение.
                    • 0
                      Распознавание. Проверочное слово — распознать.
                      • 0
                        Будущее уже рядом. Прикрутить переводчик, потом прикрутить генератор голоса,- и готово видео на любом языке. Любому пользователю. В любое время…
                        • 0
                          хм… а потом это все вместе соберут в маленькую коробочку и будут продавать как универсальный потоковый переводчик за 199.99
                        • 0
                          Гугл продолжает овладевать! Одобряе!
                          • +2
                            Хе-хе, читал недавно одну веселую новость по теме. Не могу не поделиться
                            sellme.ru/2009/10/gugl--vsemoguschij.html
                            • 0
                              А больше собака ничего не говорила? :)
                            • 0
                              Титры — это еще самое «безобидное» применение технологии. Если качество будет такое, что Google ASR будет полностью автоматизирована, то возможно появится полноценное голосовое управление. Чего не касается эта компания все радует.
                              • 0
                                «Стоит отметить, что эта функциональность будет поддерживать пока только английский язык.»

                                Не стоило. И так понятно. Русским всё будет доставаться в последнюю очередь, втридорога и по остаточному принципу, пока не будет СВОЕГО.
                                • 0
                                  Технические разговоры переводит просто ужастно, не перевод а набор рандомных слов, вот пример: www.youtube.com/watch?v=4XpnKHJAok8

                                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.