Google AIY: мейкерский набор для создания гаджетов с голосовым управлением



    Компания Google запустила инициативу AIY Projects, чтобы совместить AI с DYI, то есть совместить программные приложения ИИ с наборами для сборки гаджетов. В результате, считает Google, мейкеры смогут изготовлять полезные устройства, которые помогут «решать реальные проблемы» в жизни. Эти гаджеты будут по-настоящему взаимодействовать с человеком. Например, распознавать речь, отвечать на вопросы и выполнять голосовые команды.

    Первым проектом стал Voice Kit — демонстрационная система распознавания речи с подключением к Google Assistant (или без подключения). Как сказано в описании, в дополнении ко всем обычным функциям Google Assistant, тут вы сможете ещё добавлять в гаджет собственные пары вопросов и ответов. Приборчик выполнен в виде маленького картонного кубика с Rasberry Pi 3 внутри. Сборка набора из 12 деталей займёт примерно 1,5 часа.

    Набор деталей можно получить бесплатно при подписке на журнал MagPi. Кстати, этот журнал доступен в цифровом виде — там описано множество удивительных проектов, в том числе в сфере машинного обучения, сделанных при помощи Rasberry Pi.

    Набор продаётся и без журнала в магазинах Barnes & Noble и в британских магазинах WH Smith, Tesco, Sainsburys и Asda. Судя по всему, это пока единственные места, где продаётся набор. В набор входят интерфейсные платы, кабели, пластиковые держатели, динамик и кнопка. Не входят сама плата Raspberry Pi 3, карта SD, а также необходимые для сборки отвёртка и скотч. Главные компоненты — плата Voice HAT для распознавания речи и плата Voice HAT Microphone. Это новые платы, которые пока недоступна в свободной продаже по отдельности.



    Google предлагает подробную инструкцию, как собирать гаджет. Начиная со скрепления Raspberry Pi 3 и платы Voice HAT,



    сворачивания коробки…



    … и скрепления всего этого в единый гаджет.





    Далее предлагается скачать образ Voice Kit SD для записи на флеш-карту.

    Периферийные устройства подключаются в разъёмы, выставленные в прорези картонной коробки: клавиатура (1), мышь (2) и монитор (3).



    После загрузки с флеш-карты девайс готов к подключению к Google Cloud Platform по настроенному соединению WiFi. Там нужна настройка нового проекта через Google Assistant API, и затем устройство начнёт полностью нормально функционировать, принимая голосовые запросы и распознавая их в облаке.

    Устройство сразу понимает основные англоязычные команды:

    • Сколько времени?
    • Расскажи шутку
    • Сделать музыку громче
    • Сделать музыку тише
    • Максимальная громкость
    • Привет (ответ: «И тебе привет»)

    Как уже было сказано, можно добавлять собственные пары вопросов и ответов, то есть программировать ИИ на необходимые действия. Это делается в файле ~/voice-recognizer-raspi/src/action.py.

    # =========================================
    # Makers! Implement your own actions here.
    # =========================================
    
    import RPi.GPIO as GPIO
    
    class GpioWrite(object):
    
        '''Write the given value to the given GPIO.'''
    
        def __init__(self, gpio, value):
            GPIO.setmode(GPIO.BCM)
            GPIO.setup(gpio, GPIO.OUT)
            self.gpio = gpio
            self.value = value
    
        def run(self, command):
            GPIO.output(self.gpio, self.value)

    При желании можно использовать другие программные интерфейсы Cloud Speech API, которые переводят голосовую речь в текст и поддерживают 80 языков, в том числе русский, и обработку длинных звуковых файлов.

    Разумеется, поддерживается подключение дополнительных сенсоров. Например, подключение принтера и других бытовых устройств с голосовыми командами:

    • Включить принтер
    • Приглушить свет в комнате
    • Включить чайник на кухне
    • Сварить яйца (т. е. Вскипятить воду ровно на четыре минуты)
    • Выключить праздничную гирлянду на ёлке



    Бесплатно такой проект не осилить. Во-первых, сам набор продаётся отдельно, некоторые детали там уникальные. Во-вторых, за использование облачных API тоже нужно платить. Хотя второе не является обязательным условием. В принципе, распознавание речи можно осуществлять локально при помощи приложения на TensorFlow.

    На Хабре рассказывалось о новой платформе Google для интернета вещей — Android Things. Так вот, и она вышла в версии для AIY Voice Kit, также как есть версия для Raspberry Pi и некоторых других dev-плат.



    Фактически, такой гаджет способен заменить кнопки включения/выключения на всех домашних бытовых и электрических приборах: от пылесоса до микроволновой печи. Его можно использовать вместо приложения на смартфоне для более удобного голосового управления «умными» бытовыми приборами вроде термостата или программируемых лампочек. В конце концов, его можно подключить к роботу — общаться с ним и командовать голосом (типа «Скажи, когда у кошки кончится еда»).
    Поделиться публикацией
    Никаких подозрительных скриптов, только релевантные баннеры. Не релевантные? Пиши на: adv@tmtm.ru с темой «Полундра»

    Зачем оно вам?
    Реклама
    Комментарии 13
    • +1
      Сразу напомнило вот эту коробку)
      Рик и Морти
      image
      • +1
        демонстрационная система распознавания речи с подключением к Google Assistant (или без подключения)

        Вот автономка — очень интересно было бы. Я пробовал делать управление используя Easy VR Shield. Даже удивлялся насколько хорошо обученная плата распознаёт мой голос, пока не перешёл с ней в другую комнату )
        • +1
          Кошка быстрей скажет, что у неё кончилась еда )
          image
          • +1
            Не понял — это ж Google Home с открытым API получается. Если он поддерживает русский и позволяет активацию голосом типа «Окей Гугл, включи свет в спальне» — то это супер-штука.
            Единственное, что с микрофонами? Они такие же чувствительные?

          • 0
            Осталость только прикрутить DIY Google Dick и сказать «Ok, penis, rise and shine».
            • 0
              Да, автономного бы распознавания…
              Как-то не хочется ставить себя на прослушку в Гугле.
              • 0
                Тоже мне, проблема. Прослушкой больше, прослушкой меньше…
                • 0
                  там есть «Big Green Buton» по которой активируется прослушивание
                • 0
                  Набор продаётся и без журнала в магазинах Barnes & Noble и в британских магазинах WH Smith, Tesco, Sainsburys и Asda

                  TNW говорит о сумме ~$50, включая RPi ‪https://tnw.to/2qL601n

                  • +1
                    Картонный корпус это конечно просто жуть. Гугл же, жадность как всегда зашкаливает — 20 грамм пластика в комплект положить жалко. Сделали б тогда уж плату в форм-факторе среднестатистической банки из под консервов или упаковки от кукурузных хлопьев — скроили бы еще больше заменив картон на онлайн-инструкцию где в ней ножом проковырять отверстия под разъемы.
                    • 0

                      Банку сложнее доставлять каробка куда больше чем вот такая упаковка. Да и конструктор нацелен на diy, а у этого контенгента уже в большинстве случаев куплен и собран другой конструктор позволяющий распечатать какой угодно корпус :)

                    • 0
                      Интересна цена.
                      Если не смотреть на цену интересен вот этот продукт.
                      • 0
                        Самое интересное в этом продукте это ReSpeaker Mic Array. Это то, чего не хватает большинству систем распознавания голоса.
                        А если его привязать к тому же Raspberry и привязать распознавалку Google, то получится то же самое.

                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                      Самое читаемое