Редактор GeekTimes
840,7
рейтинг
14 мая 2015 в 17:33

Wolfram Alpha научился описывать содержимое любых картинок и фото



Разработчики сайта Wolfram Alpha добавили в копилку уникальных возможностей системы ещё одну удивительную функцию – распознавание любых фотографий. Каждый желающий может опробовать ImageIdentify в работе. Достаточно загрузить картинку на демонстрационный сайт и через несколько секунд вы получите ответ. Как утверждают сами разработчики – почти всегда правильный.

Стивен Вольфрам, основатель и главный идеолог компании, подробно описывает работу системы в записи в своём блоге. Стивен говорит, что 40 лет ждал момента, когда компьютеры научатся распознавать изображения, и был уверен в том, что этот момент настанет. Задача распознавания – одна из самых базовых для человека, и одна из самых сложных – для компьютерных систем и алгоритмов.

Стивен пишет, что хотя алгоритм и не всегда распознаёт изображения верно, даже его ошибки сильно напоминают человеческие.

Распознавание изображений теперь работает не только на демонстрационном сайте, но и в самом Wolfram Language. Можно задать изображение, получить его описание, а потом использовать уже само описание – получить, например, определение предмета из словарной статьи, или построить облако слов из статьи в Википедии.

image
image
image

Можно написать программу, автоматически анализирующую фотографии и составляющую статистику, делающую какие-либо другие подсчёты, связанные с содержанием картинок, или разбивающую их на категории. Также функция распознавания доступна через API.

Для тренировки системы разработчики использовали десятки миллионов изображений. С точки зрения Стивена это сравнимо с тем количеством информации, которое человек получает за первые пару лет жизни. Также Стивен подробно рассказывает в блоге, как разрабатывали систему машинного обучения на нейронных сетях, и какие при этом возникали проблемы. Например, когда систему ещё не научили распознавать лица, она, обработав портрет Индианы Джонса, выдала результат «Шляпа».

image

Для проверки системы Вольфрам пробовал скармливать ей разные противоречивые картинки и получал иногда странные, иногда – забавные или даже милые результаты.

image

Некоторые ошибки распознавания оказались не только вполне объяснимыми, но и даже весьма «очеловеченными». Также интересным оказался опыт распознавания абстрактной живописи – эти картины работали как своеобразные «тесты Роршаха».

image

В данный момент ImageIdentify способна распознавать до 10000 различных объектов. Пока она плохо справляется с распознаванием конкретных людей, произведений искусства и редких объектов.

Довольно забавно играть с системой, подсовывая ей не самые лёгкие варианты картинок и получая довольно своеобразные ответы.

image

Проект Wolfram Alpha был запущен в 2009 году. Система способна отвечать на заданные ей на обычном языке вопросы, и, используя данные из открытых источников, подсчитывать ответы. Например, на вопрос, заданный со смартфона, «Какие самолёты сейчас есть у меня над головой?» система ответит, определив местоположение по GPS, и укажет список самолётов, исходя из данных по рейсам авиаперевозчиков.
Вячеслав Голованов @SLY_G
карма
130,2
рейтинг 840,7
Редактор GeekTimes
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое

Комментарии (40)

  • +4

    Вот так вот.
  • +1
    Очень интересно! Спасибо!
  • +3
    О чем они вообще ведут речь, когда не смогли распознать эталонную фотографию. Небольшое пояснение wiki.
  • +2
    Пытался скормить ему персонажей Хоумстака и XCKD. В общем, восстания машин можно не опасаться: рисованных персонажей он распознает как «устройства». Что, вообще, странно, т. к. у Джона все «фитчи» person-ы есть.
  • +9
    Скормить побольше пятен роршаха и узнать, что затевает этот ИИ.
    • +7
      Всё плохо
      • +3
        Похоже всё что не смог распознать он относит к девайсам.
  • 0
    А API у них нет? Я бы свой небольшой архивчик протежил )
  • +5
    • +4
      Лого хабра www.imageidentify.com/result/1wj8qypkqny4a
  • +5
  • –1
    Главное, что нашего президента узнает. ))
    www.imageidentify.com/result/09k3vrotzp2ld
  • +2
    В чем отличие от Гугл Картинки?
  • +1
  • +1
    Для чистоты эксперимента сфотографировал несколько объектов — рюкзак, ручной эспандер, кофейный стаканчик, php-слоника, связку ключей, смарт-ключ от машины. Результат — для рюкзака сказали Pack, для бумажного стаканчика для кофе — glass cup, остальное сильно мимо. Ну, треть весьма близко — имхо это уже круто, а обучат ещё — будет ещё лучше.
  • +1
  • 0
    Неплохо опознало «Тигр»
    www.imageidentify.com/result/0wuxml0e75h99
  • +5
    Эх… похоже я так и не узнаю что изображено на этом фото =(

    www.imageidentify.com/result/1pbe0o5gxn138
    • +1
      Теперь вы и меня заинтриговали!
  • +4
    Печаль, он даже не смог распознать кисоньку!

    image

    Человечество может спать спокойно!
    • +5
      «Это не кошка!» (с) Джо из «Друзей»
      • 0
        Вы совершенно правы! Это кот!
    • +3
      Кисонька это еще ладно:

      image
      • +1
        Какой неполиткорректный вольфрам.
    • 0
      Странно! У меня жену с котом он тоже распознал как sleeping bag. Неспроста это…
    • +1
      зато он опознал спальную корзину, видать, для ИИ коте не авторитет )))
  • +2
    У меня зависло на сисьсках
  • 0
    Спутал луну с мячиком для гольфа. Закат угадал (солнце). Старый автомобиль Audi 80 B4 как ни странно угадал, назвав station wagon. Все фотографии первый раз покинули мой компьютер.
    • 0
      Угу, а шестерка у него electric car. Правда это второй вариант — первый был шуба O_o
  • +4
    Официальный и полный перевод статьи Стивена Вольфрама «Искусственный интеллект в Wolfram Language: проект по идентификации изображений» habrahabr.ru/company/wolfram/blog/258003

    Исправьте пожалуйста название вашего поста. Не Wolfram Alpha, а Wolfram Language, научился описывать содержимое любых картинок и фото. Это важно, потому что Wolfram Alpha — это вычислительный движок знаний, написанный на Wolfram Language. Это разные объекты: Wolfram Mathematica, Wolfram Alpha, Wolfram Cloud. Все они реализованы на одном языке Wolfram, но в Wolfram Alpha пользователь не может программировать напрямую на языке Wolfram. В целом это распространенные заблуждения на счёт устройства и связей между технологиями Wolfram Research.
  • +1
    Ни Гагарина, ни Шепарда, ни Королева не узнал…
  • 0
    • +2
      висит уже несколько минут
      • +1
        Опознал, значит…
  • 0
    www.imageidentify.com/result/1cpxes8tjf20l
    Ну… даже для России это перебор.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.