Игровой ИИ-чемпион от Илона Маска уничтожил людей в видеоиграх? Не так всё просто

https://www.theverge.com/2017/8/14/16143392/dota-ai-openai-bot-win-elon-musk
  • Перевод

Вы могли этого не заметить, но в первой половине августа 2017 за выходные случился небольшой переворот. Вечером в пятницу на глазах у многотысячной толпы ИИ-бот победил профессионального игрока в Dota 2 – одну из самых популярных видеоигр в мире. Человеческий чемпион, вежливый паренёк Данил «Денди» Ишутин сдался после того, как его убили три раза, и сказал, что не смог бы победить неудержимого бота. «Он немного напоминает человека, – сказал Денди. – Но одновременно похож и на что-то другое».

Отцом бота был не кто иной, как техномиллиардер Илон Маск, помогший финансировать и основать разработавшую его организацию, OpenAI. На мероприятии его не было, но своё отношение он выразил в твиттере.


OpenAI первым смог победить лучших игроков в мира в соревновательном киберспорте. Это гораздо более сложный вид, чем традиционные настольные игры вроде шахмат или го.

Что ещё интереснее, OpenAI сам научился всему, что он знает. Он обучался, постоянно играя сам с собой, накапливая многочисленные «карьеры» в игровом опыте всего за две недели.

Что же из этого следует? Было ли пятничное шоу более впечатляющим, чем победы Google ИИ в настольной игре го? Если кратко, то, наверное, нет, но всё же это представляет существенный шаг вперёд – как для киберспорта, так и для мира ИИ.

image

Да, видеоигры сложнее шахмат


Во-первых, нужно рассмотреть заявление Маска о том, что Dota «гораздо более сложный вид, чем традиционные настольные игры вроде шахмат или го». Это действительно так. Битвы в реальном времени и стратегические игры типа Dota и Starcraft II представляют собой сложные вызовы, с которыми компьютеры пока ещё не справляются. Эти игры требуют стратегического мышления, и, в отличие от настолок, утаивают важную информацию от игроков. Вы видите всё, что происходит на шахматной доске, но не в видеоигре. Это значит, вам нужно предсказывать и предвосхищать всё, что может сделать ваш противник. Это требует воображения и интуиции.

В Dota эта сложность увеличивается при работе людей в командах по пять человек, координирующих стратегии, меняющиеся по ходу действия в зависимости от используемых персонажей. Чтобы ещё усложнить задачу, в игре присутствует более 100 различных персонажей, каждый из которых обладает уникальным набором навыков; персонажей можно оснастить разными уникальными предметами, каждый из которых при применении в нужный момент может привести к выигрышу. Всё это значит, что запрограммировать выигрышные стратегии в бот для Dota невозможно.

Но игра, в которую играл OpenAI, была не такой сложной. Вместо «5 на 5» он играл с людьми в «1 на 1»; вместо выбора персонажа, у человека и компьютера был один и тот же герой – товарищ по имени Shadow Fiend [Демон тени], набор атак которого достаточно прямолинеен. Мой коллега Влад Савов, подсевший на Dota, также описавший своё впечатление от пятничной игры, сказал, что матч «1 на 1» представляет «лишь малую долю сложности полных соревнований». Так что – вероятно, не так сложно, как го.

image

Нельзя считать лучше калькулятора


Второй большой подвох – преимущества, которые были у OpenAI над человеком. Одним из главных споров в сообществе ИИ было обсуждение вопроса, есть ли у бота доступ к API для ботов Dota – это позволило бы ему подключиться напрямую к потоку информации из игры, к таким параметрам, как, например, расстояние между игроками. Грег Брокман из OpenAI подтвердил нашему изданию, что ИИ действительно использовал API, и что определённые техники были жёстко вшиты в агента, включая и предметы, которые он использовал в игре. Также его научили определённым стратегиям, используя технику проб и ошибок под названием «стимулированное обучение». В общем, его немножечко потренировали.

Андреас Теодороу, исследователь ИИ в играх из Батского университета и опытный игрок в Dota, объясняет, почему это имеет значение. «Одна из главных особенностей Dota – вам необходимо рассчитывать расстояния, чтобы знать, как далеко распространятся некоторые атаки, – говорит он. API позволяет ботам оценивать расстояния. Так что можно сказать: 'Если кто-то находится в 500 метрах, делай это', но человеку приходится вычислять всё самостоятельно, обучаясь методом проб и ошибок. Если у ботов есть доступ к информации, которой нет у человека, это даёт им преимущество». Это особенно важно для игры «1 на 1» с таким героем, как Shadow Fiend, где игрокам приходится концентрироваться на выборе правильного времени для атак, а не на общей стратегии.

Брокман говорит, что научиться такому умению для ИИ – задача тривиальная, и она никогда не была основной для исследований в OpenAI. Он говорит, что институтский бот справился бы и без информации от API, но «он просто потратил бы гораздо больше времени на приобретение навыков зрения, которое и так работает, так в чём же тогда смысл?»

Некоторым навыкам можно научиться, но нельзя научить


Имея в виду всё это, можно ли отмести победу OpenAI? Ни в коем случае, говорит Брокман. Он указывает, что то, как он самостоятельно учился, было важнее самой победы. Предыдущие чемпионы ИИ типа AlphaGo учились играть в игры, обрабатывая прошлые матчи людей-чемпионов, а бот OpenAI сам научился (почти) всему, что знает.

«У вас есть система, которая просто играла против себя, и выработала достаточно надёжные стратегии, чтобы победить профессионалов. Это нельзя принимать как само собой разумеющееся, – говорит Брокман. – И это большой вопрос для любой системы машинного обучения: как сложность попадает в модель? Откуда она берётся?»

По его словам, бот OpenAI показывает, что нам не нужно обучать компьютеры сложным вещам: они сами могут это сделать. И хотя кое-какое поведение бота было предварительно запрограммировано, некоторые стратегии он выработал сам. К примеру, он научился, как обманывать оппонентов, притворяясь, что начал атаку, но отменяя её в последний момент, и заставляя человека отражать атаку, которой не было – прямо как финт в боксе.


Другие же оценивают это более скептически. Исследователь ИИ Денни Бриц, написавший популярную запись в блог на эту тему, рассказал нам, что довольно сложно оценить степень достижения, не зная технических деталей. Брокман говорит, что они последуют, но когда точно, сказать не смог. «До выхода работы непонятно, каковы были достижения с технической точки зрения», – говорит Бриц.

Теодороу указывает, что хотя бот OpenAI выиграл у Денди в соревновании, когда игроки присмотрелись к его тактике, то смогли его перехитрить. «Если изучить их стратегии, видно, что они играли, не как все, и выиграли», – говорит он. Игроки использовали нестандартные стратегии – они не удивили бы человека, но ИИ их ещё не видел. «Бот был недостаточно гибким», – говорит Теодороу. Брокман возражает, что после изучения новых стратегий, бот уже не поддался бы им снова.

Все эксперты соглашаются, что это было серьёзное достижение, но настоящие трудности только начинаются. Это будет матч «5 на 5», где агенты OpenAI должны будут не только заниматься дуэлями в середине карты, но и работать на расползающемся, хаотичном поле боя, со множеством героев, десятками подразделений поддержки и неожиданными поворотами. Брокман говорит, что OpenAI сейчас нацелен на турнир по Dota в следующем году, который пройдёт через 12 месяцев. И за это время нужно провести гораздо больше тренировок.
Поделиться публикацией
AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Подробнее
Реклама
Комментарии 109
  • 0
    Самое интересное не рассказали — какие техники поломали мозг боту?
    • +5
      Вроде как:
      -отвод вражеских крипов на топ вышке и беготня с ними, пока союзные крипы ломают башню. (победой в 1х1 считается уничтожение т1 вышки)
      -выкладывание итемов на землю, что вводит бота в заблуждение относительно ваших характеристик и он решается на атаку, используя неточные данные о вас
      • 0

        В комментах к предыдущей статье было.


        1. выкладывать предметы на землю, тогда бот их не учитывает
        2. перехватывать чужих крипов, бот от этого похоже тупит, а свои крипы ломают башню противника
        • –7
          Угу, и за эти комментарии по стратегии обыгрывания бота(которую придумал, к сожалению, не я и не Денди), а так-же за язвительный комментарий с тезисами, содержащимися в данной статье мне даже карму слили.
          Неизвестно, станет-ли ИИ когда-нибудь угрозой, но религией он уже, похоже, стал.
      • 0
        Предыдущие чемпионы ИИ типа AlphaGo учились играть в игры, обрабатывая прошлые матчи людей-чемпионов, а бот OpenAI сам научился (почти) всему, что знает.

        А что помешало боту OpenAI так же учиться на играх чемпионов? В доте сохраняются реплеи всех игр, можно обучаться до выпадения в бсод посинения.

        • 0
          А что помешало боту OpenAI так же учиться на играх чемпионов?
          решение создателей учить бот только на играх с самим собой. Эдакий эволюционно-обучающийся алгоритм.
          • 0
            Надеюсь откажутся от подобного метода обучения, ибо природная эволюция уже показала, что это все порождает огромное кол-во костылей с целью выжить. Причем не факт, что эффективных в достаточной (критической) степени.

            Надо подобные системы обучать планомерно, направленно, дабы эффективность действий была первостепенной, а наличие костыльных решений минимум.

            Потому лучше показать пока лучшие имеющиеся стратегии, которые у нас есть, это реплеи игр чемпионов.
            • 0
              Прелесть такого подхода — вполне может появиться неизвестная ранее стратегия.
              • +1
                Судя по блогу они как раз планируют теперь обучать на чужих реплеях (5.8 млн реплеев из базы opendota).
                • 0
                  овт как раз с этим можно не согласиться…
                  Мы пытаемся научить ИИ думать как мы. А с чего люди взяли, что это самая эффективная система мышления? =)
                  Возмите людей с аутизмом — многие из них в голове считают такие уравнения, что многие профессора рот открывали — просто они мыслят несколько по иному.
                  Так что тут еще большой вопрос — нужно ли обучать ИИ именно ЧЕЛОВЕЧЕСКОМУ мышлению(ЧМ). На данном этапе его обучают ЧМ только с одной целью, что бы сам человек понимал и мог анализировать о чем думает ИИ…
                  • 0
                    Зачем нужен ИИ который не понятен человеку?
              • 0

                AI получает данные через API для ботов, возможно в риплеях данных ему не хватит.
                К тому же в гоили шахматах есть дискретные расстановки, которые можно запомнить и ходы, которые можно пометить как удачные и неудачные плюс время на перебор комбинаций. В доте так обучится не получится — вряд ли имеет смысл распозновать конкретную расстановку всех персонажей на карте с учетом их характеристик, он врядли когда-нибудь целиком повторится. Важнее предугадывание действий противника и его реакции на твои действия, тут метод проб и ошибок будет удобнее.

              • +4
                «Отцом бота был не кто иной, как техномиллиардер Илон Маск, помогший финансировать и основать разработавшую его организацию, OpenAI»
                ну офигеть «отец»
                • +2
                  Ну, кто девушку организацию «ужинает», тот её и «танцует» :)
                • 0
                  Согласен, запись про илона маска получилась немного пофосной, но к вашему комментарию возникает вопрос — кто «отец» у большого проекта?
                  Допустим есть какой то большой проект, на подпроектах которого суммарно работает человек 100 — 200? Какой то многоотцовый ребенок получается
                • –6
                  А может кто-нибудь из специалистов в области оценить практическую пользу от этих разработок? Как бы proof-of-concept для нейросетей уже реализован и уже давно.
                  Для чего натаскивать их на дотку или там на Го, если потом нельзя будет найти этим ИИ более практичного применения. Или можно?
                  Разве не логичнее будет сразу натаскивать на решение каких-либо действительно полезных задач. Ведь потрачены деньги, рабочее время, электричество, наконец, и ради чего? Ради того, чтобы комп у человека в доту выиграл? Потом-то что?
                  • +4
                    Разве не логично детей сразу учить управлять ядерным реактором, зачем все эти игры, глупые задачки? Зачем все эти школы и прочие глупости?
                    • 0
                      Я конечно в нейросетях полный профан так что поправьте если я не прав, но я пока не слышал ни об одной нейронке, которая была бы более-менее универсальной и не требовала бы практически полного переобучения при смене задачи (если эта задача не из той же плоскости)
                      • +1
                        Компания Google Brain разработала нейросеть, которая способна выполнять несколько задач одновременно. В отличие от других систем искусственного интеллекта (ИИ), которые после обучения справляются только с выученным алгоритмом, новая разработка может выполнить сразу восемь дел. Краткие подробности возможностей нейросети можно прочитать на сайте New Scientist, а полное описание алгоритма доступно на сайте ArXiv.

                        neuronovosti.ru/google-multitask
                        • 0
                          Актуальная задача сейчас — выработать способ обучения.
                          А уж обучить на любую задачу, когда будет понятно как учить — не проблема.
                          • 0
                            Нейронки в принципе — это статистические автоматы, т.е. в них кидаешь данные, они веса считают для предсказания. Никаким интеллектом там и не пахнет. Просто хайпится народ на модной теме.
                            • 0
                              «Нейронки», пусть и в примитивной форме, «слизаны» с естественных нейронных сетей. Поэтому есть большие подозрения, что в человеческой голове происходит ровно то же самое.
                              • –1
                                Чтобы нейронке научиться отличать спам от нормальных писем ей нужно скормить миллион примеров. Мне было достаточно два. Подозрения безосновательны.

                                А как в человеческой голове что происходит есть лишь смутные догадки, основанные на работах вивисектора Павлова и пространных рассуждениях нейрологов с абсолютным нулем экспериментальных данных, так что слизывать было нечего.
                                • +1
                                  Мне было достаточно два

                                  А предыдущие 25 лет получения жизненного опыта вы куда дели?

                                  • 0
                                    Так я же не разбором спама занимался. Или вы считаете что мой просмотр рекламы по телевизору меня так круто отучил? Спешу вас разочаровать, рекламу по телевизору я тоже с первого раза научился опознавать. Достаточно было один раз понять что такое реклама, и все. Нет, мне не нужно было ничего сворачивать в своих нейронах и перемножать матрицы. Наврядли эволюция такая умная как ей приписывают, что смогла такой цпу запилить со скоростями и экстремально устойчивый к ошибкам и внешнему влиянию и познаниями в математике.
                                    • 0
                                      Достаточно было один раз понять что такое реклама
                                      Для того, чтобы это понять, вам нужно было знать, что есть есть некие люди, которые вам хотят продать некий товар. Продать, чтобы заработать. Заработать, чтобы получить некие блага. Вероятно, солгав (или умолчав) о чём-нибудь в рекламе. Знать, что такое ложь и замалчивание, знать, что такое деньги/товары и тд и тп.

                                      То есть прикопаться можно к каждому слову, которое по иерархии тянет за собой годы обучения, и всё это переплетается на разных уровнях. И если этой базы мало (вам 4-5 лет к примеру), то вы не поймёте, что такое реклама. Просто скажете «хочу».
                                      • 0
                                        Вот тут мы и подобрались к интересному. Иерархия знаний, понимание концептов. На каждом этапе получения этих знаний человеку нужно лишь несколько примеров. Очень малое количество примеров. Гораздо меньшее чем требуется любой сети, сколько ты в нее нейронов не запихай. Пятилетние дети отлично понимают что такое реклама, к стати. И основы экономики заодно.

                                        У людей в принципе отсутствует такое понятие как нейронное обучение — если вы больше рекламы посмотрите вы не начнете ее распознавать лучше. Вместе с тем вы не будете делать тупых ляпов, принимая за рекламу яркие сцены с громким звуком. А также вы мгновенно распознаете рекламу, если главный герой сериала будет листать журнал, и там будет фотография баннера, на котором будет изображен рекламируемый товар. И это без какого-либо обучения, просто потому что вы знаете что такое реклама, баннеры, журналы и сериалы. Вы просто скомбинируете знания. Без миллиона примеров, без вычислений, просто кусочки знания скомбинировались и вы их поняли.

                                        Пока нейронки или любые другие формы ии не научатся нормально комбинировать знания, можно говорить что мы где-то в районе абсолютного нуля в разработке ии.
                                        • 0
                                          Пока нейронки или любые другие формы ии не научатся нормально комбинировать знания, можно говорить что мы где-то в районе абсолютного нуля в разработке ии.

                                          Не абсолютного, но очень низко, согласен. Но это не отменяет необходимости в их изучении, опытах и т.д.

                                          И поменьше бы желтизны вида «ИИ победил...», «ИИ сделал...», «ИИ работает...» — нет пока ИИ, и точка!
                                      • 0
                                        Нет, мне не нужно было ничего сворачивать в своих нейронах и перемножать матрицы.

                                        Вы следили за работой нейронов в этот момент? У вас такая внутренняя установка, чтобы ни в коем случае, никто ничего не сворачивал и не перемножал?
                                        Наврядли эволюция такая умная как ей приписывают, что смогла такой цпу запилить со скоростями и экстремально устойчивый к ошибкам и внешнему влиянию и познаниями в математике.

                                        Вы сомневаетесь в эволюции, или в работоспособности мозга?
                                    • 0
                                      Новорожденному ребенку тоже хватит двух примеров? Сомневаюсь. Да даже если и так, сравнивать мозг со 100 млрд. нейронов и ИНС, в которой их всего несколько десятков тысяч, на мой взгляд не корректно.
                                  • 0
                                    Никаким интеллектом там и не пахнет
                                    А что есть интеллект? Набор химических связей, делающих те же предсказания, но сложнее, плюс с примесью рандома. Куда в течении многих лет кидаются данные.
                                    • 0
                                      Не существует химических реакций, которые бы потекли со скоростью мышления.
                                • 0
                                  Ложные аналогии. Нет там ни детей, ни ядерных реакторов.
                                  Ребятам было интересно в доту нейросетку запилить, они запилили. Что сенсационного то? Есть огромное непаханное поле для применения этих технологий (и без ядерных реакторов). При этом польза будет практической. Вот сделали они систему, выигрывающую в Доту, что теперь с ней делать?
                                  • 0
                                    Использовать эти знания, чтобы двигаться дальше. Сейчас главным припятствием внедрения нейросетей является, их blackbox природа. Например IBM приводили пример, где они для страховой сделали две системы для решения одной задачи, одну экспертную, а вторая на нейросетках. На нейросетках работала значительно лучше, но клиент взял экспертную систему, так как IBM не смогли объяснить клиенту мышление нейросетки. Не могли сказать, вот этого человека ИИ послал, потому и потому.
                                    • 0
                                      Я допускаю, что вы можете этого не знать, вернее, вы не можете этого точно знать, но всё же спрошу: и какие же новые знания почерпнули разработчики OpenAI из игр этого бота? Или, может быть, этот бот не представляет собой «чёрный ящик», и всё в нём прозрачно и доступно пониманию?

                                      Чем игра в Dota в исследовании искусственного интеллекта лучше, чем секвенирование ДНК, к примеру, или там разработки системы, распознающей и уничтожающей сорняки на грядке? Полагаю, что результат для исследований в области ИИ был бы и там и там одинаковым, однако, в отличие от Dota, в последних двух случаях была бы ещё и практическая польза, да и намёки на коммерческий продукт (что не могло бы не порадовать инвесторов).

                                      • 0
                                        Во первых
                                        OpenAI — некоммерческая исследовательская компания

                                        Во вторых
                                        Снизу есть коммент отвечающий на ваш вопрос.
                                        Это исследовательская работа, а не коммерческий продукт. Насколько я понял, они экспериментируют с методами обучения. Практическим результатом здесь является не «обученная сетка», а новые знания о том, как можно обучать нейронные сети, сколько на это требуется времени, какие сложности при этом возникают и т.д.
                                        Почему эксперименты проводят именно на играх? Просто игры хорошо подходят для этого. Игра это формальная система, ограниченная своими рамками. Чтобы играть в игру, не нужно дополнительных знаний об окружающем мире. Это как отдельная маленькая Вселенная. В ней чётко определены правила. Описаны все возможные взаимодействия. Обозначены цели. Определены критерии победы, следовательно всегда понятно, была ли цель достигнута. Есть готовая программа для проведения симуляций (клиент игры). Легко устроить состязание с человеком, или с другим ИИ. Можно смоделировать различные ситуации, и проверить как ИИ поведёт себя. Это гораздо эффективней, чем пинать складских роботов.
                                • 0
                                  А потом стратегия управления подразделениями во время реального боя, маневрирующие по полю боя автоматические танки, которые умеют взаимодействовать и решать задачи в группе.
                                  • +2
                                    Ну вот противокорабельные ракеты типа Гранит/Оникс/Вулкан уже довольно давно это умеют — распределяют между собой цели, согласовывают манёвры, выбирают одну ракету, подсвечивающую цель РЛС, в то время, как остальные идут в режиме радиомолчания. Заменяют эту ракету в случае её уничтожения. Перераспределяют цели в случае уничтожения части ракет. Правда никаких нейросетей там нет, всё попроще.
                                    • 0
                                      Ну и задача в случае противокорабельных ракет намного проще.
                                    • 0
                                      То что используется там это алгоритм написанный человеком а тут речь о самообучении.
                                    • 0
                                      Нельзя обученную сетку применять на другую задачу — надо всё-равно переучивать. Вопрос, собственно, был в том, почему бы сразу не учить чему-то полезному. Да и не умеет конкретно эта сетка работать в группе — об этом прямо в статье и описано — игра была 1:1.
                                      • 0
                                        И слава Богам что не умеет! Пока не умеет. Или уже умеет но не показали. А по поводу другой задачи… Чем принципиально отличается взаимодействие лучников на поле боя отличается от взаимодействия стрелков вооруженных современным оружием? Только характеристиками оружия. и более ни чем.
                                        • 0
                                          Вы серьёзно полагаете, что навыки, приобретённые в Dota применимы в условиях реального боя?
                                          Почему-то все думают, что ничего не стоит «переучить» ИИ на отдалённо похожую задачу. На самом деле это нужно начинать практически с нуля. Не может пока ИИ пользоваться накопленным в других задачах опытом для решения новых. Кабы могли — совсем в другом мире мы бы жили уже.
                                          • 0
                                            Я собственно не думаю, что можно на прямую переучить, и я даже считаю, что переучивать никто не будет. Просто аналогичный ИИ можно научить уже на другую задачу. Грубо говоря, сначала одиночные бои в дота, потом групповые (там где уже важно маневрировать и использовать особенности каждого персоонажа) потом (условно) ИИ натаскаем на «танки», а потом промоделируем реальное поле боя. А там уже и один шаг до реального управления войсками…
                                            P.S. Вы реально думаете, что «годовалый» лейтенант, будет в бою управлять танковым взводом с большей эффективностью?
                                            • –1
                                              Так в том-то и дело, что «аналогичный ИИ» уже существовал и успешно решал иные задачи (не играя в Доту). Я не понимаю, что революционного конкретно в этом «свершении». Месяца не проходит, как публикуют результаты о том, чего добиваются нейронные сети. Но в большей части, эти достижения имеют хоть какую-то практическую пользу, а какую практическую пользу имеет ИИ-бот в Доту? На чемпионат его не допустят (разве что, на отдельный чемпионат между ИИ), а в остальном, для исследований в области искусственного интеллекта пользы немного.
                                              • 0
                                                Простите, а где берутся годовалые лейтенанты? Если мне не изменяет память, среднее военное образование раньше получалось за 4 года, с 90-х годов, когда к нему «для престижности» добавили гражданское высшее, стало 5 лет.
                                                Ну есть еще курсы по подготовке офицеров для прапорщиков, там длительность ниже, но военнослужащий уже должен был пройти к этому моменту школу прапорщиков, где уже приобрел часть знаний, получаемых «годовалым» лейтенантом.
                                                Ну и я уже не говорю о том, что наставления, по которым обучаются в военных учебных заведениях, писали далеко не дураки. И иметь преподавателей с боевым опытом тоже как-то стандартная практика.
                                                • 0
                                                  Ну и я уже не говорю о том, что наставления, по которым обучаются в военных учебных заведениях, писали далеко не дураки. И иметь преподавателей с боевым опытом тоже как-то стандартная практика.
                                                  Военные училища, предназначены для поставки кадров в действующую армию мирного времени. То есть сейчас все офицеры имеют полноценное образование и есть некоторый резерв. В случае полномаштабной войны, при развертывании новых дивизий и корпусов те командиры взводов которые сейчас кадровые, станут командироми рот, а на взвода придут выпускники гражданских вузов прослушавшие курс военной кафедры (как конкретно сейчас я не знаю, нам этот механизм объясняли достаточно давно когда я сама служила.)
                                                  То есть взводами будут командовать люди которые не служили в этой роли не дня. (сборы можно не считать). Плюс будет механизм подготовки офицерского состава военного времени. хорошо если год, во время великой отечественной подготовка лейтенанта занимала 6 месяцев.
                                                  Вот весь этот… бардак я скопом и обозвала «годовалыми лейтенантами» на самом деле скорее всего я многим в такой ситуации польстила.
                                                  Да я рассматриваю ситуацию большой войны или вторжения. В локальных конфликтах «годовалых» не будет.
                                                  • 0
                                                    Да и сейчас достаточно командиров взводов, которые после военной кафедры пошли годик офицером послужить, но я таких не рассматриваю.
                                                    Но вообще офицеров в войсках не хватает (ну так было лет 10 назад точно, сейчас не знаю, престиж армии и материальное обеспечение сильно подняли) и на должностях командиров взводов были и прапорщики.
                                                    Но сейчас сильно изменилась точка зрения на применение войск в глобальных конфликтах, ушли от масштабной дивизионности в сторону более мобильной бригадности. При этом, если пообщаться со старшими/высшими офицерами старой школы, то почти все плюются от таких изменений. Но и методы ведения войны и вооружение сильно изменились.
                                                    Великую Отечественную приводить несколько некорректно все-таки, тогда ни у кого не было опыта ведения войны таких масштабов в пост-индустриальную эпоху. Сталин пытался в 37-39 ротировать офицерский состав, заменяя тех, кто сделал карьеру во время революции и не имел военного образования на военных с необходимым образованием (почему-то современные «историки» другие причины придумывают :) ), но тем не менее, кадров было мало, оттуда и появились лейтенанты с подготовкой в полгода, и у которых планируемое время жизни в бою было меньше минуты. Сейчас все несколько иначе все-таки.
                                          • 0
                                            Вопрос, собственно, был в том, почему бы сразу не учить чему-то полезному.

                                            Это исследовательская работа, а не коммерческий продукт. Насколько я понял, они экспериментируют с методами обучения. Практическим результатом здесь является не «обученная сетка», а новые знания о том, как можно обучать нейронные сети, сколько на это требуется времени, какие сложности при этом возникают и т.д.
                                            Почему эксперименты проводят именно на играх? Просто игры хорошо подходят для этого. Игра это формальная система, ограниченная своими рамками. Чтобы играть в игру, не нужно дополнительных знаний об окружающем мире. Это как отдельная маленькая Вселенная. В ней чётко определены правила. Описаны все возможные взаимодействия. Обозначены цели. Определены критерии победы, следовательно всегда понятно, была ли цель достигнута. Есть готовая программа для проведения симуляций (клиент игры). Легко устроить состязание с человеком, или с другим ИИ. Можно смоделировать различные ситуации, и проверить как ИИ поведёт себя. Это гораздо эффективней, чем пинать складских роботов.
                                        • +2

                                          Ой, блин, точно, специалисты бы без вас не догадались. Почти в каждой статье встречаю такого неспециалиста, который однако предлагает то занять АИ чем-нибудь полезным, то указывает чем крутому ученому заниматься. Ну правда, как так-то?

                                          • 0
                                            Вероятно, люди, которые владеют деньгами, рабочими ресурсами и электричеством, имеют большее понимание, какие задачи полезны, а какие-нет. Увы, игровая индустрия наполнена деньгами, а значит, так же важна как и другие «полезные» области.
                                            Плюс, ИИ тут хорошо пропиарили практически на пустом месте. Это позволит влить деньги в их дальнейшее исследование, и, в последствии, они смогут принести еще больше пользы в «важных» областях.
                                            • 0
                                              Да хотя бы производство. Ты загружаешь ИИ задачу произвести то что тебе надо а он сам распределяет операции, раскрой материалов, посылает заявки поставщикам организует логистику…
                                              • 0
                                                Играли ли вы в другую игру Valve — Portal 2? Ситуация схожая с принципом работы Aperture Science, вот только в данном случае ученые кидают нейросети в стену и смотрят что прилипнет.
                                                • 0
                                                  Вся суть нейронных сетей в том, что это универсальная платформа для реализации эвристических алгоритмов. Вы можете предложить математически строгий алгоритм распознавания котиков на картинках? Котиков миллион видов, миллион ракурсов. Я думаю что никто такой алгоритм предложить не сможет, поэтому делают нейронную сеть, которая некоторым магическим образом способна эту задачу решить с некоторой погрешностью. Вот сейчас и идет пляска с подбором наилучших структур НС и методов обучения, а какую задачу выбирать для теста не суть важно — можно в доту играть, можно котиков распознавать.
                                                • +2
                                                  На самом деле нейронная сеть конечно «молодец», но ничего сложного в том что делал бот не было. Обычного бота можно было бы настроить действовать примерно так же и без участия нейронной сети. Опять же доступ к API… Вот когда бот будет играть механически двигая мышкой, считывая информацию только с экрана — вот тогда и поговорим (с)
                                                  • 0
                                                    Только очень неплохие боты в Доте, любительские и профессиональные, даже 5% скила этого бота в 1 на 1 не показывают.
                                                    • 0
                                                      Вот когда бот будет играть механически двигая мышкой, считывая информацию только с экрана — вот тогда и поговорим (с)

                                                      Для начала можно без механики — видеоинтерфейс + HID. Без всяких игровых API. Тогда условия были бы почти равными.
                                                      • 0
                                                        Что насчет времени реакции? Или вы как раз закладываете его в распознование данных с экрана?
                                                        • 0
                                                          Ну типа того. Даже если распознавание будет моментальным — пусть будет фора.
                                                          • 0
                                                            А смысл? Доказать, что если обвешать изначально более совершенную систему ограничениями, то она будет показывать результаты на уровне системы ограниченной?
                                                            • 0
                                                              Потому что выиграть у человека только за счет скорости реакции, клика или умения все расчитывать до пикселя это просто и это может совсем тупой бот, а вот за переиграть только за счет тактики и стратегии это справедливое соревнование.

                                                              Грубо говоря давайте компу кликать со скоростью человека и давайте ему возможность перемещать героя с точностью человека (никаких наведений с точностью до пикселя) и пусть он выиграет в игре 5 на 5 и полным списком всех возможностей — вот тогда будет честное соревнования именно интеллектов, а не соревнования человека с калькулятором. А шахматы, в которых на всю партию дается полсекунды, явно не честное соревнование.
                                                              • +1
                                                                Потому что выиграть у человека только за счет скорости реакции, клика или умения все расчитывать до пикселя это просто и это может совсем тупой бот, а вот за переиграть только за счет тактики и стратегии это справедливое соревнование.

                                                                Дефолтный бот имея всё это, плюс двойной опыт, двойное золото, и мап хак. Легко раскладывается средним игроком Доты. Которого разложит профессионал играя с пингом под 500.
                                                                • 0
                                                                  Дефолтный бот имея всё это, плюс двойной опыт, двойное золото, и мап хак. Легко раскладывается средним игроком Доты. Которого разложит профессионал играя с пингом под 500.

                                                                  Разумеется, никто и никогда не будет делать дефолтного бота слишком хорошим, это главная заповедь игродела — ИИ должен быть достаточно умным, чтобы не раздражать игроков, но достаточно тупым, чтобы средний игрок легко его мог победить. Это во всех стратегиях так, никому не интересно играть с совершенным ИИ.

                                                                  Кстати, двойной опыт, двойное золото, и мап хак. это тоже одна из стратегий игродела, игроки должны верить, что ИИ их обыгрывает только за счет этих плюшек, даже если они играют безобразно.
                                                                  • 0
                                                                    Только вот из новостей про этого Дота бота, я понял, что теперь он станет дефолтным.
                                                                • 0

                                                                  Ну так-то и среди людей, кто кликает быстрее, тот потенциально имеет преимущество… не?

                                                                  • 0
                                                                    Ну так-то и среди людей, кто кликает быстрее, тот потенциально имеет преимущество… не?

                                                                    Нет. Тот вылетает с сервера как читер :)
                                                                    (реально были ситуации, в шутерах естественно)
                                                                  • 0
                                                                    абсолютно согласен с вами!
                                                                  • 0
                                                                    А смысл? Доказать, что если обвешать изначально более совершенную систему ограничениями, то она будет показывать результаты на уровне системы ограниченной?

                                                                    Доказать, что она изначально более совершенна. А значит поставить в равные условия, иначе получается человек обвешан ограничениями, а система — банальный бот, просто более продвинутый.
                                                                    В реальном мире нет API…
                                                                    • 0
                                                                      API доты дает критические преимущества боту. Если вкратце — в игре есть умения, которыми можно атаковать куда угодно по карте, при этом не имеющие таких необходимых условий как «нужно повернуться в направлении точки произношения» и «воспроизвести визуально анимацию произнесения заклинания» (напр. заклинание «Sunstrike»). Таким образом, невозможно визуально определить ни момент каста, ни его направление/точку на карте. Тем не менее, стандартный бот почему-то считает «раз игрока видно его команде — значит я знаю куда и когда он послал лучи любви» и спокойно уворачивается. Какая мне разница, дефолный бот или OpenAI против меня, если они могут читерить одинаково?
                                                              • 0
                                                                Из статьи:

                                                                Брокман говорит, что научиться такому умению для ИИ – задача тривиальная, и она никогда не была основной для исследований в OpenAI. Он говорит, что институтский бот справился бы и без информации от API, но «он просто потратил бы гораздо больше времени на приобретение навыков зрения, которое и так работает, так в чём же тогда смысл?»
                                                                • 0
                                                                  Более корректным было бы ввести некоторую искусственную задержку, заменив ею время на распознавание изображения. А так у компьютера преимущество, которое игроку в принципе не доступно.

                                                                  Компания Riot Games (League of Legends) не так давно проводила исследование о том, как задержка в сети (latency) влияет на результаты игроков. Там было много разных моментов, но в том числе было хорошо видно, что просто эта чисто техническая величина часто является решающей.

                                                                  Вот цитата из одной статьи по теме того исследования:
                                                                  A small delay can leave a gamer in League of Legends dead in a pit
                                                                  • 0
                                                                    Но с другой стороны распознавание изображения это сильная сторона человека, а программы пока с этим справляются в целом хуже.
                                                                    Путь каждый выбирает средства контроля и управления по желанию — кому-то удобнее API, кому-то мышь и монитор.
                                                                • 0
                                                                  Да, обычного бота можно было бы настроить…
                                                                  Но тут как раз суть в том, что его не настраивали.
                                                                • +1
                                                                  Также его научили определённым стратегиям, используя технику проб и ошибок под названием «стимулированное обучение». В общем, его немножечко потренировали.

                                                                  Неплохое такое преимущество. Даёшь битву нетренированного бота и нетренированного человека!

                                                                  • 0
                                                                    Нетренированного человека? Даниил входит в список 10 лучших игроков dota 2, а также он один из богатейших киберспортсменов.
                                                                    • 0

                                                                      Это по какому рейтингу он в топ-10? По рейтингу ммр он где-то в конце топ-200 европы.

                                                                      • 0
                                                                        По рейтингу прошлых заслуг) Сейчас, конечно, Данил уже не тот.
                                                                        • 0
                                                                          Mmr конечно важный показатель. Никто не спорит. Но все же он не так важен на соревнованиях. Ну я о том, что те, что выигрывают international, не так и часто входят в топ-10 по mmr.
                                                                          Но посыл я ваш понял. В 2017 он уже не топ. Но в любом случае он один из тех, кого нельзя просто так выиграть. Тем более, что бот учился только 2 недели
                                                                          • 0
                                                                            Тут такой момент. Для игроков 1 и в 2 позиции MMR — важный показатель. Потому что это чаще всего игроки-«тащилы», качество исполняния которых оказывает наибольшее влияние на итоговый результат игры. Поэтому, естественным образом, у лучших игроков на этих позициях очень высокий MMR — они очень много играют и часто в одиночку «вытаскивают» игры.
                                                                        • 0

                                                                          Потому-то и понравился момент про "компьютер немножечко потренировали".

                                                                      • +1
                                                                        Вообще говоря такие игры, в отличие от шахмат, вполне реально исследовать с помощью матметодов «исследования операций». К шахматам и го они не применимы.
                                                                        К тому же для машинного обучения разница между полной информацией и неполной не такая уж и большая.
                                                                        А вот скорость реакции в видеоиграх имеет большое значение — здесь ИИ в выгодном положении.
                                                                        • +1

                                                                          Радоваться тому, что робот обыграл человека в игре на скорость реакции...

                                                                          • 0
                                                                            Считать бы, что дота игра на реакцию…
                                                                            • 0

                                                                              Ах да, там же ещё фаза выбора героев была, рошан на нулевой минуте, вардинг, размен башнями — куча очень важных тактических решений. Хотя постойте ...

                                                                              • 0
                                                                                Я понял, что вы знаете о макро в доте. А микро?
                                                                                Что лучше — добить пару своих крипов или одного чужого? Беречь ближний койл? Стоит ли отводить крипов за вышку или под вышку? Вражеский герой пошел проверять руну — идти биться или проверить другую сторону. Бот эти вопросы так или иначе решает. Не за счёт реакции.
                                                                                • 0

                                                                                  Не было там ситуаций с кучей кандидатов на ластхит. Возле вышки они не дрались: оба фрага были в канаве. За руной никто не ходил. А вот ластхитов там было 25/10 (бот) против 11/2 (денди) прямо перед первым фрагом.

                                                                                  • 0
                                                                                    Что лучше — добить пару своих крипов или одного чужого?

                                                                                    Элементарно. "Первый вариант улучшает ситуацию на 0.3331434%, второй — на 0.333155%". Это человеку надо интуицию и опыт подключать, робот это просто считает.

                                                                              • 0
                                                                                Во-первых тут не только реакция, во-вторых в играх без реакции (шахматы, гоу) ИИ уже давно лучше людей.
                                                                                • 0

                                                                                  В Go всё-таки недавно. Но о том и речь, что если уж ИИ в Go обыгрывает, то в быстроте принятия решений и применения скиллов тем более обыграет.

                                                                              • 0

                                                                                Во многом — да. Робот явно быстрее кликать будет.

                                                                                • –1
                                                                                  Дотка сложнее го. Бугага. Для всего этого давно придумали специальное слово: отчаяние.
                                                                                  • 0
                                                                                    Dota и Starcraft II представляют собой сложные вызовы, с которыми компьютеры пока ещё не справляются.

                                                                                    Как это не справляются? 1v1 Dota2 как видно уже справились, в Starcraft боты давно уже переигрывают людей.

                                                                                    Для SC2 официально Eula запрещает
                                                                                    • 0

                                                                                      Как раз почти одновременно с этим матчем был выпущен API для Starcraft II
                                                                                      http://us.battle.net/sc2/en/blog/20944009/the-starcraft-ii-api-has-arrived-8-9-2017

                                                                                      • 0
                                                                                        хорошие новости. я собственно к тому, что компьютеры с играми уже давно справляются :)
                                                                                      • 0
                                                                                        Это какие боты каких людей переигрывают в SC2?
                                                                                        На сколько помнится, проигроки даже читерящих ботов обыгрывают.
                                                                                        Вот когда бот обыграет человека в SC2 тогда родится скайнет)
                                                                                      • 0
                                                                                        Ждём адекватного бота для Цивилизации, который в игру играет, а не встроеный ИИ (искусственный идиот), который игрока развлекает только за счёт читов.
                                                                                        • 0
                                                                                          Тут надо отметить несколько аспектов:

                                                                                          1. Никто из игравших с ботом профессионалов не является специалистом по игре 1v1 на СФ-ах. Это довольно специфическое ответвление Доты, которое как соревновательная дисциплина не существует. Пытались проводить подобные соревнования в рамках турниров по Доте, но это было не интересно ни игрокам, которым хотелось сосредоточиться на доте 5v5, ни зрителям. Т.е. победу бота над игроками нельзя сравнить с победой над чемпионом по шахматам или Го.

                                                                                          2. Бот не продемонстрировал в этих матчах никакой интересной линии поведения. Стандартные вещи, блок крипов, стандартная раскачка, подвоз фласок и манго, стандартная модель поведения на линии. Т.е. он действует совершенно стандартно, просто исполняет все на очень высоком уровне. Было бы намного интереснее, если бы бот, «взглянув» на проблему свежим взглядом, продемонстрировал что-то новое, до чего игроки не додумались. Вообще эта гибкая модель самообучения никак не замета по поводению бота. Можно представить себе жестко алгоритмизированную систему, ведущую себя точно так же: идеальное исполнение в стандартной ситуации, потерянность и тупизна в нестандартной.
                                                                                          • 0
                                                                                            Я вот не понимаю почему было не настроить задержку между действиями бота чтобы исключить влияние реакции.
                                                                                          • 0
                                                                                            Чувствую себя обманутым, без апи, чтобы запилить систему распознавания это уйдет еще пару лет у них, там же куча моделей одного и того же героя, даже я человек поначалу путался между некоторыми героями из за скинов(бх с плащами как у кунки), и рассчитывать так как делал бот с попаданием 100% не получится, не только из за вычислительных мощностей, просто потому что есть такие штуки как пинги, скорость реакции героя после клика, то есть просто сама система, ОС и дота2 несовершенны.
                                                                                            После видео было ощущение что вот оно будущее, а сейчас понятно что это тоже самое как дать боту в кс бесконечную реакцию. Если сделать без апи, то даже средний человек уже будет нагибать такого бота, просто потому что у человека есть реальная система предсказания, а у бота только реакция на текущую ситуацию.
                                                                                            • 0
                                                                                              Мда, глазам своим не верю, как так получиться могло, лучшая команда в мире по доте и проиграть боту…
                                                                                              • 0
                                                                                                Сейчас бы в августе 2k17 шутки про Na'Vi шутить…
                                                                                              • 0
                                                                                                Практическое применение.
                                                                                                Думаю, сейчас разработчиков заваливают предложениями менеджеры команд, претендующих хотя бы на что-то на TI2018. Получить на тренировки такого противника, пусть даже ластхит и харас на миде потренировать — это же мечта. А если они разработают полноценную команду — то это будет просто переворот. Не нужно будет искать спарринг-партнёров (которые заведомо слабее основных команд), бояться, что они сольют твой драфт с тренировок и какие-то стратегии. Думаю, пару сотен тысяч баксов за такое отвалят.
                                                                                                • 0
                                                                                                  Конечно, робот хорошо видит границы атаки и просчитывает точную силу урона до килла. Поэтому выигрывает. В игре важно и урон точный чтобы был килл, и размещение героя и его скорость перемещения до точки нанесения удара, расстояние точное чтобы твой удар достиг противника, а его не достиг тебя. Предугадать действия, пути наступления и пути отхода. Пути вообщето более менее стандартны — по линии. Ну а дальше по наклонной, больше кила, больше денег, лучше оружие для убивания, больше денег, больше кила, лучше и быстрее убивать. Все эффективные связки героев уже расписаны, а реакция у машины для принятия решения включения колдовства быстрее, при ревных условиях. Нужно расчитать манну для атаки, урон атаки, и кулдаун атак. Вот если пик будет случайным, с запретом некоторых героев…
                                                                                                  • 0

                                                                                                    Ну да, мне вполне кажется, что ИИ лучше обучать на таких играх, как Дота. Все эти шахматы и прочее заезженная тема, так как результат обучения там сводится к тому, что можно было бы и спокойно запрограммировать. Так как в Доте этого сделать нельзя, в меру действительно слишком большого количества возможных решений и возможностей в принципе, к тому же игра в команде, достаточное число соперников, то смысл в этом действительно есть. Скилы разные у персонажей, предметов более чем достаточно, которые влияют на ход игры.

                                                                                                    • 0
                                                                                                      и сказал, что не смог бы победить неудержимого бота.

                                                                                                      Вообще-то он сказал: «мне надо больше практики с этим ботом, рано или поздно мы научимся его выигрывать».
                                                                                                      • 0
                                                                                                        Как человек, потерявший ни один месяц в доте, могу сказать, что эта шумиха — маркетинговое явление, и дело вот в чем: игроки играли с ботом в поддавки. А именно:
                                                                                                        — не использовался ботл (что в игре 1 на 1 является мастхэв, это одна из лучших вещей на начальной стадии, и после начального закупа сильные игроки берут именно его);
                                                                                                        — не использовались руны (временные бафы);
                                                                                                        — использовался одинаковый пик (герой у человека и у бота один и тот же). В реальной игре есть контрпик, когда один герой заведомо сильнее другого. Игры 5 на 5 иногда выигрываются еще на стадии подбора персонажей, до начала игры, то есть исход игры, при равной игре всех 10 участников, может быть предрешен выбором персонажей.

                                                                                                        То есть для бота упростили условия игры. Также можно добавить отсутствие мотивации к победе у игроков, это игры просто для развлечения.

                                                                                                        Объявленная победа бота над человеком в доте преждевременна даже при игре 1 на 1, про 5 на 5 и речи нет.
                                                                                                        • 0
                                                                                                          Это стандартные правила игры 1 на 1.

                                                                                                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.