Искусственный интеллект впервые в мире победил профессионального игрока в го

    Это был AlphaGo от компании Google




    Подразделение DeepMind компании Google заявило о том, что искусственный интеллект компании смог победить европейского чемпиона по настольной игре го. Система AlphaGo обыграла человека в 5 из 5 игр. До этого го была одной из немногих логических игр, профессиональные игроки в которую выигрывали у компьютеров.

    Одним из наглядных показателей развития искусственного интеллекта является победа в логических играх. ИИ может обыграть чемпиона по какой-либо логической игре, что продемонстрирует, что алгоритм умеет решать задачу лучше человека. С годами число покорённых игр растёт: сдались и шашки, и шахматы. В 1996 году алгоритм впервые выиграл у лучшего игрока в шахматы: это был поединок компьютера Deep Blue против Каспарова. А уже в 2005 году человек в последний раз выиграл у лучшего алгоритма. С тех пор компьютерные программы могут обыграть любого игрока в шахматы. Поддаются и другие игры: айбиэмовский Watson играл и выигрывал в Jeopardy, а в 2014 году искусственный интеллект поискового гиганта Google самостоятельно освоил 49 старых аркадных игр Atari.

    Но некоторые игры ещё не покорены. Одной из невзятых долгое время оставалась го. Это настольная игра, зародившаяся в Древнем Китае несколько тысяч лет назад. Прямоугольная доска 19×19 линий заполняется чёрными и белыми камнями. Перед каждым из игроков стоит задача отгородить на игровой доске камнями территорию большего размера, чем противник. Игра обладает несколькими правилами, которые осложняли создание эффективной системы искусственного интеллекта для победы над человеком. К примеру, возможных позиций камней на стандартной доске более, чем в гугол (10100) раз больше, чем в шахматах. Число возможных позиций больше, чем атомов во Вселенной. Просто так просчитать все ходы невозможно, и пока что лучшие компьютерные системы играют на уровне любителей.

    Многие ходы в го диктуются простой интуицией, а подобное трудно уложить в алгоритм. Именно эта сложность привлекает внимание специалистов по искусственному интеллекту. DeepMind — это разработчик систем искусственного интеллекта, которого компания Google приобрела в 2014 году. В DeepMind смогли создать программное обеспечение, которое в состоянии обыграть чемпионов.

    Составление дерева поиска здесь не подходит, поэтому была создана система AlphaGo. Она основана на поиске Монте-Карло и глубоких нейросетях. Нейросети пропускают описание состояния доски го через 12 различных слоёв, состоящих из миллионов нейроподобных соединений. Одна из сетей, «сеть политики», выбирает следующий ход. Другая, «сеть ценности», предсказывает победителя.



    Нейросеть обучали на 30 млн ходов партий реальных людей. Был достигнут результат корректного предсказания следующего хода в 57 % случаев. До AlphaGo лучший результат составлял 44 %. Но целью была победа, а не просто подражание человеку. AlphaGo научилась этому путём тысяч партий между собственными нейросетями и с помощью улучшения соединений в процессе обучения с подкреплением. При этом весь процесс требовал немалой вычислительной мощи, поэтому всё запускалось в облаке Google Cloud Platform.

    Сначала полученный продукт протестировали с другими лучшими решениями. AlphaGo выиграла 499 матчей из 500. Затем были приглашёны судья из Британской федерации го, редактор журнала Nature и трёхкратный чемпион Европы Фань Хуэй. Этот профессиональный игрок занимается азиатской настольной игрой го с 12 лет. Матч за закрытыми дверями проводился в лондонском офисе Google в октябре прошлого года.

    Чтобы запустить алгоритм, потребовался вычислительный кластер из 170 видеокарт и 1200 процессоров (вероятно, имелись в виду отдельные ядра). Фань с удивлением обнаружил, что он проиграл компьютеру в первой игре. Чемпион списал поражение на собственный неагрессивный стиль. Он посчитал, что это была лишь разминка, и начал играть агрессивнее. Но Фань проиграл все из четырёх последующих партий. Алгоритм AlphaGo выиграл в пяти из пяти игр.



    Как говорят в Google, это первый случай, когда программа смогла победить профессионального игрока в го. Следует отметить, что Фэнь имеет титул чемпиона 2013, 2014 и 2015 годов только в Европе, где уровень владения го не очень высок. Следующим логическим шагом является матч в Сеуле в марте против легендарного корейского го-профессионала Ли Седоля — лучшего игрока в го за последнее десятилетие. Уровень игры этого человека будет гораздо выше. Для этого матча производительность системы улучшат, чтобы её можно было запускать на более скромном оборудовании.

    В го играют десятки миллионов человек по всему миру. Постепенное покорение ещё одной логической игры — это важно. Но также интересно, что AlphaGo не была создана с помощью заданных вручную правил. Выигрывать помогло машинное обучение.

    В Google надеются использовать полученный опыт для решения проблем реального мира. Факт использования методов общего назначения означает, что подобные алгоритмы смогут найти применение во многих системах: от климатического моделирования и анализа заболеваний до торговли акциями на бирже.

    В среду результаты исследования были опубликованы в научном журнале Nature. Запись ходов игр с Фэнем можно скачать с сайта DeepMind, также их можно посмотреть в веб-виджете.

    Подобной разработкой занимаются и в Facebook. Марк Цукерберг сообщил в среду, что его исследователи близки к покорению китайской игры. Цукерберг в буквальном смысле пристально следит за процессом разработки: автор проекта сидит в шести метрах от стола исполнительного директора Facebook.



    Исследование Facebook: arXiv:1511.06410 [cs.LG]
    Поделиться публикацией
    Никаких подозрительных скриптов, только релевантные баннеры. Не релевантные? Пиши на: adv@tmtm.ru с темой «Полундра»

    Зачем оно вам?
    Реклама
    Комментарии 99
    • 0
      Интересно узнать какие еще популярные игры плохо подаются стандартным решениям с поиском в дереве решений и поиске с возвратом.
      • +2
        Например, сёги
        • +1
          Игра Точки.
          • НЛО прилетело и опубликовало эту надпись здесь
            • 0
              Размер поля игры в точки вроде ничем не ограничен? Я имею в виду, о размере поля можно договориться перед матчем.
              Хотя в Го камни убираются с поля, а в точках — нет, что добавляет сложности Го.
              И главное — это ограниченное пространство поля Го, что упрощает эту самую сложность.

              Но тут уже встаёт другой вопрос — является ли размер поля усложняющим фактором для работы нейросети?
              • 0
                На самом деле, размер поля в Го ограничен только традициями и балансом между сложностью и временем игры. Стандартными являются 9x9 (часто используется для обучения), 13x13 (для быстрых игр) и 19x19 (классический и самый распространенный размер), но никто не запрещает использовать другие размеры, например 37x37 или даже 22x23 (неквадратные поля и четные размерности используются очень редко, но тоже возможны).

                По поводу второго вопроса: скорее всего, от размера поля зависит число нейронов во входном и выходном слоях сети, так же может потребоваться увеличение количества нейронов внутри сети, что потребует увеличения требуемых ресурсов.
            • 0
              А разве точки — это не упрощенная версия го?
              • 0
                Из-за особенностей правил, эти игры можно сравнивать разве как футбол и баскетбол. Точки — это другая игра.
            • 0
              В xkcd была хорошая подборка. Если дополнять нашими играми, то «Мафия», «Поеду на север», «Бутылочка»…
              • 0
                Как бы это шуточная картинка. Не совсем корректно сравнивать игры с полной информацией и игры, зависящей от психологии и случайности.
              • 0
                «Что? Где? Когда?»
                • 0
                  Мне кажется, как раз эта игра довольно легко «решается» компьютером широкой базой данных, ибо основана на эрудиции и анализе контекста.
                  • 0
                    Хороший вопрос решается цепочкой ассоциативных связей. Таких вот ассоциативных переходов может быть достаточно много (для этого нужен мозговой штурм). И для компьютера количество вариантов ответа будет расти экспоненциально. Плюс если на один ассоциативный переход вероятность того, что он в нужную сторону == x, то для n переходов это x^n. Всё же «Что? Где? Когда?» очень отвязана от просто игры на эрудицию.
                • –1
                  habrahabr.ru/post/241531

                  Тут есть интересная табличка.
                • +16
                  Заголовок слегка желтушный. алгоритм победил чемпиона Европы. Стоило бы прояснить, как проводятся европейские чемпионаты. В них ещё играют азиаты. Так вот чемпионом Европы считается тот, кто в списке победителей первый Европеец. То есть сильнейший игрок Европы — это средний, даже начальный, профессионал в Азии. Смотрим дан Фань Хуэя — 2 профессиональный дан. А у Ли Сидоля — 9 дан. 2 и 9 дан — это две разные планеты.
                  • –2
                    Вопрос времени на обучение.
                    • +3
                      Не согласен. И до этого были программы обыгрывающие сильных европейских любителей. Теперь обыгран сильнейший, но ему очень далеко даже до средних по уровню профи, не говоря уже о топ уровне. Так что это время может растянуться на довольно долгий срок.
                      • +4
                        (ехидно) Ну и кто теперь прав? =)
                    • 0
                      Исправил, спасибо.
                      • 0
                        Ну не в данах конечно дело, но уровень Фана конечно не сопоставим с уровнем большинства азиатских профи. У него уровень сильного не азиатского любителя. Будет интересно посмотреть на матчи с Ли Седолем или еще с кем из топ игроков. Ли кстати сейчас не самый сильный в мире, но по известность/сила он конечно лучший выбор.
                        • 0
                          Вики пишет что 2p
                          • 0
                            Дело же не в дане, а уровне игры. Его уровень не сравним с уровнем тех профи кто сейчас активно играет в турнирах.
                            Сейчас бы он наверняка бы не смог пройти отбор на профи, причем дело не только в возрасте, но и в том что уровень игроков Го в Китае очень сильно вырос за последнее время.
                            И даны могут присваивать не только за спортивные достижения, а например еще за популязацию Го.
                            • 0
                              2p это где то уровень корейского пацана 11-ти лет который решил, что будет всю жизнь заниматься этой игрой. Другое дело, что 2p это даже теоретически недостижимый уровень для большинства любителей го.
                      • +10
                        Надеюсь он написан на Go. А иначе я буду горевать)))
                      • 0
                        по сути нейросеть вычисляет определённые правила которые приводят к победе в изучаемых её партиях го. поскольку связей миллионы, то правила эти вычленить (человеку из нейросети) очень сложно либо вообще невозможно (тем более, за разумный промежуток времени). в связи с этим можно говорить о достижении начала точки технологической сингулярности, когда понимание (человеческое) перестаёт успевать за прогрессом.
                        • 0
                          Технологическая сингулярность — достаточно размытый термин. Да и система всё еще написана человеком и устройство ее понятно.
                          Для меня сингулярность наступит, когда созданное человеком создаст что-то, что ни один человек не сможет понять.
                          • 0
                            Да и система всё еще написана человеком и устройство ее понятно.

                            ну так и устройство искусственного интеллекта будет написано человеком и будет ему понятно.

                            Для меня сингулярность наступит, когда созданное человеком создаст что-то, что ни один человек не сможет понять.

                            ну так данная нейросеть создаёт последовательность ходов которая ведёт к победе (в го), которую человек (ни один) не в состоянии понять.
                            • НЛО прилетело и опубликовало эту надпись здесь
                              • 0
                                Если человек способен обыграть машину, то разумно было бы сказать наоборот — его понимание игры более глубокое!

                                так человек и не способен

                                Способен ли мастер го понять сам себя? Наверное, если долго будет разбираться, будет способен

                                далеко не факт, иначе давно бы раскусили оптимальный (-ые) алгоритм (-ы) игры (в го) и не понадобилась бы тогда нейросеть.

                                Так что скорее имело бы смысл говорить о том, способна ли «машина» эффективнее _обучаться_, а не способна ли она иметь некую особенно вычурную внутреннюю структуру.

                                ну так вся фишка в том, что чтобы обыграть машину нужно вычленить все закономерности которые она нашла в уже сыгранных партиях (в го) и иметь возможность применять их. а закономерностей этих могут быть миллионы, что человеческий разум не в силах постичь.

                                а чтобы написать более эффективную и «умную» нейросеть, нужны инструменты для анализа находимых нейросетями решений. при этом непосредственный анализ самих этих решений навсегда останется за гранью человеческого понимания (в виду их огромного количества).

                                аналогично, если программы научат находить новые сложные математические доказательства, то возможно результат такой их деятельности будет не доступен для анализа (/разбора) человеком ввиду чрезмерного их объёма. и начало таких решений уже положено этой нейросетью для игры в го, как бы вам не хотелось в это верить.
                                • НЛО прилетело и опубликовало эту надпись здесь
                                  • –1
                                    > Это очень сомнительный тезис, хотя бы по тому, что до машины эти закономерности уже нашли откуда-то
                                    > люди, сыгравшие те самые партии, на которых машина обучалась.

                                    ну так раз люди (в частности чемпион мира по го) поголовно проигрывают машине, то значит нихера они не нашли. к тому же люди могли чисто случайно играть (выигрывать).

                                    > Например, вы не сможете написать алгоритм вашей ходьбы, однако делаете это без каких-либо проблем

                                    гуглите роботы Petman и Atlas от Boston Dynamics, вполне себе ходят на заложенных алгоритмах

                                    >Таким образом, если машина будет иметь внутреннюю структуру, которая будет непостижима человеком, >это не будет доказательством никаких свойств полезности или некоей эстетической ээ «совершенности» >такой машины.

                                    про это речи и не идёт

                                    >Это противоречит конкретному примеру с Го. Отдельные люди способны проанализировать партии Го >своих соперников, получив на выходе алгоритм, который гораздо лучше того, что могут (пока что) >современные машины.

                                    пруф в студию, пока что речь шла в статье о том что признанный лучший игрок мира в го не смог ни разу обыграть машину.

                                    >Пока не сделали ИИ, который играет на недостижимом для человека уровне.

                                    вы статью вообще читали? «Алгоритм AlphaGo выиграл в пяти из пяти игр» у «трёхкратный чемпион Европы Фань Хуэй»
                                    • НЛО прилетело и опубликовало эту надпись здесь
                                      • 0
                                        >Так в комментариях пишут, что не проигрывают.

                                        из статьи «Сначала полученный продукт протестировали с другими лучшими решениями. AlphaGo выиграла 499 матчей из 500.»

                                        что как бы намекает на большую оптимальность полученного решения, а также на то что оно всё же находит определённые закономерности (при том что качество этих закономерностей выше чем явно заданных в конкурирующих решениях, т.е. по сути это означает что программа ии нашла больше закономерностей чем смогли вычленить люди). конечно их может оказаться недостаточно чтобы сразить лучших игроков мира, но это не значит что у последних есть чёткое понимание алгоритмов успешной игры (если они их конечно не скрывают), иначе бы их давно внедрили в явно заданном виде в соответствующие программы (без нейросетей) и стали бы эти программы столь же давно лучшими в мире игроками по го, чего мы не наблюдаем.
                                        • НЛО прилетело и опубликовало эту надпись здесь
                                      • 0
                                        ну так раз люди (в частности чемпион мира по го) поголовно проигрывают машине, то значит нихера они не нашли. к тому же люди могли чисто случайно играть (выигрывать).

                                        Вы не поверите, но машина тоже может случайно выиграть (при расчете используется генератор случайных чисел).
                                        • +1
                                          >Вы не поверите, но машина тоже может случайно выиграть (при расчете используется генератор >случайных чисел).

                                          т.е. 499 побед из 500 партий с лучшими конкурирующими решениями — это случайность? чё ж «случайно» не выигрывают конкурирующие решения? может просто побаще генератор случайных чисел сделать порекомендуете им? :D
                                          • 0
                                            Я к вопросу об одной конкретной партии. 499 партий — это уже статистика.
                              • 0
                                Для меня сингулярность наступит, когда созданное человеком создаст что-то, что ни один человек не сможет понять.

                                Что это значит? Если не сможет понять, то как мы поймем, что это нечто осмысленное и логичное, но при этом невероятно сложное, но не наоборот — такое же сложное, но бессмысленное и нелогичное? Вы же подспудно подразумеваете, что это нечто создаст что-то осмысленное и логичное, что трудно (но не невозможно) будет понять; иначе утверждение теряет смысл.

                                А если мы сможем отличить одно от другого, тогда и не будет никакой сингулярности.
                                • 0
                                  если результат можно будет проверить экспериментально, но доказательство будет в недоступном для человечества объёме, то вполне можно будет говорить об технологической сингулярности.

                                  например если в качестве результата ии представит алгоритм быстрой факторизации числа или получения простых чисел по их порядковому номеру.
                                  • 0
                                    будет в недоступном для человечества объёме

                                    это сколько?

                                    если мы не можем проверить доказательство, то тогда не выполняется условие: мы не проверили доказанность, но бегаем вокруг точных результатов, как туземцы вокруг ружья. но без понимания того, как получены эти результаты, мы не поймем, можем ли мы доверять им как доказанным.

                                    кстати, данные, полученные машиной, может обработать другая машина, другая программа.

                                    а модные нынче big data хороший пример того, что такие массивы данных давным давно обрабатываются машинами и нас не спрашивают, доступен нам такой объем или нет. Например, БАК. Сырых данных там петабайты крутятся, но ПО уже настроено на то, чтобы часть хранить и обрабатывать дальше, а часть «забыть» как ненужное. и тут все зависит от тех, кто работает над БАК — не так настроили, не то ПО насчитает. В этом плане бозон Хиггса частица еще более далекая от обнаружения непосредственного органами чувств, чем электрон в свое время. Так что в этом смысле мы уже в сингулярности живем — устройства, запрограммированные нами, делают что-то такое, что вроде бы и верно, как мы считаем, но во многом уже ПО не меньше «понимает» в элементарных частицах и молекулярной биологии, чем физики и биологи с этим ПО работающие. Часть «понимания» доверена машинам, та часть — которую можно формализовать и отследить, насколько верна и работает такая формализация.
                                    • 0
                                      кстати проблему четырех красок решали при помощи компьютера и поместилось все это на 138 страницах ( Appel K. et al. Every planar map is four colorable. Part I: Discharging //Illinois Journal of Mathematics. – 1977. – Т. 21. – №. 3. – С. 429-490. и Appel K. et al. Every planar map is four colorable. Part II: Reducibility //Illinois Journal of Mathematics. – 1977. – Т. 21. – №. 3. – С. 491-567. ). Это недоступный человечеству объем?
                                      • 0
                                        и вот Robertson N. et al. The four-colour theorem //journal of combinatorial theory, Series B. – 1997. – Т. 70. – №. 1. – С. 2-44. пишут: «Unfortunately, the proof by Appel and Haken (briefly, A6H) has not
                                        been fully accepted. There has remained a certain amount of doubt about
                                        its validity, basically for two reasons:
                                        (i) part of the A6H proof uses a computer and cannot be verified
                                        by hand, and
                                        (ii) even the part of the proof that is supposed to be checked by
                                        hand is extraordinarily complicated and tedious, and as far as we know, no
                                        one has made a complete independent check of it.»

                                        Получается, мы уже, следуя такой логике, живем в сингулярности, ведь программы доказывают теоремы, а мы не можем доказать или опровергнуть такие доказательства в силу их сложности.
                                        • 0
                                          >Это недоступный человечеству объем?

                                          очевидно же, что всё что создал человек имеет по определению доступный для него объём.

                                          думаю о точно недоступном объёме можно говорить например при миллионе страниц.
                                          • 0
                                            «миллионы страниц» уже выдает БАК и тут же лишь часть сохраняет в постоянной памяти — настолько большие объемы информации приходится обрабатывать. В чем принципиальна разница между «миллионами страниц» сырых экспериментальных данных и такими же объемами доказательств?

                                            И почему эти миллионы страниц доказательств нельзя проверить теми же программными средствами (в смысле вообще ПО, а не тем же ПО)? И найти или не найти ошибку в доказательстве?

                                            А если мы можем проверять эти доказательства другими программами, как мы можем здесь говорить о каком-либо непонимании?

                                            Математики уже давно доказывают такие теоремы, что для перепроверки нужно использовать штаб оплачиваемых независимых математиков (по свежим следам — как проверяли доказательство, проведенное Григорием Перельманом) и/или мощный компьютер/профессиональное ПО. Получается, мы живем в такой вот экспертной сингулярности, в которой единицы способны какие-то вещи обсуждать с друг другом, а доходит до того, что без особой кропотливой работы понимания не добиться.
                                  • +3
                                    по сути нейросеть вычисляет определённые правила которые приводят к победе в изучаемых её партиях го.
                                    Да, то, о чём вы говорите, уже описывалось. Подобное носит название «эффект искусственного интеллекта». Каждый раз, когда ИИ делает что-то новое, хор критиков повторяет одно и то же: это всего лишь расчёт, это не обдумывание решения. Так было и когда Deep Blue обыграл Каспарова: все взвыли, что это всего лишь навсего перебор ходов. Между тем компьютер обыграл чемпиона по шахматам, то есть решил крайне высококлассную задачу.

                                    Искусственный интеллект — это то, что ещё не было создано. Если компьютер чего-то добивается, то методы решения быстро теряют магию неизведанности, и скептики объявляют созданное сухим расчётом.
                                    • 0
                                      >и скептики объявляют созданное сухим расчётом.

                                      весь вопрос сейчас в том насколько далеко может зайти такой «сухой» расчёт ии. слышал что в части автоматизации математических доказательств сейчас проблема в оперировании машиной понятиями бесконечности.
                                  • 0
                                    В данном случае начальное обучение проводилось на очень большом числе партий, сыгранных когда-то людьми. Еще интереснее было бы, если бы ИИ смог научиться находить выигрышные стратегии, основываясь только на правилах.
                                    • +2
                                      В таком случае просто пришлось бы провести гораздо больше партий, обучая алгоритм играть против себя же. Выборка из человеческих партий просто сэкономила время на обучение.
                                      • +1
                                        Не только. Я читал мемуары Ботвинника, который помимо всяких там шахмат был инженером и занимался созданием первой советской шахматной программы. Так вот, он говорил, что некоторые алогичные вещи, вроде этюда Рети или стандартных комбинаций приходилось вбивать вручную, потому что железка до конца не просчитывала, а позиция к нестандартным решениям не располагала.

                                        Подозреваю, что в го тоже есть стандартные решения и комбинации, которые практически невозможно посчитать, но на практике они приводят к преимуществу или потерям. Без уже наигранной базы тут не обойтись, иначе роботы будут тысячи раз делать один и тот же дебютный ход, а потом придет человек и сыграет по другому, стартуя неочевидный переход в другую ветку вариантов, которая раньше отбрасывалась как неперспективная.
                                        • +2
                                          Это не совсем так. Помимо нейронных сетей, используются и MCTS, основанный на переборе. Кроме того, машина тоже может сделать совсем не очевидный для человека ход. А с советских времен уже очень много всего поменялось и производительность железа сильно возросла.
                                          • 0
                                            Все-таки надо отличать алгоритмическое решение задачи с построением дерева возможных ходов и заложенными метриками и нейросети, которые «сами» путем балансировки связей между нейронами находят удачное решение.

                                            По этому поводу есть хороший пример, правда он из области эволюционных алгоритмов, но принцип похожий.
                                            Вот такое не стандартное решение нашел эволюционный алгоритм:
                                            image
                                            Подробнее про саму задачу лучше почитать по ссылке, иначе будет длинный комментарий.
                                      • 0
                                        Люди ещё способны нанести ответный удар. Достаточно расширить доску до 21х21. А если компьютер и в это научится играть, то можно и до 23х23 довести. Чем хороша экспоненциальная сложность, так это тем, что сервера у гугла закончатся раньше.
                                        • +3
                                          Людям тоже надо будет переучиваться. Человек при игре в го опирается в том числе и на опыт как свой так и других игроков. При увеличении доски надо понять как изменилась ценность угловых точек с которых начинается партия, переоценить все джосеки(стандартные розыгрыши в углу). Не факт что люди смогут сделат это быстрее программы, которая играет лучше их на стандартной доске.
                                          • 0
                                            Эта система не занимается полным перебором, поэтому эффект от увеличения доски будет не столь значимым. Думаю, что даже если увеличить доску до 101x101, то за год система гугла прокачается до гораздо больше уровня, чем любой человек (или группа людей).

                                            Хотя отсутствие истории партий на такой доске процесс обучения для системы, конечно же, усложнит.
                                            • 0
                                              Думаю, что не прокачается она никуда, в настоящем её виде. Причину вы указали — отсуствие уже сыгранных партий и заведомо сильных партий. Программе придётся эти партии генерировать самостоятельно, методом тыка, и тут то проявит себя эта самая экспоненциальность.
                                              • 0
                                                Я не знаю правил Го, но, думаю, можно как-нибудь использовать игры на текущей сетке для «разогрева» системы. А добить уже можно будет за счёт игры с собою.
                                            • +1
                                              Экспоненциальная сложность не «хороша», потому что если она действительно экпоненциальна, то в т.ч. и для человеческого мозга, который в отличии от гуглооблака слабо масштабируется. В противном же случае (и так и есть, скорее всего) – DeepMind продолжат оптимизировать алгоритм.
                                              • –1
                                                Не всё так просто, имхо. Для игрока среднего уровня вообщем то всё равно какого размера доска, а для всяких там Ли Седолов очень важно, что доска именно 19x19 потому что они знают прорву разных дебютов и разных хитрых ходов которым важно расстояние не только до соседних углов доски, но иногда и до противоположного угла. То есть играть такой 9-й дан будет всё равно очень хорошо, но уже не сможет воспользоваться существенной частью своих знаний о го.
                                                • +1
                                                  Как-раз таки и нет =) Это для среднего игрока важен размер доски — он знает дзёсэки, и завязан на них. Игроки уровня Седоля играют не по дзёсэкам, а по ситуации. Да, они их знают, но не используют «вслепую», в отличие от средних игроков.
                                              • +3
                                                Надо отметить, что писал статью человек далёкий от мира го. Прости, друг, но это так.
                                                gokifu.com/player/Gu+Li так выглядит история официальных матчей чемпиона
                                                gokifu.com/player/Wu+Guangya так выглядит история всё тех же официальных матчей среднего профессионального игрока
                                                gokifu.com/index.php?q=Fan+Hui так выглядит история нашего героя. Для справедливости, — gokifu.com/other.php?p=1&q=Fan%20Hui, — история игры с европейскими ноунэймами.

                                                Во-вторых, меня немножко смущают партии. В истории противостояния человека и компьютера уже были договорные матчи ради сенсации. И некоторые ходы вызывают вопросы. Да, программа безусловно сильна и наконец-то, после стольких лет, в гошный ai вливают деньги, когда-нибудь компьютер точно победит, вопрос лишь в том не является ли всё это очередным пиаром.
                                                С уважением, чемпион по го Буркина-Фасо.
                                                • 0
                                                  Спасибо, добавил замечание об этом в текст.
                                                • 0
                                                  Последним рубежом будет старерафт.
                                                  • +1
                                                    Условия ведь не равны, компьютер без проблем превзойдёт любого корейца по apm, а ещё может одновременно следить за разными частями карты. В го и шахматах реакция не важна.
                                                    • 0
                                                      Можно ввести подобные ограничения:
                                                      1. лимитировать apm до вменяемого
                                                      2. не предоставлять доступ к данным игрового поля, а предоставлять только саму картинку и возможность её перемещать (как у и игрока). При всём при этом лимитировать скорость перемещения.

                                                      Варианты есть ;)

                                                      • +1
                                                        А корейский apm можно считать адекватным?
                                                    • 0
                                                      О том же подумал. Особенно если первый старкрафт взять. В игре очень часто тяжело правильно оценить своё положение по отношению к сопернику (то есть выигрываешь ты или нет). Плюс в отличие от игр с полной информацией — можно банально проиграть по БО. Если машина будет каждый раз играть в стандарт — то это заведомо проигрышная стратегия. Даже сейчас АИ с неограниченным АПМом проигрывают крайне средним игрокам, причём их действия выглядят абсолютно глупо.
                                                      Уверен проблема в том, что АИ неспособен правильно оценить взаимодействие юнитов обеих сторон между собой (например один юнит забегает к нему на базу, и стоит вдалеке от его зданий\юнитов. Для АИ юнит за пределами базы в 90% в приоритете для атаки если он стоит ближе к его зданиям, чем юнит внутри базы. Причём в ситуациях когда даже начинающим игрокам ясно, что от юнита внутри базы надо избавляться быстрее).
                                                      Всех проблем которые надо решить даже не перечислить. Но хотелось бы посмотреть на игру АИ против человека. Надеюсь когда-нибудь такое произойдёт.
                                                    • 0
                                                      Ещё недавно ИИ только с форой в несколько камней выигрывал ведь…
                                                      • 0
                                                        И пока что ничего не изменилось, вроде как. Когда то давно Такемия Масаки (9-й дан, легенда го, но уже не в форме) играл с программой Zen (самой сильной программой, но нейросетей там никаких нет) и как то раз даже проиграл на 20 очков дав фору всего в 4 хода, чему очень удивился. Сейчас нейросеть от фейсбука (там точность 52% всего), может взять фору в 4 хода и играть на равных (половина побед) с корейским 6p (это, конечно, не 9p, но всё равно очень круто). Подтасовок там точно никаких нет, потому что ФБ запустил свою нейросеть в виде бота на КГС и там с ней играют по 200 партий в день все кому не лень.
                                                      • 0
                                                        А ресурсы весьма скромные по меркам имеющихся супер компьютеров.
                                                        Как я понимаю эта нейросеть способна победить любой классический алгоритм который не использует нейросеть. И ведь есть спец нейропроцессоры от IBM.
                                                        И какие будут возможности у нейросеть запущенной на лучьше супер компьютере?
                                                        Интересно сколько времени осталось до онлайн игр с миром который управляется нейросетью? И интересует возможность можно ли в теории сделать игру на пк где поведение ботов будет управлять нейросеть? Какой-нибудь ИИ движок унифицированный который интегрируется в игровой.
                                                        Взять тот же старкрафт материала для анализа море. Вот будет новость победа над лучшим про геймером. Только слегка отраничить чтобы не могла действовать быстрее человека. Или вообще управление мышью и клавой промышленными манипуляторами.
                                                        • 0
                                                          Проблема как раз в том, что придётся искусственно ограничивать. «Чтобы не могла действовать быстрее человека» — понятие растяжимое. Поэтому интересны именно те игры, в которых не важна реакция.
                                                          Кстати, я всё чаще слышу жалобы на ИИ в стратегиях (HoMM7, TW:Rome 2). C чего бы это?
                                                          • 0
                                                            Просто ИИ часто не уделяют достаточно времени — дедлайн горит, багов разных очень много и т.п. В тех же героях он крайне не оптимизирован, и тратит очень много времени даже на хороших компьютерах. Часто фанаты делают его намного лучше, просто потому что намного серьёзнее к нему относятся, и это уже представляет интерес.
                                                            • 0
                                                              ИИ делают изначально таким, чтобы его могли побеждать любые игроки. Какой интерес играть в игру, если ты постоянно проигрываешь? :) А вот сделать хорошо адаптированный под разных игроков ИИ действительно сложно (если не решать действием в лоб как в героях — завышением ресурсов для ИИ, уменьшением для игрока и настройке агрессивности) да и выхлоп будет сомнительным, так как если игра не играется в мультиплеере, то от ИИ толка мало.
                                                              • 0
                                                                ИИ должен быть таким, чтобы против него было интересно играть. Большую сложность несложно ослабить, но когда ИИ выбирает следующие действия абсолютно не логично, почти случайным образом это плохо. Когда ИИ в 7 героях намного хуже чем в пятых и третьих это печально, и говорит о многом. К тому же продолжительность хода компьютера на больших картах очень расстраивает. Почему на хорошем core i5 это занимает намного больше времени чем у пятых героев на одноядерном атлоне при видимо не возросшем объёме расчетов и логика его действий при этом хуже?

                                                                Бои против ИИ должны приносить удовольствие от своих тактических и стратегических заготовок, а не производить впечатление борьбы с умственно отсталым. К сожалению как минимум в седьмых героях об этом не задумались вовремя.

                                                        • 0
                                                          Возникает вопрос: каков рейтинг Эло этой системы?
                                                          • 0
                                                            Казалось только недавно видел статью про го и сложности создания для нее ИИ. И вот, оказывается, уже есть вполне успешный проект! Насколько я понял, игра с Ли Седоль еще только в планах?
                                                            • +16
                                                              Очень понравилась байка, прочитанная на другом ресурсе и связанная с данной новостью:
                                                              Во всех интервью к предыдущей новости разработчики говорят, что возможно они «решили го». Это настолько круто что я тут вспомнил отличную байку якобы от кубинского гроссмейстера Хосе Рауля Капабланки

                                                              «Однажды я участвовал в турнире в Германии, когда ко мне подошел мужчина. Решив, что ему нужен всего лишь автограф, я потянулся за ручкой, но тут мужчина сделал поразительное заявление… «Я решил шахматы!» Я стал благоразумно отступать, на случай, если мужчина был столь же опасен, сколь и безумен, но он продолжил: «Спорим на 50 марок, что если вы пойдете со мной в мой гостиничный номер, я смогу это доказать» Что же, 50 марок есть 50 марок, так что я решил быть снисходительным, и проводил мужчину к его номеру. Оказавшись в номере, он уселся за шахматную доску. «Я все понял, белые ставят мат на 12 ходу независимо ни от чего» Я играл черными возможно чересчур осторожно, но обнаружил, к своему ужасу, что белые фигуры координируются как–то странно, и что я получу мат на 12 ходу! Я попробовал снова, разыграв на этот раз совершенно иной дебют, из которого в принципе невозможно было попасть в такое положение, но после серии очень странно выглядящих ходов, я снова обнаружил своего короля окруженным, и мат должен был прийтись на 12 ход. Я попросил мужчину подождать, а сам сбегал вниз и позвал Эммануэля Ласкера, который был чемпионом мира до меня. Он был настроен крайне скептично, но согласился хотя бы придти и сыграть. По пути мы наткнулись на Алехина, который был текущим чемпионом мира, и вот все трое мы вернулись в тот номер.
                                                              Ласкер не рисковал, но играл настолько осторожно, насколько это вообще возможно, и тем не менее, после причудливой, бессмысленно выглядящей серии маневров, обнаружил себя зажатым в матовой сети, из которой не было выхода. Алехин тоже попробовал, но опять же не преуспел.
                                                              Это был какой–то кошмар! Вот они мы, лучшие игроки в мире, люди, посвятившие все свои жизни игре, и вот теперь все кончено! Турниры, состязания, все — шахматы решены, белые побеждают»
                                                              Тут один из друзей Капабланки вмешивается, со словами: «Погодите минутку, я никогда ни о чем таком не слышал! Что случилось?»
                                                              «Как что, мы его убили, конечно»
                                                              • +3
                                                                Мой друг, 4д по Го на " KGS Go Server" (что очень круто, таких людей в России несколько десятков, как я понимаю) по этому поводу скептичен. Он посмотрел партии указанные. Говорит что «чемпион» дико косячит, делает совершенно неадекватные ходы периодически.
                                                                А на счёт того, насколько крут выбранный гуглом «чемпион Европы»:
                                                                вот это чемпион мира — gokifu.com/player/Gu+Li
                                                                Вот это средний игрок мирового уровня — gokifu.com/player/Wu+Guangya
                                                                вот это «чемпион» который играл с гуглом — gokifu.com/index.php?q=Fan+Hui (международный зачёт) gokifu.com/other.php?q=Fan+Hui (европейский зачёт)
                                                                Уверяет, что это — очень слабо.

                                                                При этом по поводу игры говорит, что видно что программа — сильна, даже очень. Но не на уровне данного игрока её показывать.

                                                                По количеству ошибок игрока предположил что играли блиц.
                                                                • 0
                                                                  60 минут + 30 секунд бёёми (1 период, как я понял). Это как-то несерьезно.
                                                                  К тому же игры проходили каждый день.

                                                                  Не выиграть этому АИ даже японского титула =)
                                                                • 0
                                                                  Фан кстати в самой начале выбрал устаревший вариант при розыгрыше в левом нижнем углу. Сейчас это вариант не считается равным.
                                                                • 0
                                                                  Профессиональные игроки (не только в го) знают всех своих сильных соперников «в лицо» — знают их стиль игры, типичные ошибки или приемы, да и во время игры могут «читать» по лицу, замечать эмоции. Это тоже составляющая игры. В игре с компьютером они лишены всего этого.
                                                                  • 0
                                                                    Читать по лицу и эмоции это уже покер какой-то.
                                                                    • 0
                                                                      Очень много игр в онлайне проводятся, где нет возможности «читать по лицу».
                                                                      • 0
                                                                        Ну так наверно поэтому Ли Сидол как то раз зашёл на КГС, собрал аудиторию over 9000 зрителей и проиграл какому то спайдермену1 :)
                                                                      • 0
                                                                        В играх с полной информацией, без случайностей «эмоции» и «стиль игры» не являются составляющей игры.
                                                                        • 0
                                                                          Еще как являются. Особенно, когда ты сидишь на каком-нибудь чемпионате города на второй-третьей доске, на часах осталось минуты по три, а вокруг стоит человек тридцать участников/зрителей и молча смотрят, как вы стучите фигурами по доске. Причем тебе для призов нужно сыграть вничью, а противнику выиграть, и он давит на тебя уже второй час в незнакомом варианте староиндийки.
                                                                          • 0
                                                                            Ну мы тут все же более высокий уровень обсуждаем. Где около доски не тусуется куча народа.
                                                                            Потом в большинстве правил по Го нет ничьи и есть байоми, так что на флаг играть нельзя. А про эмоции посмотрите записи партий на Ютубе. В большинстве своем лица игроков не выражают никаких эмоций.
                                                                            И опять же профи знают/могут быстро просчитать все основные варианты. Для них незнакомый вариант не такая критичная проблема как для любителя.
                                                                            • 0
                                                                              Лучший ход в шахматах совершенно не зависит от того, кто сидит перед вами, он зависит только от позиции.
                                                                              Вничью или выиграть — имеет значение, конечно же.
                                                                          • 0
                                                                            знают их стиль игры, типичные ошибки или приемы
                                                                            Тоже самое и с AI. У него будет свой стиль. А вот эмоции они прочитать уже не смогут, хотя так даже честнее :)
                                                                          • 0
                                                                            Между прочим, в 2000х годах произошел прорыв в ИИ для логических игр, когда венгерский ученый изобрел алгоритм UCT. Это весьма интересный алгоритм, ведущий поиск по Монте-Карло, но с выставлением веса для каждой ветви вычислений по особой формуле. В связи с изобретением этого алгоритма ИИ для го впервые мог играть на уровне любителя.
                                                                            • 0
                                                                              Есть также Arimaa. Насколько я помню, она специально создавалась для того, чтобы ИИ не могли эффективно играть.
                                                                            • 0
                                                                              Небольшая поправочка к статье, называть ИИ программы для игры в шахматы, мягко говоря опрометчиво. Deep Blue просто очень быстрый в свое время компьютер, с огромной базой и хорошо составленной оценкой позиции. Но никакого ИИ там нет и близко. В шахматах грамотная стратегия перебора с удачной оценкой позиции гораздо проще и эффективнее.
                                                                              • +2
                                                                                Нормально так называть, это устоявшийся термин. Более того, это уже обсуждалось.
                                                                              • 0
                                                                                del

                                                                                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.