Два хода, которыми Ли Седоль и АльфаГо изменили будущее

Статья из журнала Wired

Сеул, Южная Корея

В партии №2, машина Google сделала красивейший ход, который бы не сделал ни один человек. На глазах у всего мира этот ход просто превосходно продемонстрировал невероятно мощные и даже непостижимые таланты современного искусственного интеллекта.

Однако, в партии №4 уже человек сделал ход, который не могла ожидать ни одна машина, и тоже очень красивый. На самом деле, он был так же великолепен, как и ход машины в партии 2, не больше и не меньше. И этот ход показал, что несмотря на то, что теперь машины способны на моменты гениальности, едва ли люди потеряли способность находить собственные прозрения. И кажется, что разработка таких машин приведет в ближайшем будущем к развитию человеческого гения в тандеме с нашим созданиями.

Эта неделя была свидетелем окончания исторического матча между Ли Седолем, одним из лучших игроков в Го, и АльфаГо, системой искусственного интеллекта, разработанной лондонской командой исследователей DeepMind, ныне принадлежащей Google
Машина обеспечила себе победу в матче из пяти партий, выиграв 4 и проиграв всего одну.
Это событие означает, что впервые машина показала себя лучшей в этой древней и чрезвычайно сложной игре. Такое достижение, которого эксперты не ожидали даже в ближайшие 10 лет.

Победа столь значительна и потому, что технологиям, заложенным в АльфаГо, принадлежит будущее. Эти технологии уже преображают Google, Facebook, Microsoft и Twitter и они уже готовы сделать прорыв в областях от робототехники до научных исследований. Это немного пугает. Беспокойство состоит в том, что машины с искусственным интеллектом заберут у нас работу, и даже вырвутся из под нашего контроля. До некоторой степени это беспокойство оправдано. Нам бы не хотелось быть застигнутыми врасплох. Но есть и другая точка зрения на эту проблему, она выводит нас за рамки противостояния человека и машины. Ее можно проиллюстрировать лекцией об этих двух великолепных ходах.

Ход 37

Тридцать седьмым ходом второй партии матча АльфаГо приподнесла сюрприз на правой части доски, который смутил даже лучших игроков Го, включая Ли Седоля. “Это очень странный ход”, сказал один из комментаторов, имеющий наивысший профессиональный ранг – 9 дан. “Мне показалось, это была ошибка”, сказал другой. Ли Седолю потребовалось около 15 минут, чтобы найти ответ на этот ход. Фан Ху, трехкратный европейский чемпион, игравший до этого закрытый матч с АльфаГо в октябре и проигравший все 5 партий, отреагировал скептически. Однако позже, вспоминая свой опыт игры с АльфаГо, а он играл с машиной и после октябрьского матча на протяжении пяти месяцев, Фан Ху увидел красоту этого очень необычного хода. На самом деле, этот ход повернул течение игры. АльфаГо выиграла вторую партию, и на послематчевой конференции Ли Седоль пребывал в растерянности. “Вчера я был удивлен”, сказал он через переводчика, ссылаясь на поражение в первой партии. “Но сегодня у меня нет слов. Посмотрите на то как развивалась игра, я признаю, что это было чистое поражение с моей стороны. С самого начала игры не было ни одного момента, когда я чувствовал, что лидирую.”

Это был переломный момент. И в то же самое время, те из нас кто наблюдал игру из сеульского отеля Four Seasons, смогли прочувствовать красоту одного этого хода, особенно после беседы с Фан Ху, заразительно философски настроенным. “Так прекрасно, так прекрасно”, повторял он. А на следующее утро, Дэвид Сильвер, ведущий разработчик проекта АльфаГо, рассказал мне, как машина увидела этот ход. И это было также прекрасно.

Один из десяти тысяч.

Первончально, Сильвер и его команда обучали АльфаГо играть в эту древнюю игру с помощью глубокой нейронной сети, программно-апаратного комплекса, построенного по принципу сети нейронов в человеческом мозге. Эта технология уже работает в онлайн сервисах Google, Facebook и Twitter, помогая идентифицировать лица на фото, распознавать голосовые команды на смартфонах, прокладывать маршруты на картах и многое другое
Если вы загрузите в нейронную сеть достаточное количество фотографий лобстеров, то она может обучиться распознавать лобстеров. Если загрузить в нее записи людских диалогов,
то она может научиться относительно прилично поддерживать разговор. А если вы загрузите в нее 30 миллионов ходов профессиональных игроков, она может научиться играть в Го.

Затем команда исследователей пошла далее. Используя вторую технологию искусственного интеллекта, называемую самообучение, они провели огромное количество матчей между немного отличающимися версиями АльфаГо. И когда АльфаГо играла сама с собой, система отслеживала какие ходы приносят больше территории. “АльфаГо научилась разрабатывать новые стратегии, играя миллионы партий сама с собой, и постепенно улучшаясь” сказал Сильвер, когда Google впервые показала АльфаГо в начале этого года.

Потом команда предприняла третий шаг, собрав ходы из этих миллионов партий между нейронными сетями и загрузив их еще в одну нейронную сеть. Эта нейронная сеть должна была тренировать систему оценке потенциального результата каждого хода, чтобы иметь возможность заглянуть в будущее развитие игры.

Итак, АльфаГо обучалась на ходах человека, затем на ходах в партиях против своих же копий. Она понимает, как играют люди, но также она может заглядывать за пределы человеческой игры на совершенно другом уровне. И это то что случилось на 37 ходу. Сильвер сказал мне, что АльфаГо оценила вероятность того, что такой ход сделает человек, как один к десяти тысячам. Однако когда она привлекла все знания, которые накопила в многочисленных играх со своими копиями, и оценила возможный исход хода в будущем, она все равно решила сделать этот ход. И он оказался гениальным

Ход 78

Затем Ли Седоль проиграл третью партию, и АльфаГо выиграла приз в один миллион долларов в этом матче из пяти партий. Настроение в отеле, где игрался матч, опять упало.
“Я не знаю что сказать сегодня, в первую очередь хочу принести свои извинения”, сказал Ли Седоль. “Я должен быо показать лучший результат, оказать большее сопротивление в этих играх”. В четвертой игре, он был намерен восстановить хотя бы часть репутации для себя и тех десятков миллионов по всему миру, кто наблюдал матч. Однако к середине игры, перспективы корейца не выглядели хорошо. “Ли Седоль должен сделать что-то необыкновенное”, сказал один из комментаторов. “В противном случае, для выигрыша будет недостаточно” И вот, после обдумывания следующего хода в течение 30 минут, он выдал нечто необычное. Это был ход 78, “вклинивание” в середине доски, и оно немедленно повернуло ход игры.

Как мы обнаружили после игры, АльфаГо сделала катастрофическую ошибку буквально следующим ходом, и несколько минут спустя, анализируя позицию на доске, машина определила, что ее шансы на выигрыш внезапно рухнули
Комментатор, игрок 9 дана Майкл Редмонд, назвал этот ход Ли Седоля блистательным : “Этот ход был для меня неожиданным. Я уверен, что и для большинства противников он был бы сюрпризом. Я думаю, что он застал АльфаГо врасплох. Среди игроков Го, этот ход получил название “Прикосновение бога”. Это действительно величайшая похвала. Но самая высокая похвала ему досталась от АльфаГо

Один из десяти тысяч – снова.

Следующим утром, во время прогулки от отеля Four Seasons, я обсуждал этот ход с Демисом Хассабисом, который координировал Deepmind Lab и являлся фактически лицом АльфаГо на протяжении семи дней матча. Когда мы шли, прохожие приветствовали его как знаменитость, и он действительно был знаменитостью, после появления в бесчисленных выпусках газет и теленовостей. Здесь, в Корее, где более 8 миллионов играют в го, Ли Седоль это фигура национального масштаба. Хассабис сказал мне, что АльфаГо была не готова к 78 ходу Ли Седоля, так как она не рассчитывала что человек когда-либо сыграл его. Опираясь на месяцы и месяцы своей тренировки, программа решила что вероятность такого хода – один к десяти тысячам. В других словах: тот же крошечный шанс что и сделанный АльфаГо ход 37 во второй партии.

Симметрия этих двух ходов прекрасна, как ничто другое. Один к десяти тысячам и один к десяти тысячам. Вот что мы должны вынести из этих поразительных семи дней. Хассабис, Сильвер и остальные разработчики построили машину, способную на нечто сверхчеловеческое. И в то же самое время, она дала сбой. Она не может делать всего того что может делать человек. На самом деле, она не может этого и близко. Она не может поддержать беседу. Она не может разгадывать шарады. Она не может пройти научный тест восьмого класса, она не может предугадать ход – “Прикосновение бога”.

Но подумайте о том что случится, если вы объедините две эти вещи. Человек и машина. Фан Ху скажет Вам, что после пяти месяцев игры с АльфаГо, он обрел совершенно иной взгляд на игру. Его положение в мировом рейтинге взлетело, как на ракете. И очевидно, что Ли Седоль чувствует подобное. Хассабис сказал, что он встречался с корейцем после четвертой игры, и Ли Седоль буквально вторил словам Фан Ху. Всего несколько матчей с АльфаГо открыли ему глаза, вот что сказал Ли Седоль.

Это означает не противостояние “человек против машины”. Это означает – человек плюс машина . Ход 37 был за пределами глубины, на которую способен человек. Но затем пришел ход 78. И мы должны спросить: Если бы Ли Седоль не сыграл предыдущие три игры с АльфаГо, смог бы он найти ход – “Прикосновение бога” Машина, которая победила его, в то же время помогла ему найти этот путь.

Источник
Автор: Cade Metz
Перевод: miksas

7 thoughts on „Два хода, которыми Ли Седоль и АльфаГо изменили будущее”

Михаил:
21.03.2016 в 21:46
Вау! Спасибо за перевод!
Neya:
21.03.2016 в 23:14
Очень любопытная статья!
Я об этом уже говорил на лекциях в клубе!
Тем интереснее увидеть подтверждение нашим размышлениям.
Тем более, мы не знали даже этих исходных данных.
Будет ещё интереснее!
Спасибо!
Snowbars:
23.03.2016 в 03:47
спасибо, отличная статья!
myexe:
24.03.2016 в 12:15
Спасибо Мишка за перевод.
EyeGem:
24.03.2016 в 12:27
Оптимистичное спасибо!
Иван:
30.03.2016 в 16:24
http://www.3dnews.ru/930756
Дмитрий:
21.01.2024 в 21:28
Ничья