21 серпня 2017

Бит или не бит: как компьютеры громят людей во все новых играх и что с этим делать

На прошедшем недавно The International – чемпионате мира по игре Dota 2 – состоялось событие, выходящее за рамки киберспорта: бот компании Илона Маска OpenAI обыграл лучших спортсменов в одном из режимов. Это первый случай, когда искусственный интеллект превзошёл человека не в классических настольных играх, а в значительно более сложной киберспортивной. Platfor.ma проверила, в каких еще соревнованиях компьютер победил человека, как ему это удалось и чего ждать дальше.

 

 

История противостояния человека и машины насчитывает более полувека, за которые компьютеру удалось добиться доминирования в тех дисциплинах, что, по оценкам экспертов, должны были еще долго оставаться непреодолимым препятствием для искусственного интеллекта.

 

 

Дольше всего люди соревнуются с компьютером в шахматах: MANIAC, первый компьютер, победивший человека (пусть и новичка), был создан в Лос-Аламосской лаборатории еще в 1956 году. Следующая модификация, Mac Hack IV, была разработана студентом MIT в 1966 и могла играть на уровне шахматиста-аматора. Следующие версии иногда побеждали и профессионалов, но это не имело большого значения, пока люди были уверены в своем общем превосходстве.

 

Ключевым событием в этой области стали игры Гарри Каспарова с Deep Blue и его предшественником Deep Thought. Каспаров, возможно, самый талантливый шахматист в истории этого вида спорта вообще, самоуверенно заявлял, что «в ХХ веке компьютерам ничего не светит в классических шахматах». В 1989 году он принял вызов команды разработчиков и легко расправится с Deep Thought, после – победил еще несколько других компьютеров. В 1997 году состоится его знаменитый матч-реванш с похорошевшим Deep Blue (первый поединок Каспаров также оставил за собой). К шоку всего мира и самого Каспарова, он проиграет две партии и три сведёт вничью, оставив за собой лишь одну – первую.

 

 

Потом об этом матче напишут книгу и снимут документальный фильм, а недавно вскрывшиеся факты прольют свет на причины поражения: в первой, проигранной партии, из-за ошибки в коде Deep Blue сделает совершенно нелогичный и нехарактерный для себя ход. Странность этого действия настолько выбьет из равновесия Каспарова, что к решающей шестой партии он окончательно утратит привычную агрессивность и, по наблюдениям экспертов, сыграет с позиции слабого соперника, что и предрешит исход серии не в его пользу.

 

Даже несмотря на эти обстоятельства, уже в начале двухтысячных компьютеры станут играть в шахматы настолько хорошо, что наилучшим исходом для любого гроссмейстера будет ничья, причем добиться этого сможет не только суперкомпьютер (коим был Deep Blue), но и коммерческие разработки. Бастион людского превосходства в шахматах безвозвратно падёт.

 

До этого компьютеру удастся одержать две менее известные, но тоже значимые победы: в 1979 году программа профессора Университета Карнеги – Меллона Ганса Берлинера победила чемпиона мира по нардам Луиджи Вилла со счётом 7-1. Это был первый случай, когда компьютеру вообще удалось победить чемпиона мира в любой игре. В 1991 году шашечная программа Chinook проиграет чемпиону мира Мэриону Тинсли. Последний ради этого матча даже пригрозит бойкотировать мировую ассоциацию, отказывавшуюся от соперника, «неподобающего» статусу чемпиона. В матче-реванше, который пройдет в 1994, Тинсли будет вынужден сдаться из-за проблем со здоровьем, но полученную корону Chinook так и не отдаст ни одному из последующих претендентов.

 

 

Следующим прорывом в индустрии стал успех нейросети AlphaGo, созданной лондонской компанией DeepMind – ее в 2014 году купил Google. AlphaGo соревновалась с человеком в древней китайской игре го, которую считают одной из сложнейших дисциплин в мире. Сложность го в огромном количестве вариантов, которые нужно просчитывать (каждый ход порождает 250 позиций, которые далее возрастают в геометрической прогрессии, а суммарное число положений превосходит количество атомов в обозримой Вселенной), так что даже лучшие игроки зачастую действуют, полагаясь на интуицию. Естественно, что у суперкомпьютеров, каким был Deep Blue, практически нет шансов победить профессионала перебором.

 

В 2014 году француз Реми Кулом создал программу Crazy Stone, которая сумела выиграть у магистра го, японца Норимото Еду, но с форой в четыре хода. После этого Кулом сказал, что понадобится еще десятилетие, чтобы компьютер сумел победить магистра в равных условиях.

 

На самом деле, на это понадобился всего год. Уже в октябре 2015 AlphaGo победила чемпиона Европы Фань Хуэя со счётом 5:0 в закрытом лондонском офисе DeepMind. На матче присутствовал корреспондент научного журнала Nature. Через три месяца он опубликует статью о матче, а о результате заявят во всеуслышание. Фань Хуэй после матча сравнит программу с «непроходимой стеной», но заявит, что ничто в ней не выдает нечеловеческую логику.

 

 

Потрясенный этим результатом, честь команды людей решился защищать кореец Ли Седоль – один из самых титулованных игроков и легенда го. Ли был готов проиграть лишь через несколько лет, а пока победить всухую либо отдать партию. В итоге всё получилось наоборот: AlphaGo выиграла со счетом 4:1 на глазах зрителей интернет-трансляций, продемонстрировав виртуозную и нестандартную игру. После этого матча Южная Корея решила инвестировать в исследования искусственного интеллекта миллиард долларов.

 

В мае этого года история подошла к логическому завершению: на саммите «Будущее го» AlphaGo сыграла еще одну важную игру – против первого номера мирового рейтинга, китайца Кэ Цзэ, и победила всухую.

 

Залогом успеха AlphaGo стал прорыв в развитии компьютерных нейросетей, пришедшийся на последние годы. Ключевая особенность нейросетей – способность самостоятельно «обучаться», в отличии от программ, которые используют набор заданных характеристик. Обучение нейросети заключено в своего рода методе проб и ошибок, и его часто сравнивают с обучением ребенка. Сеть пичкают миллионами примеров, подсказывая, какие из них правильные, а какие – нет. Ни для кого не секрет, что обученные таким образом нейросети уже способны придумывать названия для пива, сочинять симфонии, соперничать между собой и даже вести фейковый твиттер Трампа.

 

Обучение AlphaGo происходило подобным образом: сперва она посмотрела 30 млн ходов профессионалов, поняла правила игры и могла повторять их решения. А после сеть оставили играть саму с собой, множество, миллионы матчей, и, конечно, без перерывов на еду и сон.

 

Уже сейчас это приводит к соревнованиям не только в формате «человек-компьютер», но и «компьютер-компьютер»: как, например, в чемпионате по игре Doom, где сражались программы, созданные учеными ведущих технологических компаний и университетов.   

 

 

В начале 2017 произошло еще одно нестандартное событие: программа Libratus победила четырех профессиональных игроков в Техасский холдем, впервые восторжествовав в игре с «неполной» информацией. Ценности этой победе придало и то, что соревнование шло в безлимитной, особенно сложной для прогноза, версии покера. После 20 дней турнира на счету Libratus было $1,7 млн, в то время как все её оппоненты закончили турнир с минусовыми показателями. Libratus вовремя блефовала и умело ставила с хорошими картами, так что даже совместные усилия игроков не смогли исправить положение. Хотя матч и игрался по правилам «каждый сам за себя», ночью после игр люди собирались вместе и делились стратегиями: «Конечно, мы играли друг против друга, – скажет один из них, – но мы также пытались победить для человечества».

 

Ну а упомянутая в начале победа в Dota 2 была достигнута уже известным путём. Бота OpenAI закинули на игровую карту, где он сперва сыграл кучу игр сам с собой, а после сокрушил лучших игроков мира с общим счетом 20:1, к ликованию Илона Маска. Это первая победа искусственного интеллекта в дисциплине, степень случайности в которой значительно превосходят строгую логику классических настольных игр. Справедливости ради стоит отметить, что OpenAI победил в одиночном режиме, а не куда более изощренном командном, но после последних событий прогресс в сфере уже не исчисляется «десятилетиями», а сами разработчики обещают удивить уже на следующем чемпионате.

 

 

У человека еще много игр, в которых он пока не проиграл, а значит, соревнования и покоренные вершины долго будут попадать на страницы медиа. И пока что разработчики не забывают упоминать, что их игровые программы – только ключ к будущим достижениям, как, например, хирургия или биржевый менеджмент, а психологи напоминают, что люди по-настоящему болеют и завидуют только тем, на месте кого они могут представить себя. Так что возможно, когда компьютеры докажут свою непобедимость во всех соревнованиях, они смогут вернуться к любимому развлечению – игре против самих себя.

 

 

Цей матеріал було підготовлено в рамках Програми міжредакційних обмінів за підтримки Національного фонду на підтримку демократії NED.