СУХУМ, 18 дек — Sputnik. Американские ученые создали новую систему искусственного интеллекта, обыгравшую четырех сильнейших игроков в так называемый "техасский холдем", сообщает РИА Новости со ссылкой на статью, опубликованную в журнале Science.
"Те приемы, которые мы разработали при создании этой системы искусственного интеллекта, не являются специфичными для покера, и их можно применять при решении любых других проблем, когда у нас нет полной информации для принятия решений. Такие задачи встречаются повсеместно, и мы ожидаем, что идеи, заложенные в Libratus, будут играть решающую роль в дальнейшем развитии и распространении ИИ", — заявил Ной Браун (Noam Brown) из университета Карнеги-Меллон в Питтсбурге (США).
За последние два года программисты и математики совершили настоящий прорыв в области создания систем искусственного разума, превосходящих человека в умении играть в определенные стратегические и азартные игры. К примеру, в прошлом году ученые создали ИИ AlphaGo, способную играть в древнекитайскую стратегию го лучше чемпионов Европы и мира, а в этом году они представили ее новую версию, способную учиться без участия человека.
В марте прошлого года канадские программисты из университета Альберты создали искусственный разум DeepStack, способный играть в одну из простейших версий покера. Ему удалось стать победителем на одном из турниров по покеру, который проводился под эгидой Международной федерации покера.
Покер, как объясняет Браун, одновременно и сложнее, и легче, чем го – вариантов в нем меньше, чем в китайской стратегии, но при этом у него есть одно существенное различие. В отличие от игроков в го, любители покера не вынуждены действовать, не имея полных данных о том, что знает или не знает их соперник, какие карты он имеет на руках и что он может сделать.
Единственным источником информации для них являются те карты, которые имеются у них на руках, возможный набор из нескольких резервных карт, который крупье выкладывает на стол, а также мимика, жесты и прочие аспекты поведения соперников. Оценка всех этих факторов является неимоверно сложной задачей для машины, что часто вынуждает ученых идти на использование различных "заготовок" для облегчения ей задачи или на упрощение правил игры.
Браун и его коллега Туомас Сандхольм (Tuomas Sandholm) создали систему ИИ, не нуждающуюся в подобной поддержке, научив свое детище, Libratus, мыслить "абстрактно". Иными словами, эта версия искусственного разума умеет находить общие черты в различных комбинациях карт, ставок и прочих элементов игры, и считать их примерно одним и тем же вариантом развития событий, что существенно упрощает игру и позволяет находить простые решения для самых очевидных комбинаций карт и вариантов ходов соперника.
Если же ход партнера по игре является неожиданным для машины, то она просчитывает его последствия отдельно, используя мощности суперкомпьютера, и ищет безопасные варианты продолжения игры, которые помогли бы ей выиграть или хотя бы минимизировать потери.
Удачные версии этих новых ходов записываются в специальную "книгу стратегий", которую Libratus использует в последующих раундах игры.
Протестировав работу этой системы в играх с предыдущими версиями ИИ, ученые пригласили четырех ведущих игроков в "техасский холдем" – Джейсона Леса, Дона Кима, Дэниэла Макоули и Джимми Чоу — сыграть с машиной в небольшой турнир с призовым фондом в 200 тысяч долларов, 10% которого гарантированно доставались каждому мастеру.
Этот чемпионат завершился разгромом людей – как отмечают ученые, к концу соревнования на "руках" Libratus имелось огромное число фишек, чья совокупная стоимость составляла 1,8 миллиона долларов, которые он выиграл у каждого игрока по-отдельности. По сути, если бы чемпионат проводился полностью "честно", то весь призовой фонд ушел бы искусственному разуму.
Как отмечают ученые, Libratus можно применять и для решения других стратегических задач, встречающихся в реальном мире, а также для создания игровых систем для других видов покера и прочих азартных или "обычных" игр