Подпишитесь на нашу ежедневную рассылку с новыми материалами

Игры


Программа Libratus, разработанная в Университете Карнеги — Меллона, победила в 20-дневном покерном турнире Brains Vs. Artificial Intelligence: Upping the Ante. Компьютер выиграл фишек на сумму более 1,7 миллиона долларов, сообщает n+1.

Компьютеры стали совершеннее

В последнее время наработки в области машинного обучения позволили компьютерам значительно продвинуться вперед и обыграть людей в играх, в которых это традиционно считалось невозможным. Однако вплоть до недавнего времени люди по-прежнему побеждали в играх с неполной информацией.

В 2015 году программа Claudico (предшественник Libratus) играла с четырьмя профессиональными игроками и заняла третье место. На протяжении двух недель было сыграно 80 000 раздач, и из четырех живых игроков только один набрал меньше фишек, чем компьютер.

В турнире, который проходил в питтсбургском казино Rivers, было сыграно 120 тысяч раздач в безлимитный техасский холдем один на один (Хедз-Ап), против Libratus играли Даниэль МакОлэй, Джимми Чу, Донг Ким и Джейсон Лес.

Внимание! У вас отключен JavaScript, ваш браузер не поддерживает HTML5, или установлена старая версия проигрывателя Adobe Flash Player.

В результате 20-дневного турнира программа победила людей, заработав более 1,7 миллиона долларов в фишках. Несмотря на это, разработчики не получат никаких денег, а призовой фонд в 200 тысяч долларов будет поделен между четырьмя живыми игроками в зависимости от занятого места.

Принцип работы пока не раскрывается

На данный момент точно не известно, как именно работает Libratus, авторы описали лишь общую структуру программы и планируют в ближайшем будущем опубликовать статью в рецензируемом журнале.

По словам разработчиков, Libratus состоит из трех частей. Основное «ядро» Libratus было подготовлено заранее, вычисления заняли 15 миллионов ядро-часов, в то время как на Claudico ушло два-три миллиона. Вторая часть программы следила за возможными ошибками, которые могли допустить соперники, и учитывала в процессе игры эту информацию.

Третья часть Libratus отслеживала собственные слабые стороны, которые могли использовать противники, и корректировала общую стратегию с учетом этих данных. Такой подход позволил программе как блефовать самостоятельно, так и распознавать дезинформацию со стороны соперников.

Кадр из м/ф «Футурама»

По мнению авторов программы, у систем, подобных Libratus, большое будущее в самых разных сферах, где приходится иметь дело с неполной информацией. В качестве возможных сфер применения программы исследователи называют информационную безопасность, военное дело, аукционы, переговоры и даже бережливое распределение медикаментов.

Кроме покера машины также победили людей в го, игру с полной информацией. В прошлом году программа AlphaGo выиграла у одного из сильнейших игроков в мире Ли Седоля четыре игры из пяти. В некоторых играх с неполной информацией человек до сих пор побеждает компьютер, в том числе в Starcraft.

Читайте также:

Искусственный интеллект обыграл в го сильнейшего игрока-профессионала