A világtörténelemben először a mesterséges intelligencia legyőzheti az embert pókerben

Hétfő este négy kiemelkedően jó pókeres, Jimmy Chou, Dong Kim, Jason Les és Daniel McAulay egymás mellett meredt a számítógép kéken világító képernyőjére. A többszörös tornagyőztes, életük során már dollármilliókat nyerő pókeresek 13. napja gyűrték a lapokat. Nem álltak jól.

Ellenfelük ekkor már több mint 700 ezer dolláros pluszban volt, pedig 13 napja nulláról indult. Ráadásul az ellenfél egyre jobb formába lendült.

  • 27 ezer leosztás után még csak 50513 dolláros pluszban volt
  • 67 ezer leosztás után már 701242 dolláros pluszban.

Pedig a rejtélyes ellenfél egy gép, a Carnegie Mellon Egyetemen oktató Tuomas Sandholm és doktorandusza, Noam Brown Libratus névre keresztelt AI-programja. Az első, amely a jelen állás szerint legyőzheti az embereket.

Hosszú út vezetett idáig, Sandholm előző programja, Claudico 2015 májusában még 732713 dollárt bukott négy pókerbajnok ellenében. Claudico néha teljesen kiszámíthatatlanul és logikátlanul lépett. "Amikor egy ember a pot felével-háromnegyedével emelt volna, Claudico néha nevetséges tíz százalékot emelt, máskor pedig a pot tízszeresét" - írta akkor közleményében az egyetem. Doug Polk, Claudico egyik ellenfele szerint "egy ember sose tenne fel 19000 dollárt 700 dollárnyi nyereségért".

Az azóta eltelt időben Sandholmék más pókerező AI-k ellenében tökéletesítették algoritmusukat, mígnem megalkották Libratust, ami ugyan szintén úgy játszik, mintha földönkívüli lenne, de nagyon sikeresen csinálja. Ugyan hétfőn még 53 ezer leosztás hátra volt a húsz naposra tervezett, január 30-ig tartó meccsből, de 700 ezer dolláros előnye okot ad a magabiztosságra.

Libratus győzelme jelentős előrelépés lenne az AI-kutatásban. A mesterséges intelligencia dámában, sakkban és immár góban is bizonyított, de a pókerrel szemben ezek mind olyan játékok, ahol minden játékos tökéletes információk birtokában van. Magyarán mindketten rendelkeznek minden szükséges információval, így a gép végső soron előnyben van az emberrel szemben, mert sokkal több számítást képes elvégezni.

A póker más. A játék lényege, hogy egyik játszó fél sem rendelkezik minden információval, így a póker jobban szimulál olyan valóságos helyzeteket, mint amilyen egy háború. Az MIT Technology Review magyarázata szerint

„a tökéletlen információn alapuló játékokban borzasztóan nehéz megtalálni az ideális stratégiát tekintettel az ellenfél összes lehetséges megközelítésére. A texasi nincs felső határ különösen nehéz kihívás, mert az ellenfél lényegében akármennyi pénzt feltehet”.

Sandholm célja pont az volt a pókerező AI-val, hogy egy általánosan felhasználható algoritmust alkosson. Olyat, ami különösen jól teljesít a stratégiai érvelésben, így olyan valós élethelyzetekben is használható AI-t alkothat, aminek aztán kiberbiztonsági és katonai célokra is használhatnának.

De addig még hosszú az út. Először is még öt nap hátra van a versenyből, hacsak nem adnak hozzá még pár napot azért, mert a négy pókerbajnok sokkal lassabban játszik a gépnél. (Via The Washington Post, MIT Technology Review. Címlapkép: Maorix / Flickr CC BY-NC-ND 2.0)