'Superhuman' AI po prvý raz porazí profesionálov v hre POKER

Technológie

Váš Horoskop Na Zajtra

Profesionálny poker hráči boli porazení umela inteligencia program prvýkrát.



Bot s názvom Pluribus porazil popredných profesionálov v no-limit Texas hold'em pokru pre šesť hráčov, celosvetovo najpopulárnejšej forme kartovej hazardnej hry.



Pluribus porazil pokrového profesionála Darrena Eliasa, ktorý je držiteľom rekordu v počte titulov World Poker Tour, a Chrisa 'Jesusa' Fergusona, víťaza šiestich podujatí World Series of Poker.



Každý profesionál samostatne odohral 5 000 pokerových rúk proti piatim kópiám hry Pluribus, ktorú vyvinuli vedci z Univerzita Carnegie Mellon v USA v spolupráci s Facebook .

lady gaga úplne nahá

V ďalšom experimente, do ktorého sa zapojilo 13 profesionálov, z ktorých všetci vyhrali pokerom viac ako jeden milión amerických dolárov, Pluribus hral naraz s piatimi profesionálmi v celkovom počte 10 000 rúk a opäť z toho vyšiel ako víťaz.

Prof Tuomas Sandholm vyvinul Pluribus s Noamom Brownom, ktorý dokončuje doktorandské štúdium. na oddelení počítačovej vedy Carnegie Mellona ako vedecký pracovník na Facebooku AI.



Hranie online pokru

Hranie online pokru (Obrázok: Getty)

Profesor Sandholm povedal: „Pluribus dosiahol nadľudský výkon v pokri pre viacerých hráčov, čo je uznávaný míľnik v umelej inteligencii a teórii hier, ktorý je otvorený už desaťročia.



„Doteraz boli nadľudské míľniky AI v strategickom uvažovaní obmedzené na súťaž dvoch strán.

'Schopnosť poraziť ďalších piatich hráčov v takejto komplikovanej hre otvára nové možnosti využitia AI na riešenie širokej škály problémov v reálnom svete.'

filmové ceny zac efron mtv

Pán Brown, ktorý sa pripojil k Facebook AI minulý rok, povedal: „Hranie hry pre šesť hráčov namiesto priameho súboja si vyžaduje zásadné zmeny v tom, ako AI rozvíja svoju hernú stratégiu.

'Sme nadšení z jeho výkonu a veríme, že niektoré herné stratégie Pluribusu môžu dokonca zmeniť spôsob, akým profesionáli hrajú hru.'

Povedal, že algoritmy Pluribus vytvorili do jeho stratégie niekoľko prekvapivých prvkov. Väčšina ľudských hráčov sa napríklad vyhýba „donk bettingu“ – teda ukončeniu jedného kola callom, ale následnému začatiu ďalšieho kola stávkou. Považuje sa to za slabý ťah, ktorý zvyčajne nedáva strategický zmysel.

Ale Pluribus uzatváral „donk“ stávky oveľa častejšie ako profesionáli, ktorých porazil.

Pokrový profesionál Elias povedal: „Jeho hlavnou silou je schopnosť používať zmiešané stratégie.

(Obrázok: Getty)

„To je to isté, o čo sa ľudia snažia. Pre ľudí je to vec popravy – robiť to úplne náhodným spôsobom a robiť to dôsledne. Väčšina ľudí jednoducho nemôže.“

Pluribus zaznamenal solídne víťazstvo a Elias povedal. „Ten robot nehral len proti nejakým profesionálom v strede cesty. Hrali tam niektorí z najlepších hráčov na svete.“

Proti Pluribusu nastúpil aj Michael 'Gags' Gagliano, ktorý za svoju kariéru zarobil takmer dva milióny amerických dolárov.

Povedal: „Bolo neuveriteľne fascinujúce hrať proti pokerovému robotovi a vidieť niektoré stratégie, ktoré si zvolil.

„Bolo niekoľko hier, ktoré ľudia jednoducho vôbec nerobia, najmä čo sa týka veľkosti stávok.

kaitlynn carter miley cyrus

'Boti/AI sú dôležitou súčasťou vývoja pokru a bolo úžasné mať skúsenosti z prvej ruky v tomto veľkom kroku smerom k budúcnosti.'

Profesor Sandholm viedol výskumný tím študujúci počítačový poker už viac ako 16 rokov.

On a pán Brown predtým vyvinuli Libratus, ktorý pred dvoma rokmi rozhodne porazil štyroch pokrových profesionálov, ktorí spolu hrali 120 000 rúk v heads-up no-limit Texas hold'em, verzii hry pre dvoch hráčov.

Profesor Sandholm vysvetlil, že hry ako šach a Go už dlho slúžili ako míľniky pre výskum AI.

V týchto hrách všetci hráči poznajú stav hracej dosky a všetkých figúrok.

Video sa načítavaVideo je nedostupnéPrehrajte kliknutím Klepnutím spustíte prehrávanie Video sa čoskoro automaticky prehrá8ZrušiťHrať teraz
Umela inteligencia

Ale poker je väčšou výzvou, pretože je to neúplná informačná hra; hráči si nemôžu byť istí, ktoré karty sú v hre a súperi môžu a budú blafovať.

Profesor Sandholm povedal, že to robí z pokeru tvrdšiu výzvu AI a viac relevantnú pre mnohé problémy v reálnom svete zahŕňajúce viacero strán a chýbajúce informácie.

manželka Freda na prvom rande

Vysvetlil, že Pluribus sa zaobíde bez teoretických záruk úspechu a vyvíja stratégie, ktoré mu napriek tomu umožňujú neustále prehrávať súperov.

Pluribus najprv vypočíta stratégiu „návrhu“ hraním šiestich kópií seba samého, čo je dostatočné na prvé kolo stávok.

Od tohto momentu Pluribus vykonáva podrobnejšie vyhľadávanie možných ťahov v jemnejšej abstrakcii hry.

Pozerá dopredu niekoľko ťahov, ako to robí, ale nevyžaduje sa pozerať dopredu až do konca hry, čo by bolo z výpočtového hľadiska nedostupné.

Profesor Sandholm vysvetlil, že Pluribus sa tiež snaží byť nepredvídateľný. Stávkovanie by napríklad dávalo zmysel, ak by AI držala najlepšiu možnú kombináciu, ale ak AI vsádza len vtedy, keď má najlepšiu kombináciu, súperi sa rýchlo chytia.

Pluribus teda vypočítava, ako by konal s každou možnou rukou, ktorú by mohol držať, a potom vypočíta stratégiu, ktorá je vyvážená vo všetkých týchto možnostiach.

Profesor Sandhokm povedal, že Libratus použil okolo 15 miliónov jadier na vývoj svojich stratégií a počas hrania naživo použil 1 400 CPU jadier.

nesie tetovanie pre charlottu

Ale Pluribus vypočítal svoju plánovú stratégiu za osem dní s použitím iba 12 400 jadier a počas živého hrania použil iba 28 jadier.

Podrobnosti o úspechu zverejnil online časopis Science.

Najčítanejšie
Nenechajte si ujsť

Pozri Tiež: