Gracz w pokera komputerowego - Computer poker player

Gracz komputerowy to program komputerowy przeznaczony do gry w pokera przeciwko ludzkich przeciwników lub innych przeciwników komputerowych. Jest powszechnie określany jako pokerbot lub po prostu bot .

W Internecie

Te boty lub programy komputerowe są często używane w pokerze online jako prawowici przeciwnicy dla ludzi lub jako forma oszustwa . To, czy użycie bota stanowi oszustwo, jest zazwyczaj określane przez pokój pokerowy, w którym odbywają się rzeczywiste gry w pokera. Większość (jeśli nie wszystkie) sal do gry w karty zabrania korzystania z botów, chociaż poziom egzekwowania zasad przez operatorów witryn znacznie się różni.

Boty graczy

Temat botów graczy i pomocy komputerowej podczas gry w pokera online jest bardzo kontrowersyjny. Opinia graczy jest dość zróżnicowana, jeśli chodzi o decydowanie, które typy oprogramowania komputerowego zaliczają się do kategorii nieuczciwej przewagi. Jednym z głównych czynników przy definiowaniu bota jest to, czy program komputerowy może komunikować się z klientem pokera (innymi słowy, grać sam) bez pomocy ludzkiego operatora. Mówi się, że programy komputerowe z tą zdolnością mają lub są autograczami i są powszechnie definiowane jako należące do kategorii botów, niezależnie od tego, jak dobrze grają w pokera.

Kwestia nieuczciwej przewagi ma wiele wspólnego z tym, jakie rodzaje informacji i sztuczna inteligencja są dostępne dla programu komputerowego . Ponadto boty mogą grać przez wiele godzin bez ludzkich słabości, takich jak zmęczenie, i mogą znosić naturalne różnice w grze bez wpływu ludzkich emocji (lub „ tiltu ”). Z drugiej strony boty mają pewne istotne wady - na przykład botowi bardzo trudno jest dokładnie odczytać blef lub dostosować się do strategii przeciwników tak, jak potrafią to ludzie.

Egzekwowanie w domu

Chociaż regulaminy witryn pokerowych generalnie zabraniają używania botów, poziom egzekwowania zależy od operatora witryny. Niektórzy będą szukać i blokować użytkowników botów za pomocą różnych narzędzi programowych. Klient pokerowy może być zaprogramowany do wykrywania botów, chociaż jest to samo w sobie kontrowersyjne, ponieważ może być postrzegane jako osadzenie oprogramowania szpiegującego w oprogramowaniu klienckim. Inną metodą jest używanie CAPTCHA w losowych odstępach czasu podczas gry.

Boty domowe

Temat botów domowych jest jeszcze bardziej kontrowersyjny z powodu potencjalnego konfliktu interesów. Zgodnie z najściślejszą definicją, bot domowy jest automatycznym graczem obsługiwanym przez sam pokój pokerowy online, chociaż niektórzy określiliby bardziej pośrednie przykłady (na przykład gracz obsługujący boty za wiedzą i zgodą operatora) jako „boty domowe” jako dobrze. Tego typu robotów będzie równowartość cegły i zaprawy shills .

W kasynie z cegły i zaprawy gracz domu nie podważa uczciwości oferowanej gry, o ile kasyno działa uczciwie. W środowisku online to samo jest również prawdą. Z definicji uczciwy poker room online, który zdecyduje się obsługiwać boty domowe, gwarantowałby, że boty domowe nie miałyby dostępu do żadnych informacji, które nie byłyby dostępne dla żadnego innego gracza w rozdaniu (to samo dotyczyłoby również każdej ludzkiej podróbki ). Problem polega na tym, że w środowisku online dom nie ma możliwości udowodnienia, że ​​jego boty nie otrzymują poufnych informacji z serwera kart. Sytuację pogarsza jeszcze łatwość, z jaką tajne udostępnianie informacji może odbywać się w środowisku cyfrowym. Zasadniczo niemożliwe jest, aby nawet dom udowodnił, że nie kontroluje niektórych graczy – prawdopodobnie jedynym realnym sposobem, który można zrobić, byłoby ujawnienie poufnych danych osobowych każdego gracza, a tego oczywiście nie można zrobić ze względu na względy prywatności .

Sztuczna inteligencja

Poker to gra z niedoskonałymi informacjami (ponieważ niektóre karty w grze są ukryte), co utrudnia każdemu (w tym komputerowi) wydedukowanie ostatecznego wyniku rozdania. Z powodu tego braku informacji programiści komputerów muszą implementować systemy oparte na twierdzeniu Bayesa , równowadze Nasha , symulacji Monte Carlo lub sieciach neuronowych , które są technikami niedoskonałymi.

Sztuczna inteligencja, taka jak PokerSnowie i Claudico , została stworzona przez umożliwienie komputerowi określenia najlepszej możliwej strategii, pozwalając mu grać ogromną liczbę razy. Wydaje się, że jest to obecne podejście do pokerowej sztucznej inteligencji, w przeciwieństwie do prób stworzenia komputera, który gra jak człowiek. Skutkuje to dziwną wielkością zakładu i znacznie inną strategią, do której ludzie są przyzwyczajeni.

Opracowywane są metody, aby przynajmniej przybliżyć idealną strategię pokerową z perspektywy teorii gier w grze heads-up (dwóch graczy), a coraz więcej dobrych systemów jest tworzonych dla gry wieloosobowej. Doskonała strategia ma w tym kontekście wiele znaczeń. Z optymalnego punktu widzenia teorii gier, idealna strategia to taka, która nie może oczekiwać przegranej ze strategią innego gracza; jednak optymalna strategia może się różnić w przypadku nieoptymalnych graczy, którzy mają słabości, które można wykorzystać. W tym przypadku idealną strategią byłaby taka, która poprawnie lub ściśle modeluje te słabości i wykorzystuje je do osiągnięcia zysku, takie jak te opisane powyżej.

Sztuczna inteligencja przebiła się do nadludzkich wyników w pokerze w 2010 roku, z następującym harmonogramem. W 2015 roku komputery rozwiązywały heads-up limit hold'em za pośrednictwem Cepheusa . Około 2018 roku Libratus zademonstrował nadludzkie zdolności w heads-up no-limit hold'em. W 2019 roku Pluribus zademonstrował nadludzkie zdolności w sześcioosobowym no-limit hold'em, najczęściej granej odmianie pokera na świecie.

Grupy badawcze

Computer Poker Research Group (Uniwersytet Alberty, Kanada)

Duża część badań nad komputerowymi pokerzystami jest przeprowadzana na Uniwersytecie Alberty przez Computer Poker Research Group, kierowanego przez dr Michaela Bowlinga. Grupa opracowała agentów Poki , PsOpti , Hyperborean i Polaris . Poki posiada licencję na grę rozrywkową STACKED z udziałem kanadyjskiego pokerzysty Daniela Negreanu . PsOpti był dostępny pod nazwą „SparBot” w pokerowym programie szkoleniowym „Poker Academy”. Seria programów Hyperborean brała udział w corocznym konkursie pokera komputerowego, ostatnio zdobywając trzy złote medale z sześciu turniejów w 2012 roku. Ten sam kierunek badań przyniósł również Polaris , który grał przeciwko ludzkim profesjonalistom w 2007 i 2008 roku i stał się pierwszym komputerowym programem pokerowym, który wygrał znaczące zawody pokerowe.

W styczniu 2015 r. artykuł w Science autorstwa Michaela Bowlinga, Neila Burcha, Michaela Johansona i Oskara Tammelina twierdził, że ich pokerowy bot Cepheus „zasadniczo słabo rozwiązał” grę heads-up limit Texas hold'em.

Szkoła Informatyki Uniwersytetu Carnegie Mellon

T. Sandholm i A. Gilpin z Carnegie Mellon University rozpoczęli badania nad pokerową sztuczną inteligencją w 2004 roku, zaczynając od niepokonanego agenta do gry w trzy karty o nazwie Rhode-Island Hold 'em. Następnym krokiem był GS1, który przewyższał najlepsze dostępne na rynku boty pokerowe. Od 2006 roku agenci pokerowi z tej grupy uczestniczą w corocznych konkursach komputerowych. „W pewnym momencie będziemy mieli program lepszy niż najlepsi ludzie” – twierdzi Sandholm. Jego bot, Claudico , zmierzył się z czterema ludzkimi przeciwnikami w 2015 roku. W 2017 roku najnowsze oprogramowanie programu, Libratus , zmierzyło się z czterema profesjonalnymi pokerzystami. Pod koniec eksperymentu czterej gracze-ludzie stracili łącznie 1,8 miliona dolarów symulowanych pieniędzy.

Grupa AI Uniwersytetu w Auckland

Zespół z University of Auckland składa się z niewielkiej liczby naukowców, którzy wykorzystują rozumowanie oparte na przypadkach, aby tworzyć i ulepszać agentów pokera Texas Hold'em. Grupa stosuje różne techniki sztucznej inteligencji w wielu grach, w tym uczestniczy w komercyjnych projektach Small Worlds and Civilization (gra wideo) .

Laboratorium Neo Pokera

Neo Poker Lab to uznany zespół naukowy zajmujący się badaniami nad sztuczną inteligencją pokera. Od kilku lat opracowuje i stosuje najnowocześniejsze algorytmy i procedury, takie jak minimalizacja żalu i aproksymacja równowagi w przeszukiwaniu gradientowym, drzewa decyzyjne, metody wyszukiwania rekurencyjnego oraz algorytmy eksperckie do rozwiązywania różnorodnych problemów związanych z grą w pokera .

Konkursy historyczne

Konkurs ICCM 2004 PokerBot

Jeden z pierwszych konkursów botów pokerowych bez limitu został zorganizowany w 2004 roku przez Międzynarodową Konferencję Modelowania Poznawczego. Turniej gościł pięć botów z różnych uczelni z całego świata. Zwycięzcą został Ace Gruber z University of Toronto .

Zawody ACM

Association for Computing Machinery (ACM) gościł zawody gdzie zawodnicy złożyć kawałek oprogramowania zdolnego do gry w pokera na ich platformie konkretnego. Gospodarze imprezy przeprowadzają konkursy, obsługując oprogramowanie i raportując wyniki.

World Series of Poker Robots 2005

Latem 2005 roku internetowy pokój pokerowy Golden Palace zorganizował turniej promocyjny w Las Vegas, na starym Binions, z nagrodą w wysokości 100 000 $. Zostało zapowiedziane jako World Series of Poker Robots w 2005 roku. W turnieju były tylko boty bez wpisowego. Twórcami botów byli informatycy z sześciu narodowości, którzy podróżowali na własny koszt. Platformą gospodarza była Akademia Pokera. Wydarzenie obejmowało również pokazowy headsup z Philem Laakiem.

Eksperymenty z Man V Machine Uniwersytetu Alberty

Latem 2007 roku University of Alberta był gospodarzem wysoce wyspecjalizowanego turnieju heads-up pomiędzy ludźmi a ich botem Polaris na konferencji AAAI w Vancouver, BC, Kanada. Platforma hosta została napisana przez University of Alberta . Nie było 50 000 dolarów puli nagród ze specjalnymi zasadami, aby zmotywować ludzi do dobrej gry. Ludzie nie płacili wpisowego. Unikalny turniej składał się z czterech zduplikowanych sesji po 500 rozdań każda. Ludzie wygrali wąskim marginesem.

Latem 2008 roku University of Alberta i serwis pokerowy Stoxpoker zorganizowały drugi turniej podczas World Series of Poker w Las Vegas. Turniej składał się z sześciu zduplikowanych sesji po 500 rozdań każda, a ludzcy gracze byli specjalistami Heads-Up Limit. Polaris wygrał turniej z 3 zwycięstwami, 2 porażkami i remisem. Wyniki turnieju, w tym historie rozdań z meczów, dostępne są na stronie rozgrywek.

Konkurs Brains vs AI 2015 autorstwa Rivers Casino, CMU i Microsoft

Od kwietnia do maja 2015 r. najnowszy bot Carnegie Mellon University Sandholm, Claudico , zmierzył się z czterema ludzkimi przeciwnikami w serii meczów Texas Hold'em bez limitu. W końcu, po rozegraniu 80 000 rozdań, liczba graczy wzrosła o 732 713 $. Ale nawet jeśli ludzie technicznie wygrali, naukowcy uznali tę wygraną za statystycznie nieistotną (raczej statystyczną remis), gdy te 732 713 dolarów porównuje się z łączną kwotą zakładów wynoszącą 170 000 000 (170 milionów dolarów). Jednak niektórzy uznali to twierdzenie za nieszczere. Statystycznie nieistotne tutaj oznacza, że ​​programiści Claudico nie mogą powiedzieć z 95% pewnością (95% przedział ufności), że ludzie są lepsi od programu komputerowego. Jest to jednak statystycznie istotna wygrana przy 90% przedziale ufności. Oznacza to, że ludzcy gracze są w przedziale od 10 do 1 do 20 do 1 faworyta.

Struktura turnieju była podzielona na dwa zestawy po dwóch graczy. W każdym z dwóch zestawów gracze otrzymywali przeciwne karty. Oznacza to, że jeśli komputer ma As9c (as pik i dziewiątkę trefl), a człowiek ma Jh8d na jednym komputerze, drugi z dwóch graczy w zestawie będzie miał As9c przeciwko Wh8d komputera. Jednak nawet jeśli ludzie wygrywali więcej niż komputer – nie wszyscy gracze byli pozytywnie nastawieni do pojedynków head to head.

Sumy wygranych każdego z graczy były następujące:

  • Douglas Polk: +213,671$
  • Dong Kim: +70 491 $
  • Bjorn Li: +529 033 USD
  • Jason Les: -80 482 $

Coroczny Konkurs Pokera Komputerowego

Od 2006 roku Coroczny Konkurs Pokera Komputerowego organizuje serię konkursów dla programów pokerowych. Od 2010 roku grano w trzy rodzaje pokera: Heads-Up Limit Texas Hold'em, Heads-Up No-Limit Texas Hold'em i 3-osobowy Limit Texas Hold'em. W każdym wydarzeniu wymienianych jest dwóch zwycięzców: agent, który wygra najwięcej meczów (Bankroll Instant Run-off) oraz agent, który wygra najwięcej pieniędzy (Total Bankroll). Ci zwycięzcy często nie są tym samym agentem, ponieważ Bankroll Instant Run-off nagradza solidnych graczy, a Total Bankroll nagradza graczy, którzy są dobrzy w wykorzystywaniu błędów innych agentów. Konkurs jest motywowany badaniami naukowymi i kładzie się nacisk na zapewnienie, aby wszystkie wyniki były statystycznie istotne, biorąc udział w milionach rozdań pokera. Zawody 2012 miały ten sam format, z ponad 70 milionami rozdań rozegranych w celu wyeliminowania czynnika szczęścia.

Niektórzy badacze opracowali aplikację internetową, w której ludzie mogli grać i oceniać jakość sztucznej inteligencji. Tak więc od grudnia 2012 r. można było znaleźć następujące najlepsze grupy i indywidualnych agentów badaczy:

  • Hyperborean (9 złotych, 5 srebrnych i 3 brązowe)
  • Bluffbot (1 złoty, 3 srebrne i 2 brązowe medale)
  • Sartre (1 złoty, 5 srebrnych i 3 brązowe medale)
  • Neo Poker Bot (1 złoty, 5 brązowych medali)

Wyniki

2010
Heads-up Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. PULPO (Marv Andersen, Wielka Brytania)
2. Hyperborean-TBR (University of Alberta, Canada)
3. Sartre (University of Auckland, Nowa Zelandia)
1. Rockhopper (David Lin, USA)
2. GGValuta (Mihai Ciucu, Rumunia)
3. Hyperborean-IRO (Uniwersytet Alberta, Kanada)
Heads Up No Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Tartanian4-TBR (Carnegie Mellon University, USA)
2. PokerBotSLO (University of Maribor & Ljubljana, Słowenia)
3. HyperboreanNL-TBR (University of Alberta, Canada)
1. HyperboreanNL-IRO (University of Alberta, Kanada)
2. SartreNL (University of Auckland, Nowa Zelandia)
3. Tartanian4-IRO (Carnegie Mellon University, USA)
3-max Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Hyperborean3P-TBR (Uniwersytet Alberta, Kanada)
2. LittleRock (Rod Byrnes, Australia)
3. Bender (Uniwersytet Techniczny Darmstadt, Niemcy)
1. Hyperborean3P-IRO (University of Alberta, Kanada)
2. dcu3pl-IRO (Dublin City University, Irlandia)
3. LittleRock (Rod Byrnes, Australia)
2011

Heads-up Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Calamari (Marv Andersen, Wielka Brytania)
2. Sartre (University of Auckland, Nowa Zelandia)
3. Hyperborean-2011-2p-limit-tbr (University of Alberta, Canada)
1. Hyperborean-2011-2p-limit-iro (Uniwersytet Alberta, Kanada)
2. Slumbot (Eric Jackson, USA)
3. Kalmary (Marv Andersen, Wielka Brytania)
Heads Up No Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Lucky7 (Mikrospin doo, Słowenia)
2. SartreNL (University of Auckland, Nowa Zelandia)
3. Hyperborean-2011-2p-nolimit-tbr (University of Alberta, Kanada)
1. Hyperborean-2011-2p-nolimit-iro (Uniwersytet Alberta, Kanada)
2. SartreNL (Uniwersytet Auckland, Nowa Zelandia)
3. Hugh (USA i Kanada)
3-max Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Sartre3p (University of Auckland, Nowa Zelandia)
2. Hyperborean-2011-3p-limit-tbr (University of Alberta, Canada)
3. AAIMontybot (Uniwersytet Karola w Pradze, Czechy)
3. LittleRock (Rod Byrnes, Australia)
1. Hyperborean-2011-3p-limit-iro (University of Alberta, Kanada)
2. Sartre3p (University of Auckland, Nowa Zelandia)
3. LittleRock (Rod Byrnes, Australia)
2012
Heads-up Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Slumbot (Eric Jackson, USA)
2. Little Rock (Rod Byrnes, Australia)
2. Zbot (Ilkka Rajala, Finlandia)
1. Slumbot (Eric Jackson, USA)
2. Hyperborean (Uniwersytet Alberta, Kanada)
3. Zbot (Ilkka Rajala, Finlandia)
Heads Up No Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Little Rock (Rod Byrnes, Australia)
2. Hyperborean (University of Alberta, Kanada)
3. Tartanian 5 (Carnegie Mellon University, USA)
1. Hyperborean (University of Alberta, Kanada)
2. Tartanian5 (Carnegie Mellon University, USA)
3. Neo Poker Bot (Alexander Lee, Hiszpania)
3-max Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Hyperborean (University of Alberta, Kanada)
2. Little Rock (Rod Byrnes, Australia)
3. Neo Poker Bot (Alexander Lee, Hiszpania)
3. Sartre (University of Auckland, Nowa Zelandia)
1. Hyperborean (University of Alberta, Kanada)
2. Little Rock (Rod Byrnes, Australia)
3. Neo Poker Bot (Alexander Lee, Hiszpania)
3. Sartre (University of Auckland, Nowa Zelandia)
2013
Heads-up Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Marv (Marv Anderson, Wielka Brytania)
2. Feste (François Pays, Francja)
2. Hyperborean (University of Alberta, Kanada)
1. Neo Poker Bot (Alexander Lee, Hiszpania)
2. Hyperborean (University of Alberta, Kanada)
3. Zbot (Ilkka Rajala, Finlandia)
3. Marv (Marv Anderson, Wielka Brytania)
Heads Up No Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Slumbot NL (Eric Jackson, USA)
2. Hyperborean (University of Alberta, Kanada)
3. Tartanian6 (Carnegie Mellon University, USA)
1. Hyperborean (University of Alberta, Kanada)
2. Slumbot NL (Eric Jackson, USA)
3. Tartanian6 (Carnegie Mellon University, USA)
3. Nyx (Charles University, Czechy)
3-max Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Hyperborean (University of Alberta, Kanada)
2. Little Rock (Rod Byrnes, Australia)
3. Neo Poker Bot (Alexander Lee, Hiszpania)
1. Hyperborean (University of Alberta, Kanada)
2. Little Rock (Rod Byrnes, Australia)
3. Neo Poker Bot (Alexander Lee, Hiszpania)
2014
Heads-up Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Escabeche (Marv Andersen, Wielka Brytania)
2. SmooCT (University College London, Wielka Brytania)
3. Hyperborean (University of Alberta, Kanada)
3. Feste (Francois Pays, Francja)


Heads Up No Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Tartanian7 (Carnegie Mellon University, USA)
2. Nyx (Charles University, Czechy)
2. Prelude (Unfold Poker, USA)
2. Slumbot (Eric Jackson, USA)
1. Tartanian7 (Carnegie Mellon University, USA)
2. Prelude (Unfold Poker, USA)
2. Hyperborean (University of Alberta, Kanada)
2. Slumbot (Eric Jackson, USA)
3-max Limit Texas Hold'em
Całkowity bankroll Natychmiastowa wyprzedaż bankrolla
1. Hyperborean (University of Alberta, Canada)
2. SmooCT (University College London, UK)
3. KEmpfer (Technische Universität Darmstadt, Germany)
1. Hyperborean (University of Alberta, Canada)
2. SmooCT (University College London, UK)
3. KEmpfer (Technische Universität Darmstadt, Germany)

Zobacz też

Bibliografia

Zewnętrzne linki