Ponury spust - Grim trigger

W teorii gier , ponury wyzwalania (zwany również ponura strategia lub po prostu ponury ) to strategia spust na wielokrotnym gry.

Początkowo gracz używający ponurego wyzwalacza będzie współpracował, ale gdy tylko przeciwnik zdezerteruje (a tym samym spełni warunek wyzwalacza), gracz używający ponurego wyzwalacza będzie zdezerterować do końca iterowanej gry. Ponieważ pojedyncza defekt przeciwnika powoduje dezercję na zawsze, grim trigger jest najbardziej bezwzględną strategią w iterowanej grze.

W książce Roberta Axelroda The Evolution of Cooperation ponury wyzwalacz jest nazwany „Friedman”, dla artykułu Jamesa Friedmana z 1971 roku, który używa tego pojęcia.

Nieskończenie powtarzający się dylemat więźniów

Nieskończenie powtarzający się dylemat więźniów jest dobrze znanym przykładem ponurej strategii spustowej. Normalna gra dla dwóch więźniów wygląda następująco:

Więzień B Więzień A	Zachowuje milczenie (współpraca)	Zdradzić (Defekt)
Zachowuje milczenie (współpraca)	1, 1	-1, 2
Zdradzić (Defekt)	2, -1	0, 0

W dylemacie więźniów każdy gracz ma do wyboru dwie opcje na każdym etapie:

Współpracować
Wada do natychmiastowego zysku

Jeśli gracz zdarzy się defekt, zostanie ukarany do końca gry. W rzeczywistości obu graczom lepiej jest milczeć (współpracować) niż zdradzać drugiego, więc granie (C, C) jest profilem współpracy podczas gry (D, D), a także unikalną równowagą Nasha w tej grze jest profil kary.

W strategii grim trigger, gracz współpracuje w pierwszej rundzie oraz w kolejnych rundach, o ile jego przeciwnik nie złamie umowy. Gdy gracz odkryje, że przeciwnik zdradził w poprzedniej grze, odejdzie na zawsze.

W celu oceny idealnej równowagi podgry (SPE) dla następującej strategii ponurego wyzwalania w grze, strategia S* dla graczy i oraz j jest następująca:

Graj C w każdym okresie, chyba że ktoś kiedykolwiek grał D w przeszłości
Graj w D na zawsze, jeśli ktoś grał w D w przeszłości

Wtedy strategia jest SPE tylko wtedy, gdy współczynnik dyskonta wynosi . Innymi słowy, ani Gracz 1, ani Gracz 2 nie są zachęcani do odstępowania od profilu współpracy, jeśli współczynnik rabatu jest większy niż połowa. ${\textstyle \delta \geq {\frac {1}{2}}}$

Aby udowodnić, że strategia jest SPE, współpraca powinna być najlepszą odpowiedzią na współpracę drugiego gracza, a ucieczka powinna być najlepszą odpowiedzią na zdradę drugiego gracza.

Krok 1: Załóżmy, że do tej pory nie gra się D.

Gracz i wypłata z C : ${\ Displaystyle (1-\ delta ) [1 + \ delta + \ delta ^ {2} + ...] = (1-\ delta) \ razy {\ Frac {1} {1-\ delta}} = 1 }$
Gracz i wypłata z D : $(1-\delta)[2+0+0+...]=2(1-\delta)$

Wtedy C jest lepsze niż D, jeśli . To pokazuje, że jeśli granie w C jest optymalne w pareto . $1\geq 2(1-\delta)$ ${\ Displaystyle \ delta \ geq {\ Frac {1} {2}}}$

Krok 2: Załóżmy, że ktoś grał wcześniej D, a następnie gracz j zagra D bez względu na wszystko.

Gracz i wypłata z C : ${\ Displaystyle (1-\ delta) [-1+\delta \razy 0+\delta ^{2}\razy 0+...]=(1-\delta)\razy -1=\delta-1}$
Gracz i wypłata z D : ${\ Displaystyle (1-\ delta ) [0 + \ delta \ razy 0 + \ delta ^ {2} \ razy 0 + ...] = 0}$

Ponieważ granie w D jest optymalne. ${\ Displaystyle 0 \ równoważnik \ delta \ równoważnik 1}$

Powyższy argument podkreśla, że nie ma zachęty do odchodzenia (żadnego odchylenia opłacalnego) od profilu współpracy if , i dotyczy to każdej podgry. Dlatego strategią dla powtarzanej w nieskończoność gry z dylematami więźniów jest podgry Idealna równowaga Nasha. ${\ Displaystyle \ delta \ geq {\ Frac {1} {2}}}$

W iterowanych zawodach strategii dylematu więźnia, ponury spust działa słabo nawet bez hałasu , a dodanie błędów sygnału jeszcze gorzej. Jego zdolność do zagrażania trwałej dezercji daje mu teoretycznie skuteczny sposób na podtrzymywanie zaufania, ale ze względu na jego bezlitosny charakter i niemożność wcześniejszego poinformowania o tym zagrożeniu, radzi sobie słabo.

Ponury spust w stosunkach międzynarodowych

W obliczu ponurego spustu w perspektywie stosunków międzynarodowych naród współpracuje tylko wtedy, gdy jego partner nigdy go nie wykorzystywał w przeszłości. Ponieważ naród odmówi współpracy we wszystkich przyszłych okresach, gdy jego partner raz odpadnie, zerwanie współpracy na czas nieokreślony staje się zagrożeniem, które sprawia, że taka strategia jest przypadkiem ograniczającym. Chociaż ponury wyzwalacz jest przypadkiem ograniczającym, twierdzenie Folka mówi, że idealną równowagę można osiągnąć, jeśli oba narody są cierpliwe.

Ponury wyzwalacz w interakcjach użytkownik-sieć

Teoria gier została ostatnio wykorzystana przy tworzeniu przyszłych systemów komunikacyjnych, a jednym z takich przykładów jest użytkownik w grze interakcji użytkownik-sieć wykorzystującej strategię ponurego wyzwalania. Jeśli ponury wyzwalacz zdecyduje się użyć w grze interakcji użytkownik-sieć, użytkownik pozostaje w sieci (współpracuje), jeśli sieć utrzymuje określoną jakość, ale karze sieć, przerywając interakcję i opuszczając sieć, gdy tylko użytkownik dowiaduje się o wadach przeciwnika. Antoniou i in. wyjaśnia, że „biorąc pod uwagę taką strategię, sieć ma silniejszą motywację do dotrzymania obietnicy danej jakości, ponieważ grozi jej utrata klienta na zawsze”.

Porównanie z innymi strategiami

Strategie Tit for tat i Grim trigger mają podobny charakter, ponieważ obie są strategią triggerowania, w której gracz odmawia pierwszego zdrady, jeśli ma możliwość ukarania przeciwnika za zdradę. Różnica polega jednak na tym, że ponury spust dąży do maksymalnej kary za pojedynczą dezercję, podczas gdy tit za tat jest bardziej wyrozumiały, oferując jedną karę za każdą dezercję.

Languages

In other projects

Ponury spust - Grim trigger

Zawartość

Nieskończenie powtarzający się dylemat więźniów

Ponury spust w stosunkach międzynarodowych

Ponury wyzwalacz w interakcjach użytkownik-sieć

Porównanie z innymi strategiami

Zobacz też

Bibliografia