Što je dilema zatvorenika?

U samoj igri predstavljaju kazne (i nagrade, gdje je to relevantno) korisnost brojevi. Pozitivni brojevi predstavljaju dobre rezultate, negativni brojevi loše rezultate, a jedan je ishod bolji od drugog ako je broj s njim veći. (No budite oprezni kako to djeluje na negativne brojeve, jer je, na primjer, -5 veće od -20!)

U gornjoj tablici, prvi broj u svakom okviru odnosi se na ishod za igrača 1, a drugi broj predstavlja ishod za igrača 2. Ovi brojevi predstavljaju samo jedan od mnogih skupova brojeva koji su u skladu s postavljanjem dileme zatvorenika.

Jednom kada je igra definirana, sljedeći korak u analizi igre je procijeniti igračeve strategije i pokušati shvatiti kako se igrači vjerojatno ponašaju. Ekonomisti daju nekoliko pretpostavki kad analiziraju igre, prvo pretpostavljaju da su oba igrača svjesna isplativanje i sebi i drugom igraču, i, drugo, oni pretpostavljaju da oba igrača traže do racionalno maksimizirati svoje vlastito plaćanje od igre.

Jednostavan početni pristup je tražiti ono što se zove

instagram viewer

dominantne strategije- strategije koje su najbolje bez obzira na strategiju koju drugi igrač odabere. U gornjem primjeru, izbor priznanja dominantna je strategija za oba igrača:

S obzirom da je ispovjedništvo najbolje za oba igrača, nije iznenađujuće da je ishod u kojem oba igrača priznaju ravnotežni ishod igre. U tom smislu, važno je biti malo precizniji s našom definicijom.

Koncept a Neš ravnoteža kodificirao je matematičar i teoretičar igre John Nash. Jednostavno rečeno, Nash-ova ravnoteža je skup najboljih načina reagiranja. Za igru za dva igrača, Nash-ova ravnoteža je ishod u kojem je strategija igrača 2 najbolji odgovor na strategiju igrača 1, a strategija igrača 1 najbolji je odgovor na strategiju igrača 2.

Pronalaženje Nash-ove ravnoteže putem ovog načela može se ilustrirati u tablici rezultata. U ovom su primjeru najbolji odgovori igrača 2 zaokruženi zelenom bojom. Ako igrač 1 prizna, najbolji odgovor igrača 2 je priznati, jer je -6 bolji od -10. Ako igrač 1 ne prizna, najbolji odgovor igrača 2 je priznati, jer je 0 bolji od -1. (Imajte na umu da je ovo obrazloženje vrlo slično mišljenju koje se koristi za identificiranje dominantnih strategija.)

Najbolje reakcije igrača 1 zaokružene su plavom bojom. Ako igrač 2 prizna, najbolji odgovor igrača 1 je priznati, jer je -6 bolji od -10. Ako igrač 2 ne prizna, najbolji odgovor igrača 1 je priznati, jer je 0 bolji od -1.

Nash-ova ravnoteža je ishod kad postoji i zeleni i plavi krug jer to predstavlja skup najboljih strategija odgovora za oba igrača. Općenito, moguće je imati više Nash-ovih ravnoteža ili ih uopće nema (barem u čistim strategijama kako je ovdje opisano).

Možda ste primijetili da se Nešova ravnoteža u ovom primjeru na neki način čini nedovoljnom (konkretno, jer nije Pareto optimalno) jer je moguće da oba igrača dobiju -1 a ne -6. To je prirodan ishod interakcije prisutne u igri u teoriji, a ne bi priznavanje bilo pravo optimalna strategija za grupu kolektivno, ali pojedinačni poticaji sprječavaju ovaj rezultat postignut. Na primjer, ako igrač 1 misli da će igrač 2 ostati nijem, imao bi poticaj da ga šutira umjesto da šuti i obrnuto.

Iz tog razloga, Nash-ova ravnoteža može se također smatrati ishodom kada niti jedan igrač nema poticaj da jednostrano (tj. Sam od sebe) odstupi od strategije koja je dovela do tog ishoda. U gornjem primjeru, jednom kada igrači odluče priznati, niti jedan igrač ne može bolje mijenjati svoje mišljenje.