Nash rovnováha.

click fraud protection

V roku 1930 John von Neumann a Oskar Morgenstern sa stali zakladateľmi nového zaujímavého smeru matematiky, ktorý bol nazývaný "Teória hier".V roku 1950, tento trend sa začal zaujímať o mladého matematika John Nash.Teória Equilibrium sa stala témou jeho diplomovej práce, ktorú napísal vo veku 21 rokov.Tak sa zrodila nová strategická hra s názvom "nashova rovnováha", zaslúžil Nobelovu cenu o mnoho rokov neskôr - v roku 1994.

dlhá medzera medzi písanie dizertačnej práce a stal sa všeobecne prijímaný test pre matematiku.Genius bez uznania za následok vážnu duševnou poruchou, ale aj úlohou John Nash bol schopný riešiť vďaka vynikajúcej logicheskumu mysle.Jeho teória o "rovnováhe Nasha" udelená Nobelova a jeho život vo filmovej adaptácii «Beautiful Mind" ("A Beautiful Mind").

krátko teórie hier

Vzhľadom k tomu, Nash rovnováhy teória vysvetľuje ľudské správanie, pokiaľ ide o interakciu, takže by ste mali zvážiť základné pojmy z teórie hier.Teória

hier študuje správanie účastníkov (agentov) v životnom prostredí na seba vzájomne pôsobia podľa typu hry, kde výsledok závisí na rozhodnutí a správanie niekoľkých málo ľudí.Členské prijíma rozhodnutia na základe ich očakávania ohľadom správania ostatných, ktoré sa nazýva herné stratégie.

K dispozícii je tiež dominantné stratégie, v ktorých účastník dosahuje najlepšie výsledky, keď sa správanie všetkých ostatných účastníkov.To je najlepšia stratégia bezproigryshnaya hráčom.Dilema

väzni a prielom

väzenskom dileme - to je prípad s hrou, kde majú účastníci k racionálne rozhodnutia, dosiahnutie celkového cieľa alternatív v konfliktných situáciách.Otázkou je, ktorá z týchto možností bude vyberať, vedomý si osobné a všeobecnom záujme, a neschopnosť dostať niečo, a ďalšie.Hráči ako uzavretý v ťažkej hracej podmienky, ktoré sa niekedy robí si myslí, že veľmi produktívne.

túto dilemu preskúmali americký matematik John Nash.Rovnováha, ktorú viedol, bol revolučný v jeho vlastným spôsobom.Silná nová myšlienka ovplyvnila názor ekonómov o tom, ako vytvoriť rad hráčov na trhu, so zreteľom na záujmy ostatných, s hustou interakciu a priesečníkom záujmov.

Najlepšie je študovať teóriu hier s konkrétnymi príkladmi, pretože táto matematická disciplína sama o sebe nie je suchý a teoretická.Dilema

príklad

napríklad väzeň, dvaja muži spáchal lúpež, padol do rúk polície a sú vypočúvaní v samostatných bunkách.Zároveň ministri polícia ponúknuť každý účastník priaznivé podmienky, za ktorých bude uvoľnené v prípade svedčiť proti svojmu partnerovi.Každý z zločincov tam budúci súbor stratégií, že bude skúmať:
  1. Oba súčasne podať svedectvo a prijímať 2,5 rokov vo väzení.
  2. Obaja tichý a súčasne dostať na 1 rok, pretože v tomto prípade dôkazy základňa ich vine bude malý.
  3. Jeden svedčí o tom, a dostane voľný a druhý je tichý a dostane 5 rokov vo väzení.

Je zrejmé, že vyriešenie sporu závisí na rozhodnutí oboch strán, ale nemôžu dospieť k dohode, pretože sedí v rôznych bunkách.Tiež jasne viditeľné stretu ich osobnými záujmami v boji za spoločným záujmom.Každý väzeň má dve možnosti a 4 verzie výsledky.

reťazec logické uvažovanie

Takže páchateľ, ale zvážte nasledujúce možnosti:

  1. Som pokojný a tichý je môj partner - my obaja získate 1 rok vo väzení.
  2. Prenajal som si partnera, a on ma vezme - my obaja dostať 2,5 rokov vo väzení.
  3. mlčím, a môj kamarát prechádza - Pristavím päť rokov vo väzení a bol prepustený.
  4. dávam družku, ale on je ticho - mám sloboda, to je 5 rokov vo väzení.

znížiť maticu možných riešení a výsledky pre prehľadnosť.

Tabuľka pravdepodobné výsledky väzňova dilema.

otázka je, že každý účastník vybrať?

"Drž hubu, nemôžete povedať", alebo "nemôže mlčať, hovoriť»

Aby sme pochopili výber účastníka, musíte ísť cez jeho reťaz myšlienky.V nadväznosti na tvrdenia páchateľa A ak by som nič nepovedal a hovoriť nič môj partner, dostaneme minimálnu dobu (1 rok), ale nevidím, ako sa bude správať.Keby svedčia proti mne, ja tiež lepšie svedčiť, inak by som si sadnúť na 5 rokov.Ja by som radšej sadnúť do 2,5 rokov ako 5 rokov.Ak je ticho, potom tým viac musím vypovedať, rovnako, budem mať slobodu.Podobne, rozhovory a účastníka B.

je ľahké pochopiť, že dominantný stratégie pre každú z tých zločincov, - svedectvo.Optimálna bodom hry nastane, keď obe páchateľ vypovedať a objednajte si "cenu" - 2,5 rokov vo väzení.Teória hier Nash nazýva túto rovnováhu.

optimálne riešenie Non-optimálnu Nash

neshevskogo Revolučný názor, že takáto rovnováha nie je optimálna, ak vezmeme do úvahy individuálne účastníka a jeho osobný záujem.Koniec koncov, najlepšou voľbou - je mlčať a byť prepustený.

nashova rovnováha - je kontaktným miestom úrokov, kde každý účastník zvolí túto možnosť, ktorá je optimálna pre neho iba pod podmienkou, že ostatní účastníci zvoliť konkrétnu stratégiu.

zvažuje možnosť, keď ako páchateľ a prijímať všetko ticho po dobu 1 roka, môže byť nazývaný Pareto-optimálne variant.Avšak, to je možné iba v prípade, že zločinci boli schopní dospieť k dohode s predstihom.Ale ani to by nebolo zárukou tohto výsledku, pretože pokušenie uchýliť k presviedčanie a vyhnúť sa veľkým penále.Nedostatok plnou dôverou v seba a získať 5 rokov, je riziko núteného vyznania zvoliť.Meditujte na tom, že účastníci budú držať na verziu s tichý, konajúce v zhode, jednoducho iracionálne.Takýto záver môže byť, ak budeme študovať Nash rovnováhu.Príkladom za pravdu len.

Sebecky alebo spravovať

teórie Nash rovnováhu s ohľadom na závery ohromujúci oprovergnuvshie k dispozícii na tejto zásady.Napríklad, Adam Smith, považovaný za správanie každého z účastníkov ako úplne sebecký, a ktorý prináša do systému do rovnováhy.Táto teória bola nazývaná "neviditeľná ruka trhu".

John Nash videl, že ak všetky strany konať v snahe o svojich vlastných záujmov iba, to nikdy nepovedie k optimálnemu výsledku skupiny.Vzhľadom k tomu, že racionálne myslenie je vlastné každej strane, je viac pravdepodobné, voľba, ktorá ponúka strategické Nash rovnováhy.

čisto mužskej experiment

príkladom zarážajúce je hra "paradox blondína", ktoré, aj keď sa zdá z miesta, ale je to živý obrázok, ktorý ukazuje, ako sa teória hier Nash.

V tejto hre budete musieť predstaviť, že spoločnosť je bez chlapov prišla do baru.Neďaleko je spoločnosť dievčat, z ktorých jedna je lepšia ako ostatné, hovorí blondína.Pretože chlapci správať, získať čo najlepšiu priateľku pre seba?

Takže chlapci uvažovania: keby všetci sa zoznámi s blondína, potom s najväčšou pravdepodobnosťou, bude to nedostane nikoho, potom sa jej priatelia nebudú chcieť prezrieť.Nikto nechce byť druhá možnosť pádu späť.Ale ak vy rozhodnete vyhnúť blondínka, potom pravdepodobnosť každého z chalanov nájsť dobrý priateľ u dievčat je vysoká.

nashova rovnováha nie je optimálna pre chlapcov, pretože sleduje len svoje sebecké záujmy, každý by si vybral to blondína.Je vidieť, že len honba za vlastnom záujme by sa rovnalo zrútenie záujmov skupín.Nashova rovnováha by znamenalo, že každý človek chová vo svojom vlastnom záujme, ktoré sú v kontakte so záujmami celej skupiny.Táto čiastková optimálnou voľbou pre každú osobu, ale pre každého niečo, na základe celkovej stratégie úspechu.

Celý náš život je hra

Rozhodovanie v reálnom svete je veľmi podobný hry, kedy môžete očakávať určité racionálne správanie od ostatných účastníkov.V podnikaní, pracovať v tíme, v spoločnosti, a to aj vo vzťahu s opačným pohlavím.Z veľkej transakcie a bežných životných situáciách všetko je predmetom osobitný zákon.

samozrejme uvažovať o herných situáciách sa zločinci a bare - je to len vynikajúci ilustrácie zobrazujúce Nash rovnováhu.Príklady takýchto dilem často vznikajú v reálnom trhu, a to najmä v prípade dvoch monopolistov, ktorí ovládajú trh.

zmiešané stratégie

vovlekaemy Často nie sme v jednom, ale v niekoľkých hrách.Výberom jednej z možností jednej hre, pod vedením racionálne stratégií, ale dostať inú hru.Po niekoľkých racionálne rozhodnutie, možno zistíte, že vaše výsledky nie sú.Čo vziať?

vziať do úvahy dva typy stratégií:

  • Net stratégie - je správanie účastníka, ktorý pochádza z úvah o možnom správaní ostatných účastníkov.
  • zmiešaná stratégie alebo príležitostné stratégia - toto striedanie čistých stratégií náhodného výberu, alebo čistá stratégie s určitou pravdepodobnosťou.Táto stratégia sa nazýva rendomizirovannoy.

Vzhľadom k tomuto správaniu, dostaneme nový pohľad na rovnováhu Nashua.Ak ste už skôr povedal, že hráč si vyberie stratégiu raz, a možno si predstaviť rôzne správanie.Môžete vyhnúť sa možnosti, že hráči voľby stratégie náhodne s určitou pravdepodobnosťou.Hier, v ktorých nemôžete nájsť Nash rovnováhu v čistých stratégiách, sú vždy zmiešané.

nashova rovnováha v zmiešaných stratégiách sa o zmiešané bilancie. Je to rovnováha, kde každý účastník vyberie optimálna frekvencia výberom svoje stratégie, za predpokladu, že ostatní členovia zvoliť svoje stratégie s vopred stanovenou frekvenciou.

Sankcie a zmiešaná stratégie

príklad zmiešaného stratégia môže viesť k futbalu.Najlepšie ilustrácie zmiešané stratégie - to je asi sankcie.Takže, máme brankára, ktorý môže skočiť iba v jednom rohu, a hráč, ktorý sa chystá poraziť trest.

Takže, ak prvýkrát hráč zvolí stratégiu, aby dopad v ľavom rohu a brankára takisto spadá do tejto zákruty a chytiť loptu, ako sa udalosti môžu vyvinúť druhýkrát?Pokiaľ je hráč zasiahnutý do protiľahlého rohu, je to pravdepodobne príliš zrejmé, ale narazí na rovnaký uhol nie menší než zrejmý.Preto, brankár, a cesto nemá inú možnosť ako sa spoľahnúť na náhodného výberu.

Takže, striedajúci sa náhodný výber určitého čistá stratégie, hráč a brankár pytajutsja získať maximálne výsledky.