Nash Equilibrium.

Leta 1930 je John von Neumann in Oskar Morgenstern je postal ustanoviteljem nove zanimive smeri matematike, ki je bil imenovan "Game Theory".Leta 1950, je ta trend začel zanimati za mladega matematik John Nash.Teorija Equilibrium postal predmet njegove disertacije, ki jo je napisal pri starosti 21 let.Tako se je rodila nova strateška igra, ki se imenuje "Nash ravnovesje", zaslužil Nobelovo nagrado mnogo let kasneje - leta 1994.

dolgo vrzel med pisanje diplomske naloge in je postal splošno sprejet test za matematiko.Genius brez priznanja povzročila resnih duševnih motenj, ampak tudi naloga John Nash je uspelo rešiti, zahvaljujoč odličnemu logicheskumu mislih.Njegova teorija "Nash ravnovesje" prejela Nobelovo in njegovo življenje v filmu prilagoditev "Beautiful Mind" ("A Beautiful Mind").

kratko o teoriji igre

Od teorije Nash ravnovesne pojasnjuje človekovo vedenje v smislu interakcije, zato morate upoštevati osnovne pojme teorije iger.Teorija

Game proučuje obnašanje udeležencev (agents) v okolju vplivajo drug na drugega po vrsti igra, kjer je izid odvisen od odločitve in obnašanje nekaj ljudi.Članica sprejme odločitev na podlagi svojih pričakovanj o vedenju drugih, ki se imenuje strategija iger na srečo.

Obstaja tudi dominantna strategija, v kateri je udeleženec dobi najboljše rezultate, ko je ravnanje drugih udeležencev.To je najboljša strategija bezproigryshnaya igralec.Dilemma

Prisoner in preboj Dilemma

zapornika - to je primer z igro, kjer imajo udeleženci k razumnim odločitvam, doseganju skupnega cilja alternativ v situacijah konflikta.Vprašanje je, katera od teh možnosti bo, da izberejo, zaveda osebnega in splošnega interesa, in nezmožnost, da bi dobili nekaj, in še več.Igralci radi zaprti v težkih pogojih igranja, ki včasih jih naredi mislijo zelo produktivna.

ta dilema raziskoval ameriški matematik John Nash.Bilanca, ki jo je vodil, je bila revolucionarna na svoj način.Močna nova ideja vplivala na mnenje ekonomistov o tem, kako narediti različne akterjev na trgu, pri čemer upošteva interese drugih, z gosto interakcije in križišče interesov.

Zato je najbolje, da preuči teorijo iger s konkretnimi primeri, saj je to sama matematična disciplina ni suha in teoretično.

primer zapornika dilemo

primer, dva moška storila rop, padla v roke policiji in jih zasliševali v ločenih celicah.Hkrati so ministri policije ponuditi Vsak udeleženec ugodne pogoje, pod katerimi se bo sproščena v primeru pričati proti svojemu partnerju.Vsak od kriminalcev tam naslednji niz strategij, da bo preučila:

  1. Oboje hkrati izpovedati in prejeli 2,5 let v zaporu.
  2. Tako tiho in hkrati priti do 1 leta, kot v tem primeru, so dokazi o njihovi krivdi bo majhna.
  3. Ena priča in dobi brezplačno, drugi pa je tiho in dobi 5 let v zaporu.

Očitno je, da je odločitev v zadevi odvisna od odločitve obeh strank, vendar pa ne more priti do sporazuma, ker je sedel v različnih celicah.Prav tako je jasno vidno, da konflikta njihovih osebnih interesov v boju za skupni interes.Vsak zapornik ima dve možnosti in 4 različica izide.

veriga logičnega sklepanja

Torej je storilec ampak da preučijo naslednje možnosti:

  1. sem mirna in tiha je moj partner - oba sva dobili 1 leto v zaporu.
  2. najamete partnerja in on me popelje - oba sva dobili 2,5 let v zaporu.
  3. sem tiho, in moj prijatelj prehaja - bom dobil pet let zapora, in je bila sproščena.
  4. dam kolega, vendar je tiho - dobim svoboda, je 5 let v zaporu.

zmanjšanje matriko možnih rešitev in rezultatov zaradi jasnosti.

Tabela verjetne izide zapornikovo dilemo.

vprašanje je, da se bo vsak udeleženec izbrati?

"Utihni, ti ne morem reči," ali "ne more ostati tiho, rekoč»

Da bi razumeli izbiro udeleženca, morate iti skozi svojo verigo misli.Po argumentov storilca In če rečem nič in niti ne omenjamo mojega partnerja, bomo dobili minimalno obdobje (1 leto), vendar ne vidim, kako se bo on obnašal.Če je priča zoper mene, sem tudi bolje dati dokaze, sicer lahko sedli za 5 let.Jaz bi raje sedli za 2,5 let od 5 let.Če je tiho, potem je bolj moram dati dokaze, kot tudi, bom dobil svobodo.Podobno, pogovori in udeleženca B.

je težko razumeti, da je prevladujoča strategija za vsako od kriminalcev - pričevanje.Optimalna točka igre nastane, ko sta storilec pričati in prejeli vašo "nagrado" - 2,5 let v zaporu.Game Theory Nash imenuje to ravnovesje.

optimalna rešitev Non-optimalna Nash

neshevskogo The revolucionarno stališče, da je taka bilanca ni optimalna, če menimo, da posameznega udeleženca in njegov osebni interes.Konec koncev, najboljša možnost - je, da molči in se sprosti.

Nash equilibrium - je kontaktna točka interesa, kjer je vsak udeleženec izbere to možnost, ki je optimalna za njega samo pod pogojem, da drugi udeleženci izbere določeno strategijo.

upoštevamo možnost, ko sta storilec in prejemajo vse tiho za 1 leto, se lahko imenuje Pareto optimalna varianta.Vendar pa je možno le, če so kriminalci sposobni doseči dogovor vnaprej.Toda tudi to ne bi zagotovilo tega rezultata, ker je skušnjava, da pade nazaj na prepričevanja in se izogibati velikih kazni.Pomanjkanje popolnega zaupanja v drug drugega in dobili 5 let, tveganje prisilnega izpoved izbrati.Meditirajte na dejstvo, da bodo udeleženci držijo v različici s tiho, ki delujejo usklajeno, enostavno nerazumna.Tak sklep se lahko izvede, če preučujemo Nash ravnovesje.Primeri dokazujejo pravico samo.

sebično ali upravljanje

teorija Nash ravnovesje glede omamljanja sklepi oprovergnuvshie voljo s tem načelom.Na primer, Adam Smith, šteje obnašanje vsakega udeleženca kot absolutno sebičnega in ki prinaša sistem v ravnovesju.Ta teorija je bila imenovana "nevidna roka trga."

John Nash je videl, da če bi vse stranke, da ravnajo v zasledovanju lastnih interesov le, da nikoli ne bo privedlo do optimalnega rezultata skupine.Glede na to, da je racionalno razmišljanje značilno za vsako stranko, bolj verjetno izbira, ki nudi strateška Nash ravnovesje.

zgolj moški eksperiment

presenetljiv primer je igra "paradoks blondinka", ki je, čeprav se zdi, iz kraja, ampak je živa slika, ki prikazuje, kako se teorija iger Nash.

V tej igri boste morali zamisliti, da je družba brez fantje prišli do vrat.V bližini je družba deklet, od katerih je ena bolj pomembna od druge, pravijo blondinka.Kot fantje, da se obnašajo, da bi dobili najboljšo punco za sebe?

Torej fantje obrazložitev: če bodo vsi spoznate z blondinko, potem najverjetneje, da ne bo dobil nikogar, nato pa njeni prijatelji ne bodo želeli raziskati.Nihče ne želi biti druga možnost padec nazaj.Ampak, če vi odločite, da bi se izognili blondinka, potem je verjetnost vsakega od fantov, da bi našli dober prijatelj med dekleti je visoka.

Nash ravnovesje ni optimalna za fante, ker opravlja samo svoje lastne sebične interese, bi vsak izbere to blondinka.To je razvidno, da bi bila le zasledovanje lastnih interesov pomenilo propad interesov skupine.Nash equilibrium bi pomenilo, da je vsak človek deluje v lastnem interesu, ki so v stiku z interesi celotne skupine.Ta sub-optimalna možnost za vsako osebo, ampak za vsakogar, ki temelji na celoviti strategiji za uspeh.

Naše življenje je igra

Odločanje v realnem svetu je zelo podobna igri, ko ste pričakovali neko racionalno obnašanje od drugih udeležencev.V poslovnem svetu, delo v timu, v podjetju, tudi v odnosu z nasprotnim spolom.Od velikih poslov in navadnih življenjskih situacijah vse, kar je predmet posebnega zakona.

seveda velja za igralne situacije s kriminalci in vrat - to je samo odlična ilustracija prikazuje Nash ravnovesje.Primeri takih dilem pogosto pojavijo v realnem trgu, in še posebej v primeru dveh monopolistov ki nadzorujejo trga.

Mešane strategije

vovlekaemy Pogosto nismo v enem, ampak v več iger.Z izbiro ene od možnosti, ena tekma, ki jih usmerja racionalno strategijo, ampak je dobil drugačno igro.Po nekaj racionalnih odločitev, lahko ugotovite, da so vaši rezultati ne.Kaj vzeti?

upoštevati dve vrsti strategij:

  • Net strategije - je vedenje udeleženca, ki prihaja iz razmislek o morebitni vedenje drugih udeležencev.
  • mešana strategija ali priložnostno strategija - to menjavanje čistih strategij naključni izbor, ali pa čisto strategije z določeno verjetnostjo.Ta strategija se imenuje rendomizirovannoy.

Glede na to vedenje, smo dobili nov pogled na bilance Nashua.Če ste že prej dejal, da je igralec izbere strategijo enkrat, in lahko si predstavljam drugačno vedenje.Lahko bi se izognili možnosti, da bi igralci izbirajo strategije naključno z določeno verjetnostjo.Igre, v katerih jih ne morete najti v Nash ravnovesje v čistih strategijah, so vedno mešani.

Nash ravnovesje v mešanih strategijah se imenuje mešana ravnotežje. To je ravnotežje, kjer vsak udeleženec izbere optimalna frekvenca izbiranju svoje strategije, pod pogojem, da drugi člani izberejo svoje strategije z vnaprej določeno frekvenco.

Kazni in mešana strategija

primer mešane strategije, lahko povzroči v igri nogometa.Najboljša ilustracija mešane strategije - to je verjetno kazni.Torej, imamo vratarja, ki lahko skoči le v enem kotu, in igralec, ki bo premagal kazen.

Torej, če prvič igralec izbere strategijo, da bi vplivali na levem kotu in vratarja pade tudi v tem kotu in ujame žogo, kako dogodki lahko razvije še drugič?Če igralec dvignil do drugega kota, je verjetno tudi očitno, vendar je dvignil isti kot ne manj kot očitne.Zato je vratar in testo nima druge izbire, kot da se zanesejo na naključnem izboru.

Torej, izmenično naključno izberejo neke čisto strategije, igralca in vratarja pytajutsja dobite maksimalne rezultate.