Nash Equilibrium.

click fraud protection

I 1930 John von Neumann og Oskar Morgenstern ble grunnleggerne av en ny interessant retning av matematikk, som ble kalt "Game Theory".På 1950-tallet ble denne trenden interessert i den unge matematikeren John Nash.Likevekt teori ble gjenstand for hans avhandling, som han skrev i en alder av 21 år gamle.Dermed ble født en ny strategi spill kalt "Nash likevekt", fortjente de nobelpris mange år senere - i 1994.

lang gap mellom skriving av en avhandling og ble allment akseptert test for matematikk.Genius uten anerkjennelse resultert i alvorlige psykiske lidelser, men også oppgaven John Nash var i stand til å løse takket være utmerket logicheskumu sinnet.Hans teori om "Nash likevekt" tildelt Nobel og hans liv i filmatiseringen av «Beautiful Mind» («A Beautiful Mind»).

kort på spillteori

Siden Nash likevekt teori forklarer menneskelig atferd i form av samhandling, så du bør vurdere de grunnleggende begreper i spillteori.

Spillteori studerer atferden til deltakerne (agenter) i miljøet samhandle med hverandre ved den type spill hvor utfallet avhenger av beslutninger og atferd av noen få personer.Medlem tar avgjørelser basert på deres forventninger om oppførselen til andre, som kalles en spillstrategi.

Det er også en dominant strategi, der deltakeren får de beste resultatene når oppførselen til andre deltakere.Dette er den beste strategien bezproigryshnaya spiller.

Fangens Dilemma og gjennombrudd

Fangens Dilemma - er det tilfelle med spillet, hvor deltakerne har til å foreta rasjonelle beslutninger, å oppnå det overordnede målet for alternativer i konfliktsituasjoner.Spørsmålet er, hvilke av disse alternativene vil den velge, klar over personlig og allmenn interesse, og manglende evne til å få noe, og mer.Spillere som vedlagt i en tøff spilleforhold, som noen ganger gjør dem tror veldig produktive.

dette dilemmaet utforsket den amerikanske matematikeren John Nash.Balansen, som han ledet, var revolusjonerende i sin egen måte.Den sterke ny idé påvirket den oppfatning av økonomer om hvordan å gjøre en rekke aktører i markedet, tar hensyn til andres interesser, med et tett samspill og krysset av interesser.

Det er best å studere spillteori med konkrete eksempler, fordi denne matematiske disiplin i seg selv er ikke tørt og teoretisk.

Eksempel Fangens dilemma

eksempel to menn begått ranet, falt i hendene på politiet og blir avhørt i separate celler.Samtidig ministrene av politiet tilby hver deltaker gunstige vilkår som vil bli utgitt i saken vitne mot sin partner.Hver av kriminelle der neste sett med strategier som den vil vurdere:

  1. Begge samtidig gi vitnesbyrd og motta 2,5 års fengsel.
  2. Både stille og samtidig komme til 1 år, som i dette tilfelle er erfaringsgrunnlaget for deres skyld vil være små.
  3. Ett vitner og får fri, og den andre er stille og får 5 års fengsel.

Selvfølgelig utfallet av saken avhenger avgjørelsen av begge parter, men de kan ikke komme til en avtale, fordi du sitter i forskjellige celler.Også godt synlig i konflikten av sine personlige interesser i kampen for en felles interesse.Hver fange har to alternativer og 4 versjon utfall.

kjede av logiske resonnementer

Så lovbryteren men å vurdere følgende alternativer:

  1. jeg er stille og rolig er min partner - vi begge får 1 år i fengsel.
  2. Jeg leier en partner, og han tar meg - vi begge får 2,5 år i fengsel.
  3. Jeg er taus, og min kompis passerer - Jeg skal få fem års fengsel, og han ble løslatt.
  4. jeg gi kompis, men han er taus - Jeg får frihet, han er 5 år i fengsel.

redusere matrise av mulige løsninger og utfall for klarhet.

Tabell sannsynlige utfall fangens dilemma.

spørsmålet er at hver deltaker vil velge?

«Hold kjeft, du kan ikke si" eller "kan ikke tie, for å snakke»

å forstå valget av deltakeren, må du gå gjennom sin tankerekke.Etter argumenter lovbryteren Og hvis jeg sier ingenting og si ingenting min partner, vil vi få et minimum periode (1 år), men jeg kan ikke se hvordan han vil oppføre seg.Hvis han gir bevis mot meg, jeg også bedre å gi bevis, ellers jeg kan sitte ned i 5 år.Jeg vil heller sitte ned til 2,5 år enn 5 år.Hvis han er taus, så jo mer jeg trenger å forklare seg, så vel, jeg får frihet.Tilsvarende er enkelt foredrag og deltaker B.

å forstå at den dominerende strategi for hver av de kriminelle - et vitnesbyrd.Den optimale Poenget med spillet oppstår når både lovbryteren vitner og motta din "premie" - 2,5 år i fengsel.Spillteori Nash kaller dette likevekt.

optimal løsning for ikke-optimal Nash

neshevskogo Den revolusjonerende syn at en slik balanse er ikke optimal, hvis vi tenker på den enkelte deltaker og hans personlige interesse.Tross alt, det beste alternativet - er å tie og å bli utgitt.

Nash likevekt - er kontaktpunktet av interesse, hvor hver deltaker velger dette alternativet, som er optimalt for ham bare på betingelse av at andre aktører velger en bestemt strategi.

vurderer et alternativ når både lovbryteren og motta alle stille i 1 år, kan kalles en Pareto-optimal variant.Men det er bare mulig hvis de kriminelle var i stand til å komme til en avtale på forhånd.Men selv det ville ikke garantere dette utfallet, fordi fristelsen til å falle tilbake på overtalelse og unngå store bøter.Mangelen på full tillit til hverandre og få 5 år, er risikoen for tvungen tilståelse å velge.Meditere på at deltakerne vil holde seg til den versjonen med stille, som handler i konserten, rett og slett irrasjonell.En slik konklusjon kan gjøres, hvis vi studerer Nash likevekt.Eksempler bare bevise høyre.

Selfishly eller leder

teori Nash likevekt gitt de fantastiske konklusjoner oprovergnuvshie tilgjengelig for dette prinsippet.For eksempel, Adam Smith, betraktet oppførselen til hver av deltakerne som helt egoistisk, og som bringer systemet i balanse.Denne teorien ble kalt den "usynlige hånd av markedet."

John Nash så at hvis alle parter til å handle i jakten på sine egne interesser bare, det vil aldri føre til optimal konsernresultatet.Gitt at rasjonell tenkning er iboende til hver av partene, en mer sannsynlig valg, som tilbyr strategi Nash likevekt.

rent mannlig eksperiment

slående eksempel er spillet "et paradoks blonde", som, selv om det virker malplassert, men er en levende illustrasjon som viser hvordan spillteori Nash.

I dette spillet må du forestille deg at selskapet er fri for gutter kom til baren.Nærliggende er selskapet av jenter, hvorav den ene er å foretrekke fremfor den andre, sier den blonde.Som guttene til å oppføre seg, for å få den beste kjæresten for deg selv?

Så folkens resonnement: hvis alle vil bli kjent med den blonde, så mest sannsynlig vil det ikke komme noen, så hennes venner ikke ønsker å utforske.Ingen ønsker å være den nest fall-back alternativet.Men hvis dere velger å unngå den blonde, så sannsynligheten for hver av gutta å finne en god venn blant jenter er høy.

Nash likevekt er ikke optimal for gutta fordi, forfølge bare sine egne egoistiske interesser, ville hver velge det blonde.Det er sett at bare jakten på egeninteresse ville være ensbetydende med å kollapsen av gruppeinteresser.Nash likevekt ville bety at hvert menneske fungerer i sine egne interesser, som er i kontakt med interessene til hele gruppen.Dette sub-optimale alternativet for hver person, men det beste for alle, basert på den overordnede strategien for å lykkes.

Hele livet er et spill

beslutninger i den virkelige verden er svært lik spillet når du forvente en viss rasjonell atferd fra de andre deltakerne.I næringslivet, arbeide i team, i et selskap, selv i et forhold med det motsatte kjønn.Fra store transaksjoner og til ordinære livssituasjoner alt er gjenstand for en bestemt lov.

selvfølgelig vurderes for spillsituasjoner med kriminelle og bar - er det bare utmerket illustrasjon som viser Nash likevekt.Eksempler på slike dilemma oppstår ofte i den virkelige marked, og spesielt i tilfelle av de to monopolinnehaveres som kontrollerer markedet.

Blandede strategier

vovlekaemy Ofte er vi ikke i ett, men i flere spill.Ved å velge ett av alternativene ett spill, guidet av en rasjonell strategi, men får et annet spill.Etter noen rasjonelle beslutninger kan du oppleve at resultatene ikke.Hva du skal ta?

vurdere to typer strategier:

  • Net strategi - er oppførselen til deltakeren som kommer fra refleksjon over mulige adferd av andre deltakere.
  • blandet strategi eller uformell strategi - denne vekslingen av rene strategier tilfeldig utvalg eller ren strategi med en viss sannsynlighet.Denne strategien kalles rendomizirovannoy.

Vurderer denne oppførselen, får vi et nytt perspektiv på balansen av Nashua.Hvis du tidligere har sagt at spilleren velger strategien gang, og man kan tenke seg en annen adferd.Du kan unngå muligheten for at spillere velger strategier tilfeldig med en viss sannsynlighet.Spill der du ikke kan finne en Nash likevekt i rene strategier, de er alltid blandet.

Nash likevekt i blandede strategier kalles en blandet balanse. Det er en balanse, hvor hver deltaker velger den optimale frekvensen velge sine strategier, forutsatt at de øvrige medlemmene velge sine strategier med en forhåndsbestemt frekvens.

Straff og blandet strategi

eksempel på en blandet strategi kan resultere i en fotballkamp.Den beste illustrasjonen på blandet strategi - dette er trolig de straffer.Så har vi en keeper som kan hoppe bare i ett hjørne, og den spilleren som kommer til å slå en straff.

Så hvis første gang spilleren velger en strategi for å gjøre et inntrykk i venstre hjørne og keeper også falle i dette hjørnet og fange ballen, kan hvordan hendelser utvikle en annen gang?Hvis en spiller blir truffet i motsatt hjørne, er det sannsynligvis for opplagt, men treffer samme vinkel på ikke mindre enn opplagt.Derfor har keeper, og røren ikke annet valg enn å stole på tilfeldig utvalg.

Så, alternerende tilfeldig utvalg av en viss ren strategi, spiller og keeper pytajutsja få maksimale resultater.