Nash-evenwicht.

click fraud protection

In 1930 John von Neumann en Oskar Morgenstern werd de oprichters van een nieuwe interessante richting van de wiskunde, die werd genoemd "Game Theory".In de jaren 1950, werd deze trend geïnteresseerd in de jonge wiskundige John Nash.Evenwichtstheorie werd het onderwerp van zijn proefschrift, dat hij schreef op de leeftijd van 21 jaar oud.Zo ontstond een nieuwe strategie spel genaamd "Nash-evenwicht", verdiende de Nobelprijs vele jaren later - in 1994.

lange kloof tussen het schrijven van een proefschrift en werd universeel geaccepteerde test voor wiskunde.Genie zonder erkenning resulteerde in ernstige psychische stoornissen, maar ook de taak John Nash was in staat om op te lossen dankzij de uitstekende logicheskumu geest.Zijn theorie van de 'Nash-evenwicht "bekroond met de Nobel en zijn leven in de verfilming van" Beautiful Mind »(« A Beautiful Mind').

kort op speltheorie

Sinds Nash-evenwicht theorie verklaart het menselijk gedrag op het gebied van interactie, dus je moet rekening houden met de basisbegrippen van de speltheorie.

Speltheorie bestudeert het gedrag van de deelnemers (agents) in het milieu met elkaar door het soort spel waar het resultaat is afhankelijk van de beslissingen en het gedrag van een paar mensen.Lid neemt beslissingen op basis van hun verwachtingen over het gedrag van anderen, dat heet een gaming strategie.

Er is ook een dominante strategie, waarin de deelnemer krijgt de beste resultaten bij het gedrag van andere deelnemers.Dit is de beste strategie bezproigryshnaya speler.Dilemma

Prisoner's en de doorbraak Dilemma

Prisoner's - het is het geval met het spel, waar de deelnemers moeten rationele beslissingen te nemen, het bereiken van de algemene doelstelling van alternatieven in conflictsituaties.De vraag is, welke van deze opties te kiezen, bewust van persoonlijk en algemeen belang, en het onvermogen om iets, en nog veel meer te krijgen.Spelers als ingesloten in een zware spelen omstandigheden, die soms maakt ze denken dat zeer productief.

dit dilemma onderzocht de Amerikaanse wiskundige John Nash.Het saldo, dat hij leidde, was revolutionair op zijn eigen manier.De sterke nieuw idee invloed op de mening van economen over hoe aan een verscheidenheid van spelers op de markt, rekening houdend met de belangen van anderen, met een dichte interactie en kruising van belangen.

Het beste is om speltheorie met concrete voorbeelden te bestuderen, omdat deze wiskundige discipline zelf is niet droog en theoretisch.

Voorbeeld prisoner's dilemma

bijvoorbeeld twee mannen gepleegd de overval, viel in de handen van de politie en worden ondervraagd in afzonderlijke cellen.Tegelijkertijd hebben de ministers van de politie te bieden elke deelnemer gunstige omstandigheden waaronder het zal worden uitgebracht in de zaak getuigen tegen zijn partner.Elk van criminelen er volgend set van strategieën die zal overwegen:

  1. Beide tegelijkertijd de getuigenis en ontvangen 2,5 jaar in de gevangenis.
  2. Zowel stil en tegelijkertijd naar 1 jaar, zoals in dit geval de feitenbank hun schuld klein zijn.
  3. Eén getuigt en krijgt gratis en de andere is stil en krijgt 5 jaar in de gevangenis.

Uiteraard is de uitkomst van de zaak afhangt van de beslissing van beide partijen, maar ze kunnen niet tot een akkoord komen, want zitten in verschillende cellen.Ook duidelijk zichtbaar voor het conflict van hun persoonlijke belangen in de strijd voor een gemeenschappelijk belang.Elke gevangene heeft twee opties en 4 versie uitkomsten.

keten van logisch redeneren

Dus de dader, maar om de volgende opties te overwegen:

  1. Ik ben rustig en stil is mijn partner - we allebei 1 jaar in de gevangenis.
  2. ik een partner huren en neemt hij mij - we allebei 2,5 jaar in de gevangenis.
  3. Ik ben stil, en mijn vriend gaat - ik krijg vijf jaar in de gevangenis, en hij werd vrijgelaten.
  4. Ik geef partner, maar hij is stil - ik krijg de vrijheid, is hij 5 jaar in de gevangenis.

verminderen van de matrix van mogelijke oplossingen en uitkomsten voor de duidelijkheid.

Tabel waarschijnlijke uitkomsten prisoner's dilemma.

vraag is dat elke deelnemer zal kiezen?

«Hou je mond, je kunt niet zeggen" of "kan niet zwijgen, spreken»

Om de keuze van de deelnemer te begrijpen, moet je door zijn ketting van het denken.Naar aanleiding van de argumenten dader En als ik niets te zeggen en niets zeggen mijn partner, zullen we een minimale periode (1 jaar) te krijgen, maar ik kan niet zien hoe hij zich zal gedragen.Als hij geeft bewijs tegen mij, ik ook beter om getuigenis af te leggen, anders kan ik naar beneden voor 5 jaar zitten.Ik zou liever gaan zitten om 2,5 jaar dan 5 jaar.Als hij stil is, dan is het meer ik nodig om te getuigen, maar ook, zal ik de vrijheid te krijgen.Ook lezingen en deelnemer B.

is gemakkelijk te begrijpen dat de dominante strategie voor elk van de criminelen - een getuigenis.Het optimale punt van het spel vindt plaats wanneer zowel de dader getuigen en ontvang uw "prijs" - 2,5 jaar in de gevangenis.Game Theory Nash noemt dit evenwicht.

optimale oplossing Niet-optimale Nash

neshevskogo De revolutionaire opvatting dat een dergelijk evenwicht is niet optimaal, als we rekening houden met de individuele deelnemer en zijn persoonlijke interesse.Immers, de beste optie - is om te zwijgen en worden vrijgegeven.

Nash-evenwicht - is het aanspreekpunt van belang, waarbij elke deelnemer kiest voor deze optie, die optimaal is voor hem alleen op voorwaarde dat de andere deelnemers kiezen voor een bepaalde strategie.

overweegt een optie wanneer zowel de dader en ontvang alle stil 1 jaar, kan een Pareto-optimale variant worden genoemd.Het is echter alleen mogelijk als de criminelen in staat waren om tot een akkoord te komen op voorhand.Maar zelfs dat zou niet garanderen dat dit resultaat, omdat de verleiding om terug te vallen op overreding en vermijd grote boetes.Het ontbreken van volledige vertrouwen in elkaar en krijg 5 jaar, is het risico van gedwongen bekentenis te kiezen.Mediteren op het feit dat de deelnemers zal vasthouden aan de uitvoering met stille, die in onderling overleg, gewoon irrationeel.Een dergelijke conclusie kan worden gemaakt, als we de studie van de Nash-evenwicht.Slechts voorbeelden bewijzen rechts.

Egoïstisch of beheerder

theorie Nash-evenwicht, gezien de overweldigende conclusies oprovergnuvshie beschikbaar om dit principe.Bijvoorbeeld, Adam Smith, als het gedrag van elk van de deelnemers volstrekt zelfzuchtig en dat brengt het systeem in evenwicht.Deze theorie werd de "onzichtbare hand van de markt" genoemd.

John Nash zag dat als alle partijen om te handelen in de uitoefening van hun eigen belang alleen, het zal nooit leiden tot een optimaal groepsresultaat.Gezien het feit dat rationeel denken is inherent aan elke partij, een meer waarschijnlijke keuze, welke strategie Nash-evenwicht biedt.

puur mannelijke experiment

opvallend voorbeeld is het spel "een paradox blonde", die, hoewel het lijkt niet op zijn plaats, maar is een levendige illustratie die laat zien hoe de speltheorie Nash.

In dit spel moet je voor te stellen dat het bedrijf vrij is van jongens kwam naar de bar.Waar het bedrijf van meisjes, waarvan de voorkeur de andere, bijvoorbeeld de blonde.Als de jongens te gedragen, om de beste vriendin voor jezelf?

Dus jongens redenering: als iedereen waarschijnlijk kennis zal komen met de blonde, dan zal het niet iedereen krijgen, dan haar vrienden zullen niet willen verkennen.Niemand wil de tweede fall-back optie.Maar als jullie kiezen om de blonde, dan is de kans van elk van de jongens te voorkomen dat het vinden van een goede vriend onder meisjes is hoog.

Nash-evenwicht is niet optimaal voor de jongens, omdat het nastreven van alleen hun eigen egoïstische belangen, elk zou kiezen deze blonde.Het is gezien dat alleen het nastreven van eigenbelang neer op de ineenstorting van de groep belangen zou zijn.Nash-evenwicht zou betekenen dat elke man handelt in hun eigen belang, die in contact staan ​​met de belangen van de hele groep.Deze sub-optimale keuze voor elke persoon, maar het beste voor iedereen, betrokken op de totale strategie voor succes.

Ons hele leven is een spel

Besluitvorming in de echte wereld is zeer vergelijkbaar met het spel wanneer je een bepaald rationeel gedrag van de andere deelnemers verwacht.In het bedrijfsleven, werken in een team, in een bedrijf, zelfs in een relatie met het andere geslacht.Van grote transacties en het gewone leven situaties alles is onderworpen aan een bijzondere wet.

natuurlijk beschouwd voor spelsituaties met criminelen en de bar - het is gewoon een uitstekende illustratie die het Nash-evenwicht.Voorbeelden van dergelijke dilemma's vaak in de echte markt, en vooral bij de twee monopolisten die de markt te controleren.

Gemengde strategieën

vovlekaemy Vaak zijn we niet in één, maar in meerdere games.Door te kiezen voor een van de opties een spel, geleid door een rationele strategie, maar krijg je een ander spel.Na enkele rationele beslissingen die je kan vinden dat uw resultaten niet.Wat mee te nemen?

overwegen twee soorten strategieën:

  • Net strategie - is het gedrag van de deelnemer die afkomstig is van reflectie over de mogelijke gedrag van de andere deelnemers.
  • gemengde strategie of casual strategie - deze afwisseling van pure strategieën willekeurige selectie of pure strategie met een zekere waarschijnlijkheid.Deze strategie wordt genoemd rendomizirovannoy.

Gezien dit gedrag, krijgen we een nieuw perspectief op de balans van Nashua.Als u eerder zei dat de speler kiest de strategie eens, en men kan een ander gedrag voorstellen.U kunt de mogelijkheid dat spelers kiezen strategieën willekeurig met een zekere waarschijnlijkheid voorkomen.Games waarin je een Nash-evenwicht in pure strategieën niet kunt vinden, zijn ze altijd gemengd.

Nash-evenwicht in gemengde strategieën wordt een gemengde balans. Het is een evenwicht, waarbij elke deelnemer kiest de optimale frequentie kiezen hun strategieën, mits de andere leden kiezen hun strategieën met een vooraf bepaalde frequentie.

Sancties en gemengde strategie

voorbeeld van een gemengde strategie kan resulteren in een potje voetbal.De beste illustratie van de gemengde strategie - dit is waarschijnlijk de sancties.Dus, we hebben een keeper die kan springen maar in een hoek, en de speler die gaat om een ​​boete te verslaan.

Dus, als de eerste keer dat de speler kiest een strategie om een ​​effect in de linkerhoek en de doelverdediger vallen ook in deze hoek te maken en de bal vangen, hoe de gebeurtenissen kan een tweede keer te ontwikkelen?Als een speler wordt geraakt aan de tegenoverliggende hoek, het is waarschijnlijk ook voor de hand liggend, maar raakte in dezelfde hoek van niet minder dan voor de hand.Daarom is de keeper, en het beslag heeft geen andere keuze dan te vertrouwen op willekeurige selectie.

Dus, afgewisseld willekeurige selectie van een bepaalde pure strategie, speler en doelman pytajutsja krijgen maximale resultaten.