Nash Equilibrium.

click fraud protection

În 1930 John von Neumann și Oskar Morgenstern au devenit fondatorii o nouă direcție interesantă de matematică, care a fost numit "teoria jocurilor".În anii 1950, această tendință a devenit interesat de tânărul matematician John Nash.Teoria echilibrului a devenit subiectul tezei sale, pe care a scris la vârsta de 21 de ani.Astfel, sa născut o nouă joc de strategie numit "echilibru Nash", a meritat Premiul Nobel Mulți ani mai târziu - în 1994.

decalaj lung între scrierea unei disertații și a devenit universal acceptat test pentru matematică.Genius fără recunoaștere a dus la tulburări psihice grave, dar, de asemenea sarcina John Nash a fost capabil să rezolve datorită excelent mintea logicheskumu.Teoria sa a "echilibrului Nash" acordat Nobel și viața în adaptarea cinematografica a "Beautiful Mind» («A Beautiful Mind").

scurt pe teoria jocurilor

Din teoria echilibrului Nash explică comportamentul uman în termeni de interacțiune, astfel încât să ar trebui să analizeze conceptele de bază ale teoriei jocurilor.Teoria

joc studiază comportamentul participanților (agenți) în mediul interacționează unele cu altele prin tipul de joc în cazul în care rezultatul depinde de deciziile și comportamentul câțiva oameni.Membru ia decizii bazate pe așteptările lor cu privire la comportamentul altora, care se numește o strategie de joc.

Există, de asemenea o strategie dominantă, în care participantul obține cele mai bune rezultate atunci când comportamentul toți ceilalți participanți.Acesta este cel mai bun jucător de strategie bezproigryshnaya.Dilema

Prizonierul și descoperire Dilema

deținutului lui - acesta este cazul cu jocul, în cazul în care participanții trebuie să ia decizii raționale, realizarea obiectivului general de alternative în situații de conflict.Întrebarea este, care dintre aceste opțiuni se va alege, conștient de interes personal și general, și incapacitatea de a obține ceva, și mai mult.Jucători precum închise într-o condiții de joc dur, care, uneori, le face cred că foarte productive.

această dilemă explorat matematicianul american John Nash.Soldului, care a condus, a fost revoluționar în felul său.Puternic idee nouă influențat opinia economiștilor cu privire la modul de a face o varietate de jucători de pe piață, ținând seama de interesele altora, cu o interacțiune dens și intersecția de interese.

Cel mai bine este de a studia teoria jocului cu exemple concrete, pentru că această disciplină matematică în sine nu este uscat și teoretică.Dilemă

exemplu

Exemplul prizonier lui, doi oameni comis jaf, a căzut în mâinile poliției și sunt interogați în celule separate.În același timp, miniștrii de poliție oferă fiecare participant condiții favorabile în care va fi lansat în cazul depună mărturie împotriva partenerului său.Fiecare dintre criminali acolo următorul set de strategii care va lua în considerare:
  1. Ambele simultan mărturie și de a primi 2,5 ani de închisoare.
  2. Atât tăcut și, în același timp, ajunge la 1 an, ca și în acest caz, baza de probe de vinovăția lor va fi mic.
  3. O mărturisește și devine liber, iar celălalt este tăcut și devine 5 ani de închisoare.

Evident, rezultatul cauzei depinde de decizia de ambele părți, dar nu pot ajunge la un acord, pentru că stau în celule diferite.De asemenea, în mod clar vizibile la conflictul de interese personale în lupta pentru un interes comun.Fiecare prizonier are două opțiuni și 4 rezultate versiune.Lanț

de raționament logic

Deci infractorul, dar să ia în considerare următoarele opțiuni:

  1. Sunt liniștit și tăcut este partenerul meu - ne-am lua 1 an de închisoare.
  2. să închiriez un partener și el ma duce - ne-am obține 2,5 ani de închisoare.
  3. Sunt tăcut, și prietenul meu trece - Aduc cinci ani de închisoare, iar el a fost eliberat.
  4. dau pereche, dar el este tăcut - mă libertate, el este de 5 ani de închisoare.

reduce matricea de soluții posibile si a rezultatelor pentru claritate.

Tabelul rezultate probabile dilema prizonierului.

întrebare este că fiecare participant va alege?

«Taci, nu se poate spune" sau "nu poate rămâne tăcut, pentru a vorbi»

Pentru a înțelege alegerea participantului, trebuie să treacă prin lanțul său de gândire.În urma infractorului argumente Și dacă spun nimic și nu spun nimic partenerul meu, vom obține o perioadă minimă de timp (1 an), dar eu nu pot vedea cum se va comporta.Dacă el dă dovadă împotriva mea, eu, de asemenea, mai bine să depună mărturie, în caz contrar pot sta jos timp de 5 ani.Mi-ar sta mai degrabă în jos pentru a 2,5 ani de 5 ani.Dacă el este tăcut, atunci cu atât mai mult am nevoie pentru a da dovadă, de asemenea, voi primi libertate.În mod similar, discuții și participant B.

este ușor de înțeles că strategia dominantă pentru fiecare dintre criminali - o mărturie.Punctul de optim de joc apare atunci când atât infractorul a depune mărturie și de a primi dvs. "premiul" - 2,5 ani de închisoare.Teoria jocurilor Nash solicită acest echilibru.

soluție optimă non-optime Nash

neshevskogo Opinia revoluționar că un astfel de echilibru nu este optimă, dacă avem în vedere participantul individual și interesul său personal.La urma urmei, cea mai bună opțiune - este de a păstra tăcerea și de a fi eliberat.

Nash de echilibru - este punctul de contact de interes, în cazul în care fiecare participant alege această opțiune, care este optimă pentru el numai cu condiția ca alți participanți pentru a alege un anumit strategie.

considerare o opțiune atunci când atât infractorul și să primească toate tăcut timp de 1 an, poate fi numit o variantă Pareto-optimal.Cu toate acestea, este posibil numai în cazul în care criminalii au fost capabili să ajungă la un acord în prealabil.Dar chiar că nu ar garanta acest rezultat, pentru că tentația de a cădea din nou pe persuasiune și pentru a evita sancțiuni mari.Lipsa de încredere completă în celălalt și de a lua 5 ani, riscul de mărturisire forțat să aleagă.Medităm asupra faptului că participanții vor lipi la versiunea cu tăcut, acționează în mod concertat, pur și simplu irațional.O astfel de concluzie se poate face, dacă vom studia echilibrul Nash.Exemple dovedi chiar numai.

egoist sau pentru a administra teorie

Nash de echilibru, având în vedere concluziile uimitoare oprovergnuvshie disponibile la acest principiu.De exemplu, Adam Smith, considerat comportamentul fiecărui participant ca fiind absolut egoist, și că aduce sistemul în echilibru.Această teorie a fost numit "mâna invizibilă a pieței."

John Nash a văzut că, dacă toate părțile să acționeze în urmărirea propriilor interese numai, se va niciodată duce la un rezultat optim de grup.Având în vedere că gândirea rațională este inerentă fiecărei părți, o alegere mai probabil, care oferă strategia Nash de echilibru.

experiment pur masculin

izbitoare exemplu este jocul "un paradox blondă", care, deși se pare că din loc, dar este o ilustrare vie care arată modul în care teoria jocurilor Nash.

In acest joc ai nevoie să-și imagineze că societatea este liber de tipi a venit la bar.In apropiere este compania de fete, dintre care unul este de preferat la alta, spune blonda.În ceea ce băieții să se comporte, pentru a obține cea mai bună prietenă pentru tine?

Deci raționamentul baieti: dacă toată lumea va face cunostinta cu blonda, atunci cel mai probabil, acesta nu va primi pe nimeni, atunci prietenii ei nu vor dori să exploreze.Nimeni nu vrea să fie a doua opțiune de rezervă.Dar dacă voi alege pentru a evita blonda, atunci probabilitatea de fiecare dintre voi să găsească un bun prieten în rândul fetelor este mare.

Nash de echilibru nu este optim pentru baieti, deoarece, urmărind numai propriile lor interese egoiste, fiecare ar alege o blonda.Se observă că doar urmărirea de auto-interes ar echivala cu prăbușirea intereselor de grup.Echilibru Nash ar însemna că fiecare om acționează în propriul lor interes, care sunt în contact cu interesele întregului grup.Această opțiune sub nivelul optim pentru fiecare persoană, dar cel mai bun pentru toată lumea, în funcție de strategia globală de succes.

Toată viața noastră este un joc

decizional în lumea reală este foarte similar cu jocul atunci când vă așteptați un anumit comportament rațional de ceilalți participanți.In afaceri, lucra într-o echipă, într-o companie, chiar și într-o relație cu sexul opus.Din tranzacții mari și la situații viața obișnuită totul este supus unei anumite legi.

curs considerate pentru situații de joc cu criminali și bar - este doar ilustrare excelent care arată echilibrul Nash.Exemple de astfel de dileme apar de multe ori în piața reală, și mai ales în cazul celor două monopoliștilor care controlează piața.

strategii mixte

vovlekaemy multe ori nu suntem într-o singură, dar în mai multe jocuri.Alegând una dintre opțiunile un joc, ghidat de o strategie rațională, dar obține un alt joc.După câteva decizii raționale puteți găsi că rezultatele nu sunt.Ce să ia?

în considerare două tipuri de strategii:

strategie
  • Net - este comportamentul participantului care vine de la reflecție cu privire la posibila comportamentul altor participanti.
  • strategie mixtă sau strategie ocazional - acest alternanță de strategii pure selecție aleatorie sau de strategie pur cu o anumită probabilitate.Această strategie se numește rendomizirovannoy.

Având în vedere acest comportament, vom obține o nouă perspectivă asupra echilibrului Nashua.Dacă ați declarat anterior că jucătorul alege strategia dată, și se poate imagina un comportament diferit.Puteți evita posibilitatea ca jucătorii aleg strategiile aleator cu o anumită probabilitate.Jocuri în care nu se poate găsi un echilibru Nash în strategiile pure, ele sunt întotdeauna amestecate.

Nash de echilibru în strategii mixte este numit un echilibru mixt. Este un echilibru, în cazul în care fiecare participant alege frecvența optimă selectarea strategiilor lor, cu condiția ca ceilalți membri aleg strategiile lor cu o frecvență predeterminată.Sancțiuni

și strategie mixtă

exemplu de strategie mixtă poate duce la un joc de fotbal.Cea mai bună ilustrare a strategiei mixte - aceasta este, probabil, sancțiunile.Deci, avem un portar care poate sări doar într-un colț, și jucătorul care este de gând să bată un penalty.

Deci, în cazul în care pentru prima dată jucătorul alege o strategie pentru a face un impact în colțul din stânga, iar portarul, de asemenea, se încadrează în acest colț și prinde mingea, modul în care evenimentele se pot dezvolta a doua oară?Dacă un jucător este lovit la colțul opus, este, probabil, prea evident, dar a lovit același unghi de cel puțin evidente.Prin urmare, portarul, iar aluatul nu are de ales decât să se bazeze pe selecție aleatoare.

Deci, alternând selecție aleatorie a unei anumite strategii pure, player și portarul pytajutsja obține rezultate maxime.