Nash Equilibrium.

click fraud protection

1930 John von Neumann un Oskar Morgenstern kļuva dibinātājiem jaunu interesantu virzienu matemātiku, ko sauca "Game Theory".In 1950, šī tendence kļuva interesē jauniešu matemātiķis John Nash.Equilibrium teorija kļuva priekšmets viņa tēzes, ko viņš rakstīja vecumā 21 gadu veciem.Tādējādi bija dzimis jaunu stratēģijas spēli sauc "Nash līdzsvara", ir pelnījis Nobela prēmiju daudzus gadus vēlāk - 1994. gadā.

ilgi plaisa starp rakstiski disertācijas un kļuva vispārpieņemtu tests math.Genius bez atzīšanas izraisījusi smagas garīgās attīstības traucējumiem, bet arī uzdevums John Nash varēja atrisināt, pateicoties lielisko logicheskumu prātā.Viņa teorija "Nash līdzsvara" piešķirta Nobela un viņa dzīvi filmu pielāgošanu «Beautiful Mind" ("A Beautiful Mind").

īsi par spēli teorija

Kopš Nash līdzsvara teorija izskaidro cilvēku uzvedību attiecībā uz mijiedarbību, tāpēc jums vajadzētu apsvērt pamatjēdzienus spēļu teorijas.

Spēļu teorija pēta uzvedība dalībnieku (aģenti) vidē mijiedarboties ar otru, ko veida spēle, kur iznākums ir atkarīgs no lēmumiem un rīcību dažiem cilvēkiem.Dalībvalsts pieņem lēmumus, pamatojoties uz viņu cerībām par uzvedību citiem, ko sauc spēļu stratēģija.

Ir arī dominējošā stratēģija, kurā dalībnieks saņem vislabākos rezultātus, ja rīcība jebkuriem citiem dalībniekiem.Šī ir labākā stratēģija bezproigryshnaya spēlētājs.

cietumnieka dilemma un atklājumu

cietumnieka dilemmu - tas ir gadījumā ar spēli, kur dalībnieki ir pieņemt racionālus lēmumus, lai sasniegtu kopējo mērķi alternatīvu konflikta situācijās.Jautājums ir, kas no šiem variantiem būs jāizvēlas, apzinās personīgās un vispārējās interesēs, un nespēja iegūt kaut ko, un vairāk.Spēlētāji patīk ievietojas grūts spēļu apstākļiem, kas dažkārt padara viņus domāt ļoti produktīvs.

šī dilemma jāizpēta amerikāņu matemātiķis John Nash.Līdzsvars, kuru viņš vadīja, bija revolucionārs savā veidā.Spēcīgā jauna ideja ietekmēja viedokli ekonomistu par to, kā veikt dažādus tirgus dalībniekiem, ņemot vērā intereses citiem, ar blīvu mijiedarbības un krustošanās interesēm.

Vislabāk ir izpētīt spēļu teorija ar konkrētiem piemēriem, jo ​​tas matemātisko disciplīna pati par sevi nav sausa un teorētiska.

Piemērā ieslodzītā dilemma

piemērs, divi vīrieši izdarījusi laupīšanu, iekrita rokās policijas un pratināja atsevišķās šūnās.Vienlaikus ministri policijas piedāvāt katram dalībniekam labvēlīgus apstākļus, kādos tas tiks izlaists gadījumā liecināt pret savu partneri.Katrs no noziedzniekiem tur blakus noteikt stratēģiju, ka tā uzskata:

  1. abus vienlaicīgi sniegt liecības un saņemt 2,5 gadus cietumā.
  2. Gan klusa un tajā pašā laikā nokļūt līdz 1 gadam, kā tas ir šajā gadījumā pierādījumu bāze par to vainu būs neliels.
  3. Viens apliecina un saņem bezmaksas, un otrs ir kluss un saņem 5 gadi cietumā.

Protams, iznākums lietas atkarīgs lēmumu abas puses, bet viņi nevar vienoties, jo sēž dažādās šūnās.Tāpat ir skaidri saskatāms ar konfliktu viņu personas interešu cīņā par kopējas intereses.Katram ieslodzītajam ir divas iespējas un 4 versiju rezultātus.

ķēde loģiskā domāšana

Tātad likumpārkāpējs, bet apsvērt šādas iespējas:

  1. es esmu kluss un kluss ir mans partneris - mēs abi saņemsiet 1 gads cietumā.
  2. Es iznomāt partneri un viņš mani notiek - mēs abi iegūt 2,5 gadus cietumā.
  3. Es esmu klusa, un mans draugs iet - es nopirkšu piecus gadus cietumā, un viņš tika atbrīvots.
  4. Es dodu mate, bet viņš ir kluss - man brīvība, viņam ir 5 gadi cietumā.

samazināt matricu iespējamiem risinājumiem un rezultātiem skaidrību.

tabula iespējamās rezultāti ieslodzītā dilemma.

jautājums ir tas, ka katrs dalībnieks izvēlēsies?

«Shut up, jūs nevarat teikt" vai "nevar klusēt, runāt»

Lai saprastu izvēli dalībnieka, jums ir iet caur viņa ķēdi domas.Pēc Argumenti pārkāpēju Un, ja es saku neko un teikt, nekas mans partneris, mēs saņemam minimālo laika periodu (1 gads), bet es neredzu, kā viņš rīkosies.Ja viņš dod pierādījumus pret mani, es arī labāk sniegt liecību, citādi es varētu apsēsties uz 5 gadiem.Es drīzāk sēdēt 2,5 gadiem līdz 5 gadiem.Ja viņš ir kluss, tad vēl man ir nepieciešams, lai sniegtu pierādījumus, kā arī, es nopirkšu brīvību.Tāpat sarunas un dalībnieka B.

ir viegli saprast, ka dominējošais stratēģija attiecībā uz katru no noziedzniekiem - liecību.Optimālā temperatūra spēles notiek, kad abi likumpārkāpējs liecināt un saņemtu savu "balvu" - 2,5 gadus cietumā.Spēļu teorija Nash aicina šo līdzsvaru.

optimāls risinājums nav optimāls Nash

neshevskogo revolucionāro viedokli, ka šāds līdzsvars nav optimāls, ja mēs uzskatām, individuālo dalībnieku un viņa personisko ieinteresētību.Galu galā, labākais variants - ir klusēt un tikt atbrīvota.

Nash līdzsvara - ir kontaktpunkts interešu, kur katrs dalībnieks izvēlas šo iespēju, kas ir optimāla viņam tikai ar nosacījumu, ka citi dalībnieki izvēlēties konkrētu stratēģiju.

apsver iespēju kad gan likumpārkāpējs un saņemt visi klusēja uz 1 gadu, var saukt par Pareto-optimālo variantu.Tomēr tas ir iespējams tikai tad, ja noziedznieki bija iespēja vienoties jau iepriekš.Bet pat tas negarantētu šo rezultātu, jo kārdinājums krist atpakaļ pārliecināšanas un izvairīties no lieliem sodiem.No pilnīgas uzticības otru trūkums un saņemt 5 gadus, risks piespiedu atzīšanās izvēlēties.Meditēt par to, ka dalībnieki būs stick ar versiju ar klusu, kas rīkojas saskaņoti, vienkārši iracionāla.Šādu secinājumu var izdarīt, ja mēs pētītu Nash līdzsvaru.Piemēri tikai izrādīties taisnība.

egoistiski vai pārvaldīt

teorija Nash līdzsvaru, ņemot vērā apdullināšanas secinājumi oprovergnuvshie pieejams uz šo principu.Piemēram, Ādams Smits uzskatīja uzvedība katrs no dalībniekiem kā absolūti savtīgi, un tas rada sistēmu līdzsvaru.Šī teorija tika saukta par "neredzamā roka no tirgus."

John Nash redzēja, ka, ja visas puses rīkoties, lai sasniegtu savām interesēm tikai, tas nekad nebūs optimālo grupas rezultātu.Ņemot vērā, ka racionāla domāšana ir raksturīgs katrai pusei, vairāk iespējams izvēle, kas piedāvā stratēģiju Nash līdzsvaru.

tīri vīrietis eksperiments

Spilgts piemērs ir spēle "paradokss blondīne", kas, lai gan šķiet nevietā, bet ir spilgts piemērs, kas parāda, kā spēle teorija Nash.

Šajā spēlē jums ir nepieciešams, lai iedomāties, ka uzņēmums ir bez puiši nonāca pie bāra.Netālu ir uzņēmums meitenes, no kurām viena ir labāka par otru, saka blondīne.Kā zēni uzvesties, lai iegūtu labāko draudzeni par sevi?

Tātad puiši argumentācija: ja ikvienam būs iepazīties ar blondīne, tad visticamāk, tas nav iegūt ikviens, tad viņas draugi negrib, lai izpētītu.Neviens vēlas būt otrais alternatīvais variants.Bet, ja jūs guys izvēlēties, lai izvairītos no blonda, tad varbūtība katram no puišiem, lai atrastu labu draugu vidū meitenēm ir augsts.

Nash līdzsvara nav optimāla puišiem, jo, īstenojot tikai savas savtīgās intereses, katrs varētu izvēlēties tā blondīne.Ir redzams, ka tikai veikšanu pašu interesēs nozīmētu sabrukuma grupu interesēm.Nash līdzsvars nozīmētu, ka katrs cilvēks rīkojas savās interesēs, kas ir saskarē ar interesēm visai grupai.Šī optimāls variants par katru personu, bet labākais ikvienam, balstoties uz vispārējo stratēģiju panākumus.

Visa mūsu dzīve ir spēle

Lēmumu pieņemšana reālajā pasaulē ir ļoti līdzīga spēle, kad jūs sagaida noteiktu racionālu rīcību no citiem dalībniekiem.Uzņēmējdarbībā, strādāt komandā, uzņēmumā, pat attiecības ar pretējā dzimuma.No lieliem darījumiem un uz parastiem dzīves situācijās viss ir pakļauts konkrētu likumu.

kurss uzskatīts spēļu situācijās ar noziedzniekiem un bāra - tas ir vienkārši lielisks piemērs rāda Nash līdzsvaru.Piemēri dilemmas bieži rodas reālajā tirgū, un jo īpaši attiecībā uz abiem monopolistu kurš kontrolēt tirgu.

Jauktie stratēģijas

vovlekaemy Bieži vien mēs esam ne vienā, bet vairākās spēlēs.Izvēloties kādu no iespējām vienā spēlē, vadībā racionālu stratēģiju, bet saņemt dažādas spēles.Pēc pāris racionālus lēmumus jūs varat atrast, ka jūsu rezultāti nav.Ko ņemt?

apsvērt divu veidu stratēģijas:

  • Net stratēģija - ir uzvedība dalībniekam, kas nāk no pārdomām par iespējamo uzvedību citiem dalībniekiem.
  • jaukta stratēģija vai gadījuma stratēģija - tas pārmaiņus tīru stratēģiju izlases atlases vai tīra stratēģijas ar noteiktu varbūtību.Šī stratēģija sauc rendomizirovannoy.

Ņemot vērā šo problēmu, mēs iegūtu jaunu skatījumu uz to Nashua līdzsvaru.Ja iepriekš teica, ka spēlētājs izvēlas stratēģiju vienreiz, un var iedomāties citu uzvedību.Jūs varat novērstu iespēju, ka spēlētāji izvēlēties stratēģiju nejauši ar noteiktu varbūtību.Spēles, kurā jūs nevarat atrast Nash līdzsvaru tīrā stratēģijas, tie vienmēr sajauc.

Nash līdzsvara jauktās stratēģijas sauc jaukts līdzsvars. Tas ir līdzsvars, kur katrs dalībnieks izvēlas optimālo frekvenci izvēloties savas stratēģijas, ar nosacījumu, ka citi dalībnieki izvēlas savu stratēģiju ar iepriekš noteiktu frekvenci.

Sodi un jaukta stratēģija

piemērs jaukta stratēģija var izraisīt spēlē futbolu.Labākais piemērs jaukto stratēģija - tas ir iespējams, sodi.Tātad, mums ir vārtsargs, kurš var lēkt tikai vienā stūrī, un spēlētājs, kurš gatavojas pārspēt sodu.

Tātad, ja pirmo reizi spēlētājs izvēlas stratēģiju, lai panāktu ietekmi kreisajā stūrī un vārtsargs arī ietilpst šajā stūrī un noķert bumbu, kā notikumi var attīstīties otrreiz?Ja spēlētājs ir hit uz pretējo stūri, tas ir iespējams, ir pārāk acīmredzamas, taču trāpīja pa to pašu leņķi ne mazāk kā acīmredzama.Tāpēc, vārtsargs, un mīklu nav citas izvēles, kā vien paļauties uz izlases.

Tātad, pārmaiņus izlases izvēli noteiktu tīra stratēģijas, spēlētāju un vārtsarga pytajutsja iegūt maksimālu rezultātu.