Nash Equilibrium.

click fraud protection

W 1930 roku John von Neumanna i Oskara Morgensterna stali się założycielami nowej ciekawej kierunku matematyki, który był nazywany "Game Theory".W 1950 roku ten trend zainteresował się młody matematyk John Nash.Teoria równowagi stał się tematem jego pracy magisterskiej, którą napisał w wieku 21 lat.Tak narodził nową grę strategiczną o nazwie "równowaga Nasha", zasłużył na Nagrodę Nobla wiele lat później - w 1994 roku.

długa przerwa między napisaniem pracy dyplomowej i stał się powszechnie akceptowane test matematyki.Geniusz bez rozpoznania spowodowało poważnych zaburzeń psychicznych, ale również zadanie John Nash był w stanie rozwiązać dzięki doskonałej umysłu logicheskumu.Jego teoria "Nash równowagi" nagrodzony Noblem i jego życie w filmowej adaptacji «Piękny umysł" ("Piękny umysł").

krótko teorii gier

Od teorii równowagi Nasha wyjaśnia ludzkich zachowań w zakresie interakcji, więc należy wziąć pod uwagę podstawowe pojęcia z zakresu teorii gier.Teoria

Gra bada zachowanie uczestników (agentów) w środowisku oddziałują na siebie przez rodzaj gry, w której wynik zależy od decyzji i zachowania kilku osób.Użytkownik podejmuje decyzje w oparciu o ich oczekiwań co do zachowań innych osób, które nazywa się strategia gry.

Istnieje również dominująca strategii, w którym uczestnik uzyskuje najlepsze wyniki, gdy zachowanie innych uczestników.Jest to najlepszy gracz strategia bezproigryshnaya.Dylemat więźnia

i przełom Dylemat więźnia

- to jest w przypadku gry, w których uczestnicy mają do podejmowania racjonalnych decyzji, osiągnięcie ogólnego celu alternatyw w sytuacjach konfliktowych.Pytanie, która z tych opcji będzie wybrać, świadomi własnych zainteresowań i ogólnej, a niezdolność dostać coś, i więcej.Graczy, takich jak zamknięty w trudnych warunkach gry, która czasem sprawia im myśleć bardzo produktywny.

ten dylemat zbadać amerykański matematyk John Nash.Bilans, który prowadził, był rewolucyjny na swój sposób.Silny nowy pomysł wpływ opinii ekonomistów o tym, jak dokonać różnych graczy na rynku, biorąc pod uwagę interesy innych, z gęstym interakcji i skrzyżowaniu interesów.

Najlepiej jest uczyć się teorii gier z konkretnych przykładów, bo ta sama dyscyplina matematyczna nie jest sucha i teoretyczne.Dylemat

przykładem

przykład więźnia, dwóch mężczyzn popełnił rozbój, wpadł w ręce policji i są przesłuchiwani w osobnych celach.Jednocześnie ministrowie policji oferują każdego uczestnika sprzyjające warunki, w jakich będzie on wydany w przypadku zeznawać przeciwko swoim partnerem.Każdy z przestępców nie Następny zestaw strategii, które uzna za:
  1. Oba jednocześnie dać świadectwo i odbierać 2,5 lat więzienia.
  2. Zarówno cichy i jednocześnie dostać się do 1 roku, tak jak w tym przypadku podstawą dowody ich winy będzie mała.
  3. Jeden świadczy i dostaje za darmo, a drugi milczy i dostaje 5 lat w więzieniu.

Oczywiście wynik sprawy zależy od decyzji obu stron, ale nie mogą dojść do porozumienia, bo siedzi w różnych komórkach.Również wyraźnie widoczne w konflikcie z ich osobistych interesów w walce o wspólny interes.Każdy więzień ma dwie opcje i 4 wyników wersji.

łańcuch logicznego rozumowania

Więc sprawca, ale rozważyć następujące opcje:

  1. Jestem spokojny i cichy jest mój partner - oboje się 1 rok w więzieniu.
  2. I wynająć partnera, a on mnie bierze - oboje się 2,5 lat więzienia.
  3. milczę, a mój kumpel przechodzi - Wezmę pięć lat w więzieniu, a on został zwolniony.
  4. daję partnera, ale on milczy - uzyskać wolność, jest 5 lat więzienia.

zmniejszyć matrycę możliwych rozwiązań i wyników dla jasności.

Tabela prawdopodobne wyniki dylemat więźnia.

pytanie jest, że każdy z uczestników będzie wybrać?

«Zamknij się, nie można powiedzieć" albo "nie może milczeć, mówić»

Aby zrozumieć wybór uczestnika, musisz przejść przez jego łańcucha myśli.Po sprawcy argumenty i jeśli nic nie mówić i nic nie mówią mojego partnera, będziemy mieli minimalny okres czasu (1 rok), ale nie mogę zobaczyć, jak będzie się zachowywał.Jeśli on daje dowody przeciwko mnie, ja też lepiej dać dowody, inaczej mogę usiąść na 5 lat.Wolę usiąść do 2,5 lat niż 5 lat.Jeśli on jest cichy, to tym bardziej trzeba dać dowód, jak dobrze, będę miał swobodę.Podobnie, rozmów i uczestnika B.

jest łatwa do zrozumienia, że ​​dominująca strategia dla każdego z przestępców - świadectwo.Optymalny punkt gry pojawia się, gdy zarówno sprawca zeznawać i otrzymywać swoją "nagrodę" - 2,5 lat więzienia.Teorii gier Nash nazywa tę równowagę.

optymalne rozwiązanie dla optymalnego Nash

neshevskogo The rewolucyjny pogląd, że takiej równowagi nie jest optymalny, jeśli weźmiemy pod uwagę indywidualnego uczestnika i jego osobisty interes.Po tym wszystkim, najlepszym rozwiązaniem - jest milczeć i być wydany.

równowaga Nasha - jest punktem kontaktowym interesów, gdzie każdy uczestnik wybiera tę opcję, która jest optymalna dla niego tylko pod warunkiem, że inni uczestnicy wybrać konkretną strategię.

rozważa opcję, gdy zarówno sprawca i otrzymywać wszystkie milczy na 1 rok, można nazwać Pareto optymalnego wariantu.Jest to jednak możliwe tylko wtedy, gdy przestępcy byli w stanie dojść do porozumienia z góry.Ale nawet to nie gwarantuje tego wyniku, ponieważ pokusa, by się znowu na perswazji i unikać dużych kar.Brak pełnego zaufania do siebie i dostać 5 lat, ryzyko przymusowej spowiedzi do wyboru.Rozmyślać nad tym, że uczestnicy będą trzymać się wersji z cicha, działając w porozumieniu, po prostu irracjonalne.Taki wniosek można wyciągnąć, jeśli badamy równowagi Nasha.Przykłady tylko udowodnić prawo.

Samolubnie lub zarządzasz

teorii równowagi Nasha względu na wspaniałe wnioski oprovergnuvshie dostępne do tej zasady.Na przykład, Adam Smith, uważa się zachowanie każdego z uczestników jako całkowicie samolubny i wprowadza system w równowadze.Teoria ta była nazywana "niewidzialna ręka rynku".

John Nash zobaczyłem, że jeśli wszystkie strony do działania w dążeniu do własnych interesów tylko, że nigdy nie będzie prowadzić do optymalnego wyniku grupy.Biorąc pod uwagę, że racjonalne myślenie jest nieodłącznym elementem każdej strony, bardziej prawdopodobne, wybór, który oferuje strategii Nash równowagi.

czysto męskiej eksperyment

przykład uderzające jest gra "paradoks blond", która, choć wydaje się nie na miejscu, ale jest żywą ilustracją, która pokazuje, jak teoria gier Nash.

W tej grze trzeba sobie wyobrazić, że firma jest wolny od chłopaków przyszedł do baru.W pobliżu znajduje się firma z dziewcząt, z których jedna jest zalecane dla innych, mówią blondynkę.Jak chłopcy się zachowywać, aby uzyskać najlepszą dziewczynę dla siebie?

Więc chłopaki rozumowania: jeśli każdy będzie zapoznania się z blondynką, to najprawdopodobniej, nie będzie nikogo, a następnie jej przyjaciele nie chcą zbadać.Nikt nie chce być druga opcja upadek do tyłu.Ale jeśli faceci wybrać, aby uniknąć blondynka, to prawdopodobieństwo każdego z chłopaków, aby znaleźć dobry przyjaciel wśród dziewcząt jest wysoka.

równowaga Nasha nie jest optymalny dla facetów, ponieważ, prowadzi tylko własne egoistyczne interesy, każdy wybierze to blond.Okazuje się, że tylko pogoń za własnym interesem byłoby równoznaczne z upadkiem interesów grupowych.Równowaga Nasha oznaczałoby, że każdy człowiek działa we własnym interesie, które są w kontakcie z interesem całej grupy.To optymalna opcja dla każdej osoby, ale najlepsze dla siebie, w zależności od ogólnej strategii sukcesu.

Całe nasze życie to gra

Podejmowanie decyzji w realnym świecie jest bardzo podobna do gry, gdy można oczekiwać pewnego racjonalnego zachowania od innych uczestników.W biznesie, pracy w zespole, w firmie, nawet w relacji z płcią przeciwną.Od dużych transakcji i zwykłych sytuacjach życiowych wszystko jest przedmiotem prawa partykularnego.Oczywiście

rozważyć w sytuacji gry z przestępców i na pasku - to jest po prostu doskonała ilustracja przedstawiająca równowagi Nasha.Przykłady takich dylematów powstają często w rzeczywistym rynku, w szczególności w przypadku dwóch monopolistów kontrolujących rynek.

mieszane strategie

vovlekaemy Często nie jesteśmy w jednym, ale w kilku grach.Wybierając jedną z opcji jednej grze, kierując się racjonalną strategią, ale się w inną grę.Po kilku racjonalnych decyzji może się okazać, że wyniki nie są.Co zabrać?

pod uwagę dwa rodzaje strategii:

strategii
  • netto - jest zachowanie uczestnika, który pochodzi z refleksji na temat możliwego zachowania innych uczestników.
  • strategii mieszanej lub dorywczo strategia - to naprzemienne czystych strategii wybór losowy lub czystej strategii z pewnym prawdopodobieństwem.Strategia ta jest nazywana rendomizirovannoy.

Biorąc pod uwagę ten problem, mamy nową perspektywę na bilans Nashua.Jeśli wcześniej powiedział, że gracz wybiera strategię raz, i można sobie wyobrazić inne zachowanie.Możesz uniknąć możliwości, że gracze wybierają strategie losowo z pewnym prawdopodobieństwem.Gry, w których nie można znaleźć równowagę Nasha w czystych strategii, zawsze są mieszane.

równowaga Nasha w strategiach mieszanych mieszane nazywany jest równowaga. To jest równowaga, gdzie każdy uczestnik wybiera optymalną częstotliwość wybierając swoje strategie, pod warunkiem, że pozostali członkowie wybrać swoje strategie z ustaloną częstotliwością.Kary

i strategii mieszanej

przykładem mieszanej strategii może doprowadzić do gry w piłkę nożną.Najlepszą ilustracją mieszanej strategii - jest to prawdopodobnie kary.Tak, mamy bramkarza, który może przejść tylko w jednym rogu, a gracz, który ma zamiar pokonać karę.

Tak więc, jeśli po raz pierwszy gracz wybiera strategię wywierania wpływu w lewym rogu i bramkarz również należą do tej rogu i złapać piłkę, jak wydarzenia mogą rozwijać się po raz drugi?Jeśli gracz jest trafiony do przeciwległego narożnika, to chyba zbyt oczywiste, ale uderzył w sam kąt nie mniejszy niż oczywiste.Dlatego, bramkarz, a ciasto nie ma wyboru, jak tylko liczyć na wybór losowy.

Tak, na przemian wybierają losowo pewnej czystej strategii, gracza i bramkarz pytajutsja uzyskać maksymalne rezultaty.