Equilíbrio de Nash.

click fraud protection

Em 1930 John von Neumann e Oskar Morgenstern tornaram-se os fundadores de uma nova direção interessante de matemática, que foi chamado de "Teoria dos Jogos".Na década de 1950, esta tendência se interessou pelo jovem matemático John Nash.Teoria do equilíbrio tornou-se o tema de sua tese, que ele escreveu com a idade de 21 anos.Assim nasceu um novo jogo de estratégia chamado "equilíbrio de Nash", mereceu o Prêmio Nobel muitos anos depois - em 1994.

longo intervalo entre a escrita de uma dissertação e tornou-se universalmente aceito teste para a matemática.Genius sem reconhecimento resultou em sérios transtornos mentais, mas também a tarefa John Nash era capaz de resolver graças ao excelente mente logicheskumu.Sua teoria do "equilíbrio de Nash" premiado com o Nobel e sua vida na adaptação cinematográfica de «Beautiful Mind» («Uma Mente Brilhante").

brevemente sobre a teoria dos jogos

Desde teoria do equilíbrio de Nash explica o comportamento humano em termos de interação, então você deve considerar os conceitos básicos da teoria dos jogos.Teoria

Jogo estuda o comportamento dos participantes (agentes) no ambiente de interagir uns com os outros pelo tipo de jogo em que o resultado depende das decisões e do comportamento de algumas pessoas.Membro toma decisões com base em suas expectativas sobre o comportamento dos outros, que é chamado uma estratégia de jogo.

Há também uma estratégia dominante, no qual o participante obtém os melhores resultados quando o comportamento de todos os outros participantes.Este é o melhor jogador de estratégia bezproigryshnaya.Dilema do Prisioneiro

eo avanço Dilema do Prisioneiro

- é o caso do jogo, onde os participantes têm de tomar decisões racionais, a consecução do objectivo global de alternativas em situações de conflito.A questão é, qual dessas opções que vão escolher, consciente do interesse pessoal e geral, e da incapacidade de obter algo, e muito mais.Jogadores como fechado em um difíceis condições de jogo, que por vezes faz pensar muito produtivo.

este dilema explorou o matemático americano John Nash.O saldo, que ele liderou, foi revolucionário em seu próprio caminho.A idéia forte novo influenciado a opinião dos economistas sobre como fazer uma variedade de players no mercado, tendo em conta os interesses dos outros, com uma interação densa e intersecção de interesses.

É melhor estudar a teoria dos jogos com exemplos concretos, porque a própria esta disciplina matemática não é seco e teórico.Dilema exemplo

de

Exemplo prisioneiro, dois homens cometeram o roubo, caiu nas mãos da polícia e são interrogados em celas separadas.Ao mesmo tempo, os ministros da polícia oferecer cada participante condições favoráveis ​​ao abrigo do qual serão lançados no caso testemunhar contra seu parceiro.Cada um dos criminosos lá no próximo conjunto de estratégias que ele irá considerar:
  1. Ambos dão testemunho simultaneamente e receber 2,5 anos de prisão.
  2. silencioso e ao mesmo tempo obter a 1 ano, como, neste caso, a base da evidência da sua culpa será pequeno.
  3. Uma testemunha e fica livre eo outro é silencioso e deixa 5 anos de prisão.

Obviamente, o resultado do processo depende da decisão de ambas as partes, mas eles não podem chegar a um acordo, porque sentado em células diferentes.Também claramente visível para o conflito de seus interesses pessoais na luta por um interesse comum.Cada prisioneiro tem duas opções e 4 resultados de versão.Cadeia

de raciocínio lógico

Assim, o infractor, mas considerar as seguintes opções:

  1. Estou tranquilo e silencioso é o meu parceiro - que ambos get 1 ano de prisão.
  2. I alugar um parceiro e ele me leva - que ambos obter 2,5 anos de prisão.
  3. fico em silêncio, e meu amigo passa - Vou pegar cinco anos de prisão, e ele foi libertado.
  4. eu dou companheiro, mas ele está em silêncio - eu obter a liberdade, ele é de 5 anos de prisão.

reduzir a matriz de possíveis soluções e resultados para maior clareza.

Tabela resultados prováveis ​​dilema do prisioneiro.

questão é que cada participante irá escolher?

«Cale-se, você não pode dizer" ou "não pode permanecer em silêncio, para falar»

Para entender a escolha do participante, você deve ir através de sua cadeia de pensamento.Seguindo o infrator argumentos E se eu não dizer nada e não dizem nada meu parceiro, nós entraremos em um período mínimo de tempo (1 ano), mas eu não posso ver como ele vai se comportar.Se ele dá provas contra mim, eu também melhor dar provas, caso contrário, eu possa sentar-se por 5 anos.Eu preferiria sentar-se para 2,5 anos a 5 anos.Se ele está em silêncio, então quanto mais eu preciso dar provas, bem, eu vou obter a liberdade.Da mesma forma, palestras e participante B.

é fácil compreender que a estratégia dominante para cada um dos criminosos - um testemunho.O ponto ótimo do jogo ocorre quando tanto o ofensor testemunhar e receber o seu "prêmio" - 2,5 anos de prisão.Game Theory Nash chama esse equilíbrio.

solução ideal para não-ideal Nash

neshevskogo A visão revolucionária que esse equilíbrio não é o ideal, se considerarmos o participante e seu interesse pessoal.Afinal de contas, a melhor opção - é de permanecer em silêncio e para ser liberado.

equilíbrio de Nash - é o ponto de contato de interesse, onde cada participante escolhe esta opção, o que é óptimo para ele na condição de que outros participantes escolher uma estratégia particular.

considerando uma opção quando tanto o ofensor e receber tudo em silêncio por um ano, pode ser chamado de uma variante Pareto-óptima.No entanto, só é possível se os criminosos foram capazes de chegar a um acordo com antecedência.Mas mesmo que não garantiria esse resultado, porque a tentação de recair na persuasão e evitar grandes penalidades.A falta de completa confiança em si e obter 5 anos, o risco de confissão forçada a escolher.Medite sobre o fato de que os participantes vão ficar com a versão com silenciosa, agindo em conjunto, simplesmente irracional.Tal conclusão pode ser feita, se estudarmos o equilíbrio de Nash.Exemplos apenas provam direita.

Egoísta ou gerencia equilíbrio

teoria Nash dadas as conclusões impressionantes oprovergnuvshie disponíveis para este princípio.Por exemplo, Adam Smith, considerado o comportamento de cada um dos participantes como sendo absolutamente egoísta, e que traz o sistema ao equilíbrio.Esta teoria foi chamada de a "mão invisível do mercado."

John Nash viu que, se todas as partes a agir em busca de seus próprios interesses somente, ele nunca vai conduzir ao resultado grupo ideal.Tendo em conta que o pensamento racional é inerente a cada uma das partes, uma escolha mais provável, que oferece estratégia de equilíbrio de Nash.

experiência puramente masculino

flagrante exemplo é o jogo "um paradoxo blonde", que, ao que parece fora do lugar, mas é uma vívida ilustração que mostra como a teoria dos jogos Nash.

Neste jogo você precisa imaginar que a empresa está livre de vocês veio para o bar.Perto é a companhia de meninas, um dos quais é preferível para o outro, dizem que a loira.Como os meninos a se comportar, para obter a melhor amiga para si mesmo?

Portanto, rapazes raciocínio: se todos irão se familiarizar com a loira, então muito provavelmente, não vai ter alguém, em seguida, seus amigos não vão querer explorar.Ninguém quer ser a segunda opção de recurso.Mas se vocês optar por evitar a loira, então a probabilidade de cada um dos rapazes para encontrar um bom amigo entre as meninas é alta.Equilíbrio

Nash não é o ideal para os caras, porque, perseguindo apenas os seus próprios interesses egoístas, cada um iria escolhê-lo loiro.Vê-se que apenas a busca do auto-interesse seria o mesmo que o colapso dos interesses de grupo.Equilíbrio de Nash significaria que cada homem age em seus próprios interesses, que estão em contacto com os interesses de todo o grupo.Esta opção sub-óptima para cada pessoa, mas o melhor para todos, com base na estratégia global para o sucesso.

Toda a nossa vida é um jogo

Tomada de decisão no mundo real é muito parecido com o jogo quando você espera um certo comportamento racional dos outros participantes.Nos negócios, trabalho em equipe, em uma empresa, mesmo em um relacionamento com o sexo oposto.De grandes operações e situações comuns da vida tudo está sujeito a uma lei particular.Claro

considerados para situações de jogo com criminosos e do bar - é simplesmente excelente ilustração que mostra o equilíbrio de Nash.Exemplos de tais dilemas surgem frequentemente no mercado real, e especialmente no caso de os dois monopolists que controlam o mercado.Estratégias mistas

vovlekaemy Muitas vezes não estamos em um, mas em vários jogos.Ao escolher uma das opções de um jogo, guiados por uma estratégia racional, mas começar um jogo diferente.Depois de algumas decisões racionais que você pode achar que seus resultados não são.O que levar?

considerar dois tipos de estratégias:

estratégia
  • Net - é o comportamento do participante que vem de reflexão sobre o possível comportamento de outros participantes.
  • estratégia mista ou estratégia casual - essa alternância de estratégias puras de seleção aleatória ou de estratégia pura, com uma certa probabilidade.Esta estratégia é chamada rendomizirovannoy.

Considerando este comportamento, temos uma nova perspectiva sobre o equilíbrio de Nashua.Se você já disse que o jogador escolhe a estratégia de uma vez, e pode-se imaginar um comportamento diferente.Você pode evitar a possibilidade de que os jogadores escolhem estratégias aleatoriamente com uma certa probabilidade.Jogos em que você não pode encontrar um equilíbrio de Nash em estratégias puras, eles estão sempre misturados.

equilíbrio de Nash em estratégias mistas é chamado um saldo misto. É um equilíbrio, onde cada participante escolhe a freqüência ideal de selecionar as suas estratégias, desde que os outros membros escolher suas estratégias com uma frequência pré-determinada.Penalidades

e estratégia mista

exemplo de uma estratégia mista pode resultar em um jogo de futebol.A melhor ilustração da estratégia mista - este é, provavelmente, as penalidades.Então, nós temos um goleiro que pode saltar apenas em um canto, eo jogador que vai bater um pênalti.

Assim, se a primeira vez que o jogador escolhe uma estratégia para fazer um impacto no canto esquerdo eo goleiro também se enquadram nesta esquina e pegar a bola, como os eventos podem desenvolver uma segunda vez?Se um jogador é atingido para o canto oposto, é provavelmente demasiado óbvio, mas bateu o mesmo ângulo de não menos do que óbvio.Portanto, o goleiro, ea massa não tem escolha a não ser confiar na seleção aleatória.

Assim, alternando seleção aleatória de uma certa estratégia pura, jogador e guarda-redes pytajutsja obter o máximo de resultados.