Équilibre de Nash.

click fraud protection

En 1930, John von Neumann et Oskar Morgenstern est devenu les fondateurs d'une nouvelle direction intéressante de mathématiques, qui a été appelé "la théorie des jeux".Dans les années 1950, cette tendance est devenu intéressé par le jeune mathématicien John Nash.Théorie de l'équilibre est devenu le sujet de sa thèse, qu'il a écrit à l'âge de 21 ans.Ainsi est né un nouveau jeu de stratégie appelée «équilibre de Nash», méritait le prix Nobel de nombreuses années plus tard - en 1994.Long intervalle

entre la rédaction d'un mémoire et est devenu universellement acceptée test pour les mathématiques.Genius sans la reconnaissance a abouti à de graves troubles mentaux, mais aussi la tâche John Nash a été en mesure de résoudre grâce à l'excellent esprit de logicheskumu.Sa théorie de la «équilibre de Nash" décerné le Nobel et sa vie dans l'adaptation cinématographique de «Beautiful Mind» («A Beautiful Mind").Brièvement

sur la théorie des jeux

Puisque la théorie d'équilibre de Nash explique le comportement humain en termes d'interaction, de sorte que vous devriez considérer les concepts de base de la théorie des jeux.Théorie

Jeu étudie le comportement des participants (agents) dans l'environnement interagissent les uns avec les autres par le type de jeu où le résultat dépend des décisions et le comportement de quelques personnes.Membre prend des décisions basées sur leurs attentes concernant le comportement des autres, ce qui est appelé une stratégie de jeu.

Il ya aussi une stratégie dominante, dans laquelle le participant obtient les meilleurs résultats lorsque le comportement de tous les autres participants.Ceci est le meilleur joueur de la stratégie bezproigryshnaya.Le dilemme du prisonnier

et la percée dilemme du prisonnier

- il est le cas avec le jeu, où les participants doivent prendre des décisions rationnelles, la réalisation de l'objectif global de solutions de rechange dans les situations de conflit.La question est, laquelle de ces options, il choisira, au courant de l'intérêt personnel et général, et l'incapacité d'obtenir quelque chose, et plus encore.Des joueurs comme enfermé dans une difficiles conditions de jeu, ce qui les rend parfois pensent très productive.

ce dilemme exploré le mathématicien américain John Nash.Le solde, qu'il a dirigé, était révolutionnaire à sa manière.La nouvelle idée forte influencé l'opinion des économistes sur la façon de faire une variété de joueurs sur le marché, en prenant en compte les intérêts des autres, avec une interaction dense et intersection des intérêts.

Il est préférable d'étudier la théorie des jeux avec des exemples concrets, parce que cette discipline mathématique elle-même ne sont pas secs et théorique.Dilemme l'exemple

de

Exemple prisonnier, deux hommes commis le vol, est tombé dans les mains de la police et sont interrogés dans des cellules séparées.Dans le même temps, les ministres de la police offre à chaque participant des conditions favorables dans lesquelles il sera libéré dans le cas témoigner contre son partenaire.Chacune des criminels là la prochaine série de stratégies dont il tient compte:
  1. donnent tous deux simultanément témoignage et recevoir 2,5 ans de prison.
  2. deux silencieux et en même temps rendre à 1 an, comme dans ce cas, la base de preuves de leur culpabilité sera faible.
  3. Une témoigne et obtient libre et l'autre est silencieux et obtient 5 ans en prison.

Évidemment, l'issue de l'affaire dépend de la décision des deux parties, mais ils ne peuvent pas parvenir à un accord, parce assis dans des cellules différentes.Aussi clairement visible au conflit de leurs intérêts personnels dans la lutte pour un intérêt commun.Chaque détenu dispose de deux options et 4 Version résultats.Chaîne

du raisonnement logique

Donc, le délinquant, mais de considérer les options suivantes:

  1. je suis tranquille et silencieuse est mon partenaire - nous avons tous deux obtenez 1 an de prison.
  2. Je loue un partenaire et il me prend - nous avons tous deux obtenons 2,5 ans de prison.
  3. je me tais, et mon copain passe - Je vais prendre cinq ans de prison, et il a été libéré.
  4. je donne compagnon, mais il est silencieux - je reçois la liberté, il est de 5 ans de prison.

réduire la matrice de solutions et de résultats possibles pour plus de clarté.

Tableau des résultats probables dilemme du prisonnier.Question

est que chaque participant choisir?

«Tais-toi, vous ne pouvez pas dire" ou "ne peut pas garder le silence, de parler»

Pour comprendre le choix du participant, vous devez passer par sa chaîne de pensée.Après le délinquant arguments Et si je ne dis rien et ne dis rien mon partenaire, nous aurons une période de temps minimale (1 an), mais je ne peux pas voir comment il va se comporter.Si il donne des preuves contre moi, je également préférable de donner des preuves, sinon je peux asseoir pour 5 ans.Je préfère s'asseoir à 2,5 ans à 5 ans.Si il se tait, alors le plus que je dois donner des preuves, aussi bien, je vais prendre la liberté.De même, des entretiens et participant B.

est facile de comprendre que la stratégie dominante pour chacun des criminels - un témoignage.Le point du jeu optimale se produit lorsque le délinquant témoigner et recevez votre «prix» - 2,5 ans de prison.Game Theory Nash appelle cet équilibre.

solution non optimale Nash

neshevskogo La vue révolutionnaire qui un tel équilibre est pas optimale, si nous considérons le participant et son intérêt personnel.Après tout, la meilleure option - est de garder le silence et d'être libéré.

équilibre de Nash - est le point de contact d'intérêt, où chaque participant choisit cette option, ce qui est optimal pour lui qu'à la condition que les autres participants choisissent une stratégie particulière.

l'examen d'une option lorsque le délinquant et recevoir tous silencieux pendant 1 an, peut être appelé une variante Pareto-optimale.Cependant, il est seulement possible si les criminels étaient en mesure de parvenir à un accord à l'avance.Mais même cela ne serait pas garantir ce résultat, parce que la tentation de retomber sur la persuasion et d'éviter des pénalités importantes.Le manque de confiance totale en l'autre et obtenir 5 ans, le risque d'aveux forcés de choisir.Méditez sur le fait que les participants vont coller à la version avec silencieux, agissant de concert, tout simplement irrationnel.Une telle conclusion ne peut être fait, si l'on étudie l'équilibre de Nash.Exemples prouvent seulement droite.

égoïste ou le gérant de

théorie équilibre de Nash Compte tenu des conclusions de superbes oprovergnuvshie disponibles à ce principe.Par exemple, Adam Smith, considéré comme le comportement de chacun des participants comme étant absolument égoïste, et qui apporte le système en équilibre.Cette théorie a été appelé la «main invisible du marché."

John Nash a vu que si toutes les parties agissent dans la poursuite de leurs propres intérêts seulement, il ne sera jamais conduire au résultat du groupe optimal.Étant donné que la pensée rationnelle est inhérent à chaque partie, un choix plus probable, qui offre stratégie équilibre de Nash.

expérience purement masculine

exemple frappant est le jeu "un paradoxe blonde", qui, bien qu'il semble hors de propos, mais est une illustration vivante qui montre comment la théorie des jeux Nash.

Dans ce jeu vous devez imaginer que l'entreprise est libre de gars est venu à la barre.A proximité se trouve la compagnie de jeunes filles, dont l'une est préférable à l'autre, dit la blonde.Comme les garçons à se comporter, pour obtenir la meilleure amie pour vous-même?

Alors les gars raisonnement: si tout le monde va se familiariser avec la blonde, alors très probablement, il ne sera pas tout le monde, puis ses amis ne voudront pas à explorer.Personne ne veut être la deuxième option de repli.Mais si vous les gars choisissent d'éviter la blonde, alors la probabilité de chacun des gars de trouver un bon ami chez les filles est élevée.

équilibre de Nash est pas optimale pour les gars parce que, poursuivant seulement leurs propres intérêts égoïstes, chacun devrait le choisir blonde.On voit que seule la poursuite de l'intérêt personnel reviendrait à l'effondrement des intérêts du groupe.Équilibre de Nash signifierait que chaque homme agit dans leurs propres intérêts, qui sont en contact avec les intérêts de l'ensemble du groupe.Cette option de sous-optimale pour chaque personne, mais le meilleur pour tout le monde, sur la base de la stratégie globale pour le succès.

Toute notre vie est un jeu

prise de décision dans le monde réel est très similaire au jeu quand vous vous attendez un certain comportement rationnel des autres participants.En affaires, travailler en équipe, dans une entreprise, même dans une relation avec le sexe opposé.De grandes transactions et à des situations ordinaires de la vie tout est soumis à une loi particulière.

bien sûr pris en considération pour des situations de jeu avec des criminels et la barre - il est juste excellente illustration montrant l'équilibre de Nash.Des exemples de tels dilemmes surgissent souvent dans le marché immobilier, et surtout dans le cas des deux monopoles qui contrôlent le marché.

stratégies mixtes

vovlekaemy Souvent, nous ne sommes pas dans un, mais dans plusieurs jeux.En choisissant l'une des options d'un jeu, guidés par une stratégie rationnelle, mais obtenir un jeu différent.Après quelques décisions rationnelles vous pouvez constater que vos résultats ne sont pas.Que prendre?

considérer deux types de stratégies:

stratégie
  • Net - est le comportement du participant qui vient de la réflexion sur le comportement possible des autres participants.
  • stratégie mixte ou stratégie casual - cette alternance de stratégies pures de sélection aléatoire ou pure stratégie avec une certaine probabilité.Cette stratégie est appelée rendomizirovannoy.

Considérant ce comportement, nous obtenons une nouvelle perspective sur l'équilibre de Nashua.Si vous avez déjà dit que le joueur choisit la stratégie une fois, et on peut imaginer un comportement différent.Vous pouvez éviter la possibilité que les joueurs choisissent des stratégies au hasard avec une certaine probabilité.Jeux dans lesquels vous ne pouvez pas trouver un équilibre de Nash en stratégies pures, ils sont toujours mélangés.

équilibre de Nash en stratégies mixtes est appelé un bilan mitigé. Il ya un équilibre, où chaque participant choisit la fréquence optimale du choix de leurs stratégies, à condition que les autres membres choisissent leurs stratégies avec une fréquence prédéterminée.Sanctions

et stratégie mixte

exemple d'une stratégie mixte peut entraîner dans un jeu de football.La meilleure illustration de la stratégie mixte - ce qui est probablement les pénalités.Donc, nous avons un gardien de but qui ne peut sauter dans un coin, et le joueur qui va battre une pénalité.

Donc, si la première fois le joueur choisit une stratégie visant à avoir un impact dans le coin gauche et le gardien sont également dans ce coin et attraper la balle, comment les événements peuvent développer une deuxième fois?Si un joueur est frappé au coin opposé, il est probablement trop évident, mais a frappé le même angle d'au moins évidente.Par conséquent, le gardien, et le frappeur n'a pas le choix que de compter sur une sélection aléatoire.

Donc, alternant sélection aléatoire d'une certaine stratégie pure, joueur et gardien pytajutsja obtenir un maximum de résultats.