Nash Equilibrium.

click fraud protection

Pada tahun 1930 John von Neumann dan Oskar Morgenstern menjadi pendiri arah menarik baru matematika, yang disebut "Teori Game".Pada tahun 1950, tren ini menjadi tertarik pada matematika muda John Nash.Teori keseimbangan menjadi subyek tesisnya, yang ia menulis pada usia 21 tahun.Maka lahirlah permainan strategi baru yang disebut "kesetimbangan Nash", layak Hadiah Nobel bertahun-tahun kemudian - pada tahun 1994.

kesenjangan panjang antara penulisan disertasi dan menjadi universal diterima tes untuk matematika.Genius tanpa pengakuan mengakibatkan gangguan mental yang serius, tetapi juga tugas John Nash mampu memecahkan berkat logicheskumu pikiran baik.Teorinya tentang "Nash equilibrium" dianugerahi Nobel dan hidupnya dalam film adaptasi dari «pikiran Indah» («A Beautiful Mind").

sebentar pada teori permainan

Sejak teori Nash equilibrium menjelaskan perilaku manusia dalam hal interaksi, sehingga Anda harus mempertimbangkan konsep dasar teori permainan.Teori

Permainan mempelajari perilaku peserta (agen) di lingkungan berinteraksi satu sama lain oleh jenis permainan di mana hasilnya tergantung pada keputusan dan perilaku beberapa orang.Anggota mengambil keputusan berdasarkan harapan mereka tentang perilaku orang lain, yang disebut strategi game.

Ada juga strategi dominan, di mana peserta mendapatkan hasil terbaik ketika perilaku dari setiap peserta lainnya.Ini adalah pemain terbaik strategi bezproigryshnaya.Dilema

Tahanan dan terobosan Dilema

Tahanan - itu adalah kasus dengan permainan, di mana peserta harus membuat keputusan yang rasional, mencapai tujuan keseluruhan alternatif dalam situasi konflik.Pertanyaannya adalah, mana dari pilihan ini akan memilih, menyadari kepentingan pribadi dan umum, dan ketidakmampuan untuk mendapatkan sesuatu, dan banyak lagi.Pemain suka tertutup dalam kondisi bermain yang sulit, yang kadang-kadang membuat mereka berpikir sangat produktif.

dilema ini mengeksplorasi matematika Amerika John Nash.Keseimbangan, yang dia pimpin, revolusioner dengan caranya sendiri.Ide baru yang kuat dipengaruhi pendapat ekonom tentang bagaimana membuat berbagai pemain di pasar, dengan mempertimbangkan kepentingan orang lain, dengan interaksi padat dan persimpangan kepentingan.

Cara terbaik adalah untuk mempelajari teori permainan dengan contoh-contoh konkret, karena disiplin matematika ini sendiri tidak kering dan teoritis.

Contoh tahanan dilema

contoh, dua orang berkomitmen perampokan, jatuh ke tangan polisi dan diinterogasi dalam sel terpisah.Pada saat yang sama para menteri polisi menawarkan setiap peserta kondisi yang menguntungkan di mana itu akan dirilis dalam kasus bersaksi melawan pasangannya.Setiap penjahat ada berikutnya mengatur strategi yang akan mempertimbangkan:

  1. Kedua secara bersamaan memberikan kesaksian dan menerima 2,5 tahun penjara.
  2. Kedua diam dan pada saat yang sama mendapatkan 1 tahun, seperti dalam kasus ini dasar bukti kesalahan mereka akan kecil.
  3. Satu bersaksi dan mendapat gratis dan yang lain adalah diam dan mendapat 5 tahun penjara.

Jelas, hasil dari kasus tergantung pada keputusan kedua belah pihak, namun mereka tidak dapat mencapai kesepakatan, karena duduk di sel yang berbeda.Juga jelas terlihat dengan konflik kepentingan pribadi mereka dalam perjuangan untuk kepentingan bersama.Setiap tahanan memiliki dua pilihan dan 4 hasil versi.

rantai penalaran logis

Jadi pelaku tetapi untuk mempertimbangkan pilihan berikut:

  1. aku tenang dan diam adalah pasangan saya - kami berdua mendapatkan 1 tahun penjara.
  2. Saya menyewa pasangan dan dia membawaku - kami berdua mendapatkan 2,5 tahun penjara.
  3. Saya diam, dan teman saya melewati - saya akan mendapatkan lima tahun penjara, dan dia dibebaskan.
  4. saya berikan pasangan, tapi dia diam - Saya mendapatkan kebebasan, dia adalah 5 tahun penjara.

mengurangi matriks solusi yang mungkin dan hasil untuk kejelasan.

Tabel kemungkinan hasil dilema narapidana.Pertanyaan

adalah bahwa setiap peserta akan memilih?

«Diam, Anda tidak bisa mengatakan" atau "tidak bisa tinggal diam, berbicara»

Untuk memahami pilihan peserta, Anda harus melalui rantai nya pemikiran.Setelah argumen pelaku Dan jika saya mengatakan apa-apa dan mengatakan apa-apa pasangan saya, kita akan mendapatkan periode minimal waktu (1 tahun), tapi aku tidak bisa melihat bagaimana ia akan berperilaku.Jika dia memberikan bukti terhadap saya, saya juga lebih baik untuk memberikan bukti, kalau tidak saya bisa duduk selama 5 tahun.Saya lebih suka duduk untuk 2,5 tahun dari 5 tahun.Jika dia diam, maka semakin saya harus memberikan bukti, juga, saya akan mendapatkan kebebasan.Demikian pula, pembicaraan dan peserta B.

mudah untuk memahami bahwa strategi yang dominan untuk masing-masing penjahat - kesaksian.Titik optimal dari permainan terjadi ketika kedua pelaku bersaksi dan menerima "hadiah" Anda - 2,5 tahun penjara.Game Theory Nash menyebut keseimbangan ini.

solusi optimal Non-optimal Nash

neshevskogo Pandangan revolusioner yang seimbang seperti itu tidak optimal, jika kita mempertimbangkan peserta individu dan kepentingan pribadinya.Setelah semua, pilihan terbaik - adalah untuk tetap diam dan akan dirilis.

Nash equilibrium - adalah titik kontak yang menarik, di mana setiap peserta memilih opsi ini, yang optimal untuk dia hanya dengan syarat bahwa peserta lain memilih strategi tertentu.

mempertimbangkan opsi ketika kedua pelaku dan menerima semua diam selama 1 tahun, bisa disebut varian Pareto-optimal.Namun, itu hanya mungkin jika para penjahat mampu mencapai kesepakatan di muka.Tapi bahkan yang tidak akan menjamin hasil ini, karena godaan untuk jatuh kembali persuasi dan menghindari hukuman besar.Kurangnya kepercayaan penuh di satu sama lain dan mendapatkan 5 tahun, risiko pengakuan dipaksa untuk memilih.Renungkan fakta bahwa peserta akan menempel versi dengan diam, bertindak dalam konser, hanya tidak rasional.Kesimpulan tersebut dapat dibuat, jika kita mempelajari kesetimbangan Nash.Contoh hanya membuktikan benar.

Egois atau mengelola

teori Nash equilibrium diberikan kesimpulan menakjubkan oprovergnuvshie tersedia untuk prinsip ini.Misalnya, Adam Smith, dianggap perilaku masing-masing peserta sebagai benar-benar egois, dan yang membawa sistem ke keseimbangan.Teori ini disebut "tangan tak terlihat dari pasar."

John Nash melihat bahwa jika semua pihak untuk bertindak dalam mengejar kepentingan mereka sendiri saja, itu tidak akan pernah menyebabkan hasil kelompok optimal.Mengingat bahwa pemikiran rasional melekat masing-masing pihak, pilihan lebih mungkin, yang menawarkan strategi Nash equilibrium.

percobaan murni laki-laki

mencolok contoh adalah permainan "paradoks pirang", yang, meskipun tampaknya keluar dari tempat, tetapi gambaran yang jelas yang menunjukkan bagaimana teori permainan Nash.

Dalam permainan ini Anda perlu membayangkan bahwa perusahaan bebas dari orang-orang datang ke bar.Terdekat adalah perusahaan anak perempuan, salah satunya adalah lebih baik untuk yang lain, mengatakan si pirang.Ketika anak-anak untuk berperilaku, untuk mendapatkan pacar terbaik untuk diri sendiri?

Jadi orang penalaran: jika semua orang akan berkenalan dengan pirang, maka kemungkinan besar, hal itu tidak akan mendapatkan siapa pun, maka teman-temannya tidak akan ingin menjelajahi.Tak seorang pun ingin menjadi pilihan jatuh kembali kedua.Tetapi jika kalian memilih untuk menghindari pirang, maka probabilitas dari masing-masing orang untuk mencari teman yang baik di antara gadis-gadis yang tinggi.

Nash equilibrium tidak optimal untuk karena orang-orang, mengejar hanya kepentingan mereka sendiri, masing-masing akan memilih pirang.Hal ini terlihat bahwa hanya mengejar kepentingan diri sendiri akan sama saja dengan runtuhnya kepentingan kelompok.Ekuilibrium Nash akan berarti bahwa setiap orang bertindak dalam kepentingan mereka sendiri, yang berada dalam kontak dengan kepentingan seluruh kelompok.Pilihan ini sub-optimal untuk setiap orang, tapi yang terbaik untuk semua orang, berdasarkan strategi keseluruhan untuk sukses.

seluruh hidup kami adalah permainan

Pengambilan keputusan di dunia nyata sangat mirip dengan permainan ketika Anda mengharapkan perilaku rasional tertentu dari peserta lain.Dalam bisnis, bekerja dalam tim, di sebuah perusahaan, bahkan dalam hubungan dengan lawan jenis.Dari transaksi besar dan situasi kehidupan biasa semuanya tunduk pada hukum tertentu.Tentu saja

dipertimbangkan untuk situasi permainan dengan penjahat dan bar - itu hanya ilustrasi yang sangat baik yang menunjukkan keseimbangan Nash.Contoh dilema seperti itu sering muncul di pasar nyata, dan terutama dalam kasus dua monopolis yang mengendalikan pasar.Strategi

Mixed

vovlekaemy Seringkali kita tidak dalam satu tetapi dalam beberapa pertandingan.Dengan memilih salah satu opsi satu pertandingan, dipandu oleh strategi yang rasional, tetapi mendapatkan permainan yang berbeda.Setelah keputusan rasional beberapa Anda mungkin menemukan bahwa hasil Anda tidak.Apa untuk mengambil?

mempertimbangkan dua jenis strategi:

strategi
  • Net - adalah perilaku peserta yang berasal dari refleksi pada perilaku yang mungkin dari peserta lainnya.
  • strategi campuran atau strategi kasual - pergantian ini strategi murni pilihan acak atau strategi murni dengan probabilitas tertentu.Strategi ini disebut rendomizirovannoy.

Mengingat perilaku ini, kita mendapatkan perspektif baru pada keseimbangan Nashua.Jika Anda sebelumnya mengatakan bahwa pemain memilih strategi sekali, dan satu bisa membayangkan perilaku yang berbeda.Anda dapat menghindari kemungkinan bahwa pemain memilih strategi acak dengan probabilitas tertentu.Permainan di mana Anda tidak dapat menemukan keseimbangan Nash dalam strategi murni, mereka selalu dicampur.

Nash equilibrium dalam strategi campuran disebut keseimbangan campuran. Ini adalah keseimbangan, di mana setiap peserta memilih frekuensi optimal memilih strategi mereka, asalkan anggota lain memilih strategi mereka dengan frekuensi yang telah ditentukan.

Hukuman dan strategi campuran

contoh strategi campuran dapat menghasilkan permainan sepak bola.Ilustrasi terbaik dari strategi campuran - ini mungkin adalah hukuman.Jadi, kami memiliki kiper yang bisa melompat hanya di salah satu sudut, dan pemain yang akan mengalahkan penalti.

Jadi, jika pertama kalinya pemain memilih strategi untuk membuat dampak di sudut kiri dan kiper juga jatuh ke sudut ini dan menangkap bola, bagaimana peristiwa dapat mengembangkan kedua kalinya?Jika seorang pemain memukul ke sudut yang berlawanan, itu mungkin terlalu jelas, tapi memukul sudut yang sama tidak kurang dari jelas.Oleh karena itu, kiper, dan adonan tidak memiliki pilihan selain mengandalkan pilihan acak.

Jadi, bolak pilihan acak dari strategi murni, pemain dan kiper pytajutsja tertentu mendapatkan hasil yang maksimal.