O'yin nazariyasi. O'yinni rasmiylashtirish
"Mahbusning dilemmasi"
Aralash strategiyalar
O'yin nazariyasi. O'yinni rasmiylashtirish
Iqtisodiy tahlilning zamonaviy dunyosidagi o'yin nazariyasi orqali kartellar, Evropa Ittifoqi va evro zonalarining muammolarini aniq belgilash mumkin, bundan tashqari, ularning yordami bilan ko'plab ishtirokchilar bilan boshqa o'zaro ta'sirlarni simulyatsiya qilish mumkin.
1 ta'rifi O'yin nazariyasi – har qanday strategik hamkorlik ishtirokchilari – shaxmatchilar va karta o'yinchilari, oligopolistik bozorda raqobatchilar va biznes bilan o'zaro aloqada bo'lgan davlat, qurolli mojaroning qarama-qarshi tomonlari va xalqaro birlashmaning ishtirokchilari bo'lgan mamlakatlarning qarorlarini tahlil qilish va prognozlash mavzusi bo'lgan matematik bo'lim.
O'yin nazariyasida o'yin o'zaro ta'sir deb ataladi, bu o'zaro ta'sirning ishtirokchilari futbolchilar deb ataladi. O'yinda har bir futbolchining farovonligi o'z harakatlariga va boshqa o'yinchilarning harakatlariga bog'liq. Har qanday futbolchini qabul qilgan barcha muqobil usullar va harakatlar strategiyasi deb ataldi. Barcha o'yin ishtirokchilarining turli strategiyasi va harakatlari natijasida to'lovlarni qabul qilish mumkin.
O'yinni rasmiylashtirish
O'yin rasmiylashtirish uchun bir necha yo'llari bor. Ko'pincha bu matematik usul bo'lib, oddiy o'yinlar uchun to'lov jadvali ko'pincha ishlatiladi.
2 ta'rifi To'lov jadvali-barcha kombinatsiyalar va strategiyalar uchun o'yinchilarning barcha to'lovlarini qayd etadigan jadval.
Quyidagi jadvalda "tosh, qaychi, qog'oz"o'yinida bir rublda o'ynaydigan bir nechta o'yinchilar uchun to'lov matritsasining namunasi keltirilgan.
|
2 o'yinchi
|
Tosh
|
Qaychi
|
Qog'oz
|
1 o'yinchi
|
Tosh
|
O'yinchi 1: 0 rub., o'yinchi 2: 0 rub.
|
O'yinchi 1: +1 rub., o'yinchi 2: -1 rub.
|
O'yinchi 1: -1 rub., o'yinchi 2: +1 rub.
|
Qaychi
|
O'yinchi 1: -1 rub., o'yinchi 2: +1 rub.
|
O'yinchi 1: 0 rub., o'yinchi 2: 0 rub.
|
O'yinchi 1: +1 rub., o'yinchi 2: -1 rub.
|
Qog'oz
|
O'yinchi 1: +1 rub., o'yinchi 2: -1 rub.
|
O'yinchi 1: -1 rub., o'yinchi 2: +1 rub.
|
O'yinchi 1: 0 rub., o'yinchi 2: 0 rub.
|
"Mahbusning dilemmasi"
Nazariy adabiyotda kooperativ va operatsion bo'lmagan o'yinlarni tahlil qilish o'rtasidagi farq mavjud. Yuqorida aytib o'tilganidek, o'yinchilar o'zlarining kelishuvlarini tuzishga qodir. Bunday kelishuvlarning kafolati yopiq. Ko'pgina o'yin teorisyalari, kelishuvlarni aldash va buzish inson munosabatlarining umumiy xususiyatlari ekanligini ta'kidlaydi, shuning uchun bunday xatti-harakatlar strategik makon ichida qolishi kerak. Ular, ayniqsa, modelda, DZ o'yinlarining cheksiz takrorlanadigan ketma-ketligi bilan kooperativ bo'lmagan o'yin modellarida kooperatsiya paydo bo'lishini va saqlanishini tushuntirishga harakat qilishadi.
O'yinlarning yakuniy ketma-ketligi hech qanday natija bermaydi, chunki oxirgi o'yinda dominant strategiya aniq chekinishga aylanadi va kutilgan vaqtdan boshlab, oldingi o'yin uchun ham xuddi shunday bo'ladi va birinchi o'yinga qadar. G'alabalarni diskontlash bo'yicha muayyan taxminlar bilan o'yinlarning cheksiz seriyasida muvozanat strategiyasi sifatida hamkorlik paydo bo'lishi mumkin. Shunday qilib, operatsion bo'lmagan tahlil strategik makon ta'rifining bir qismi sifatida o'yinning asosiy qoidalarini qabul qilish zaruratidan qochmaydi. Bu faqat qoidalar mukammal va kam cheklovchi majmuini o'z ichiga oladi.
Kooperativ tahlildan farqli o'laroq, shartnomalar irodasi bilan yirtilishi mumkin. Boshqa tomondan, uzluksiz o'yindan chiqish cheklangan. Hech qanday yondashuv tahlilni boshlashdan oldin o'yin qoidalarini belgilash zaruratidan qochmaydi. DZ tadqiqotida eng qiziqarli so'nggi yutuqlardan biri, ikki ishtirokchi bilan DZ takrorlanadigan o'yinlarni o'tkazish uchun oldindan belgilangan strategiyalar o'rtasida musobaqalar tashkil etish edi. Ulardan birinchisi Robert Axelrod (1984da tasvirlangan) tomonidan tashkil etilgan va o'yinni 200 partiyalarida ketma-ketlik bilan kiritgan. DZ ishtirokchilari kompyuter dasturlarini taklif qilishdi va keyinchalik bir-birlari bilan raqobatlashdi.
R. Axelrod o'yinchilarga strategiyalar g'alabalar soni bo'yicha emas, balki boshqa barcha strategiyalarga qarshi ballar miqdori bo'yicha baholanadi, har biri o'zaro hamkorlik uchun uch ball, o'zaro murtadlik uchun bir ball va murtadlik/hamkorlik uchun 5-ga 0-ga ega bo'ladi. Yuqorida ta'kidlab o'tilganidek, murtadlik oxirgi o'yinning dominant strategiyasidir va shuning uchun har bir avvalgi o'yin. R. Axelrod tomonidan tahlil qilingan DZDA g'alaba qozongan matritsani ko'rib chiqing, chunki boshqa o'yinchi nima qilsa, xiyonat hamkorlikdan ko'ra ko'proq mukofot beradi. Agar birinchi o'yinchi boshqa o'yinchining jim bo'lishini o'ylasa, unda unga xiyonat qilish yanada foydali bo'ladi ($5>$3). Boshqa tomondan, agar birinchi o'yinchi boshqasini xiyonat qilsa, unga xiyonat qilish yanada foydali bo'ladi ($1 hech narsadan yaxshiroq). Natijada, vasvasalar xiyonat qilishga moyil. Ammo agar ikkalasi ham xiyonat qilsa, ikkalasi ham hamkorlik holatidan kamroq bo'ladi($1+$1<$3+$3).
Mahbusning ikkiyuzlamasi-iqtisodiyotda mashhur muammo-bir agent uchun oqilona yoki maqbul bo'lgan narsa birgalikda ko'rib chiqilgan bir guruh shaxslar uchun oqilona yoki maqbul bo'lmasligi mumkinligini ko'rsatadi. Insonning xudbin xatti-harakati guruh uchun zararli yoki halokatli bo'lishi mumkin. DZ ning takrorlanadigan o'yinlarida tegishli strategiya aniq emas.
Yaxshi strategiyani topish uchun musobaqalar tashkil etildi. Agar g'olib g'alaba-yo'qotish asosida qat'iy ravishda olinadigan bo'lsa, unda turnirning har bir ishtirokchisi doimiy murtadlikni taklif qilishi kerak edi. Shu bilan birga, g'alaba qozonish qoidalari muayyan hamkorlikni tashkil etish umumiy natijalarga olib kelishi mumkinligini aniq ko'rsatdi.
Ko'pchilik ajablanib, A. Rapoport tomonidan taklif etilgan oddiy tish-to-tish strategiyasi g'olib bo'ldi: o'yinchi birinchi bosqichda hamkorlik qiladi va keyin boshqa o'yinchi oldingi bosqichda harakat qiladi. Ikkinchi turnirda ko'plab futbolchilar, jumladan, mutaxassislar, shuningdek, birinchi tur natijalari haqida bilganlar ishtirok etdi. Natijada nusxa ko'chirish strategiyasining yana bir g'alabasi ("tish uchun tish") edi. Turnir natijalarini tahlil qilish muvaffaqiyatli strategiyaga olib keladigan to'rtta xususiyatni aniqladi:
keraksiz mojarodan qochish va boshqa birov kabi uzoq vaqt hamkorlik qilish istagi;
2) boshqalarning xiyonatidan kelib chiqadigan biror narsaga qarshi kurashish qobiliyati;
3) qo'ng'iroqqa javob berganidan keyin kechirim;
4) xatti-harakatlarning ravshanligi, shuning uchun boshqa o'yinchi birinchi harakat imidjini taniy olishi va moslashishi mumkin.
R. Axelrod, kooperatsiya boshlanishi, rivojlanishi va barqarorlashishi mumkinligini ko'rsatdi, aks holda yaxshi narsalar va'da qilmasdan favqulodda. Analitik ma'noda "tish-to-tish" strategiyasi, albatta, takrorlanadigan o'yinda irratsionaldir, ammo empirik ravishda aniq emas. Agar tish-to-tish strategiyasi boshqa analitik strategiyalar bilan raqobatlashsa, ularning barchasi doimiy murtadlikdan iborat bo'lsa, u turnirda g'alaba qozona olmadi.
Barcha o'yin nazariyasi bo'yicha eng mashhur o'yin - "mahbusning ikkilanishi". Uning ma'nosi quyidagicha. Jinoyat sodir etganlikda gumon qilingan ikki mahbus politsiya tomonidan hibsga olingan va keyinchalik turli kameralarga joylashtirilgan. Ularning har biri ikkiyuzlamachilik oldida – jinoyatni tan olish yoki qilmaslik.
Ularning hech biri boshqalarning qanday ishlashini bilmaydi, podelnik qanday strategiyani tanlashini bilmaydi. Ular faqat bu haqida ma'lumotga ega: Agar hech kim tan olmasa, har ikkala jinoyatchi ham dalil yo'qligi sababli olti oy ichida ozod qilinishi mumkin. Agar har kim tan olsa, ular ikki yil qamoq jazosini oladi, chunki tergov bilan hamkorlik tufayli muddat qisqartiriladi. Agar ulardan faqat bittasi tan olinsa, ikkinchisi aybni inkor etsa, ongli ravishda darhol ozod qilinadi va uch yil davomida sukut saqlagan kishi. Ushbu o'yinning to'lov matritsasi quyidagi jadvalda keltirilgan. Shuni ta'kidlash kerakki, to'lovlar qamoqxonada o'tkaziladigan yillar sonini aks ettirishi sababli salbiy.
|
Jinoyatchi 2
|
Jim
|
Qabul qilish
|
Jinoyatchi 1
|
Jim
|
P1: -0,5 P2: -0,5
|
P1: -3 P2: 0
|
Qabul qilish
|
P1: 0 P2: -3
|
P1: -2 P2: -2
|
Mahbuslar uchun eng yaxshi stsenariy shundaki, ularning ikkalasi ham sukut saqlashlari kerak va faqat bu holatda ular olti oy ichida qamoqdan chiqib ketishlari mumkin. Ammo bunday jinoyatchilar ko'pincha turli kameralarga joylashtirilgan va haqiqiy guvohliklarni alohida-alohida olishga harakat qilishlari ajablanarli emas. Psixologik darajada jinoyatchilar bir-biridan shubhalanadilar va menimcha, kimdir hali ham tan olinadi va keyin ulardan biri barlarda ancha uzoq vaqt sarflashi kerak. Ular oldindan mudofaa strategiyasiga rozi bo'lishlari ehtimoldan yiroq emas va shuning uchun ular qaysi liniyalar haqida ma'lumotga ega emaslar. Himoya tarafdorlari tomonidan tanlanadi.
Podelnik haqida hech qanday ma'lumotga ega emas, balki matematik matritsani bilish bilan birga, ularning har biri shunday fikr yuritishi mumkin: sherikning qaysi strategiyasidan qat'i nazar, men uchun eng foydali strategiya bormi? O'yin nazariyasida bunday strategiya dominant deb ataladi. Bunday strategiya ikki jinoyatchilar uchun mumkin ekanligini tushunish uchun muhim ahamiyatga ega, har bir kishi o'z – o'zini tan olish strategiyasi bor. Misol uchun, birinchi jinoyatchi uchun "tan olish" strategiyasi dominant.
Agar ikkinchisi jim bo'lsa, unda birinchi bo'lib mukammallikka erishish va ikkinchisini ochish foydalidir, bu holda u olti oy ichida emas, balki darhol ozod qilinadi. Agar siz ikkinchisini tan olsangiz, unda birinchi bo'lib tan olish ham foydalidir, chunki bu holda ikkalasi ham uch yil emas, balki ikki yil oladi. Bunga asoslanib, ikkinchi tanlov qanday bo'lishidan qat'i nazar, birinchi navbatda, tan olish foydalidir.
Xuddi shu sxemaga ko'ra, ikkinchisining tan olinishi ham foydalidir va uning dominant strategiyasi bo'ladi. Har ikki gumon dominant strategiyasini tanlash bo'lsa, natija paradoksal bo'ladi - har ikki ular olti oydan kechiktirmay ozod bo'ladi, deb umid oziqlangan bir vaqtning o'zida, qamoqda ikki yil sarflaydi.
Yana bir muammo shundaki, agar o'yinda Nash muvozanati bo'lsa, u Paretoda samarali natijalarga olib kelmaydi. Misol uchun, jadvalda tasvirlangan o'yinni ko'rib chiqing.27.4. Ushbu o'yin mahbusning dilemmasi sifatida tanilgan. O'yinning dastlabki versiyasida jinoyatchilarning ikkita mahbusi — alohida xonalarda so'roq qilinadigan vaziyat ko'rib chiqildi.
Mahbuslarning har biri tanlovga ega: jinoyatni tan olish va shu bilan boshqasini aldash yoki jinoyatda ishtirok etishni inkor etish. Agar mahbuslardan faqat bittasi tan olinsa, u ozod qilinadi va prokuratura 6 oy qamoq jazosiga hukm qilinadigan boshqa mahbusga tushadi. Agar har ikkala mahbus jinoyatga aloqadorligini inkor etsa, ikkalasi ham 1 oy qamoqxonada ushlab turiladi agar ikkala futbolchi ham tan olinsa, ikkalasi ham 3 oy qamoq jazosiga hukm qilinadi. Ushbu o'yin uchun to'lov matritsasi jadvalda keltirilgan.27.4.
Matritsaning har bir hujayrasidagi yozuvlar har bir o'yinchiga turli qamoq muddatlariga taalluqli bo'lgan foyda keltiradi, biz soddalik uchun "minus"belgisi bilan olingan qamoq muddati deb hisoblaymiz.
Agar o'yinchi b jinoyat sodir etganligini inkor etishga qaror qilsa, unda, albatta, siz tan olasiz, chunki siz ozod bo'lasiz. Xuddi shunday, agar b o'yinchi tan olinsa, unda siz tan olishingiz kerak, chunki bu holda siz 6 oy qamoq jazosiga hukm qilinmaydi, faqat 3. Shuning uchun, b o'yinchi nima qilsa, a o'yinchi tan olish uchun ko'proq foydalidir.
Do'stlaringiz bilan baham: |