بخشی از پاورپوینت
اسلاید 1 :
تعادل minimax و تعادل همبسته
اسلاید 2 :
تعادل minimax
در یک بازی دونفره و جمع-صفر فرض کنید که رقیب شما از راهبرد ترکیبی شما اطلاع دارد.
مثلاً می داند به احتمال 50% سنگ و به احتمال 50% قیچی بازی می کنید. اما نمی داند که چه تصمیمی خواهید گرفت.
در مقابل این رقیب قدرتمند چه کاری از دست شما بر می آید؟
فرض کنید که رقیب سود شما (یعنی ضرر خودش) را حداقل می کند، سپس شما از بین این سودهای حداقلی، سود خودتان را بیشینه کنید.
maxσi mins-i ui(σi, s-i)
یا برعکس، سعی کنید که سود خودتان ( یعنی ضرر ایشان) را حداکثر کنید، سپس ایشان از بین این سودهای حداکثری، سود شما (ضرر خود) را کمینه خواهد کرد.
- minσi maxs-i u-i(σi, s-i)
اسلاید 3 :
مثال اول
می خواهیم در بازی سنگ، کاغذ، قیچی احتمالهای بهینه ی prock, ppaper, pscissors را برای خودمان بدست آوریم.
سود ناشی از بازی سنگ بازیگر دیگر برای او: pscissors - ppaper
سود ناشی از بازی کاغذ بازیگر دیگر برای او: prock - pscissors
سود ناشی از بازی قیچی بازیگر دیگر برای او: ppaper – prock
لذا ما می خواهیم که ترمهای عبارت زیر را حداقل کنیم تا بازیگر دیگر از بین این حداقلها بیشترین را انتخاب کند:
max{pscissors - ppaper, prock - pscissors, ppaper – prock}
راهبرد Minimax:
prock = ppaper = pscissors = 1/3
اسلاید 4 :
مثال دوم
اسلاید 5 :
مثال سوم
در این مثال A2 بهترین بازی بازیگر A است زیرا ضرر آن (1-) برای A کمترین است.
B2 نیز بهترین بازی بازیگر B است زیرا ضرر آن (0) برای B کمترین است.
اما این راه حل پایدار نیست.
از طرفی ردیف سوم و ستون سوم به ترتیب یک راهبرد مغلوب برای A و B هستند و می توانیم آنها را از بازی حذف کنیم.
در بازی خلاصه شده، A می تواند با احتمال 1/6 بازی A1 و با احتمال 5/6 بازی A2 را بازی کند.
B نیز می تواند با احتمال 1/3 بازی B1 و با احتمال 2/3 بازی B2 را بازی کند.
اسلاید 6 :
بازیهای عمومی
اگر چه می توانید از راهبرد minimax در بازیهای عمومی نیز استفاده کنید، اما اینکار عاقلانه نیست:
اگر بازیگر روی ستون بخواهد به بازیگر روی ردیف ضربه بزند، چپ بازی می کند. بازیگر ردیف نیز در مقابل پایین بازی می کند.
در واقعیت، بازیگر روی ستون بهتر است از راهبرد غالب راست استفاده کند.
اسلاید 7 :
تعادل همبسته در مقابل تعادل نش
بازی ترس جوجه ای
این بازی دو تعادل نش خالص دارد: (D,C), (C,D)
اگر هر بازیگر با احتمال ترکیبی 1/3 نترسد، یک تعادل نش ترکیبی داریم.
سود تعادل نش ترکیبی برابر 4.5 است.
دقت کنید سود تعادلهای نش خالص هم 4.5 است.
اگر هر بازیگر با احتمال 1/3یکی از بازیهای (C,C), (D,C) و (C,D) را انتخاب کند، سود حاصل این تعادل همبسته 5 است.
در اینجا فرض کرده ایم، نفر سومی وجود دارد که اگر به بازیگر اول بگوید D بازی کند به بازیگر دوم اعلام می کند که C بازی نماید.
اسلاید 8 :
یک مثال دیگر
فرض کنید نفر سوم به بازیگر ردیف بگوید که D بازی کند.
سود D برای بازیگر ردیف برابر است با: (2/3)*(-1) = -2/3
سود S برای بازیگر ردیف برابر است با:(1/3)*1 + (2/3)*(-5) = -3
لذا بهتر است به حرف نفر سوم گوش کنیم.
حال فرض کنید نفر سوم به بازیگر ردیف بگوید که S بازی کند.
سود S برای بازیگر ردیف برابر است با: 1
سود D برای بازیگر ردیف برابر است با:0
لذا باز هم بهتر است به حرف نفر سوم گوش کنیم.
همین موضوع برای بازیگر ستون هم صادق است.
20%
40%
40%
اسلاید 9 :
یک نسخه ی متفاوت از بازی سنگ .
احتمالات فوق یک تعادل همبسته هستند.
فرض کنید به بازیگر ردیف بگوییم سنگ بازی کند.
اگر سنگ بازی کند، سود حاصل ½ خواهد بود.
اگر کاغذ بازی کند، سود حاصل 0خواهد بود.
اگر قیچی بازی کند، سود حاصل ½ خواهد بود.
لذا بازی سنگ بهینه است (اگر چه یکتا نیست)
1/6
1/6
1/6
1/6
1/6
1/6
اسلاید 10 :
بازی موهومی
فرض می کنیم هر بازیگر رفتارهای گذشته ی بازیگر مقابل را بررسی می کند و بهترین پاسخ به رفتارهای گذشته را در دور جاری بازی ارایه می کند.
اگر بازی موهومی همگرا شود، به سمت یک تعادل نش ترکیبی بازی خواهد رفت.
شرایط همگرایی:
ماتریس بازی 2*2 باشد.
جمع-صفر باشد.
بتوان با حذف راهبردهای مغلوب آنرا حل کرد.
در بازیهای عمومی نمی توان همگرایی را تضمین کرد.
اسلاید 11 :
بازی شیپلی
F.P. بین (1,1),(1,2),(2,2),(2,3),(3,3),(3,1) نوسان خواهد کرد.
تعادل نش بازی استفاده از احتمال 1/3 برای هر سه حالت است.
تعادل همبسته استفاده از احتمال 1/6 برای حالتهایی است که جمع سود آنها صفر نیست.
سود تعادل نش 1/3 و سود تعادل همبسته ½ است.