بخشی از مقاله
*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***
پیش بینی نتایج فوتبال مبتني بر داده هاي آماري جزئي با استفاده از شبکه ي عصبی مصنوعی
چکيده
هدف اين مقاله ، پیش بینی نتايج مسابقات فوتبال بر مبناي آمار بازي هاي انجام شده می باشد. داده هاي ورودي ، آمار جزئي بازي هاي انجام شده در يک نیم فصل بوده که شامل مواردي مانن د: تعداد گل ، تعداد شوت ، تعداد شوت داخل چارچوب و تعداد پاس هاي صحيح می باشد. در اينجا براي پيش بيني نتايج از شبکه ي عصبی پرسپترون چند لايه با الگوريتم انتشار خطا رو به عقب استفاده شده است . شبکه ي عصبی مذکور با آمار نیم فصل اول آموزش ديده و بر روي بازي هاي نیم فصل دوم آزمايش شده است . در پااين نتايج اين روش با ساير روش هاي ارائه شده که تقريبا همگي آنها تنها مبتني بر نتیجه ي بازي هاي انجام شده می باشند، مقايسه شده است . نتايج نهايي حاکي از برتري محسوس اين روش بر روش هاي آماري موجود ميباشد.
کلمات کليدي
محاسبات نرم ، شبکه ي عصبی مصنوعي، پرسپترون چند لايه، پیش بینی نتايج فوتبال
١. مقدمه
بدون شک فوتبال يکي از محبوب ترين ورزش ها در سراسر دنياست که يکي از دلايل آن ، نامشخص بودن نتیجه ي بازي می باشد. علاقه به دانستن نتیجه ي بازي، پيش از اتمام آن ، همواره مورد توجه علاقه مندان اين رشته ي ورزشي بوده و هم ين امر باعث ايجاد مسابقات جانبي براي پیش بینی نتايج بازي ها شده است . بسياري از افراد بر اين باورند که فوتبال قابل پیش بینی نيست ؛ دليل آنها نيز نتايج به ظاهر عجيب و دور از انتظاري است که در برخي از مسابقات رخ می دهد. اما ممکن است اين تفکر از عدم شناخت کامل ما بر عوامل مؤثر بر نتیجه ي بازي نشأت گرفته باشد. به نظر می رسد که فاکتورهاي گوناگوني که بعضا در تعامل با يکديگر نیز هستند بر نتیجه ي نهايي تأث ير می گذارند و از آنجا که اين فاکتورها هر يک با نسبت ي مشخص بر نتیجه ي بازي مؤثرند، درک برآيند و ن يز محاسبات آنها از توانايي انسان خارج است .
روش هاي پیش ب يين فوتبال را می توان به دو دسته ي کل ي تقس يم نمود. دسته ي اول روش هاي آماري بوده که تلاش می کنند تا بر اساس نتايج کسب شده توسط ت ي ها در بازي هاي گذشته ي آنها، الگويي براي پیش بینی نتايج بازي هاي آينده ارائه دهند. اين روش ها عموما به علت ماهيت ذاتي خود، از انعطاف پذيري چندان بالايي برخوردار نيستند؛ در مقابل مشخص شده است که روش هاي مبتني بر محاسبات نرم ، به ويژه شبکه هاي عصبی مصنوعي [١ و ٢]، به علت توانايي بالاي آنها در حل مسائلي که رابطه اي غيرخطي بين وروديها و خروجيها وجود دارد، منجر به نتايج بهتري می شوند.
در بخش ٢ مروري بر کارهاي پيشين در زمينه ي پيش بيني نتايج فوتبال داشته و روش کار هر يک به اختصار بيان ميشود. در بخش ٣ ايده ي پيشنهادي، معرفي شده و چگونگي عملکرد آن ، داده هاي ورودي، پارامترها، ساختار شبکه و آموزش آن به طور کامل شرح داده ميشود. در بخش ٤، نتايج استفاده از شبکه ي عصبي پرسپترون چند لايه بر روي داده هاي آماري جزئي با روش هاي پيشين مقايسه شده و در فصل٥ نيز جمع بندي و کارهايي که در آينده در جهت تکميل اين روش انجام خواهند شد، آورده شده است .
٢. کارهاي پيشين
تا کنون چندين مدل بر اساس روش هاي آماري و نيز شبکه هاي عصبی ارائه شده است . ماهيت اصلي روش هاي آماري، استفاده از شرط هاي متداخل if-else می باشد. در تمام مواردي که در ادامه ميآيد، فرض بر اين است که تیم A، میزبان و تیم B، ميهمان ميباشد.
سيستم Elo: اين روش ابتدا براي بازي هاي شطرنج و Go ارائه گرديد، اما امروزه براي ورزش هاي مختلف ، از جمله فوتبال ، مورد استفاده قرار می گيرد.
PAB: احتمال پيروزي تیم A بر تیم
B Score: امتياز کل يک تیم
PAB = 44.8% + 0.53% * | ScoreA – ScoreB |
مدل مقايسه ي نسبت گل : اين روش مبتني بر شرط هاي if-else متداخل بر اساس نسبت تعداد گل هر تیم بر تعداد بازي هاي انجام داده شده می باشد.
GR: نسبت تعداد گل هاي زده ي يک تیم بر تعداد بازي هاي آن
مدل مقايسه اي شش بازي اخير: اين مدل مبتني بر نتيجه ي شش بازي اخير تيم ها می باشد.
Score: امتیاز کل يک تیم
روش Cheng و ديگران [ ١]: اين روش از يک شبکه ي عصبي هيبريد ( BP و LVQ) بهره ميبرد. در روش مذکور، بازي بر حسب بردار ورودي LVQ که به صورت ميباشد به سه دسته تقسيم ميشود. شماي کلي اين روش در شکل ١ نشان داده شده است .
AverageScore: امتياز کسب شده بر تعداد بازي
AverageNetGoals: تفاضل گل بر تعداد بازي
شکل ١ : سيستم پيشنهادي Cheng و ديگران
نتيجه ي دسته بندي بازي به صورت زير ميباشد: تيم A از تيم B قويتر است . تيم A و B تقريبا در حد هم ميباشند. تيم A از تيم B ضعيف تر است .
بر اساس دسته بندي انجام شده در مرحله ي فوق ، اين اطلاعات با داده هاي ورودي BP ترکيب شده و منجر به پیش بینی نهايي بازي می شوند . در شکل ٢، بردار ورودي براي BP نشان داده شده است . مقدار home-win براي تيم ميزبان ١.٠ و براي تيم ميهمان ٠.٥ ميباشد.
morale نيز در واقع ضريب تأثير نتيجه ي ٣ بازي گذشته بر نتيجه ي بازي مورد نظر بوده و مقدار آن از رابطه ي زير به دست ميآيد.
شکل ٢ : بردار ورودي BP در مدل Cheng و ديگران
روش Aslan و ديگران [٢]: اين روش مشابه روش Cheng و ديگران ميباشد. در اين روش دو ديدگاه مبتني بر LVQ که LVQA و LVQB نام دارند استفاده شده که تفاوت آنها در اين است که بردار ورودي LVQB از LVQA ساده تر بوده و تنها شامل ٢ پارامتر ميباشد.