بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

مقايسه دو روش ماشين بردار پشتيبان SVM و نرم افزار Statistica براي پيش بيني دبي روزانه

خلاصه
مديريت موفق منابع آب نيازمند رويکردهاي جهت دار، جامع و سيستماتيک مي باشد تا بتواند با وجود روند تشديد مشکلات مربوط به آب و افزايش رو به رشد تقاضاي آن ، نياز مصرف کنندگان را برطرف سازد. در اين راستا بهره گيري از شيوه هاي نوين مدلسازي منابع آب از اهميت ويژه اي برخوردار است . از طرفي ، پيشرفتهايي که در زمينه روشهاي پردازش اطلاعات صورت پذيرفته ، روشهاي داده - محور را نسبت به روشهاي رفتار- محور (روشهاي فيزيکي ) افزايش داده است . ماشين بردار پشتيبان روشي است که در آن نقاط قوت روش هاي آماري سنتي که بيشتر تئوري محور مي باشند و از نظر تجزيه و تحليل ساده هستند، ترکيب مي گردد. در سال هاي اخير در حوزه هاي هيدرولوژي و مديريت منابع آب و پيش بيني سري هاي زماني از رويکرد SVM استفاده هاي زيادي شده است . در اين پژوهش با استفاده از مدل بردار پشتيبان سري هاي زماني و اطلاعات يک دوره ١٨ ساله از سال ١٣٦٨ تا ١٣٨٦ از رودخانه قره سو جهت توليد جريان مصنوعي ، مورد استفاده قرار گرفت . در نهايت با نتايج حاصل از نرم افزار STATISTICA مقايسه ، که نتايج خروجي روش ماشين بردار پشتيبان نشان داد که توانايي بهتر و بالاتري نسبت به نرمافزار آماري STATISTICAدارا مي باشد.
کلمات کليدي : مديريت منابع آب ، پيش بيني دبي ، ماشين بردار پشتيبان SVM، نرم افزار آمار STATISTICA ، رودخانه قره سو
١. مقدمه
در سال هاي اخير، شاهد رشد روزافزون کاربرد هوش محاسباتي (CI)Computational Intelligence در حل مسائلي هستيم که تأثير پارامترهاي بسيار زياد در برخي فرايندهاي فيزيکي و وجود روابط کاملاً غيرخطي ميان آنها حاکم مي باشد. مبناي روش هاي هوشمند، استفاده از دانش نهفته در داده ها، تلاش براي استخراج روابط ذاتي بين آنها و تعميم آن در موقعيت هاي ديگر است . مهمترين روش هاي خبره عبارتند از شبکه هاي عصبي مصنوعي (محاسبات نروني )، منطق فازي (استنتاجات تقريبي ) و آلگوريتم ژنتيک (محاسبات موتاسيوني ) و روشي جديد به عنوان روش بردار پشتيبان .
ماشين بردار پشتيبان (SVM) يکي از پوياترين و جديدترين حوزه هاي تحقيق در حال حاضر مي باشد که محققين زيادي را در زمينه هاي گوناگون علمي به خود جلب کرده است .از طرف ديگر، يکي از مباحث مهم در مديريت منابع آب تشخيص صحيح ميزان دبي به صورت لحظه اي ، کوتاه مدت و بلند مدت و توان پيش بيني دبي در آينده مي باشد تا بتوان با اتکا به آن پيش بيني دقيق ، نسبت به مديريت مصرف برنامه ريزي هاي لازم را انجام داد. هدف از ارائه اين مقاله ، به کارگيري يک روش جديد مدلسازي به منظور پيش بيني دبي با استفاده از ماشين هاي بردار پشتيبان ١(SVMs) مي باشد. بدين منظور رودخانه از اطلاعات موجود در رودخانه قره سو استفاده شده است
٢.منطقه مورد مطالعه
حوزه آبريز رودخانه قره سو در استان گلستان واقع است . محدوده اين حوزه آبريز در مختصات (٥٤) تا (٤٥-٥٤) طول شرقي و (٣٦-٣٦) تا (٥٩-٣٦) عرض شمالي واقع شده است . مساحت حوزه آبريز رودخانه قره سوً ١٦٧٨/١ کيلومترمربع مي باشد. حداکثر ارتفاع حوزه و طول رودخانه اصلي به ترتيب ٣٢٠٠ متر از سطح دريا و ١٠٨/٠٠٥کيلومتر مي باشد. شکل ١ نقشه طبيعي و موقعيت حوزه رودخانه قره سو را نشان مي دهد.

شکل ١: نقشه طبيعي و موقعيت حوزه رودخانه قره سو
بيش از چهار ايستگاه باران سنجي بر روي رودخانه قره سو و سرشاخه هاي آن واقع شده است اما به دليل آنکه سالهاي داراي آمار اين ايستگاه ها با يکديگر مطابقت ندارند، نتوانستيم از همه اين ايستگاه ها در اين تحقيق استفاده کنيم . از آنجائيکه ايستگاه قره سو در خروجي حوزه قره سو واقع شده است ، در اين تحقيق از آمار آبدهي ايستگاه قره سو به عنوان آبدهي خروجي حوزه و سه ايستگاه آب سنجي زيارت ،شصت کلاته و کردکوي در سه نقطه از اين حوزه استفاده شده است (جدول ا).

٣.پيش پردازش داده ها
پيش پردازش داده ها شامل انتخاب متغيرهاي موثر، انتخاب الگوهاي آموزش و آزمون و نيز نرمال کردن (استاندار کردن ) الگوها مي شود. هدف از نرمال کردن ، هم ارزش کردن تمامي عناصر موجود در يک الگو است . معمولاً نرمال کردن الگوها تبديلي است که آنها را به بازه مشخصي مانند [١- ٠] يا [١-١-] نگاشت مي دهند. پس از نرمال کردن تمامي الگوها، طول دوره انتخابي از سال ١٣٦٨ تا ١٣٨٦ در حدود ١٨ سال اشد. در اين ١٨ سال در حدود ٦٥٥٠ الگوي روزانه براي هر ايستگاه موجود بوده که از اين تعداد ٧٥% داده ها جهت آموزش ماشين بردار پشتيبان و ٢٥% داده ها براي آزمون انتخاب شده است . نمودار ١ و ٢ به ترتيب هيدروگراف آبدهي روزانه ايستگاه قره سو در دوره آموزش و تست را نشان مي دهد.

٤.ماشين هاي بردار پشتيبان
روش ماشين هاي بردار پشتيبان که بر پايه تئوري يادگيري آماري استوار است .مقدار پارامتر Z در موقعيت x٠ را به صورت زير تخمين مي زند:

که .,. نشان دهنده ضرب داخلي بين بردارهاي بردار وزن ، x٠ بردار پشتيبان ، ˆZ مقدار پيش بيني شده وb مقدار باياس مي باشد. براي سهولت x٠ را با x نشان مي دهيم . مقادير بردار وزن و باياس با کمينه کردن تابع خطاي که با رابطه زير (تع٢ر)يف مي شود، به دست مي آيند:

که (Z)x کميت اندازه گيري شده و  دقتي است که بر اساس آن تخمين زده شده است .
در مسائل رگرسيوني با استفاده از اصل کمينه سازي خطاي ساختاري ، روش ماشين هاي بردار پشتيبان منجر به حل مسأله بهينه سازي زير مي گردد:

که C بيانگر سازشي است ميان پيچيدگي تابع تخمين زده شده و بالاترين مقداري از انحرافات بيشتر از  که قابل تحمل خواهند بود و متغيرهاي جريمه ايست که تابع هدف براي خطاهاي بزرگ تر از  در نظر خواهد گرفت .
اغلب مسأله بهينه سازي فوق در فرم دوگانه و با استفاده از ضرايب لاگرانژ حل مي شود که قادر به تخمين روابط غيرخطي نيز خواهد بود. با نوشتن رابطه (٣) در فرم دوگانه و مشتق گيري نسبت به متغيرهاي اصلي خواهيم داشت :

که ضرايب لاگرانژ و تابع کرنلي است که جايگزين ضرب داخلي شده است . بنابراين براي حل مسأله بايد مقادير C، وارامترهاي مربوط به تابع کرنل انتخابي مشخص باشند. الگوريتم هاي مختلفي براي تعيين وراپارامترهاي مدل ارائه شده است که مرسوم ترين آن ها روش تصديق متقاطع مي باشد.
٤-١.طراحي و تهيه مدل شبيه سازي با SVM
در آموزش يک ماشين بردار پشتيبان ، انتخاب تعداد و نوع پارامترهاي ورودي مدل از اهميت بسياري برخوردار است . از آنجايي که در ساختار ورودي ماشين بردار پشتيبان ، يک روش ثابت و يکسان وجود ندارد، مي توان از نتايج مقاله هاي ارائه شده در اين زمينه کمک گرفت . بر اين اساس پنج الگوي ورودي زير مورد بررسي قرار گرفته است :

در روابط فوق :
Q: متوسط آبدهي روزانه ايستگاه قره سو
Qn: متوسط آبدهي روزانه ايستگاه نهارخوران

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید