بخشی از مقاله

*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***

ارزيابي عملکرد توابع کرنل در تخمين جريان رودخانه ها با استفاده از ماشين بردار پشتيبان
چکيده
سابقه و هدف: پيش بيني دقيق رواناب رودخانه ها نقش مهمي در مديريت بهينه منابع آب در دسترس دارد. در سالهاي اخير، ماشين بردار پشتيبان (SVM) که يکي از مهم ترين مدلهاي دادهکاوي است براي اين منظور مورد توجه قرار گرفته است . اين مدل يک سيستم يادگيري کارآمد بر مبناي تئوري بهينه سازي مقيد است که از اصل استقراي کمينه سازي خطاي ساختاري استفاده کرده و منجر به يک جواب بهينه کلي ميگردد. همانند مدلهاي دادهکاوي ديگر مدل SVM نيز ميتواند در مواقعي که فقط دادههاي رواناب در دسترس ميباشد جهت شبيه سازي رواناب مورد استفاده قرار گيرد (مدلسازي خودهمبسته ). به طور معمول سه تابع کرنل پايه شعاعي (RBF)، چندجمله اي درجه d و خطي در ماشين بردار پشتيبان مورد استفاده قرار ميگيرند که کاربرد هر يک از اين توابع با پارامترهاي مختلف در تخمين رواناب رودخانه ها ممکن است منجر به نتايج متفاوتي شود. بنابراين ارزيابي کارايي و دقت هر يک از اين توابع و انتخاب تابع کرنل مناسب در پيش بيني جريان رودخانه ضروري است . همچنين از آنجا که مدلهاي سري زماني AR،ARMA و ARIMA از مدل هاي اصلي در شبيه سازي خودهمبسته رواناب ميباشند بنابراين ميتوان از طريق مقايسه عملکرد هر يک از توابع کرنل با اين مدلها، دقت نسبي اين توابع در اين زمينه را مورد بررسي قرار داد. بنابراين ارزيابي دقت هر يک از توابع کرنل در شبيه سازي رواناب ماهانه و مقايسه عملکرد آنها با مدلهاي سري زماني هدف اصلي اين پژوهش را رقم ميزند.
مواد و روشها: در اين پژوهش حوضه خرخرهچاي به عنوان منطقه مورد مطالعه انتخاب شده و جريان ماهانه مشاهداتي اين حوضه در ايستگاه آبسنجي سنته جهت واسنجي و اعتبارسنجي مدلها به کار گرفته شد. براي اين منظور، در ابتدا ٧٥ درصد از دادههاي جريان ماهانه (١٣٨٤-١٣٦٧) براي واسنجي مدل ها انتخاب شده و ٢٥ درصد دادهها (١٣٩٠-١٣٨٥) جهت اعتبارسنجي مدلها استفاده شد. سپس توزيع احتمالاتي دادههاي جريان ماهانه در ايستگاه آبسنجي سنته براساس آزمونهاي کلموگروف- اسميرنوف و شاپيرو- ويلک مورد بررسي قرار گرفته و نرمالسازي توزيع دادهها انجام گرفت . پس از بهينه سازي پارامترهاي مربوط به هر يک از توابع کرنل ، مقادير جريان ماهانه در ايستگاه آبسنجي سنته پيش بينيشده و عملکرد اين توابع با استفاده از جذر ميانگين مربعات خطا (RMSE) و ضريب همبستگي (CC) مورد ارزيابي قرار گرفت .

يافته ها: بررسيهاي اين پژوهش نشان داد که اگرچه تفاوت معنيدار بين نتايج سه تابع کرنل وجود ندارد، ولي تابع کرنل چندجمله اي درجه ٤ با مقادير ضريب همبستگي و جذر ميانگين مربعات خطا به ترتيب برابر با ٠.٨٦ و ٥.٨٨ (مترمکعب در ثانيه ) در دوره تست ، در مقايسه با توابع کرنل ديگر از دقت بالا و عملکرد بهتري در پيش بيني جريان ماهانه برخوردار است . همچنين نتايج نشان داد که مدل (٦٢)ARMA با مقادير ضريب همبستگي و مجذور ميانگين مربعات خطا به ترتيب برابر با ٠.٨٢ و ٦.٤٧ (مترمکعب در ثانيه ) در دوره تست ، نسبت به ساير مدلهاي سري زماني عملکرد خوبي را در پيش بيني جريان ماهانه حوضه خرخرهچاي دارا ميباشد.
نتيجه گيري: در نهايت مقادير جريان ماهانه پيش بيني شده با استفاده از تابع کرنل چندجمله اي درجه ٤ (به عنوان نماينده مدل SVM) با نتايج مدل (٦٢)ARMA (به عنوان نماينده مدلهاي سري زماني) مقايسه گرديد و اين نتيجه حاصل شد که مدل SVM از کارايي بهتري نسبت به مدلهاي سري زماني در پيش بيني جريان ماهانه حوضه خرخرهچاي برخوردار است .
واژههاي کليدي: پيش بيني جريان رودخانه ، توابع کرنل ، حوضه خرخرهچاي، ماشين بردار پشتيبان، مدلهاي سري زماني

مقدمه
مدلهاي مختلفي در تخمين جريان حوضه هاي آبخيز مورد استفاده قرار ميگيرند که کارايي و همچنين موارد استفاده از آنها براساس ساختار حوضه ، دادههاي در دسترس و مورد نياز و همچنين هدف شبيه سازي از همديگر متفاوت است . انتخاب مدلي که بتواند ميزان جريان رودخانه را با دقت بالا و خطاي کم مدلسازي نمايد کمک شاياني در مديريت صحيح طرحهاي منابع آبي و افزايش عملکرد آنها دارد. در دهه هاي اخير مدلهاي سري زماني و اخيرا مدل ماشين بردار پشتيبان 1(SVM) به دليل ماهيت رياضي و داده محور بودن آن، جهت تخمين جريان رودخانه ها مورد توجه پژوهشگران قرار گرفته اند.
مدلهاي سري زماني از دو بخش اصلي، شامل مؤلفه تصادفي و مؤلفه جبري تشکيل شدهاند که مؤلفه جبري مدل با استفاده از ارقام مشاهداتي و بخش تصادفي با استفاده از روشهاي مختلف استوکاستيک ٢ به دست ميآيد. بنابراين در صورت درست انتخاب 70 کردن مدل و انجام صحيح محاسبات، ساختار مدلهاي سري زماني ميتواند با ساختار سريهاي هيدرولوژيکي سازگاري و مطابقت ويژهاي داشته باشد (٢٠). بيش تر مدلهاي سري زماني رايج در هيدرولوژي و منابع آب از نوع خطي بوده که AR٣، ARMA٤ و ARIMA٥ از متداولترين نوع آنها ميباشند (٢٠). ماشين هاي بردار پشتيبان، سيستم هاي يادگيري خاصي هستند که از يک فضاي فرضيه به نام فضاي مشخصه ٦ شامل توابع خطي با بعد زياد استفاده کرده و ميتوانند براي پيش بيني (دسته بندي و رگرسيون) مورد استفاده قرار گيرند. اين سيستم ها توسط الگوريتم يادگيري که بر اساس تئوري بهينه سازي استوار است ، واسنجي ميشوند. اين تئوري که توسط وپنيک و کورتيس (١٩٩٥) به عنوان روشي قدرتمند و مهم معرفي گرديده از پيش قدر يادگيري ٧ که از تئوري يادگيري آماري استخراج شده استفاده ميکند (٢٢).
تاکنون پژوهش هاي زيادي در مورد ارزيابي و همچنين مقايسه عملکرد هر يک از اين مدلها با مدلهاي هوشمند از قبيل شبکه عصبي مصنوعي، فازي و نروفازي در تخمين جريان رودخانه انجام گرفته است . آسفا و همکاران (٢٠٠٥) مدل SVM با تابع کرنل خطي را براي پيش بيني جريانهاي فصلي و ساعتي در حوضه رودخانه سويئر در ايالات متحده به کار گرفتند. آنها در اين پژوهش با توجه به حجم جريان معادل برف و همچنين حجم جريان در دورههاي پيشين ، ميزان حجم جريان در دورههاي ٦ ماهه و ٢٤ ساعته را پيش بيني نمودند که نتايج مطالعه ايشان از دقت مطلوبي برخوردار بود (٣). در پژوهشي ديگر جاين و کومار (٢٠٠٧) کارآيي مدلهاي شبکه عصبي مصنوعي و مدلهاي سري زماني را در پيش بيني مقادير جريان ماهانه رودخانه کلرادو تحت تأثير سه سناريو مورد بررسي قرار دادند که در هر سه سناريو دقت مدل شبکه عصبي بهتر از مدل خود همبسته (AR) به دست آمد (١٣).
داملي و يالسين (٢٠٠٧) به پيش بيني جريانهاي سيلابي با استفاده از سريهاي زماني در رودخانه ميسيسيپي آمريکا پرداختند. نتايج مطالعه ايشان نيز بيانگر توانايي سريهاي زماني در ساخت دادههاي جريان روزانه و صحت پيش بينيهاي حاصله است (٩). ليو (٢٠١١) در مطالعه خود عملکرد مدلهاي رگرسيوني، ARIMA و شبکه عصبي مصنوعي را در پيش بيني جريان روزانه رودخانه وايت کليکريک نزديک ايالت پنسيلوانيا مورد ارزيابي قرار داده و دقت آنها را در تخمين جريان رودخانه با يکديگر مقايسه کردند. نتايج پژوهش آنان نشان داد زماني که دادهها از توزيع نرمال تبعيت کرده و داراي طول دوره آماري کافي باشند، مدلهاي خطي کم ترين خطا را در پيش بيني جريان رودخانه دارا ميباشند (١٧). آداموفسکي (٢٠١٣) روش مدل ماشين بردار پشتيبان و شبکه عصبي مصنوعي را براي شبيه سازي بارش- رواناب در يک حوضه کوهستاني با دادههاي محدود در يوتارانچال هندوستان به کار گرفت . نتايج بررسي وي نشان از توانايي مدل ماشين بردار پشتيبان با تابع کرنل پايه شعاعي در پيش بيني رواناب مستقيم ، جريان پايه و جريان کل اين منطقه کوهستاني و پر از تپه داشت .(1)
کاکائيلفاداني و همکاران (٢٠١٣) سه مدل ماشين بردار پشتيبان و نرو فازي (ANFIS) و مدل هيدرولوژيکي مفهومي NA.Mike١١ را در شبيه سازي جريان روزانه حوضه اسکندري به کار گرفتند. نتايج نشان داد که هر سه مدل داراي عملکرد مناسب در منطقه مورد مطالعه ميباشند. درنهايت مدل ماشين بردار پشتيبان با تابع کرنل پايه شعاعي بالاترين ضريب همبستگي و کم ترين ميانگين مربعات خطا را در شبيه سازي جريان رودخانه نسبت به دو مدل ديگر از خود نشان داد (١٦). بنيحبيب و وليپور (٢٠٠٨) عملکرد سه مدل آرما، آريما و شبکه عصبي مصنوعي را در پيش بيني ماهانه جريان ورودي به مخزن سد دز مورد مقايسه قرار دادند که نتايج بيانگر دقت بيش تر مدل شبکه عصبي مصنوعي نسبت به دو مدل ديگر در پيش بيني جريان ماهانه بوده است (٦). انتخاب مدلي که ميزان جريان رودخانه را با دقت بالا و خطاي کم تر پيش بيني نمايد ميتواند کمک شاياني در مديريت صحيح طرحهاي منابع آبي و افزايش عملکرد اين طرحها داشته باشد. با توجه به آنچه آمد پژوهش حاضر سعي دارد تا کارايي مدل SVM را در کنار مدلهاي سري زماني در پيش بيني رواناب ماهانه حوضه رودخانه خرخرهچاي مورد ارزيابي قرار دهد و دقت اين مدلها را در اين پيش بيني نسبت به يکديگر بررسي کند. با توجه به اين که ترکيب وروديها و نوع ساختار به کار گرفته شده براي هر يک از اين مدلها تأثير چشم گيري در نتايج پيش بيني و عملکرد آنها دارد؛ بنابراين در اين پژوهش تلاش شد کارايي مدلهاي مذکور به ازاي تأخيرهاي ١ تا ١٥ ماهه جريان و همچنين انواع ساختارهاي مختلف مدلها مورد ارزيابي قرار گيرد. براي اين منظور مدلهاي خطي AR،ARMA و ARIMA (به عنوان مدلهاي سري زماني) و مدل SVM با سه تابع کرنل پايه شعاعي (RBF1)، چندجمله اي درجه d و کرنل خطي جهت پيش بيني ماهانه رواناب به کار گرفته شدند.
مواد و روشها
داده و منطقه مورد مطالعه : محدوده مورد مطالعه در اين پژوهش حوضه رودخانه خرخرهچاي از شاخه هاي اصلي حوضه زرينه رود است که در طول جغرافيايي ٤٦ درجه و ٢٢ دقيقه تا ٤٦ درجه و ٤٨ دقيقه شرقي و عرض جغرافيايي ٣٥ درجه و ٤٢ دقيقه تا ٣٦ درجه و ١٠ دقيقه شمالي قرار دارد (شکل ١).
اين حوضه سهم قابل توجهي در حجم آب ورودي به سد بوکان و در نتيجه تأمين نيازهاي آبي پايين دست اين سد دارد. مساحت اين حوضه در محل ايستگاه آبسنجي سنته بالغ بر ١٢٣٢ کيلومترمربع بوده و متوسط ارتفاع آن از سطح دريا ٢٠٣٥ متر است .
همچنين متوسط بارش سالانه اين حوضه در حدود ٤٠٢ ميليمتر است . دادههاي مورد استفاده در اين پژوهش شامل جريان ماهانه مشاهداتي در ايستگاه آبسنجي سنته طي دوره ١٣٦٧ الي ١٣٩٠ است .
به طوريکه دادههاي دوره آماري (بهمن ١٣٨٤- بهمن ١٣٦٧) به عنوان دادههاي واسنجي و دوره (شهريور ١٣٩٠- اسفند ١٣٨٤) به عنوان دادههاي صحت سنجي هر يک از مدلها انتخاب گرديدند. به عبارت ديگر ٧٥ درصد از دادههاي مشاهداتي براي واسنجي و ٢٥ درصد ديگر جهت صحت سنجي مدلها در نظر گرفته شدند (شکل ٢).


نرمالسازي داده ها: پيش شرط استفاده از مدلهاي سري زماني تبعيت نمودن دادههاي مورد استفاده از توزيع نرمال است (٢). به علت تبعيت نکردن دادههاي دبي مشاهداتي ماهانه ايستگاه سنته از توزيع نرمال؛ از روشهاي متعددي هم چون باکس - کاکس ١، تبديل جانستون ٢ و توابع لگاريتمي، نمايي، تواني، راديکالي و معکوس هر يک از آنها جهت نرمالسازي دادههاي جريان استفاده گرديد. با به کارگيري هر يک از اين روشها بر روي دادههاي جريان و انجام آزمونهاي کلموگروف- اسميرنوف و شاپيرو- ويلک در سطح اطمينان ٠.٩٥ بر روي آنها، اين نتيجه حاصل شد که هيچ يک از روشهاي مذکور در نرمالسازي دادههاي جريان کارساز نيستند. در نهايت در پژوهش حاضر از روابط ١ تا ٣ که حاصل تجربه نويسندگان مقاله است ، جهت نرمالسازي دادهها استفاده گرديد.


در اين روابط n تعداد سالها، ميزان جريان مشاهداتي در ماه j ام از سال iام، ميانگين درازمدت جريان در ماه j ام، SDw انحراف معيار متغير و جريان نرمال شده در ماه j ام از سال i ام هستند. بعد از نرمالسازي دادهها، شاخص هاي آماري ميانگين ، مقادير حداقل و حداکثر، انحراف معيار، چولگي و کشيدگي محاسبه گرديده و آزمونهاي کلموگروف- اسميرنوف و شاپيرو- ويلک در سطح اطمينان ٠.٩٥ براي دادههاي مشاهداتي اوليه و نرمال شده انجام گرفت که نتايج آنها در جدول ١ آورده شده است . لازم به ذکر است که آزمونهاي آماري کلموگروف- اسميرنوف و شاپيرو- ويلک با استفاده از نرمافزار ٢٢ SPSS انجام گرفته است .


همچنين در اين جدول نتايج مربوط به محاسبه شاخص ها و انجام آزمونهاي مذکور براي دادههاي اوليه (نرمالنشده) نشان داده شده است . لازم به ذکر است چنانچه طي آزمونهاي مذکور سطح معنيداري بيش تر از ٠.٠٥ به دست آيد دادهها با سطح اطمينان
٠.٩٥ از توزيع نرمال تبعيت ميکنند. بر اين اساس با توجه به نتايج آمده در جدول ١ ميتوان دريافت که توزيع احتمالاتي دادههاي جريان ماهانه مشاهداتي اوليه در ابتدا نرمال نبوده ولي پس از اعمال معادلات ٢٠ تا ٢٢ بر روي آنها، توزيع دادهها به نرمال تبديل شده است . شکل هاي ٣ و ٤ به ترتيب هيستوگرام فراواني دادههاي اوليه و نرمال شده را نشان ميدهند.

تعيين تعداد ورودي مدل ها: ميتوان با استفاده از توابع ACF و PACF ميزان همبستگي جريان ماهانه با تأخيرهاي ماهانه مختلف را مشخص نموده و از اين طريق به طور تقريبي تعداد و درجه تأخيرهاي ماهانه که بر جريان تأثير معنيداري دارند را تعيين کرد (١٤، ٢٤). در شکل هاي ٥ و ٦ به ترتيب نمودار توابع ACF و PACF مربوط به دادههاي جريان ماهانه نرمال شده
نشان داده شده است .

مطابق با نمودار PACF دادههاي نرمالشده جريان (شکل ٦)، اولين جريان تأخير يافته (درجه تأخير برابر با يک ) بيش ترين تأثير را در برآورد جريان دارد و همچنين براساس نمودار ACF جريان با تأخيرهاي ١ تا ١٥ ماهه خارج از باند استقلال قرار گرفته اند. پس ميتوان نتيجه گرفت که تعداد تأخيرهاي جريان ماهانه لازم جهت لحاظ نمودن در پيش بيني جريان توسط مدلهاي مذکور (تعداد متغيرهاي ورودي لازم به مدلها) برابر با ١٥ ماه ميباشد. در جدول ٢ ترکيب وروديهاي مختلف مورد استفاده در هر يک از مدلها آورده شده است .
ماشين بردار پشتيبان (SVM): اولين کاربرد اين روش در مسائل آب توسط ديباک و همکاران (٢٠٠١) جهت شبيه سازي بارش رواناب ارائه شد (١٠). ماشين بردار پشتيبان يک سيستم يادگيري کارآمد بر مبناي تئوري بهينه سازي مقيد است که از اصل استقراي کمينه سازي خطاي ساختاري استفاده کرده و منجر به يک جواب بهينه کلي ميگردد (١١). شکل ٧ ساختار ماشين بردار پشتيبان را نشان ميدهد.

در مدل رگرسيون SVM تابعي مرتبط با متغير وابسته y که خود تابعي از چند متغير مستقل x است ، برآورد ميشود. مشابه ساير مسائل رگرسيوني فرض ميشود رابطه ميان متغيرهاي مستقل و وابسته با تابع جبري مانند به علاوه مقداري اغتشاش ١ (خطاي مجاز ε) مشخص شود.

چنانچه W بردار ضرايب و b ثابت مشخصه هاي تابع رگرسيوني و  نيز تابع کرنل باشد، آنگاه هدف پيدا کردن فرم تابعي براي است . اين مهم با واسنجي مدل SVM توسط مجموعه اي از نمونه ها (مجموعه واسنجي) محقق ميشود.
اين روند شامل بهينه سازي متوالي تابع خطاست .
بسته به تعريف اين تابع خطا دو نوع مدل SVM تعريف ميشود:
SVM رگرسيوني نوع ١ (به عنوان ɛ-SVM رگرسيوني نيز شناخته ميشود)؛ SVM رگرسيوني نوع ٢ (به عنوان υ-SVM رگرسيوني شناخته ميشود).
شايان ذکر است در اين پژوهش از مدل ɛ-SVM رگرسيوني، به دليل کاربرد گسترده آن در مطالعات رگرسيوني، براي پيش بيني جريان رودخانه استفاده شده است (١١).
بنابراين براي محاسبه W و b لازم است تابع خطا (رابطه ٦) در مدل ɛ-SVM با در نظر گرفتن شرايط مندرج (قيود) در رابطه ٧ بهينه شود.


در معادلات بالا C عددي صحيح و مثبت است ، که عامل تعيين جريمه در هنگام رخ دادن خطاي واسنجي مدل ميباشد،  تابع کرنل ٢، N تعداد نمونه ها و دو مشخصه متغيرهاي کمبود 3 هستند که حد بالا و پايين خطاي آموزش مرتبط با مقدار خطاي مجاز ɛ را مشخص ميکنند (١١).
در مسائل پيش بيني ميشود که دادهها، درون بازه مرزي ɛ قرار گيرند. حال اگر دادهاي خارج از بازه ɛ قرار گرفت آنگاه يک خطا معادل وجود خواهد داشت . ذکر اين نکته نيز لازم است که مدل SVM مشکلات ناشي از کم تخميني ٤ و فوقبرازشي 5 را با کمينه کردن هم زمان دو ترم و خطاي آموزشي، يعني را در رابطه ٦ حل
ميکند. بنابراين با معرفي ٢ ضريب لاگرانژ مسأله بهينه سازي با حداکثرسازي عددي تابع درجه دوم زير (رابطه ٨) با شرايط رابطه ٩ حل خواهد شد.

تابع هدف رابطه ٨ تابع محدب است و بنابراين جواب رابطه ٨ يکتا و بهينه خواهد بود. پس از تعريف ضرايب لاگرانژ در رابطه ٨ مشخصه هاي w و b در مدل SVM رگرسيوني با استفاده از شرايط تئوري کراش- کوهن - تاکر١ محاسبه ميشوند (١٢)
که در آن است . در نتيجه براي مدل SVM رگرسيوني خواهيم داشت :

بايد توجه داشت که ترمهاي لاگرانژ ميتواند صفر و يا غيرصفر باشند. بنابراين فقط مجموعه دادههايي که ضرايب آنها غيرصفر است در معادله رگرسيون نهايي وارد ميشوند و اين مجموعه دادهها به عنوان بردارهاي پشتيبان شناخته ميشوند. به طور ساده، بردارهاي پشتيبان آن دادههايي هستند که به ساختار شدن تابع رگرسيوني کمک ميکنند. در ميان بردارهاي مذکور آنهایی که مقدار ان ها کم تر از C باشد بردارهاي پشتیبان حاشیه ای نامیده میشوند . هنگامي که مقدار

بردار های پشتیبان برابر مقدار c باشد به عنوان بردار پشتیبان خطا ، یا بردار پشتیبان کراندار شناخته میشود .
بردارهاي پشتيبان حاشيه اي در حاشيه مرز غيرحساس يافت ميشوند، در حاليکه بردارهاي پشتيبان خطا خارج از بازه هستند. در نهايت تابع SVM رگرسيوني را ميتوان به فرم زير بازنويسي کرد:

در رابطه ميانگين ضرايب لاگرانژ ميباشد. محاسبه در فضاي مشخصه آن ممکن است بسيار پيچيده باشد. براي حل اين مشکل روند معمول در مدل SVM رگرسيوني انتخاب يک تابع کرنل است (١١). ماشين بردار پشتيبان معمولا با سه تابع کرنل پايه شعاعي ٤(RBF)، چندجمله اي درجه d و خطي مورد استفاده قرار ميگيرد که روابط مورد استفاده در هر کدام از آنها به ترتيب در زير آورده شده است (٥، ١٥).

در شکل ٨ تابع کرنل خطي، پايه شعاعي و چندجمله اي درجه d در دسته بندي دادهها به کلاسهاي متمايز به صورت شماتيک نشان داده شدهاند.

با توجه به اين که از پرکاربردترين توابع کرنل ، کرنل خطي، پايه شعاعي و چندجمله اي ميباشند (٧، ١٧، ٢١) در اين پژوهش نيز از اين سه تابع کرنل استفاده شده است . لازم به ذکر است فرآيند محاسبات ماشين بردار پشتيبان، بر اساس کدنويسي در محيط متلب انجام و پارامترهاي توابع کرنل از طريق سعي و خطا بهينه گرديدند.
مدلهاي سري زماني: شبيه سازي سريهاي زماني از جمله رويکردهاي مطرح در زمينه پيش بيني و توليد دادههاي جديد ميباشد که در هيدرولوژي از اوايل دهه ١٩٦٠ توسط توماس ١، فيرينگ ٢ و يوجويج ٣ آغاز گرديده و در دهه ١٩٧٠ توسط باکس ٤ و جنکينس ٥ توسعه يافته است (٨). در پيش بيني با دقت بالا، افق زماني مشخص و محدود بوده در حاليکه در توليد دادهها، افق زماني خاصي را نميتوان در نظر گرفت (٨). در اين پژوهش از مدلهاي AR،ARMA و ARIMA جهت پيش بيني سريهاي زماني استفاده گرديده که در جدول ٣ به طور مختصر به روابط هر کدام از آنها اشاره شده است (٢٣، ٢٦).

در روابط فوق Xt و Zt  ميانگين سري زماني دادهها، ضرايب مدل AR و سري مستقل با توزيع نرمال، ميانگين صفر
tو انحراف معيار ضرايب مدل ARMA ضرايب مدل ARIMA،n تعداد دادهها همبستگي جريان با تأخير j،p و q مرتبه مدلها و واريانس دادهها ميباشند. همچنين سري ut توسط تفاضل گيري d ام از سري Xt حاصل ميشود. لازم به ذکر است که در پژوهش حاضر از روش حداکثر درست نمايي در تخمين پارامترهاي مدلهاي فوق استفاده گرديده است .
همچنين فرآيند محاسبات مدلهاي سري زماني از طريق کدنويسي در محيط متلب انجام شده است .
تعيين زمان تأخير و معيارهاي ارزيابي: توابع خودهمبستگي 1(ACF) و خودهمبستگي جزئي 2(PACF) از جمله معيارهاي مطرح در تعيين تعداد وروديهاي مؤثر در پيش بيني متغير مورد نظر ميباشند (١٤، ٢٤). در پژوهش حاضر نيز از اين توابع جهت تعيين تعداد تأخيرهاي جريان ماهانه لازم که بايد در ارزيابي کارايي مدلهاي ماشين بردار و سريهاي زماني مورد بررسي قرار گيرند استفاده گرديد.
با استفاده از روشهاي مختلفي ميتوان عملکرد مدلها را مورد ارزيابي و مقايسه قرار داد، يکي از اين روشها استفاده از معيارهاي ارزيابي ميباشد. از جمله معيارهاي ارزيابي پرکاربرد در علوم مهندسي آب ، ضرايب همبستگي 3(CC)، ريشه ميانگين مربعات خطا 4(RMSE) و معيار نش - ساتکليف 5(NS) ميباشند که به ترتيب در روابط ٢٠، ٢١ و ٢٢ آورده شدهاند. دقيق ترين مدل با توجه به اين معيارها، مدلي خواهد بود که مقدار اين سه معيار براي آن به ترتيب نزديک به يک ، صفر و يک باشد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید