بخشی از مقاله

*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***

مقايسه عملکرد روشهاي ماشين بردار پشتيبان و شبکه هاي بيزين در پيش بيني جريان روزانه رودخانه (مطالعه موردي: رودخانه باراندوزچاي )
چکيده
سابقه و هدف: از آنجا که پيش بيني جريان رودخانه ها در مهندسي منابع آب از اهميت ويژهاي برخوردار است ، پژوهشگران متعددي در دهه هاي اخير روشهاي مختلفي را در اين زمينه به کار برده و مورد بررسي قرار دادهاند.
همچنين با توسعه و گسترش روشهاي هوش مصنوعي از يک دهه قبل به اين سو، امکان کشف و آشکارسازي بهتر ارتباطات بين متغيرهاي مختلف هيدرولوژيکي به طور چشم گيري ميسر گرديده است . ماشين بردار پشتيبان و شبکه هاي بيزين از جمله روشهاي نويني هستند که در زمينه پيش بيني جريان رودخانه در سالهاي اخير به کار گرفته شدهاند.
مواد و روشها: در اين مطالعه ، به منظور پيش بيني جريان رودخانه باراندوزچاي از دو روش ماشين بردار پشتيبان (SVM) و شبکه هاي بيزين (BNs) استفاده شد. ماشين بردار پشتيبان يکي از روشهاي يادگيري تحت نظارت است که هم براي دسته بندي و هم رگرسيون قابل استفاده است . در سالهاي اخير سيستم هاي پشتيباني تصميم ، جهت جمع آوري و يکپارچه سازي بهترين دانش و اطلاعات براي اتخاذ مناسب ترين تصميم گيري، در سطح وسيعي از علوم گسترش يافته است که مدل شبکه تصميم گيري بيزين يکي از انواع مختلف سيستم هاي پشتيباني تصميم است . شبکه تصميم گيري بيزين ، روشي سودمند است که مي تواند اطلاعات و دادههاي کمي را به خوبي با دانش کيفي کارشناسي همسو نمايد.
يافته ها: دادههاي جريان روزانه اين رودخانه در محل ايستگاه آبسنجي ديزج در خلال سالهاي ١٣٨٥ تا ١٣٨٩ براي ايجاد مدل استفاده شد که ٨٠ درصد دادهها براي آموزش و ٢٠ درصد براي صحت سنجي مدل به کار رفت . همچنين نقش حافظه در کاهش يا افزايش دقت پيش بيني مورد بررسي قرار گرفت . جهت مدلسازي جريان رودخانه با مدلهاي SVM و BNs از حافظه هاي دبي يک روز قبل ، دو روز قبل و ... پنج روز قبل استفاده شد و نتايج براساس شاخص هاي آماري جذر ميانگين مربعات خطا، ضريب همبستگي و معيار نش - ساتاکليف مورد بررسي قرار گرفت .
بنابراين الگوهاي ورودي متعددي به مدلها معرفي شد. در نهايت مشخص گرديد که با افزايش حافظه ، دقت مدلسازي نيز افزايش مييابد به طوريکه بيش ترين دقت در الگوي سوم براي هر دو روش به دست ميآيد.

مقايسه نتايج دو مدل نشان داد که دقت روش ماشين بردار پشتيبان با و معيار نش - ساتاکليف معادل با ٠.٩٤٩ نسبت به روش شبکه هاي بيزين با و معيار نش - ساتاکليف برابر با ٠.٩٢١ بيش تر است .
نتيجه گيري: با دقت بيش تر در نتايج ارائه شده، ميتوان نتيجه گرفت که عملکرد دو روش SVM و BNs از نظر تحليل هاي آماري نزديک به هم بوده، اما از نقطه نظر گرافيکي و تخمين دبيهاي کمينه و بيشينه ، مشخص است که هر دو مدل در پيش بيني دبي بيشينه خطاي بيش تري دارند اما در پيش بيني دبي متوسط و کمينه عملکرد مدل SVM به مراتب بهتر از مدل BNs ميباشد.
واژههاي کليدي: شبکه هاي بيزين ، ماشين بردار پشتيبان، مدلسازي


مقدمه
از آنجا که پيش بيني جريان رودخانه ها در مهندسي منابع آب از اهميت ويژهاي برخوردار است ، پژوهشگران متعددي در دهه هاي اخير روشهاي مختلفي را در اين زمينه به کار برده و مورد بررسي قرار دادهاند. روشهاي پيش بيني رايج را به طور عمده ميتوان به روشهاي مبتني بر سريهاي زماني، مدلهاي رگرسيوني و مدلهاي حوضه آبريز تقسيم بندي نمود (٢٤). در اين بين ، روشهاي سري زماني از محدوديت بيش تري برخوردار بوده و در مجموع دقت کم تري در پيش بيني درازمدت جريان رودخانه دارند. از طرف ديگر، مدلهاي حوضه آبريز که براي پيش بيني جريان استفاده ميشوند بسيار پيچيده بوده و تهيه و توليد آنها نيازمند هزينه بسيار ميباشد. با توجه به اين که مدلهاي رگرسيوني ميتوانند ساختارهاي ساده و پيچيدهاي را شامل شوند اما اغلب به دليل پيچيدگيهاي موجود در فرآيند تبديل بارش و برف به جريان رودخانه قادر به پيش بيني دقيق جريان به ويژه در فاصله هاي زماني کوتاهمدت نميباشند. از طرفي، کارايي مدلهاي رگرسيوني به طور عمده مربوط به پيش بينيهاي ميانمدت بوده و در درازمدت علاوه بر دلايل ذکر شده با توجه به دخالت عوامل ديگر قادر به پيش بيني و يا حتي نشان دادن رابطه پارامترهاي مختلف و جريان رودخانه نميباشند (٢٣). از سويي ديگر با توسعه و گسترش روشهاي هوش مصنوعي از يک دهه قبل به اين سو، امکان کشف و آشکارسازي بهتر ارتباطات بين متغيرهاي مختلف هيدرولوژيکي به طور چشم گيري ميسر گرديده است . ماشين بردار پشتيبان ١ و شبکه هاي بيزين ٢ ازجمله روشهاي نويني هستند که در زمينه پيش بيني جريان رودخانه در سالهاي اخير به کار گرفته شدهاند.
ماشين بردار پشتيبان يکي از روشهاي يادگيري تحت نظارت ٣ است که هم براي دسته بندي و هم رگرسيون قابل استفاده است . اين روش توسط وپنيک (١٩٩٨) بر پايه تئوري يادگيري آماري ٤ بنا نهاده شده است (٢٥). ماشين بردار پشتيبان روشي براي طبقه بندي دوتايي در فضاي ويژگيهاي دلخواه است و از اين رو روشي مناسب براي مسائل پيش بيني به شمار ميرود (١٨). ماشين بردار پشتيبان در اصل يک دسته بنديکننده دو کلاسه است که کلاسها را توسط يک مرز خطي از هم جدا ميکند. در اين روش نزديک ترين نمونه ها به مرز تصميم گيري را بردارهاي پشتيبان مينامند. اين بردارها معادله مرز تصميم گيري را مشخص ميکنند. الگوريتم هاي شبيه سازي هوشمند کلاسيک مانند شبکه هاي عصبي مصنوعي، معمولا قدرمطلق خطا يا مجموع مربعات خظاي دادههاي آموزشي را حداقل ميکنند، ولي مدلهاي SVM، اصل حداقل سازي خطاي ساختاري را به کار ميگيرند (٩). اخيرا اين مدلها در گستره وسيعي از مسايل هيدرولوژيکي و به ويژه پيش بيني جريان رودخانه ها به کار رفته اند. نيکبخت شهبازي (٢٠٠٨) از مدل ماشين بردار پشتيبان سريهاي زماني و دادههاي رودخانه هاي کشف رود (ايستگاه آق دربند) و هريرود (ايستگاه پل خاتون) در يک دوره ٤٥ ساله (١٣٣٠ تا ١٣٧٤) جهت توليد جريان استفاده کردند. نتايج نشان داد که ماشين بردار پشتيبان در حفظ توام خواص ماهيانه و ساليانه جريان بسيار خوب عمل ميکند.
مقايسه نتايج حاصل با مدل HEC4، نشان داد که مدل بردار پشتيبان روشي بسيار بهتر و دقيق تر در توليد جريان مصنوعي بوده و عملکردي به مراتب بهتر از خود نشان مي دهد (١٧). يو و همکاران (٢٠٠٥) از روش ماشين بردار پشتيبان براي پيش بيني سيلاب ساعتي رودخانه لان يانگ در کشور تايوان استفاده کردند. نتايج نشان داد که اين روش براي پيش بيني سيلاب يک ساعت آينده از دقت بالايي برخوردار بود (٢٦). در مطالعه اي ديگر، يو و چن (٢٠٠٦) از روش ماشين بردار پشتيبان جهت پيش بيني سيل ساعتي رودخانه لان يانگ در تايوان استفاده نمودند. نتايج حاصل بيانگر دقت مناسب و قابل قبول روش مذکور در پيش بيني رويداد هاي سيل در ١ تا ٦ ساعت بعد داشت (٢٧). آداموفسکي و پراشر (٢٠١٢) براي 1 پيش بيني جريان روزانه در حوضه کوهستاني سيانجي واقع در منطقه هيمالياي هندوستان از دو روش رگرسيون ماشين بردار پشتيبان و شبکه هاي موجک ٢ استفاده کردند. مقايسه نتايج نشان داد که گرچه هر دو روش از دقت خوبي در پيش بيني جريان روزانه برخوردار بودند، اما دقت روش شبکه هاي موجک اندکي بيش تر بود (١). چوبي و همکاران (٢٠١٤) از مدل SVM براي پيش بيني و دادهکاوري جريان ورودي به سد نارمادا٣ واقع در ايالت مادهايا پرادش ٤ هند استفاده کرده و نشان دادند که اين روش از توانايي بسيار خوبي در مدلسازي و پيش بيني جريان ميانمدت ماهانه برخوردار است (٥).
5 در سالهاي اخير سيستم هاي پشتيباني تصميم ، جهت جمع آوري و يکپارچه سازي بهترين دانش و اطلاعات براي اتخاذ مناسب ترين تصميم گيري، در سطح وسيعي از علوم گسترش يافته است که مدل شبکه تصميم گيري بيزين يکي از انواع مختلف سيستم هاي پشتيباني تصميم است . شبکه تصميم گيري بيزين ٦، روشي سودمند است که ميتواند اطلاعات و دادههاي کمي را به خوبي با دانش کيفي کارشناسي همسو نمايد (٢).
از طرف ديگر اين شبکه ها را ميتوان به عنوان هوش مصنوعي نيز قلمداد کرد. تکنيک هاي مدلسازي بيزين داراي ويژگيهايي هستند که آنها را براي پرسش هاي تحليلي و مديريتي دادههاي جهان واقعي، کاربردي و مفيد ساخته اند (٢٠). امروزه اين مدلهاي احتمالاتي کاربرد وسيعي در علوم مربوط به محيط زيست و منابع آب پيدا کردهاند. براي مدل بيزين ميتوان مزيت هاي زير را بيان کرد:
١) در شبکه هاي بيزين جهت انجام تحليل ، چيزي به عنوان اندازه حداقل براي دادههاي نمونه وجود ندارد و اين شبکه ها در محاسبات خود از تمامي دادههاي موجود استفاده مي کنند و حتي با وجود نمونه هايي با اندازههاي نسبتا کوچک ميتوان به پيش بينيهايي با دقت خوب دست يافت .
٢) به کارگيري و ترکيب منابع مختلف دادهها: از مهم ترين ويژگيهاي شبکه بيزين ، استفاده از اطلاعات پيشين و اوليه راجع به موضوع مورد نظر ميباشد.
سپس جهت کسب ترکيبي از دانش اوليه و دادههاي جديد، اين اطلاعات به وسيله دادهها به روز ميشوند.
اين تلفيق به دست آمده نيز ميتواند به عنوان اطلاعات اوليه در يک مطالعه جديد مورد استفاده قرار گيرد. از ديگر امتيازات شبکه هاي بيزين اين است که به راحتي در يک مسير رياضي، ميتواند اطلاعات به دست آمده با درجه دقت و منابع مختلف را با هم ترکيب کرده و مورد استفاده قرار دهد. در اين صورت دانش کارشناسي ميتواند در خصوص متغيرهايي که داده لازم در مورد آنها موجود نيست ، با ساير اطلاعات در دسترس ترکيب شود (١٥). ٣) توان بالاي شبکه هاي بيزين در نمايش تصويري متغيرها و روابط بين آنها در يک سيستم منجر به شناخت و درک بالاتري از سامانه ميگردد (٢١).
رجيني و ويترز (٢٠٠٨) با کاربرد مدلهاي بيزين و با در نظر گرفتن عدم قطعيت هاي موجود به پيش بيني تراز سطح آب در سيستم پيش بيني جريان رود راين پرداختند. با ترکيب يک تابع هزينه در مدل براي برآورد ارزش اقتصادي ارسال هشدار سيلاب، خسارت ناشي از هر تراز سطح آب پيش بيني شده را تعيين کرده و به اين نتيجه رسيدند که به کمک اين روش، با يک ريسک قابل قبول ميتوان تصميم گيري در شرايط عدم قطعيت را براي پيش بيني جريان رودخانه تسهيل نمود (٢٠). مددگر و مرادخاني (٢٠١٤) در مطالعه اي به پيش بيني تغييرات مکاني خشکسالي در حوضه آبريز رودخانه گانيسون در آمريکا پرداختند. بدين منظور براي پيش بيني رواناب حوضه و محاسبه خشکساليهاي آتي، از مدلهاي بيزين استفاده شده بود. نتايج حاصل نشان داد که اين مدلها در پيش بيني جريان رودخانه از توانايي بالايي برخوردار هستند (١٣).
با عنايت به موارد فوق ميتوان دريافت که پيش بيني متغيرهاي هيدرولوژيکي هم چون جريان رودخانه ها از ديرباز مورد توجه پژوهشگران امر بوده و بدين منظور روشهاي متعددي از جمله مدلهاي تجربي- نيمه تجربي، سريهاي زماني و مدلهاي هوشمند توسعه يافته اند که در اين ميان مدلهاي هوشمند با الهام گرفتن از طبيعت ، از عملکرد بهتري نسبت به ساير روشها برخوردار هستند. همچنين با توجه به بررسي منابع صورت گرفته مشاهده ميشود که در منابع داخلي از مدلهاي شبکه بيزين و ماشين بردار پشتيبان به صورت بسيار محدودي در پيش بيني متغيرهاي هيدرولوژيکي استفاده شده است . بنابراين در اين پژوهش سعي گرديده است که عملکرد دو مدل هوشمند BNs و SVM در پيش بيني جريان روزانه رودخانه باراندوزچاي مورد بررسي و مقايسه قرار گيرد.
مواد و روشها
معرفي منطقه مورد مطالعه : در اين مطالعه ، از دادههاي دبي جريان روزانه ايستگاه هيدرومتري ديزج واقع بر رودخانه باراندوزچاي اروميه در دوره آماري
١٣٨٥ تا ١٣٨٩ استفاده گرديد. مساحت حوضه باراندوزچاي در ايستگاه هيدرومتري ديزج ٦٦٠.٧١ کيلومتر مربع است . اين حوضه در شمالغرب کشور بين درياچه اروميه و مرز ايران و کشورهاي عراق و ترکيه در موقعيت جغرافيايي ́٤٥°٤٤ تا ́١٤°٤٥ طول شرقي و ́٠٦°٣٧ تا ́٢٩°٣٧ عرض شمالي واقع شده است . طول آبراهه اصلي حوضه ٧٥ کيلومتر بوده و حداکثر و حداقل ارتفاع اين حوضه به ترتيب ٣٥٠٠ و ١٢٥٠ متر از سطح آزاد درياها ميباشد. در جدول ١ مشخصات آماري ايستگاه هيدرومتري ديزج آورده شده است . شکل ١ نيز حوضه آبريز باراندوزچاي و موقعيت ايستگاه هيدرومتري ديزج را نشان ميدهد.
\

شبکه هاي بيزين : شبکه بيزين يک مدل گرافيکي احتمالاتي است که مجموعه اي از متغيرها و احتمالات مربوط به هر کدام را نشان ميدهد. اين شبکه يک گراف مستقيم و غيرچرخه اي است که در آن گرهها در حکم متغيرهاي مسأله هستند. شبکه هاي بيزين محدوديتي در نماياندن متغيرهاي تصادفي ندارند.
ساختار يک شبکه بيزين در واقع يک نمايش گرافيکي از اثرات متقابل متغيرهايي است که بايد مدل شوند و علاوه بر اين که کيفيت رابطه بين متغيرهاي مسأله را نشان ميدهد، کميت ارتباط بين اين متغيرها را نيز به نمايش ميگذارد که به صورت عددي از توزيع احتمال مشترک آنها استفاده ميکند (٧). اين روش بر مبناي محاسبات احتمالات وابسته يا قانون بيز ميباشد (رابطه ١). يک شبکه بيزي را ميتوان اين گونه تعريف کرد: تعدادي گره که نشاندهنده آن دسته از متغيرهاي تصادفي هستند که با يکديگر در تعامل ميباشند. اين برهم کنش ، به وسيله ايجاد ارتباط بين گرهها ايجاد ميشود (٣).

که در آن، احتمال وقوع پيشامد احتمال وقوع پيشامد احتمال وقوع پيشامد b به شرطي که a اتفاق افتاده باشد و احتمال وقوع پيشامد a به شرطي که b اتفاق افتاده باشد، هستند.
متغيرهايي که در مسايل زيست محيطي و منابع آب به کار ميروند، ميتوانند کيفي يا کمي باشند. تعيين تعداد مناسبي از متغيرها در يک مسأله مدلسازي از مسايل چالش برانگيزي است که بايد با دقت به آن پرداخته شود. قانون احتمالات اعمال شده نيز بايد بر مبناي بهترين يافته هاي موجود يا اطلاعات کمي و کيفي بين متغيرها باشد. پيشنهادها و تصميم هايي که براي اجرا ارائه ميشوند، بر اساس حداکثر سود پيش بيني شده است (١٥). هر شبکه بيزين از سه جزء اصلي تشکيل شده است :
١) مجموعه اي از گرهها که در واقع متغيرهاي سيستم مديريتي هستند. اين گرهها ميتوانند متغيرهاي پيوسته يا ناپيوسته ، اعداد ثابت و يا توابع پيوسته باشند. هر گره به چند طبقه يا کلاس تقسيم ميشود. در حالت کلي گرهها يا والد هستند يا ولد (فرزند). يک گره ولد ميتواند از چندين والد توليد شده باشد (١٤)
٢) مجموعه اي از بندها: روابط سببي بين متغيرها به وسيله بندها به وجود ميآيند (٢١) اين روابط به وسيله پيکان نمايش داده ميشوند. گرهها به وسيله پيکانها به هم مربوط ميشوند. عدم وجود پيکان بين گرهها، بيانگر استقلال متغيرها ميباشد (١٩). گرههايي که هيچ پيکاني به آنها وارد نشده است ، گرههاي والد ورودي هستند. گرهي که پيکان به آن وارد و از آن خارج ميشود، بيانگر گره ولد وضعيت ميباشند و گرههايي که از آنها هيچ پيکاني خارج نميشود، نشاندهنده گرههاي ولد خروجي ميباشند. منظور منطقي پيکاني که از سمت متغير x به سمت متغير y ميرود، اين است که متغير x اثر مستقيمي بر متغير y دارد. مثلا دما اثر مستقيم بر تبخير و تعرق ميگذارد
.(19)
٣) مجموعه اي از احتمالات: هر کدام براي متغير شرايط تصميمي را مشخص ميکند که اين شرايط از طريق متغيرهايي که مستقيما آن را تحت تأثير قرار ميدهند (والدين آن)، به آن نسبت داده ميشوند (٣).
گرههايي که قبل از آنها گره ديگري در گراف وجود دارد با توزيع احتمالي شرطي تعريف ميشوند و در غير اين صورت، با احتمال آغازين (اوليه ) بيان ميشوند. احتمال شرطي، احتمال ميزان تأثير يک گره ورودي به يک گره مفروض در شبکه را به دست ميدهد و احتمال آغازين بيانگر ميزان احتمال قرارگيري يک متغير ورودي در يک کلاس معين ميباشد و از طريق اطلاعات اوليه موجود راجع به متغيرها به دست ميآيد. احتمالات مربوط به پايين ترين بخش در شبکه بيزين از طريق قانون احتمال کل به دست ميآيد و احتمالات مرتبط با بخش هاي بالايي شبکه ، براساس قانون بيز هستند. در حالت کلي، اگر گره x داراي والد نباشد گره غيرمشروط و در غير اين صورت گره مشروط ميباشد (١٢).
ماشين هاي بردار پشتيبان: در يک مدل رگرسيوني
SVM لازم است وابستگي تابعي متغير وابسته y به مجموعه اي از متغيرهاي مستقل x تخمين زده شود.
فرض بر اين است که مانند ديگر مسايل رگرسيوني، رابطه بين متغيرهاي وابسته و مستقل توسط يک تابع معين f به علاوه يک مقدار اضافي نويز (Noise) مشخص ميشود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید