بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***


استفاده از مدل ماشین بردار پشتیبان براي پیش بینی خشکسالی

(مطالعه موردي : کرمان)

 

چکیده

کمبود آب امروزه در قسمت هاي مختلف جهان از جمله ایران، متاثر از تغییرات اقلیمی و افزایش تقاضا در بخش هاي گوناگون و همچنین آلودگی منابع تامین آب می باشد. جلوگیري از وقوع خشکسالی امکان پذیر نیست ولی می توان با استفاده از آماره هاي موجود و پیش بینی صحیح و بکارگیري طرح هاي مقابله با خشکسالی و مدیریت آن خسارات ناشی ازاین پدیده را تا حد زیادي کاهش داد. لذا یافتن نمایه هاي اندازه گیري خشکسالی براي پیش بینی و ارزیابی مکانی و زمانی این پدیده به منظور مدیریت بحران آن ضروري و حیاتی به نظر می رسد.در تحقیقات مختلف، پارامترهاي هواشناسی متفاوتی در پیش بینی دوره هاي کم بارش مورد توجه قرار گرفته اند.در این تحقیق نمایه بارش استاندارد (SPI)در مقیاس هاي زمانی9،12،18،24 و48 ماهه محاسبه شده و از متغیر هاي بارش و دما براي پیش بینی خشکسالی مورد استفاده قرار گرفته است. یکی از روش هاي یادگیري آماري با استفاده از ناظر به نام ماشین بردار پشتیبان((SVMبراي تدوین مدل پیش بینی SPI استفاده شد که این مدل نشان می دهد در پیش بینی رفتارهاي غیرخطی داده هاي هواشناسی، داراي دقت مناسب می باشد و سریع تر از شبکه هاي عصبی مصنوعی متداول آموزش می بیند. در انتها بر اساس نتایج بدست آمده، مناسب ترین متغیرها براي پیش بینی خشکسالی معرفی گردید. بر اساس این نتایج، مقادیر بارندگی، دماي حداکثر، دماي حداقل و شاخص SPI بیشترین تاثیر را در برآورد بهترین ترکیب در مقیاس زمانی 18 ماهه دارند و براي پیش بینی خشکسالی می توانند مورد استفاده قرار گیرند و نتایج مناسبی را نیز ارائه دهند.


کلمات کلیدي : خشکسالی، پیش بینی، شاخص SPI ، ماشین بردار پشتیبان، کرمان

-1مقدمه

دوره خشک یکی از ویژگی هاي بارز اقلیم هاي خشک و نیمه خشک است که تخلیه منابع آبی را باعث می شود و به دلیل وابستگی حیات موجودات و اکوسیستم به موجودیت آب، آثار ناشی از آن می تواند بسیار شدید و گسترده باشد. به جهت پیچیدگی این پدیده، فهم آن در قیاس با دیگر بلایاي طبیعی مشکل تر است و بخش هاي بیشتري را تحت تاثیر خود قرار می دهد. با بررسی هاي انجام شده تعیین درجه، شدت، زمان وقوع و خاتمه آن خیلی مشکل است و براي کاهش آثارش نیاز به ابزار مدیریتی بسیار زیادي است.

شاخص هاي زیادي به منظور پیش بینی خشکسالی ارائه شده است که در میان شاخص هاي خشکسالی، شاخص پالمر و SPI کاربرد وسیعی در تعیین و درجه بندي خشکسالی زراعی و هواشناسی در اکثر کشورها دارد، این شاخص تنها بدلیل نیاز به آمار بارندگی ماهانه که در اکثر ایستگاه هاي کشور در دسترس می باشد، قابلیت درجه بندي و ارزیابی خشکسالی در مقیاس هاي زمانی مختلف کوتاه مدت، میان مدت و دراز مدت و قدرت پایش نزدیک به زمان واقعی را دارد.

براي بررسی ارتباط آماري بین متغیرهاي هواشناسی، خشکسالی و بارش، روش هاي متفاوتی مورد توجه قرار گرفته است که از جمله می توان به شبکه هاي عصبی مصنوعی، ماشین بردار پشتیبان1، خوشه بندي و زنجیره مارکف اشاره نمود. در این میان ماشین هاي بردار پشتیبان، سیستم هاي یادگیري خاصی هستند که از یک فضاي فرضیه به نام فضاي مشخصه2 ، شامل توابع خطی با بعد زیاد استفاده کرده و می توانند برا ي پیش بینی (دسته بندي و رگرسیون) مورد استفاده قرار گیرند. این سیستم ها توسط الگوریتم یادگیري که بر اساس تئوري بهینه سازي استوار است، آموزش داده می شوند. این تئوري که توسط وپنیک و همکاران3 به عنوان روشی قدرتمند و مهم معرفی گردید از پیش قدر یادگیري که از تئوري یادگیري آماري استخراج شده استفاده می کند به گونه اي که از آغاز معرفی این روش، از آن در کاربردهاي مختلفی استفاده شده است. تاکنون در زمینه هاي مختلف هیدرولوژي از روشSVM استفاده شده است که برخی از موارد آن در ادامه آورده شده است.

به نقل از نیک بخت شهبازي و همکاران (2011) در نمایه بارش استاندارد شده((SPI براي6 سناریوي فصل محاسبه کردند و با استفاده از متغیرهاي هواشناسی دماي هوا، ارتفاع ژئوپتانسیل به این نتیجه رسیدند که SVM در اکثر موارد پیش بینی، دقت مناسب دارد. این روش می تواند در پیش بینی رفتارهاي غیرخطی داده هاي هواشناسی با طول دوره آماري کوتاه مورد استفاده قرار گیرد(.(Nikbakht shahbazi, et al., 2011 شاکري و همکاران (1390) روي"

پیش بینی جریان فصل پاییز با استفاده از سیگنال هاي اقلیمی، کاربرد ماشین بردار پشتیبان" کار کردند و با استفاده از سیگنال هاي NAOو SOIو TNA نشان دادند که جریان ایستگاه ارمند در فصل پاییز همبستگی خوبی را نشان داده است. و دریافتند که روش ماشین بردار پشتیبان از جمله روش هاي داده- محور است که در سال هاي اخیر نتایج موفقیت آمیزي از خود نشان داده است. نوري و همکاران (1389) روي پیش بینی ماهانه دبی رودخانه با استفاده از ماشین بردار پشتیبان برمبناي آنالیز مؤلفه اصلی (PCA) کار کردند و دریافتند که پیش پردازش متغیرهاي ورودي به مدل SVM با استفاده از PCA، بهبود عملکرد مدل SVM را به همراه داشته است. کیان پیشه و همکاران (1389) روي تدوین مدل پیش بینی بارش با استفاده از مدل ماشین بردار پشتیبان کار کردند و نتیجه را با مدل هاي K نزدیک ترین همسایگی و شبکه عصبی مقایسه کردند، نتایج حاکی از برتري مدل ماشین بردار پشتیبان در پیش بینی بارش بود. در مطالعه اي براي پیش بینی بارش رواناب از یک تکنیک ساده و کارآمد SSA – SVM استفاده کردند و در نهایت نتایج را با یک مدل غیر خطی NLP مقایسه کردند که نتایج حاکی از دقت بالاي روش پیشنهادي در پیش بینی بارش بود .(Sivapragasam, et al., 2001) در تحقیقی به بررسی پتانسیل ماشین بردار پشتیبان در پیش بینی بلند مدت 12) ماهه) سطح آب دریاچه Erie پرداختند و این مدل را با مدل شبکه عصبی پرسپترون چند لایه (MLP) و یک مدل خود بازگشت (اتورگرسیو) مقایسه کردند. که نتایج نشان دهنده ي عملکرد بهتر مدل SVM نسبت به دو مدل دیگر است .(Khan and Coulibaly, 2006) کینگ و همکاران (2012) روي پیش بینی بارش بر اساس سري هاي زمانی کار کردند که در مرحله ي اول براي عوامل محیطی از ماشین بردار پشتیبان (SVM) و در مرحله ي دوم به منظور برآورد از کنترل خود بازگشت (اتورگرسیو) (CAR) استفاده کردند. در نهایت قابلیت اطمینان این روش (SVM – CAR) براي پیش بینی مورد تایید قرار گرفت و به این نتیجه رسیدند که این روش داراي دقت بالایی براي پیش بینی خشکسالی و پیش بینی سیل است(.(Qing, et al., 2012 براي پیش بینی سیلاب و به حداقل رساندن خسارات از تکنیک هاي SVM استفاده کردند و نتایج برآمده را با مدل ANN مقایسه کردند که SVM نتایج امیدوار کننده اي در پیش بینی از خود نسبت به مدل ANN نشان داد(.(Liong and Sivapragasam , 2002 کیسی و سایمن (2012) روي پیش بینی بارش روزانه در دو منطقه بر اساس مدل ماشین بردار پشتیبان همراه موجک استفاده کردند و براي دقت مدل یکبار از WSVR استفاده شد و بار دیگر از SVR و شبکه عصبی مصنوعی و نتایج مدل ها با هم مقایسه شدند که در این مقایسه بردار پشتیبانی رگرسیون نسبت به شبکه عصبی مصنوعی عملکرد بهتري از خود نشان داد و همچنین در این مقایسه برتري مدل ترکیبی WSVR نسبت به مدل SVR شناخته شد(.(Kisi and Cimen, 2012 پنگ و زو (2010) تحقیقاتی روي پیش بینی بلند مدت رواناب با استفاده از ماشین بردار پشتیبان انجام دادند و این مدل را با مدل هاي ARMA و ARIMA، PSOو ANN مقایسه کردند که به این نتیجه رسیدند که دقت شبیه سازي و پیش بینی SVM بر اساس پارامترهاي ɛ و C تعیین می شود .(Peng and Xue, 2010)

-2مواد و روش ها

1-2 منطقه مورد مطالعه

استان کرمان با مساحت 175069 کیلومتر مربع در جنوب خاوري ایران واقع شده . این استان از نظر جغرافیایی بین 25 درجه و 55 دقیقه تا 32 درجه ي عرض شمالی و 52 درجه و 26 دقیقه تا 59 درجه و 26 دقیقه ي طول شرقی از نصف النهار گرینویچ قرار گرفته است. منابع آب هر مکان به میزان بارش در گذشته و حال بستگی دارد. استان کرمان به لحاظ قرار گرفتن در منطقه پر فشار جنب حاره و دوري از منابع تامین کننده ي رطوبت، میزان بارش اندکی دارد. تغییر پذیري و بی نظمی هاي بارش زیاد است، به طوري که خشکسالی ها به صورت متناوب ظاهر می شوند و بر منابع آب استان تاثیر منفی می گذارند.

2-2 نمایه بارش استاندارد شده

شاخصSPIنمایه اي است که بستگی به احتمال بارش براي هر زمان و مقیاس داشته و براي مقیا س هاي زمانی گوناگون قابل محاسبه است. این شاخص می تواند براي هشدار اولیه جهت بروز خشکسالی و کمک به ارزیابی شدت آن بکار گرفته شود. این روش به وسیله مک کی و همکاران با توجه به بررسی تاثیرات متفاوت کمبود بارش بر آب هاي زیرزمینی، ذخایر و منابع آب سطحی، رطوبت خاك و جریان آبراهه ابداع و توسعه داده شد .نمایهSPI با قرار دادن تفاوت بارش ازمیانگین براي یک مقیاس زمانی مشخص و سپس تقسیم آن بر انحراف معیار بارش بدست می آید . این شاخص به دو صورت کوتاه مدت و بلند مدت محاسبه می شود .مقادیر مثبت شاخص نشان دهنده دوره ترسالی و مقدار منفی بیانگر دوره خشکسالی است .شاخصSPIبر اساس آماره)Z اختلاف میان مقدار بارندگی در هر ماه با میانگین بارندگی بلند مدت بر انحراف معیار بارندگی در آن مقیاس زمانی)محاسبه می گردد .مقیاسهاي زمانی می توانند1، 3، 6، 9، 12، 18، 24 و 48 ماهه باشند. دامنه تغییرات و طبقه بندي آن براي بیان شدت خشکسالی در جدول (1) آورده شده است.

جدول -1 طبقات مختلف ترسالی و خشکسالی بر اساس مقادیر مختلف SPI

 

3-2 روش محاسبه نمایه SPI

محاسبهSPI از آنجا که توزیع بارندگیمعمولاً از توزیع نرمال تبعیت نمی کند، تا حدودي پیچیده می باشد . براي محاسبه آن می توان ابتدا بارندگی ماهیانه و یا مجموع بارندگی در هر بازه زمانی دلخواه (سه ماهه، شش ماهه، نه ماهه و ...) را با استفاده از یک توزیع مناسب مانند توزیع گاما و یا پیرسون تیپ سه برازش داد .بدین ترتیب مقادیر SPI مطابق رابطه زیردر توزیع نرمال استاندارد بدست می آید.

در رابطه (1)، xi مقادیر بارندگی،x̅ متوسط مقادیر بارندگی وσ انحراف از معیار مقادیر بارندگی می باشد.

4-2 مدل ماشین بردار پشتیبان

در سال هاي اخیر ابزار جدیدي در زمینه هوش مصنوعی که ماشین بردار پشتیبان نامیده می شود، کاربرد زیادي در روش هاي یادگیري ماشینی پیدا کرده است.رابطه اصلی براي مراحل یادگیري آماري به صورت زیر است:

(٢)

که خروجی مدل مجموع خطی M جزء است، بخش تبدیل غیرخطی مدل به وسیله( ϕ( نشان داده شده است. این معادله براي بکارگیري مدل ماشین هاي بردار پشتیبان به صورت زیر تبدیل می شود:


(٣)


که در آن K تابع کرنل، wi و b پارامترهاي مدل، N تعداد داده ها براي آموزش و Xi بردار داده ها براي آموزش شبکه و X بردار مستقل است. پارامتر مدل با حداکثرسازي تابع هدف تعیین می شوند. در این مدل، تمامی داده هاي ورودي به صورت بردار ساماندهی می شوند و برخی از آنها در فرآیند مدلسازي استفاده می شوند. داده هاي آموزشی را براي کالیبره مدل و تخمین پارامترهاي آن استفاده می کند ولی مهمترین قسمت داده هاي بردار ورودي را در مدل نگه می دارد. این بردارها، بردارهاي پشتیبان نامیده می شود (تنها بخش کوچکی از داده هاي آموزشی انتخاب می شود). ساختار ویژه تابع کرنل براي تبدیل غیرخطی قادر به رها شدن از بیشترین بردارهاي آموزشی است، بنابراین نتیجه مدل کوچکتر است . بردارهاي پشتیبان کاهش یافته قابلیت تعمیم مدل ر ا افزایش می دهند و بار محاسباتی آن را کاهش می دهند.

هدف از توسعه یک مدل بردار پشتیبان، یافتن تابع خطی است که بهترین درونیابی را براي نقاط آموزشی انجام دهد. y = f(x) = ‹w.b›+ b که بر اساس روش حداقل نمودن مجموع مربعات داده هاي بدست آمده، پارامترهاي〈w,b〉تعیین می شود. به منظور در نظر گرفتن خطاي بوجود آمده بین مقادیر واقعی و مقادیر مدل سازي، مقدار ԑ وارد محدودیت هاي مدل فوق می شود.

می توان فرض کرد یک پهنایی یا باندي در اطراف صفحه تابع f(x) قرار گرفته است که براي نقاط خارج از این باند، خطاي آموزش وجود دارد و در غیر اینصورت متغیر کمکی ξi نامیده می شود .این متغیر کمکی براي نقاط در پهنا صفر می باشد و بصورت تصاعدي براي نقاط خارج از آن افزایش می یابد . این روش رگرسیون ԑ-SV نامیده می شود که معمول ترین روش مدل سازي است. در این روش تابع هزینه که در شکل (1) نشان داده شده است، به صورت رابطه زیر فرموله می شود:


(۶)

شکل – 1 تابع هزینه مدل SVM

دو صفحه اطراف صفحه تابع f(x) بایستی بگونه اي تعیین شوند که ناحیه مرزي مورد نظر را حداکثر کند که با نرم اقلیدسی بردار نرم صفحه∥w∥2 نسبت عکس دارد. بنابراین، نرم اقلیدسی بردار نرم صفحه یا در نظر گرفتن تابع هزینه بایستی حداقل شود:

(٧)

که در آن C ضریب هزینه است.
4-2 ارزیابی عملکرد مدل

براي ارزیابی و مقایسه عملکرد مدل در پیش بینی نتایج از آماره هاي ضریب تبیین( R2)4 و جذر میانگین مربع خطاها(RMSE)5 به شرح روابط زیر استفاده شده است.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید