بخشی از مقاله

*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***

مدل الگوریتم انبوه سازی ذرات در پیش بینی حداکثر دمای ماهیانه
چکیده
با توجه به تغییرات اقلیمی، گرمایش جهانی و خشکسالیهای اخیر، پیشبینی دمای حداکثر به عنوان یکی از مهمترین پارامترهای اقلیمی فرصت مناسبی را برای برنامهریزان قرار میدهد. بررسی و تحلیل دمای حداکثر به عنوان یکی از پارامترهای اقلیمی در مدیریت منابع آبی و طبیعی، کشاورزی، گسترش آفات و بیماریها، ذوب برف و سیلاب، تبخیر و تعرق، خشکسالی و غیره اهمیت زیادی دارد. امروزه با گسترش مدلهای هوشمند و تجربی در علوم مختلف، از جمله اقلیمشناسی و لزوم پیشبینیهای دقیقتر، جایگزینی آنها بهجای مدلهای قدیمی اهمیت پیدا میکند. یکی از این روشها ماشین بردار پشتیبان میباشد، که یکی از مهمترین کاربردهای آن پیشبینی و محاسبه پارامترهای اقلیمشناسی میباشد. در این تحقیق متغیرهای دمای حداقل، متوسط درجه حرارت، حداکثر مطلق دما، حداقل مطلق دما، تعداد ساعات آفتابی و حداقل و حداکثر مطلق رطوبت بهعنوان ورودی و دمای حداکثر را به-عنوان خروجی در نظر میگیریم. با اجرای مدل SVM و یادداشت نتایج آن و همچنین آنالیز حساسیت برای تعیین بهترین ترکیب ورودی شاهد نتایج خوب این مدل هستیم R2test =0/92) و .(RMSETest=2/46 در انتها جهت بهبود نتایج، از الگوریتم تکاملی pso استفاده شد .نتایج حاصل شده نشان از کارایی روش پیشنهادی برای پیش بینی دمای حداکثر دارند. که با مقایسه مدل SVM و SVM-PSO شاهد برتری روش ترکیبی SVM-PSOهستیم.
کلمات کلیدی: دمای حداکثر، ماشین بردار پشتیبان، PSO


مقدمه
یکی از چالشهای قرن 21 میلادی موضوع نوسانات و تغییرات اقلیمی است .دما یکی از عمده ترین واساسیترین عناصر اقلیمی است که به علت اهمیت آن از دیر باز مورد توجه اقلیم شناسان بوده است براساس گزارش هیأت بین الدول تغییرات اقلیمی سطح کره زمین در فاصله زمانی 1861- 2000 میلادی حدود 0/6 درجه سانتی گراد افزایش یافته است .این در حالی است که رفتار فراسنج دمای حداقل و حداکثر با یکدیگر متفاوت بوده و دمای حداقل به طور آشکاری نرخ افزایشی داشته است، و با وجود افزایش دمای حداکثر، نرخ آن از نرخ دمای حداقل کمتر بوده است. از این رو مدلسازی متغیرهای حدی دمای هوا که در مدیریت منابع آب و کشاورزی به خصوص در اقلیم های خشک و نیمه خشک حائز اهمیت میباشند لازم و ضروری است . مدلهای اقلیمی که بر پایه اصول آماری – احتمالی بنا گذاشته شده اند از اهمیت ویژه و کاربرد پر شماری برخوردارند .کاربرد مدلهای آماری در بازسازی مقادیر گذشته و باز آفرینی مقادیر آینده داده ها به تحلیل سری های زمانی موسوم است. یک سری زمانی مجموعه مشاهداتی است که بر حسب زمان مرتب شده اند .بسیاری از محققین برای توصیف رفتار یک سری زمانی، اجزای زیر را برای آن در نظر می گیرند :روند، تغییرات دوره های، تغییرات فصلی و تغییرات نامنظم .هدف از تجزیه و تحلیل سریهای زمانی کشف و شناسایی مدل احتمالی مولد داده ها و پیش بینی مقادیر آینده سری است.
به نقل از نیک بخت شهبازی و همکاران (2011) در نمایه بارش استاندارد شده((SPI برای6 سناریوی فصل محاسبه کردند و با استفاده از متغیرهای هواشناسی دمای هوا، ارتفاع ژئوپتانسیل به این نتیجه رسیدند که SVM در اکثر موارد پیش بینی، دقت مناسب دارد. این روش می تواند در پیش بینی رفتارهای غیرخطی داده های هواشناسی با طول دوره آماری کوتاه مورد استفاده قرار گیرد(.(Nikbakht shahbazi, et al., 2011 شاکری و همکاران (1390) روی" پیش بینی جریان فصل پاییز با استفاده از سیگنال های اقلیمی، کاربرد ماشین بردار پشتیبان" کار کردند و با استفاده از سیگنال های NAOو SOIو TNA نشان دادند که جریان ایستگاه ارمند در فصل پاییز همبستگی خوبی را نشان داده است. و دریافتند که روش ماشین بردار پشتیبان از جمله روش های داده- محور است که در سال های اخیر نتایج موفقیت آمیزی از خود نشان داده است. نوری و همکاران (1389) روی پیش بینی ماهانه دبی رودخانه با استفاده از ماشین بردار پشتیبان برمبنای آنالیز مؤلفه اصلی (PCA) کار کردند و دریافتند که پیش پردازش متغیرهای ورودی به مدل SVM با استفاده از PCA، بهبود عملکرد مدل SVM را به همراه داشته است. کیان پیشه و همکاران (1389) روی تدوین مدل پیش بینی بارش با استفاده از مدل ماشین بردار پشتیبان کار کردند و نتیجه را با مدل های K نزدیک ترین همسایگی و شبکه عصبی مقایسه کردند، نتایج حاکی از برتری مدل ماشین بردار پشتیبان در پیش بینی بارش بود. در مطالعه ای برای پیش بینی بارش رواناب از یک تکنیک ساده و کارآمد SSA – SVM استفاده کردند و در نهایت نتایج را با یک مدل غیر خطی NLP مقایسه کردند که نتایج حاکی از دقت بالای روش پیشنهادی در پیش بینی بارش بود .(Sivapragasam, et al., 2001) در تحقیقی به بررسی پتانسیل ماشین بردار پشتیبان در پیش بینی بلند مدت 12) ماهه) سطح آب دریاچه Erie پرداختند و این مدل را با مدل شبکه عصبی پرسپترون چند لایه (MLP) و یک مدل خود بازگشت (اتورگرسیو) مقایسه کردند. که نتایج نشان دهنده ی عملکرد بهتر مدل SVM نسبت به دو مدل دیگر است Coulibaly, 2006) .(Khan and کینگ و همکاران (2012) روی پیش بینی بارش بر اساس سری های زمانی کار کردند که در مرحله ی اول برای عوامل محیطی از ماشین بردار پشتیبان (SVM) و در مرحله ی دوم به منظور برآورد از کنترل خود بازگشت (اتورگرسیو) (CAR) استفاده کردند. در نهایت قابلیت اطمینان این روش (SVM – CAR) برای پیش بینی مورد تایید قرار گرفت و به این نتیجه رسیدند که این روش دارای دقت بالایی برای پیش بینی خشکسالی و پیش بینی سیل است(.(Qing, et al., 2012 برای پیش بینی سیلاب و به حداقل رساندن خسارات از تکنیک های SVM استفاده کردند و نتایج برآمده را با مدل ANN مقایسه کردند که SVM نتایج امیدوار کننده ای در پیش بینی از خود نسبت به مدل ANN نشان داد(Sivapragasam , 2002 .(Liong and کیسی و سایمن (2012) روی پیش بینی بارش روزانه در دو منطقه بر اساس مدل ماشین بردار پشتیبان همراه موجک استفاده کردند و برای دقت مدل یکبار از WSVR استفاده شد و بار دیگر از SVR و شبکه عصبی مصنوعی و نتایج مدل ها با هم مقایسه شدند که در این مقایسه بردار پشتیبانی رگرسیون نسبت به شبکه عصبی مصنوعی عملکرد بهتری از خود نشان داد و همچنین در این مقایسه برتری مدل ترکیبی WSVR نسبت به مدل SVR شناخته شد(.(Kisi and Cimen, 2012 پنگ و زو (2010) تحقیقاتی روی پیش بینی بلند مدت رواناب با استفاده از ماشین بردار پشتیبان انجام دادند و این مدل را با مدل های ARMA و ARIMA، PSOو ANN مقایسه کردند که به این نتیجه رسیدند که دقت شبیه سازی و پیش بینی SVM بر اساس پارامترهای و C تعیین می شود .(Peng and Xue, 2010)
نیکو و همکاران (1389) پهنهبندی کیفی منابع آب سطحی با استفاده از ماشینهای بردار پشتیبان احتمالاتی و شبکههای بیزی بررسی کردند. ماشینهای بردار پشتیبان احتمالاتی ( (PSVMs ابزاری جدید و قدرتمند برای کلاس بندی نسبت به روشهایی که خطای تجربی را حداقل میکنند، میباشند. در این بررسی ، با استفاده از اطلاعات کیفی آب جمعآوری شده از نقاط پایش کیفی در طول رودخانه جاجرود، پهنهبندی کیفی آب با استفاده از PSVMs و شبکههای بیزی صورت پذیرفته است.
کی نیا و همکاران (1391) به پیش بینی کوتاه مدت باد با استفاده از شبکه عصبی چندلایه آموزش یافته با PSO پرداختند که با توجه به گسترش روزافزون استفاده از انرژی بادی در تولید جهانی انرژی و با توجه به ساختار نامطمئن و گسسته تولید انرژی بادی، پیش بینی در فواصل زمانی مختلف ضرورت مییابد. در این مطالعه، از PSO شبکه های عصبی آموزش یافته با الگوریتم تکاملی جهت پیش بینی باد استفاده شده است. ساختار تغییرپذیر و معمولاً غیرمتناوب باد باعث می شود تا الگوریت مهای آموزشی معمول جهت آموزش شبک ههای عصبی که از روش های گرادیانی جهت آموزش استفاده می کنند، به خوبی نتوانند فرآیند آموزش را کامل کنند. از طرفی هدف از آموزش شبکه های عصبی یافتن اندازه وزن ها و بایاس ها به نحوی است که خطای داده های آموزش را به حداقل برساند. لذا آموزش شبکه های عصبی را می توان در بردارنده یک مسئله بهینه سازی دانست. از آنجا که پی شبینی باد توسط شبکه عصبی تابعی پیچیده و غیرخطی است، لذا استفاده از رو شهای بهینه سازی در فرآیند آموزش شبکه های عصبی مورد توجه قرار می گیرد . داده های باد از منطقه ای در کشور دانمارک و با فرکانس 2.5 ثانیه نمونه برداری شده است. پیش بینی برای داده های باد واقعی و باد فیلتر شده صورت می گیرد. کار اصلی مقاله، استفاده از در آموزش شبکه عصبی و ارائه PSOالگوریتم تکاملی توجیهی برای استفاده از داده های فیلتر شده در پیش بینی بادمی باشد.


مواد و روشها
ماشینهای بردار پشتیبان
(1995) Vapnik برای نخستین بار ماشینهای بردار پشتیبان را ارائه کرد. روش های کلاسیک یـادگیری، جهـت حـداقلکـردن خطا بر روی مجموعه دادههای آموزش1 (حداقلسـازی خطـای تجربـی(2 طراحـی شـدهانـد. متـداولتـرین نمونـه از ایـن روشهـا، شبکههای عصبی مصنوعی میباشند. برخلاف این روش ها، ماشینهای بردار پشتیبان مبتنی بر حداقلکردن خطای ساختاری هسـتند. به عبارت سادهتر ساختار سیستم مانند شبکههای عصبی از ابتدا مشخص نمیباشد و در طول فرآیند آموزش علاوه بر حـداقلسـازی خطای تجربی، خطای ساختاری نیز حداقل شده و بهینهترین ساختار سیستم نیز تعیین میگردد. این ماشینهـا دارای قـدرت بـالاتری نسبت به بقیه روشهای یادگیری برای دادههای غیرآموزشی (دادههای آزمایش(3 میباشـند. SVMs کـه ابـزاری قـوی در حـوزه شناسایی الگو میباشند در چند سال گذشته برای شناسایی اعداد دست نویس منفصل، شناسایی شیء، شناسایی و تشـخیص هویـت گوینده و کشف چهرهها در تصویر به کار رفته اند. منطق اصلی آموزش ماشین های بردار پشتیبان شبیه دیگـر مـدل هـای موجـود در هـوش مصـنوعی مـیباشـد. ماشـین بـردار پشـتیبانی (Support vector machines - SVMs) یکـی از روشهـای یـادگیری بانظارت است که از آن برای طبقهبندی و رگرسیون استفاده میکنند.
این ماشینها ابزار جدید و قدرتمندی برای فراهم کردن راهحلهایی برای دستهبندی و رگرسیون میباشند. اخیراً این ماشینها به شیوههای مقادیر تصمیمSVM) 4 قطعی) و تخمین های احتمـالیSVM) 5 احتمـالاتی) تقسـیم بنـدی شـده انـد. شـیوه تخمـینهـای احتمالی به تازگی به قابلیتهای ماشینهـای بـردار پشـتیبان اضـافه شـده اسـت و تـاکنون کاربردهـای آن بسـیار محـدود مـیباشـد. کلاس بندی ماشین های بردار پشتیبان را میتوان به دو گروه اصلی کلاس بندی دوکلاسـی6 (بـاینری) و کـلاس بنـدی چندکلاسـی7 تقسیم کرد. کلاسبندی دوکلاسی، خود به دو دسته کلاسبندی خطی8 و کلاسبنـدی غیرخطـی9 تقسـیم مـیشـود. کـلاسبنـدی ماشین های بردار پشتیبان خطی نیز به دو حالت کلاسبندی دادههای جدایی پذیر10 و دادههای جداییناپذیر11 تقسیمبندی میگـردد. سادهترین حالت ممکن ماشینهای بردار پشتیبان، ماشینهای خطی است که بر روی دادههای جداییپذیر آموزش میبینند. در چنین مسأله ای زوج های اطلاعاتی می توانند به طرز صحیحی کلاسبندی شوند یعنی خطای آموزش میتواند دقیقاً برابر صـفر باشـد. ایـن مسأله ساده ترین حالت ممکن کلاس بندی بـوده و مقدمـه ای جالـب بـرای همـه ایـدههـای مهـم از جملـه تئـوری آمـاری آمـوزش، حداقلسازی خطای ساختاری و ماشینهای بردار پشتیبان میباشـد.
به طور کلی در ماشین های بردار پشتیبان چهار نـوع کرنـل خطـی12، کرنـل چندجملـهای13، کرنـل تانژانـت هیپربولیـک14 و کرنـل گوسی(RBF) 15 به کار گرفته شده است. که در جدول 1 نشان داده شدهاند.


در این تحقیق به منظور استفاده از ماشینهای بردار پشتیبان از نرمافزار STATISTICA 7 ، استفاده میشود. رابطه اصلی برای مراحل یادگیری آماری به صورت زیر است:

که خروجی مدل مجموع خطی M جزء است، بخش تبدیل غیرخطی مدل به وسیله( ϕ( نشان داده شده است. این معادله برای بکارگیری مدل ماشین های بردار پشتیبان به صورت زیر تبدیل می شود:

که در آن K تابع کرنل، wi و b پارامترهای مدل، N تعداد داده ها برای آموزش و Xi بردار داده ها برای آموزش شبکه و X بردار مستقل است. پارامتر مدل با حداکثرسازی تابع هدف تعیین می شوند. در این مدل، تمامی داده های ورودی به صورت بردار ساماندهی می شوند و برخی از آنها در فرآیند مدلسازی استفاده می شوند. داده های آموزشی را برای کالیبره مدل و تخمین پارامترهای آن استفاده می کند ولی مهمترین قسمت داده های بردار ورودی را در مدل نگه می دارد. این بردارها، بردارهای پشتیبان نامیده می شود (تنها بخش کوچکی از داده های آموزشی انتخاب می شود). ساختار ویژه تابع کرنل برای تبدیل غیرخطی قادر به رها شدن از بیشترین بردارهای آموزشی است، بنابراین نتیجه مدل کوچکتر است . بردارهای پشتیبان کاهش یافته قابلیت تعمیم مدل ر ا افزایش می دهند و بار محاسباتی آن را کاهش می دهند.
هدف از توسعه یک مدل بردار پشتیبان، یافتن تابع خطی است که بهترین درونیابی را برای نقاط آموزشی انجام دهد.
y = f(x) = ‹w.b›+ b که بر اساس روش حداقل نمودن مجموع مربعات داده های بدست آمده، پارامترهای(w,b)تعیین می شود. به منظور در نظر گرفتن خطای بوجود آمده بین مقادیر واقعی و مقادیر مدل سازی، مقدار ԑ وارد محدودیت های مدل فوق می شود.

می توان فرض کرد یک پهنایی یا باندی در اطراف صفحه تابع f(x) قرار گرفته است که برای نقاط خارج از این باند، خطای آموزش وجود دارد و در غیر اینصورت متغیر کمکی ξi نامیده می شود .این متغیر کمکی برای نقاط در پهنا صفر می باشد و بصورت تصاعدی برای نقاط خارج از آن افزایش می یابد . این روش رگرسیون ԑ-SV نامیده می شود که معمول ترین روش مدل سازی است. در این روش تابع هزینه که در شکل (1) نشان داده شده است، به صورت رابطه زیر فرموله می شود:


دو صفحه اطراف صفحه تابع f(x) بایستی بگونه ای تعیین شوند که ناحیه مرزی مورد نظر را حداکثر کند که با نرم اقلیدسی بردار نرم صفحه∥w∥2 نسبت عکس دارد. بنابراین، نرم اقلیدسی بردار نرم صفحه یا در نظر گرفتن تابع هزینه بایستی حداقل شود:

که در آن C ضریب هزینه است.
مبانی نظری الگوریتم انبوه ذرات16 PSO
الگوریتم انبوه ذرات که در سال 1995 از سوی ابرهارت و کندی ارائه شد ، یک پارادایم محاسباتی بر اساس ایده ای است که از رفتار مشترک و حرکت گله ای جمعیت بیولوژیک با الهام از رفتار اجتماعی پرندگان مهاجم یا تجمع ماهیان ارائه شده است . به بیان دیگر، این تکنیک یک الگوریتم تکاملی جهت بهینهسازی توابع غیرخطی است که بر مبنای تشبیهی از فعل و انفعال اجتماعی همچون رفتار کلاغ ها ارائه شده است . در حرکت یک دسته از کلاغ ها، یک کلاغ (سرگروه) دارای بهترین موقعیت می باشد و بقیه کلا غها با توجه به موقعیت خود و کلاغ های مجاور سعی در بهتر کردن مکان و نزدیک شدن به سر گروه را دارند . در این حین ، چنانچه یکی از اعضا بتواند موقعیت بهتری نسبت به سرگروه پیدا کند، او به عنوان سرگروه انتخاب می شود که عملکرد الگوریتم انبوه ذرات نیز به این گونه است . الگوریتم انبوه ذرات یک فرآیند ساده است، اجرای آن آسان ا ست، در کنترل پارامترها قوی عمل می کند و از نظر محاسباتی کارایی آن در مقایسه با سایر الگوریتمهای ابتکاری 7 در مسائل بهینه یابی مختلف به اثبات رسیده است . زمانی که الگوریتم انبوه ذرات به منظور حل یک مسئله بهینه یابی به کار می رود .جمعیتی از ذرات جهت اکتشاف فضای پاسخ مسئله به منظور دستیابی به یک پاسخ بهینه به کار گرفته می شوند .هر ذره یک پاسخ احتمالی فضای مسئله را ارائه میدهد که با مختصات معینی در فضا ی D بعدی شناخته می شود .موقعیت ذره i ام با نشان داده می شود .سرعت ذره نیز توسط نشان داده میشود .تابع برازندگی برای هر ذره در جمعیت اندازه گیری شده و با اندازه بهترین نتیجه قبلی همان ذره و بهترین ذره در میان کل جمعیت مقایسه می شود .پس از یافتن این دو مقدار بهینه، ذره با بروز رسانی سرعت و موقعیتش بر اساس توابع زیر حرکت میکند:

در دسته ای متشکل از N جزء، موقعیت جزء i ام تحت اثر یک بردار مکانی n بعدی مطابق معادله زیر قرار دارد

که در آن S فضای جستجو است .این جزء همچنین دارای یک بردار سرعت به صورت معادله زیر می باشد .
بهترین موقعیت قبلی بدست آمده برای جز i ام استفاده از معادله زیر نمایش داده می شود.
در نهایت موقعیت جدید اجزای دسته با استفاده از معادلات بالا به دست می آید.

g اندیس به کار رفته برای ذر های است که بهترین موقعیت را دارد.
:t نمایانگر تعداد تکرار می باشد.
:c ثابت شتاب، که میزان وابستگی ذرات به کل گروه و خود ذره را مشخص می کند
:r1,r2 اعدادی تصادفی در بازه 0 و 1
سرعت هر یک از ذرات دارای مقدار حداکثری است که توسط کاربر تعیین می شود . این عامل باعث می شود که اندازه سرعت دسته کنترل شود و از افزایش فضای جوابهای مسئله به نواحی که در آن جواب وجود ندارد، جلوگیری شود.
از طرفی اگر چه الگوریتم PSO قادر است ناحیه جواب بهینه را بسیار سریع پیدا کند، ولی با رسیدن به این ناحیه، سرعت همگرایی آن به شدت کاهش می یابد .برای رفع این مشکل، رابطه((11 به صورت زیر تصحیح میگردد.


استفاده از پارامتر وزن اینرسی باعث می شود که مصالحه ای بین توانایی اکتشاف سراسری و محلی دسته ایجاد گردد .وزن اینرسی بزرگ، محرکی برای بزرگتر شدن مقدار بردار سرعت ذرات در سراسر ناحیه جوابها حرکت به سمت مناطقی از فضای جستجوی جواب مسئله که پیشتر تجربه نشده اند (بوده، در حالیکه یک وزن اینرسی کمتر سبب کوچک شدن فضای جواب مسئله در ناحیه کوچک فعلی می شود .در واقع وزن کمتر باعث می شود که جستجو در مناطقی که در گذشته تجربه شده اند، با دقت بیشتری ادامه پیدا نماید . انتخاب اندازه مناسب برای w متضمن برقراری تعادل مطلوب بین توانایی اکتشاف در فضای جوابهای محلی و سراسری بوده و در نتیجه باعث افزایش کارآیی الگوریتم می گردد . نتایج تجربی نشان می دهند که انتخاب مقادیر بزرگ برای W در آغاز جستجو، باعث می شود که اولویت اکتشافات سراسری نسبت به اکتشافات محلی بالاتر رود، و با کاهش تدریجی W جستجو در فضاهای محلی با دقت بیشتری دنبال گردد .در نتیجه مقدار W در ابتدای جستجو برابر 1 انتخاب می گرددو تدریجاً به صفر میل می کند .

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید