بخشی از مقاله
خلاصه
پیش بینی دقیق بارش به عنوان یکی از اجزای اصلی چرخه هیدرولوژی، از مسائل مهم در مدیریت منابع آب های سطحی به ویژه اتخاذ تدابیر مناسب در مواقع سیلاب و بروز خشکسالی ها به شمار می رود. در این تحقیق به منظور پیش بینی بارش ماهانه در دو ایستگاه اصلی سینوپتیکی استان آذربایجان شرقی طی یک دوره آماری 24 ساله از مدل ترکیبی موجک- برنامه ریزی بیان ژن - W-GEP - که تلفیق آنالیز موجک و برنامه ریزی بیان ژن - GEP - می باشد، درمقیاس های زمانی مختلف در 6 ترکیب متفاوت شامل بارش ماهانه، میانگین ماهانه متوسط دما، متوسط فشار و میانگین رطوبت نسبی استفاده گردید تا بهترین حالت ممکن جهت پیش بینی انتخاب و ساختار بهینه معرفی گردد.
سپس نتایج حاصل، با مدل های شبکه عصبی مصنوعی - - ANN، برنامه ریزی بیان ژن و رگرسیون خطی چند متغیره - MLR - مقایسه گردید. عملکرد مدل ها توسط شاخص های آماری ضریب همبستگی - R - ، ریشه مربع خطا - RMSE - ارزیابی گردید. نتایج این تحقیق نشان داد که مدل ترکیبی موجک-برنامه ریزی بیان ژن با ضرایب همبستگی 0/839 و 0/786 که به ترتیب مربوط به ایستگاه های جلفا و سراب می باشند، توانایی بیشتری در پیش بینی بارش ماهانه نسبت به سایر مدل ها دارد. نتایج حاصل، حاکی از توانایی موجک در بالا بردن دقت مدل می باشد.
1. مقدمه
نیاز به روش هایی جهت پیش بینی مقادیر آینده در تمامی علوم همواره احساس می شود که در مهندسی آب نیز این مهم مستثنی نمی باشد. در حال حاضر با توجه به روند سریع افزایش نیاز های آبی از یک طرف و تغییرات اقلیمی و کمبود آب از طرف دیگر، لزوم مدیریت منابع آب با استفاده از روش های پیشرفته کاملا احساس می شود. بارندگی را می توان مهم ترین عاملی دانست که به طور مستقیم در چرخه هیدرولوژی دخالت دارد. تغییرات قابل ملاحظه بارندگی در زمان و مکان از یک سو و کمبود ایستگاه های باران سنج معمولی در ثبت میزان بارندگی از سوی دیگر، ضرورت ارائه مدل های تخمین بارندگی را امری اجتناب ناپذیر می نمایند.
به منظور پیش بینی بارش در طی سالیان گذشته روش های مختلفی استفاده شده است، که به طور کلی می توان به دو دسته مدل های مفهومی و مدل های مبتنی بر داده یا آماری طبقه بندی کرد. مدل های آماری کاربردی تر از مدل های مفهومی می باشند زیرا درک ساختار داخلی آنها از فرآیند های فیزیکی مدل سازی مستقل است.
در طی دهه های گذشته مدل های مبتنی بر داده کاربرد گسترده ای در پیش بینی فرایند های هیدرولوژی پیدا کرده اند. به منظور بررسی و پیش بینی بارش ماهانه می توان از روش های مختلفی نظیر الگوریتم ژنتیک، شبکه عصبی مصنوعی، منطق فازی، برنامه ریزی بیان ژن و ... بهره برد. مدل برنامه ریزی بیان ژن جدید ترین شیوه از بین روش های الگوریتم تکاملی می باشد که به دلیل دارا بودن دقت کافی، از کاربرد بیشتری برخوردار است.
این روش با استفاده از اطلاعات موجود در داده ها و بدون هیچ فرضیه ای در ساختار و رابطه بین متغیر های مستقل و وابسته، رابطه ای مناسب بین متغیرها برقرار کرده و بارش ماه بعد را پیش بینی می کند. تحقیقات خو و همکاران در مورد پیش بینی رواناب در حوضه اورگوال فرانسه، لونگ و همکاران[2] روی بارش- رواناب و همچنین بررسی پدیده حمل رسوب توسط آیتک و همکاران[ از جمله تحقیقاتی هستند که با استفاده از برنامه ریزی ژنتیک انجام شده و برتری آن نسبت به سایر روش ها به اثبات رسیده است. هدف از این تحقیق مدل سازی بارش ماهانه با استفاده از مدل ترکیبی موجک-برنامه ریزی بیان ژن و مقایسه نتایج حاصل، با مدل های شبکه عصبی مصنوعی و برنامه ریزی بیان ژن و ارائه ساختار درختی مدل بهینه جهت شبیه سازی بارش ماهانه در ایستگاه های مورد مطالعه می باشد.
2. مواد و روش ها
در این تحقیق از داده های بارش ماهانه، میانگین ماهانه متوسط دما، متوسط فشار و میانگین رطوبت نسبی دو ایستگاه اصلی سینوپتیکی واقع در استان آذربایجان شرقی که شامل جلفا و سراب - جدول - 1 می باشد، استفاده شده است. دادههای اولیه در دسترس، مقادیر بارش ماهانه، میانگین ماهانه متوسط دما، میانگین رطوبت نسبی و متوسط فشار در طول دوره آماری - از سال تاسیس ایستگاه تا سال - 2010 میباشد که پس از بررسی از نظر صحت و انجام اصلاحات مورد نیاز، جهت تحلیل به کار گرفته شدند. جدول 2 مشخصات آماری هر یک از ایستگاه ها ی سینوپتیکی مورد مطالعه را نشان می دهد.
3. تبدیل موجک
اصول اولیه آنالیز سیگنال توسط فوریه در قرن 19 مطرح شد. کار های فوریه پایه ای بود برای ابداع تئوری موجک. سال ها محققان با استفاده از آنالیز فوریه اقدام به تجزیه و تحلیل داده های نامنظم و متناوب می نمودند و در بسیاری از موارد نتایج خوبی از این روش نمی گرفتند. با استفاده از تبدیل فوریه یک سیگنال به عوامل سینوسی یعنی فرکانس های سازنده سیگنال تجزیه می شود اما این تبدیل دارای محدودیت هایی می باشد متاسفانه اطلاعات زمان یا مکان، ممکن است در طول تبدیل خراب شوند و بعضی خصوصیات سیگنال کاسته شود و در بعضی مواقع تشخیص زمان و مکان یک رویداد خاص غیر ممکن باشد.
مورلت پس از سال ها تحقیق در سال 1980 با کمک گراسمن و یک تیم تحقیقاتی موفق به پایه گذاری تئوری موجک شدموجک. تابع مشخص ِ مفروضی با میانگین صفر است. بر خلاف چند جمله ای های مثلثاتی، موجک ها در فضا به صورت موضعی بررسی می شوند و به این ترتیب ارتباط نزدیکتری بین بعضی توابع و ضرایب آن ها امکان پذیر می شود و پایداری عددی بیشتری در بازسازی و محاسبات فراهم می گردد.
هر کاربردی که مبتنی بر تبدیل سریع فوریه است را می توان با استفاده از موجک ها فرمول بندی کرد و اطلاعات بیشتری به دست آورد. در این تحقیق از دو موجک مادر db2 و sym2 برای تجزیه سری اصلی بارش استفاده شده است. شکل 1 یک نمونه موجک است که به نام موجک مادر دابچیز - - db معروف است. عبارت مادر به این دلیل به کار می رود که موجک های متفاوت به وجود آمده بر اساس پارامتر های مقیاس و انتقال همگی از تابع پایه - موجک مادر - ناشی می شوند .[4]
4. شبکه عصبی پرسپترون چند لایه
شبکه چند لایه ایستا با توابع محرک غیر خطی که برای آموزش آن از روش های نظارت شده با الگوریتم پس انتشار استفاده می شود را شبکه چند لایه پیش خور با الگوریتم پس انتشار و یا شبکه پرسپترون چند لایه می نامند. از بردار های ورودی و هدف در راستای آموزش این نوع شبکه برای تقریب زدن یک تابع، یافتن رابطه بین ورودی و خروجی و دسته بندی ورودی ها استفاده می شود.
در این شبکه برای لایه های مخفی از تابع محرک سیگموئید و برای لایه خروجی از تابع محرک خطی استفاده شد. تابع محرک سیگموئید، باعث می شود که شبکه رفتاری نزدیک به سیستم بیولوژیکی از خود نشان دهد. برای استفاده از خاصیت غیر خطی تابع محرک سیگموئید و همچنین برای اینکه کوچکی یک متغییر ورودی در مقایسه با دیگر متغییر ها تاثیر آن را در آموزش شبکه کمرنگ نکند، توصیه می شود که داده های مشاهداتی و هدف به محدوده ای از بازه +1 - و - -1 نگاشت شوند. معمولاً در کار های تحقیقاتی به منظور توجیه فیزیکی ساده تر داده ها و برای اینکه داده ها اثر یکسانی از نقطه نظر علامت جبری شان در آموزش شبکه داشته باشند به محدوده مثبت کوچکتر از یک نگاشت می شوند.
با توجه به اینکه اگر ورودی صفر باشد ضرائب وزن اختصاص داده شده با آن در روند یادگیری خوب آموزش نخواهد دید، به همین دلیلمعمولاً d min 0 فرض می شود. در این تحقیق از محدوده 1]و[0/05 برای نرمال سازی داده هاکه درکار های تحقیقاتی بسیار مرسوم می باشد استفاده شده است . از الگوریتم های متعددی می توان برای تربیتِ شبکه عصبیِ پرسپترون چند لایه بهره جست ولی الگوریتم لونبرگ-مارکوارت که ترکیبی از روش های شبه نیوتن و گرادیان توام میباشد و عموماً در حل مسائل تخمین تابع با پارامتر های کمتر کارایی خوبی از خود نشان می دهد، بسیار مورد توجه محققان می باشد.در این تحقیق نیز الگوریتم لونبرگ-مارکوارت1 برای آموزش و تربیتِ شبکه مورد استفاده قرار گرفت.
5. برنامه ریزی بیان ژن
یکی از اهداف علوم رایانه استفاده از رایانه برای حل مسائل، بدون اینکه به رایانه دستورالعمل حل مسئله بیان شود، می باشد. برنامه ریزی بیان ژن - GEP - که جزو الگوریتم های تکاملی و تعمیم یافته می باشد این کار را با برنامه ریزی خودکار، با تولید ژنتیکی یک جمعیت از برنامه های رایانه ای با استفاده از اصل انتخاب طبیعی داروین و عملگر های بیولوژیکی انجام می دهد. برنامهریزی بیان ژن همانند الگوریتم ژنتیک - GA - و برنامهریزی ژنتیک - GP - ، یک الگوریتم ژنتیکی است بطوری که جمعیتی از افراد را مطابق برازندگی انتخاب میکند و تغییرات ژنتیکی را با استفاده از یک یا چند عملگر ژنتیکی اعمال مینماید.

