بخشی از مقاله

خلاصه

تلفیق داده، فرآیند ترکیب یا توأم کردن اطلاعاتی است که از طرق مختلف به دست میآیند به گونهای که از این عمل، جوابهایی دقیقتر و قابل اعتمادتر از حالتی که اطلاعات از یک منبع به دست میآیند، حاصل شوند. از آنجا که معمولاً مدلهای پیشبینی هیدرولوژیکی مختلف، هر یک در جنبهای نسبت به دیگر مدلها برتری دارند، با تلفیق نتایج آنها میتوان پیشبینی بهتری داشت. هدف این مقاله، توسعه مدلهای مختلف تلفیق داده به منظور پیشبینی دبی رودخانه و مقایسه عملکرد آنها است. در این مقاله، به منظور توسعه چنین مدلی، از مدلهای پیشبینی مبتنی بر سری زمانی و مدلهای دادهمحور استفاده میشود و کارایی و دقت مدلهای تلفیق مختلف با توجه به نتایج کاربرد آنها در پیشبینی جریان رودخانه با یکدیگر مقایسه میشوند.

کلمات کلیدی: تلفیق داده، پیشبینی جریان رودخانه، عدم قطعیت، مدل سری زمانی

.1مقدمه

پیشبینی جریان رودخانه ها در طراحی تأسیسات آبی و آبگیری از رودخانهها اهمیت زیادی داشته و همواره مورد توجه مهندسان آب بوده است. پیشبینی هرچه دقیقتر دبی جریان و تغییرات آن در طول رودخانه، از ارکان اساسی برنامهریزی و مدیریت منابع آب های سطحی است. پیشبینی جریان رودخانه جایگاه ویژهای در مدیریت و برنامهریزی منابع آب دارد و با استفاده از پیشبینی دقیق، میتوان خسارت ناشی از خشکسالی و سیلها را تا حد قابل توجهی کاهش داد. رشد روزافزون جمعیت و محدودیت منابع آب سطحی در کشور، لزوم پیشبینی دقیق تر مقدار آورد و رودخانه را به دلیل اهمیت در برنامهریزی و مدیریت منابع آب با استفاده از ابزارها و روش های نوین مدلسازی میطلبد.

از دهه 1990 در کنار پیشرفت های به وجود آمده در روش های پیشبینی، استفاده از مفاهیم تلفیق داده3، نگاه جدیدی را پیش روی محققان هیدرولوژی گشوده است.[1] تلفیق داده ها، عملیات ترکیب و آمیختن اطلاعات چند حسگر یا دادههایی از منابع مختلفی است که باعث افزایش دقت بر اساس بر اساس معیارهای ارزیابی مختلف شود.تحقیقات اخیر نشان میدهد که استفاده از رویکرد تلفیق داده نتایج بهتری در پیش بینی هیدرولوژیک، نسبت مدل های منفرد پیشبینی ارائه میدهد.[2] شمسالدین و همکاران - 1997 - مفهوم تلفیق خروجیهای به دستآمده از مدلهای بارش - رواناب متفاوت را مورد بحث قراردادند. در این مطالعه از سه روش میانگینگیری ساده، میانگینگیری وزندار و شبکه عصبی جهت تلفیق خروجیها استفاده شد. نتایج نشان داد که با تلفیق خروجیهای به دست آمده از مدلهای مختلف می توان تخمین بهتری از رواناب به دست آورد.[3] تاد و همکاران - 2000 - از سه مدل ARMA4،

ANN1 و K-NN2 برای پیشبینی بارش استفاده کردند. نتایج نشان داد که مدل شبکه عصبی بهترین دقت را به خصوص زمانی که نتایج پیشبینی سه مدل به عنوان ورودی شبکه عصبی در نظر گرفته شود، ارائه میکند.[4] آبراهات و سی - 2002 - شش روش مختلف تلفیق داده را مورد ارزیابی قرار دادند و به این نتیجه رسیدند که تلفیق داده به روش شبکهعصبی مصنوعی، بهترین نتایج را ارائه میکند.[5] کولیبالی و همکاران - 2005 - روش میانگینگیری وزندار را برایتلفیق مدلهای ANN و K-NN به منظور پیشبینی جریان روزانه ورودی به مخزن اعمال کردند.[6] عزمی و همکاران - 2010 - شش روش تلفیق داده را اعمال کرده و به این نتیجه رسیدند که مدل های تلفیق داده، دقت پیشبینی را به شکل قابل ملاحظهای افزایش میدهند و در میان روشهای تلفیق داده، روش نوین بر پایه نزدیکترین همسایگی نتایج بهتری ارائه میدهد.[1 ] جعفرگندمی و جین - 2013 - برای تلفیق دادههای ژئوفیزیک از شبکههای بیزی استفاده کردند و نشان دادند که رویکرد تلفیق داده در تخمین اطلاعات موفق است.[7]

اسمیت و جین - 2014 - نشان دادند که رویکرد تلفیق عملکرد بهتری نسبت به مدلهای منفرد در پیشبینی سریهای زمانی دارد. آنها دو روش برای انتخاب بهترین مدلهای منفرد جهت رویکرد تلفیق ارائه کردند و در پایان از روش میانگینگیری به عنوان روش تلفیق استفاده کردند.[8] در این مقاله به منظور انتخاب بهترین متغیرهای پیش بینیکننده به عنوان ورودی مدل های منفرد، از روش رگرسیون گامبهگام استفاده شده و از هفت روش تلفیق داده مختلف، برای تلفیق نتایج مدل های منفرد ARIMA، ANN و ANFIS استفاده شده است. در این تحقیق، حوضه آبریز لیقوان به عنوان مطالعه موردی برگزیده شده است.

2.    مواد و روشها

2-1 روش رگرسیون گام بهگام3

یکی از مسائل مهم در پیشبینی های هیدرولوژیک، انتخاب بهینه پیشبینیکننده ها از میان تعداد زیاد متغیرهای موجود است. در یک فرآیند تلفیق داده، علاوه بر تأثیرگذاری بالای دقت مدلهای پیشبینی منفرد و مدلهای تلفیق داده، انتخاب بهترین متغیرهای پیشبینیکننده به عنوان ورودی مدل های منفرد و انتخاب بهترین مدلهای منفرد به عنوان ورودی مدلهای تلفیق داده نیز از اهمیت بالایی برخوردار است.[1] برای این منظور از روش رگرسیون گامبهگام استفاده شده است. رگرسیون گامبهگام یک روش سیستماتیک برای اضافه و حذف عبارات از یک مدل رگرسیون چند متغیره با توجه به اهمیت اثرگذاری عبارات در نتیجه رگرسیون میباشد. این روش با یک مدل اولیه شروع شده و توانایی آن در شبیه سازی رابطه موجود بین دادهها با مدلهای با عبارات کمتر و بیشتر مقایسه میگردد.

اگر SSR/1'…'/S نشان دهنده مجموع مربعات رگرسیون با لحاظ کردن P فاکتور xL1'…'[Lp باشد، SSR/ - S+1 - /1'…'/S نشان دهنده افزایش مجموع مربعات رگرسیون با افزودن فاکتور xL - p+1 - به مدل خواهد بود که به صورت زیر محاسبه میشود : SSR/ - S+1 - /1'…'/S = SSR/1'…'/ - S+1 - - SSR/1'…'/S     - 1 - در رگرسیون گام به گام حذف رو به عقب بعد از اضافه کردن هر یک از متغیرها صورت میگیرد، تا متغیرهای مازاد از مدل حذف گردند. در هر مرحله از حذف و اضافه، از روش های آماری مانند P-Value و یا تست F استفاده میشود تا عملکرد مدل با و بدون متغیر مورد نظر ارزیابی گردد. مراحل حذف و اضافه تا زمانی که دیگر نتوان بهبود قابل ملاحظهای در عملکرد مدل ایجاد نمود، دنبال میشود.

2-2 روشهای تلفیق داده

2-2-1 میانگین گیری ساده4

این روش، روشی ساده است ولی برابر در نظر گرفتن وزن های مدل های منفرد از مشکلات این روش است.

-2-2-2 میانگینگیری وزن دار1

برای غلبه بر مشکل وزن های برابر مدلهای منفرد میتوان از میانگینگیری وزندار استفاده کرد. در این روش به هر مدل منفرد یک وزن اختصاص داده میشود. که در آن Cjوزن هر مدل منفرد است. برای به دست آوردن این وزن ها، شو و برن حداقلسازی تابع زیر را پیشنهاد دادهاند.[2]اشکال این روش، ثابت بودن وزنها در طول دوره مشاهدات است.

2-2-3 بهترین مدل در گام زمانی قبلی

در این روش مدل منفردی که در گام زمانی قبلی بهترین عملکرد - کمترین خطا - را داشته باشد، به عنوان مدل پیش بینی کننده در گام زمانی بعدی انتخاب میشود.

2-2-4 مدل شبکه عصبی مصنوعی

شبکه عصبی مصنوعی یک سیستم پردازش موازی اطلاعات با تقلید ساده از سیستم عصبی مغز انسان است. این تقلید بر اساس یک پیکربندی ریاضی است. به این ترتیب که با استفاده از تعداد بسیار زیادی از عصب های مصنوعی به هم پیوسته، محاسبات لازم را انجام می دهد. هر شبکه عصبی مصنوعی شامل یک یا چند لایه متصل به هم است و هر لایه نیز می تواند از چندین عصب تشکیل شود. فرایند عملکرد این شبکهها بدین نحو است که لایه ورودی، اقدام به پذیرش داده ها نموده و در نهایت، لایه خروجی اقدام به نمایش خروجیهای حاصل از کاربرد مدل مینماید.[9]و[10] در مدل تلفیق داده به روش شبکه عصبی، خروجی مدلهای منفرد، به عنوان ورودی شبکه عصبی در نظر گرفته میشود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید