بخشی از مقاله
خلاصه
مدلسازی و پیشبینی جریان رودخانه از دغدغههای ابتدایی بشر بوده است که با وجود پیشرفت روزافزون از یک سو و گرم شدن کره زمین از سوی دیگر، نیاز انسان به آن بیش از پیش احساس میشود. در تحقیق حاضر، از روش رگرسیون بردار پشتیبان - SVR - با سه تابع کرنل چند جملهای، تابع کرنل پیرسون و تابع کرنل با پایه شعاعی برای پیشبینی دبی روزانه حوضه رودخانه لیقوان واقع در استان آذربایجان شرقی استفاده گردید. همچنین تاثیر ترکیبهای متفاوتی از پارامترهای ورودی دبی و بارش با تعریف شش حالت مختلف مورد مطالعه قرار گرفت.
مقایسه نتایج حاصل شده با استفاده از معیارهای ضریب همبستگی، جذر میانگین مربعات خطا و خطای میانگین مطلق، نشان داد که در حالت محاسبه دبی رودخانه با حافظههای قبلی دبی و بارش و استفاده از تابع کرنل چندجملهای - سناریوی شماره - 16، رگرسیون بردار پشتیبان با داشتن ضریب همبستگی 0/962، میانگین خطای مطلق 0/123 و جذر میانگین مربعات خطای 0/387، عملکرد مناسبتری را در مقایسه با دیگر حالتها از خود نشان داده است. در نهایت سناریوی شماره 16 به عنوان بهترین و سناریوی شماره 1 به عنوان بهینهترین حالت رگرسیون بردار پشتیبان جهت پیشبینی جریان روزانه رودخانه لیقوان چای پیشنهاد گردید.
1. مقدمه
زندگی انسان از ابتدای پیدایش وابستگی شدیدی به آب داشته است، به طوری که تمدنهای ما قبل تاریخ در کنار رودخانهها شکل گرفته بودند و مصریان باستان اولین انسانهایی بودند که با استفاده از ابزارهای مختلف اقدام به ثبت تغییرات دبی رودخانه نیل کردند تا از آن در پیشبینی وقوع سیل بهره گیرند
مدلسازی و پیشبینی جریان رودخانه از دغدغههای ابتدایی بشر بوده است که با وجود پیشرفت روزافزون بشر از یک سو و گرمشدن کره زمین از سوی دیگر نیاز انسان به آن بیش از پیش رو به افزایش است.
امروزه مدلسازی میتواند در مواردی همچون ذخیره بهینه و استفاده از آن، مدیریت رخدادهای شدید مانند سیل و خشکسالی، برنامهریزی برای آینده و کمک به درک بهتر رخدادهای هیدرولوژیکی همانند تغییرات اقلیم به یاری محققان و مهندسان بشتابد
در سالهای اخیرتلاشهای تحقیقاتی بسیاری برای اصلاح و بهبود روشهای تجربی موجود انجام شده است، با این وجود این روشها برای مدلسازی پدیدههای فیزیکی پیچیده پاسخگوی دقیقی نیستند. یکی از متداولترین روشهای جایگزین برای روابط تجربی موجود، روشهای موسوم به دادهکاوی1 است. از جمله روشهای داده کاوی میتوان به روشهای شبکه عصبی مصنوعی - ANN - 2 و ماشین بردار پشتیبان - SVM - 3 اشاره کرد
شبکه عصبی مصنوعی محبوب ترین روشی است که توسط محققان در دو دهه گذشته به منظور پیشبینی جریان رودخانهای مورد استفاده قرار گرفته است. اما در این بین محققین از روشهای دیگر داده کاوی نیز استفاده کردهاند. به عنوان مثال آسفا و همکاران [5] نشان دادند که ماشین بردار پشتیبان میتواند پیشبینی قابل قبولی از دادههای دبی رودخانه ارائه دهد. لیانگ و همکاران [6] نشان دادند که ماشین بردار پشتیبان در مقایسه با شبکه عصبی مصنوعی در مدلسازی بارش- رواناب عملکرد بهتری داشته است.
با این حال تاکنون عملکرد روش رگرسیون بردار پشتیبان برای پیشبینی روند رودخانه در مقیاس محدودی بررسی شده است. لوندهه و همکاران [7] با استفاده از روش رگرسیون بردار پشتیبان نشان دادند که نتایج بدست آمده در دو حوضه مورد مطالعه قابل قبول بوده و از خطای کمتری برخوردار بوده است. با توجه به اهمیت موضوع شبیهسازی به خصوص در مباحث هیدرولوژیکی، هدف از تحقیق حاضر بررسی کارایی مدل رگرسیون بردار پشتیبان در شبیهسازی مقادیر دبی روزانه میباشد. در این تحقیق از روش رگرسیون بردار پشتیبان برای پیشبینی دبی روزانه در حوضه رودخانه لیقوان با تابع کرنل چند جملهای، تابع کرنل پیرسون و تابع کرنل با پایه شعاعی استفاده شده است.
2. مواد و روشها
.1,2 منطقه مورد مطالعه
حوضه آبریز لیقوان چای با مختصات جغرافیایی 37 درجه و 55 دقیقه تا 37 درجه و 43 دقیقه و 30 ثانیه عرض شمالی و 46 درجه و 22 دقیقه و 25 ثانیه تا 46 درجه و 2 دقیقه و 16 ثانیه طول شرقی، از دامنههای شمالی رشته کوه سهند سرچشمه میگیرد. چشمه سارهای متعددی از درههای شرقی و غربی لیقوان به آن میپیوندد و رودخانه پرآبی را تشکیل میدهند. لیقوان چای زهکش اصلی حوضه بوده و جریان رودخانه با طی مسیر از سمت جنوب به شمال، باعث آبیاری اراضی پایین دست حوضه لیقوان میگردد.این رودخانه در دره نسبتاً عمیقی نسبت به سطح روستای لیقوان جریان دارد. حوضه لیقوان چای با مساحت 77 کیلومترمربع دارای رژیم برفی می باشد و به همین دلیل آبریز حوضه مذکور دارای شاخهبندی مشخص و از نوع کمتراکم است. این حوضه در سال 1350 به عنوان حوضه معرف انتخاب گردید.
شکل -1 موقعیت حوضه لیقوان چای
.2,2 رگرسیون ماشین بردار پشتیبان
ماشین بردار پشتیبان یکی از روشهای یادگیری است که در سال 1992 میلادی توسط بوسر و همکاران [9] بر پایه تئوری یادگیری آماری معرفی شد. بوسر و همکارانش طی سالهای بعد تئوری ابرصفحه1 بهینه را به عنوان طبقهبندی کننده خطی ارائه دادند. آنها همچنین طبقهبندی کنندههای غیرخطی را با کمک توابع کرنل معرفی نمودند.
اصول اساسی آن چه که امروز به عنوان ماشین بردار پشتیبان شناخته میشود نتایج کارهای بوسر و همکاران است و در نهایت گسترش ماشین بردار پشتیبان بر اساس رگرسیون نیز در سال 1995 توسط وپنیک و همکاران [10] به نتیجه رسید. به طورکلی ماشین بردار پشتیبان در مسائل طبقهبندی دو یا چند کلاسه به صورت خطی یا غیرخطی و رگرسیون مورد استفاده قرار میگیرد. در این روش، دادهها به دو دسته آموزش و آزمایش تقسیم میشوند. مدل ساختهشده با استفاده از دادههای آموزش، با استفاده از دادههای آزمایش ارزیابی میشود تا دقت مدل بررسی شود
منظور از رگرسیون، به دست آوردن یک ابرصفحه است که بر دادههای مورد نظر برازش داده میشود. فاصله هر نقطه از این ابرصفحه نشاندهنده خطای آن نقطه خاص است. بهترین روشی که تاکنون برای رگرسیون خطی پیشنهاد شده است، روش حداقل مربعات میباشد. با این وجود، برای مسائل رگرسیون، این امکان وجود دارد که استفاده از برآورد کننده کمترین مربعات در حضور دادههای پرت، بطور کامل شدنی نباشد و در نتیجه رگرسور عملکرد ضعیفی را از خود به نمایش بگذارد. بنابراین میبایست یک برآوردکننده نیرومند که نسبت به تغییرات کوچک در مدل حساس نباشد را توسعه داد. در واقع، یک تابع زیان− 1 غیرحساس به صورت زیر تعریف می شود:
مقدار تخطی نمایند میبایست متناسب با مقدار تخطی، متغیر کمبود تعریف شود که در شکل 2 نمونهای از این تخطی نمایش داده شده است. مطابق با تابع زیان اشاره شده، کمینهسازی، مسأله اولیه، نقطه زینی و مسأله دوگان مربوطه را با استفاده از توابع کرنل تشکیل و بررسی می شود
شکل - 2 میزان تخطی دادهها از مقدار مجاز.
در رابطه2، || ||2 نرم بردار وزن و ∗ و متغیرهای کمبود کمکی هستند که در شکل 2 نشان داده شدهاند و پارامتر ضریب تعادل پیچیدگی میان ماشین و تعداد نقاط تفکیک ناپذیر است که با سعی و خطا بدست میآید. در تحقیق حاضر، مقدار آن پس از آزمون و خطا برابر 0/7 انتخاب شد. مقدار نیز به طور پیش فرض برابر 0/001 میباشد که پس از آزمون های انجام گرفته، مقدار پیشفرض به عنوان عدد بهینه انتخاب گردید.
یکی از تکنیکهای متداول برای حل مسائل غیرخطی، استفاده از توابع کرنل میباشد که بر اساس ضرب داخلی دادههای مفروض، تعریف میشود. در واقع، با یک تبدیل غیرخطی از فضای ورودی به فضایی با ابعاد بیشتر - حتی نامتناهی - می توان مسائل را به صورت خطی، تفکیک پذیرساخت. در تحقیق حاضر از سه تابع کرنل مهم کهعموماً در کاربردهای مهندسی متداول هستند - جدول - 1، استفاده شده است.