بخشی از مقاله
*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***
مقایسه عملکرد ماشین بردار پشتیبان با سایر مدل های هوشمند در شبیه سازی فرآیند
چکیده
شبیه سازی فرآیند بارش- رواناب به عنوان مهمترین گام در مطالعات مهندسی آب و مدیریت منابع آب است. در این تحقیق فرآیند بارش- رواناب ماهانه سیمینه رود در دوره آماری (۱۳۹۰-۱۳۷۷) با استفاده از مدل های ماشین بردار پشتیبان با توابع کرنل پایه شعاعی، چندجمله ای و خطی، مدل شبکه بیزی با الگوریتم یادگیری PC و نیز مدل های متداول شبکه عصبی مصنوعی و برنامه ریزی بیان ژن شبیه سازی شده و نتایج آنها مورد مقایسه قرار گرفته است. از پارامترهای ضریب همبستگی، ریشه میانگین مربعات خطا و ضریب نش ساتکلیف برای ارزیابی صحت مدل ها استفاده گردید. نتایج گویای عملکرد قابل قبول هر چهار مدل و برتری مدل برنامه ریزی بیان ژن با بیشترین ضریب همبستگی کم ترین ریشه میانگین مربعات خطا و مقدار ضریب نش ساتکلیف در مرحله صحت سنجی است.
واژه های کلیدی: بارش- رواناب، برنامه ریزی بیان ژن، سیمینه رود، شبکه بیزی، شبکه عصبی مصنوعی، ماشین بردار پشتیبان
مقدمه
برنامه ریزی بهره برداری از منابع آبهای سطحی و زیرزمینی، ساماندهی رودخانه ها و هشدار سیل نیاز به پیش بینی آبدهی رودخانه و رواناب حوزه آبخیز دارد. به طوری که، آگاهی از چگونگی ارتباط بین بارندگی و رواناب حوزه های آبخیز بخش جدا نشدنی مطالعات طرح های آبی است. خاصیت غیرخطی، نبود قطعیت ذاتی این فرایند، نیاز به اطلاعات وسیع، و پیچیده بودن مدل های فیزیکی از دلایلی است که باعث شده محققان به سوی مدل های متداول شامل شبکه عصبی مصنوعی (ANN) و برنامه ریزی بیان ژن (GEP) و مدل های جدیدی هم چون شبکه های تصمیم بیزی (BN) و ماشین بردار پشتیبان (SVM) رو آورند. دریاچه ارومیه یکی از بزرگترین و مهم ترین اکوسیستم های آبی در ایران میباشد. با توجه به این که افزایش دما و کاهش تغییرات زیاد بارش، در سالهای اخیر به کاهش شدید تراز سطح آب دریاچه منجر شده است، آگاهی از میزان بارش و یا رواناب ناشی از آن در تفسیر و بررسی ذخیره ابی و نیز مسائل مربوط به برنامه ریزی و مدیریت منابع آب این حوزه مؤثر است. لذا در این تحقیق سیمینه رود، یکی از مهمترین رودخانه های این حوزه مورد مطالعه قرار گرفته است.
مطالعات متعددی با روش های ذکر شده در زمینه هیدرولوژی و به ویژه فرآیند بارش- رواناب صورت گرفته است. سلطانی و همکاران (۲۲) با کاربرد برنامه ریزی بیان ژن در شبیه سازی فرآیند بارش- رواناب روزانه حوزه آبخیز لیقوان، با تعریف دو مجموعه عملگر ریاضی به این نتیجه دست یافتند که مدل حاصل از مجموعه عملگرهای اصلی مناسب تر است.
جایاواردنا و همکاران (۱۰) با استفاده از برنامه ریزی ژنتیک فرآیند بارش- رواناب را با داده های روزانه در دو حوزه نسبتا بزرگ چین شبیه سازی کردند که نتایج حاصل با داده های واقعی مطابقت داشت. آیتک و همکاران (۱) با شبکه های عصبی مصنوعی و برنامه ریزی بیان ژن بارش- رواناب روزانه حوزه رودخانه جونياتا" در ایالت پنسیلوانیای آمریکا را شبیه سازی کردند و نتیجه گرفتند که برنامه ریزی بیان ژن با دقت بهتری نسبت به شبکه های عصبی مصنوعی فرآیند بارش- رواناب را شبیه سازی مینماید. میسرا و همکاران (۱۶) با مقایسه مدل ماشین بردار پشتیبان با شبکه عصبی مصنوعی به پیش بینی رواناب و بار رسوب با استفاده از داده های روزانه، هفتگی و ماهانه در حوزه آبخیز هند پرداختند.
نتایج نشان داد ماشین بردار پشتیبان هم در زمینه پیش بینی رواناب و هم بار رسوب نسبت به شبکه عصبی مصنوعی بهتر میباشد. یون و همکاران (۲۵) دو مدل شبکه عصبی مصنوعی و ماشین بردار پشتیبان را به منظور پیش بینی تغییرات سطح آب زیرزمینی به کار گرفتند، که نتیجه این تحقیق حاکی از برتری مدل ماشین بردار پشتیبان می باشد. باتسیس و همکاران بارش- رواناب روزانه در کالیفرنیا را شبیه سازی کردند، مدل ماشین بردار پشتیبان با سه نوع تابع کرنل با مدل شبکه عصبی مصنوعی مورد مقایسه قرار گرفت، در نتیجه این تحقیق ماشین بردار پشتیبان شبیه سازی دقیق تری از بارش- رواناب داشت (۲). شهبازی و همکاران (۲۱) مطالعه ای در زمینه پیش بینی فصلی خشکسالی در حوزه سدهای طالقان و ماملو با مدل ماشین بردار پشتیبان انجام دادند. ماشین بردار پشتیبان برای پیش بینی نمایه بارش استاندارد (SPI)" استفاده گردید که نتایج حاصل در اکثر موارد دقت خوبی را نشان داد. طاهری و همکاران (۲۳) دو روش یادگیری فعال و ماشین بردار پشتیبان را برای شبیه سازی جریانات روزانه رودخانه کارون مورد مقایسه قرار دادند و قابلیت بالای ماشین بردار پشتیبان در شبیه سازی رواناب را مطرح نمودند. مهاجرانی و همکاران (۱۷) با کاربرد شبکه بیزی در مدیریت بهره برداری از آب زیرزمینی، بیان کردند که استفاده از شبکه بیزی در مدیریت بهره برداری از منابع آب زیرزمینی می تواند به مدیران و برنامه ریزان به منظور برنامه ریزی و مدیریت صحیح منابع آب کمک شایانی کند. فرمانی و همکاران (۷) با شبکه های بیزی به مدیریت بهینه آلودگی آبهای زیرزمینی در کپنهاگ پرداختند. نتیجه به دست آمده حاکی از موفقیت آمیز بودن کاربرد الگوهای شبکه بیزی در مدیریت آلودگی آبهای زیرزمینی منطقه بوده است. کارمونا و همکاران (۴) برای مدیریت منابع آب زیرزمینی در دو مطالعه موردی واقع در اسپانیا از الگوی شبکه بیزی که یک سامانه مناسب پشتیبانی استفاده نموده اند. صادقی حصار و همکاران (۱۹) به منظور پیش بینی بارش ماهانه استان خراسان قابلیت مدل شبکه بیزی را مطرح و تأئید نموده اند.
افزون بر مطالعات ذکر شده میتوان به تحقیقات انجام شده از سوی دیباک و همکاران (۴)، فربودفام و همکاران (۶)، قربانی و همکاران (۹۰۸)، خطیبی و همکاران ( ۱۳، ۱۲ ، ۱۱ )، مدیر و همکاران (۱۵) و نوری و همکاران (۱۸) اشاره کرد. با توجه به موارد ذکر شده و اهمیت حوزه سیمینه رود در این تحقیق سعی شده است فرآیند بارش - رواناب با استفاده از مدل های ماشین بردار پشتیبان، شبکه بیزی، شبکه عصبی مصنوعی و برنامه ریزی بیان ژن شبیه سازی شده و عملکرد هر یک مورد بررسی قرار گیرد.
مواد و روشها
مدل ماشین بردار پشتیبان
ماشین بردار پشتیبان یک سیستم یادگیری کارآمد بر مبنای تئوری بهینه سازی مقید است که از اصل استقرای کمینه سازی خطای ساختاری استفاده کرده و به یک جواب بهینه کلی منجر می گردد. در مدل رگرسیون SVM تابعی مرتبط با متغیر وابسته Y که خود تابعی از چند متغیر مستقل X است، برآورد می شود. مشابه سایر مسائل رگرسیونی فرض می شود رابطه میان متغیرهای مستقل و وابسته با تابع جبری مانند (f( x به علاوه مقداری اغتشاش (خطای مجاز ) مشخص شود.
که در این معادله W: بردار ضرایب و b: ثابت مشخصه های تابع رگرسیونی و نیز تابع کرنل باشد، آنگاه هدف پیدا کردن فرم تابعی برای (f( x است. این مهم با آموزش مدل SVM از طریق مجموعه ای از نمونه ها (مجموعه آموزش) محقق می شود. برای محاسبهاو b لازم است تابع خطا (معادله ۳) در مدل با در نظر گرفتن شرایط مندرج (قیود) در معادله (۴) بهینه شود.
در معادلات بالا C: عددی صحیح و مثبت است، که عامل تعیین جریمه در هنگام رخ دادن خطای آموزش مدل است. 0 : تابع کرنل، N: تعداد نمونه ها و دو مشخصه متغیرهای کمبود هستند. در نهایت تابع SVM رگرسیونی را می توان به فرم زیر بازنویسی کرد:
در معادله (۵) میانگین ضرایب لاگرانژ میباشد. محاسبه در فضای مشخصه آن ممکن است بسیار پیچیده باشد. برای حل این مشکل روند معمول در مدل SVM رگرسیون انتخاب یک تابع کرنل به صورت رابطه زیر است:
می توان از توابع مختلف کرنل برای ساخت انواع مختلف استفاده کرد. انواع توابع کرنل قابل استفاده در مدل SVM رگرسیونی عبارتند از: کرنل چندجمله ای با سه مشخصه هدف، کرنل توابع پایه شعاعی (RBF) با یک مشخصه هدف و کرنل خطیه در مطالعات بارش - رواناب عمدتا از مدل RBF استفاده میشود (۵). برای انجام فرآیند محاسبات کدی در محیط متلب نوشته شده است. شبکه تصمیم بیزی شبکه بیزی یک الگوی نموداری احتمالاتی است که مجموعه ای از متغیرها و احتمالات مربوط به هر یک را نشان میدهد. این شبکه یک گراف مستقیم و غیر چرخه ای است که در آن گرهها در حکم متغیرهای مسئله هستند. ساختار یک شبکه بیزی در واقع یک نمایش نموداری از اثرات متقابل متغیرهایی است که باید الگوبندی شوند، علاوه بر این که کیفیت رابطه بین متغیرهای مسئله را نشان میدهد، کمیت ارتباط با این متغیرها را نیز به نمایش می گذارد. این روش بر مبنای محاسبات احتمالات شرطی (قانون بیز) است. معادله (۷) رابطه بیز را نشان میدهد: رابطه (۷)
که در آن، (p ( a: احتمال وقوع پیشامد احتمال وقوع پیشامد احتمال شرطی پیشامد b است، به شرطی که پیشامد a اتفاق افتاده باشد و احتمال شرطی پیشامد a است. هر شبکه بیزی از سه جزء اصلی تشکیل شده است: مجموعه ای از گره ها (متغیرهای سامانه مدیریتی)، مجموعه ای از بندها روابط سببی بین متغیرها) و مجموعه ای از احتمالات. شکل (۱) نمونه ای از گراف شبکه بیزی را به صورت چرخه ای و مستقیم نشان میدهد.
در حالت کلی، گرهها یا والد هستند یا ولد (فرزند) ، یک گره فرزند می تواند از سوی چندین والد تولید شده باشد، گرههایی که قبل از آنها گره دیگری در گراف وجود دارد با توزیع احتمال شرطي تعریف می شوند، در غیر این صورت با احتمال آغازینه (اولیه) بیان می شوند. پایین ترین بخش در شبکه بیزی از طریق قانون احتمال کل به دست می آید. احتمالات مرتبط با بخش های بالایی شبکه بر اساس قانون بیز می باشند. شکل (۲) مراحل ساخت و توسعه الگوی شبکه بیزی را به صورت خلاصه بیان می کند (۱۷). با استفاده از نرم افزار GeNIe2 ساختار شبکه بیزی تشکیل و نتایج این تحقیق حاصل شده است.
برنامه ریزی بیان ژن تعمیم یافته الگوریتم ژنتیک است که برای اولین بار بر اساس تئوری داروین ارائه شد. به این ترتیب که جمعیتی در جهت تکامل به صورت انتخابی، جمعیت نامناسب را رها کرده و فرزندانی اصلاح شده ایجاد می کنند. ساختارهای درختی از مجموعه توابع (عملگرهای ریاضی مورد استفاده در فرمول ها) و ترمینال ها (متغیرهای مسئله و اعداد ثابت) ایجاد میشوند (۱۴). قبل از مراحل اجرایی برنامه ریزی بیان ژن گامهای مقدماتی زیر باید از سوی کاربر تعیین شوند: 1- مجموعه ترمینال ها (متغیرهای مسئله، اعداد ثابت تصادفی)، ۲- مجموعه عملگرهای ریاضی مورد استفاده در فرمولها، ۳- انتخاب تابع برازش، برای سنجش برازش فرمولها، ۴- تعیین پارامترهای کنترل کننده اجرای برنامه، ۵- معیار پایان و ارائه نتایج اجرای برنامه (مثل، تعداد تولید جمعیت جدید، تعیین یک مقدار مشخص برای برازش فرمول ها که اگر میزان برازش برابر یا بیشتر از آن مقدار شد، اجراء متوقف شود. طرح کلی گام های اجرایی برنامه ریزی بیان ژن در شکل (۳) نشان داده شده است. برای اطلاعات بیشتر در این مورد می توان به رفرنس (۲۲) مراجعه نمود.
در این تحقیق در راستای شبیه سازی فرآیند بارش- رواناب با مدل برنامه ریزی بیان ژن از نرم افزار 4 . 0 GeneXproTools استفاده شد. شبکه های عصبی مصنوعی در حالت کلی شبکه عصبی شامل سه لایه است شکل (۴). لایه ورودی که وظیفه آن معرفی پارامترها به شبکه می باشد، لایه خروجی محل استقرار پارامترهای خروجی شبکه و لایه پنهان، لایه های ما بین لایه ورودی و خروجی می باشند، که نقش پردازشگری اطلاعات را بر عهده دارد.
یک شبکه عصبی مصنوعی علائم را از واحدهای ورودی دریافت کرده و این سیگنال ها در طول شبکه انتشار یافته و در نهایت به سوی نرون خروجی حرکت می نمایند. پارامترهای کنترلی اصلی مدل های شبکه عصبی مصنوعی مقاومت های اتصالی بین نرونها هستند، که وزنها و گرایش ها نامیده میشوند. لایه های مختلف در شبکه عصبی و نیز نرونهای موجود در لایه ها می توانند دارای توابع محرک متفاوت یا یکسانی باشند. شبکه های عصبی از نظر ساختار و ارتباطات بین نرونها به گروههای مختلفی تقسیم می شوند. شبکه پرسپترون چند لایه رایج ترین مدل شبکه عصبی استفاده شده در مسائل مهندسی آب می باشد که برای آموزش این شبکه از الگوریتم پس انتشار خطا که یک روش یادگیری با ناظر است استفاده می شود. تنظیم پارامترها در شبکه پرسپترون چند لایه از طریق سیگنال خطا و سیگنال ورودی صورت می گیرد. تعیین تعداد لایه ها و نرون های موجود در آنها از مهمترین مسائل در شبیه سازی با شبکه عصبی مصنوعی است (۲۰). توکار و جانسون رایج ترین توابع محرک استفاده شده در شبکه های انتشار برگشتی را توابع محرک سیگموئید و تانژانت هیپربولیک ذکر کردند (۲۴). معیارهای ارزیابی برای ارزیابی دقت و قابلیت مدلها از نمایه های ضریب همبستگی (CC)، ریشه میانگین مربعات خطا (RMSE)" و معیار نش ساتکلیف (NS طبق روابط ۸، ۹ و ۱۰ صورت گرفت. بهترین مقدار برای این سه معیار به ترتیب یک، صفر و یک می باشد.
در روابط به ترتیب مقادیر مشاهداتی و محاسباتی رواناب ماهانه در گام زمانی iام، N تعداد داده ها، ترتیب میانگین مقادیر مشاهداتی و محاسباتی رواناب ماهانه ایستگاه قزل گنبد سیمینه رود می باشد. علاوه بر معیارهای فوق از نمودارهای پراکنش و سری زمانی مقادیر مشاهداتی محاسباتی نسبت به زمان جهت مقایسه و تحلیل بیشتر استفاده شده است.
معرفی منطقه و دادههای مورد استفاده
سیمینه رود در استان آذربایجان غربی قرار گرفته و یکی از زیر حوزه های حوزه آبخیز دریاچه ارومیه میباشد. این رودخانه از ارتفاعات اطراف سقز در جنوب دریاچه ارومیه سرچشمه می گیرد و در جهت جنوب به شمال جریان دارد. حوزه این رودخانه با مساحت ۷۶۹ کیلومتر مربع در ارتفاع ۱۳۹۴ متری از سطح دریا در عرض جغرافیایی ۲۶ ۳۶۶ و طول جغرافیایی ۵۶°۴۵ واقع شده است. در این تحقیق اطلاعات باران سنجی و آبسنجی ماهانه ایستگاه قزل گنبد از سال ۱۳۷۷ تا ۱۳۹۰ مورد استفاده قرار گرفته است. در شکل (۵) موقعیت جغرافیایی و نقشه حوزه آبخیز منطقه مورد مطالعه نشان داده شده است. در شکل (۶) نمودار تغییرات بارش و رواناب و در جدول (۱) ویژگیهای آماری در بازه زمانی (۱۳۹۰-۱۳۷۷) نشان داده شده است.