مقاله مقایسه و ارزیابی مدل های شبکه عصبی بیزین ، برنامه ریزی بیان ژن ، ماشین بردار پشتیبان و رگرسیون خطی در تخمین بده جریان ؛ مطالعه موردی حوضه صوفی چای

word قابل ویرایش
28 صفحه
دسته : اطلاعیه ها
12700 تومان
127,000 ریال – خرید و دانلود

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

مقایسه و ارزیابی مدل های شبکه عصبی بیزین ، برنامه ریزی بیان ژن ، ماشین بردار پشتیبان و رگرسیون خطی در تخمین بده جریان ؛ مطالعه موردی حوضه صوفی چای
چکیده
پیش بینی جریان رودخانه برای برنامه ریزی طراحی و مدیریت مطمئن پروژه های منابع آب مهم است . در این پژوهش قابلیت کاربرد شبکه عصبی بیزین ، برنامه ریزی ژن ، ماشین بردار پشتیبان و رگرسیون خطی چندمتغیره برای پیش بینی سری زمانی جریان رودخانه صوفی چای بررسی شد. سری زمانی جریان روزانه رودخانه برای دوره ١٣٧۶ تا ١٣٨٩ برای ایستگاه هیدرومتری تازه کند رودخانه صوفی چای مورد استفاده واقع شد. جهت بدست آوردن بهترین نگاشت ورودی و خروجی؛ ترکیبات مختلف ورودی با استفاده از داده های پیشین جریان روزانه رودخانه محاسبه شد. کارایی مدل ها با استفاده از چهار معیار خطای: ضریب همبستگی (CC)، ریشه جذر میانگین خطا (RMSE ) و ضریب نش ساتکلیف و بایاس محاسبه شد.
مقایسه مدل ها نشان داد که شبکه عصبی بیزین با ضریب همبستگی (٠.٩٩١)، جذر میانگین مربعات خطا (s.m٠٠٣١٣)، نش ساتکلیف (٠.٩٨١) و مقدار بایاس (٠.٠٠۶-) بهترین تخمین را از داده های روزانه جریان رودخانه نسبت به مدل های برنامه ریزی بیان ژن ، ماشین بردار پشتیبان و رگرسیون خطی چندمتغیره داشته است .
واژه های کلیدی: برنامه ریزی بیان ژن ، دبی جریان ، شبکه عصبی بیزین ، ماشین بردار پشتیبان .

مقدمه
امروزه با توجه به اهمیت و حساسیت امر مهار آب های سطحی خصوصا در کشور ما که اکثر رودخانه های مناطق مختلف فصلی بوده و کمبود آبی که در پهنه وسیعی از کشور وجود دارد، نیاز به شناسایی و به مدل درآوردن رفتار رودها و شریان های آبی جهت برنامه ریزیهای بلندمدت و استفاده بیشتر و بهتر از پتانسیل های آن ها ضروری است . لذا انتخاب مدلی که بتواند با استفاده از عوامل تأثیرگذار، جریان ورودی را به طور قابل قبولی برآورد نماید امری ضروری به نظر می رسد. امروزه سیستم های هوشمند به طور گسترده برای پیش بینی پدیده های غیرخطی مورداستفاده قرار میگیرد، که روش شبکه عصبی بیزین (BNN1)، برنامه ریزی بیان ژن (GEP2) و ماشین بردار پشتیبان (S.V.M3( از جمله ی این روش ها است . شبکه های عصبی بیزین به عنوان یکی از روش های مبتنی بر شبکه های عصبی در مدل کردن مسایل غیرخطی و پیچیده از طریق الگوریتم های خاص و روش های آماری است . با استفاده از این روش می توان به مدل کردن روابط علت و معلولی یک فرآیند، آنالیز وضعیت موجود و تخمین وضعیت آینده یک سیستم پرداخت (طباطبایی و دشتی زاده ،١٣٨٧). برنامه ریزی ژن یک تکنیک برنامه ریزی خودکار است که راه حل مساله را با استفاده از برنامه ریزی کامپیوتر ارایه کرده و عضوی از خانواده الگوریتم تکاملی می باشد (قربانی و صالحی،١٣٩٠). ماشین بردار پشتیبان نیز یک سیستم یادگیری کارآمد بر مبنای تئوری بهینه سازی مقید است .
در سال های اخیر استفاده از روش های هوشمند موردبررسی در مطالعات پیش بینی جریان ورودی به مخازن سدها موردتوجه محققین قرارگرفته است ، که ازجمله می توان به موارد ذیل اشاره نمود: در پژوهشی به منظور پیش بینی جریان روزانه رودخانه لیقوان از مدل برنامه ریزی بیان ژن استفاده نمودند نتایج این تحقیق نشان داد که مدل برنامه ریزی بیان ژن از دقت بسیار بالایی نسبت به روش شبکه های عصبی مصنوعی و مدل های سری زمانی برخوردار است (فربودنام و همکاران ، ١٣٨٨). در پژوهشی دیگر جهت بررسی همبستگی روزانه بین ایستگاه های هیدرومتری در پیش بینی جریان ورودی به مخزن سد دز از مدل شبکه عصبی مصنوعی و رگرسیون خطی چند متغیره استفاده نمودند نتایج نشان داد با در نظر گرفتن ضریب همبستگی و معیار میانگین مربعات خطاها، مدل شبکه عصبی مصنوعی عملکرد بهتری نسبت به مدل رگرسیون خطی دارد (بنیحبیب و همکاران ، ١٣٨٩). نتایج حاصل از پژوهش استفاده از مدل ماشین بردار پشتیبان جهت پیش بینی دبی روزانه رودخانه قره سو حاکی از دقت و کارایی مناسب این مدل است (محرم پور و همکاران ، ١٣٩٠). از سوی دیگر در پژوهشی کاربرد شبکه عصبی بیزین را جهت شبیه سازی فرآیند بارش – رواناب با استفاده از داده های روزانه حوضه ساگونی ۴ در کانادا موردبررسی قراردادند که نتایج حاصله نشان داد مدل شبکه عصبی بیزین خطایی ناچیز در تخمین رواناب داشته و نیز نسبت به روش شبکه عصبی مصنوعی در تخمین اکثر مقادیر دقت بالایی دارد (٢٠٠۶ ,.Khan and Coulibaly). جهت پیش بینی دبی جریان روزانه رودخانه شویل ۵ در آمریکا از روش برنامه ریزی بیان ژن و شبکه عصبی مصنوعی استفاده نمود و نشان داد که هر دو روش نتایج قابل قبولی داشته ، ولی برنامه ریزی بیان ژن از دقت بالاتری نسبت به شبکه عصبی مصنوعی برخوردار است (٢٠٠٩ ,.Guven). در پژوهشی کاربرد شبکه عصبی بیزین را در ایستگاه جاتیسرنو واقع در اندونزی جهت تخمین بارش ساعتی موردبررسی قراردادند و نتایج نشان داد که شبکه عصبی بیزین دقت بالا و خطایی ناچیز نسبت به شبکه های عصبی مصنوعی دارد (٢٠١٣ ,.Fithriasari et al). در پژوهشی دیگر جهت پیش بینی جریان رودخانه در منطقه ای کوهستانی و نیمه خشک واقع در شمال غربی ۶۶ چین از ماشین بردار پشتیبان استفاده نمودند و دریافتند که مدل ماشین بردار پشتیبان عملکردی مناسب جهت پیش بینی جریان رودخانه در مناطق کوهستانی نیمه خشک داشته و نسبت به مدل های شبکه عصبی مصنوعی و سیستم استنتاج فازی از دقت مطلوبی برخوردار است )۲۰۱۴,.He et al.(در مجموع با توجه به پژوهش های انجام شده و ذکر این نکته که ایستگاه های هیدرومتری بالادست سد علویان به عنوان مهم ترین منبع تأمین کننده آب بخش های مختلف و نواحی مجاور خود می باشد، بنابراین اهمیت تخمین جریان و اقدامات مدیریتی جهت بهبود بهره برداری بهینه از مخازن سد ضروری است . لذا، هدف از این تحقیق تخمین دبی جریان در ایستگاه هیدرومتری بالادست سد علویان با کمک شبکه عصبی بیزین و مقایسه نتایج آن با برنامه ریزی بیان ژن ، ماشین بردار پشتیبان و رگرسیون خطی می باشد.

شبکه های عصبی بیزین
این روش یکی از روش های سیستم پشتیبان تصمیم گیری می باشد که ابزار قدرتمندی در مدل کردن روابط علی و معلولی در قالب شبکه ای از احتمالات است .
نکته بسیار مهم در مورد روش شبکه عصبی بیزین این است که این روش به اطلاعات دقیق و تاریخچه کامل یک واقعیت نیاز ندارد بلکه می تواند با استفاده از اطلاعات ناقص و غیردقیق نیز به نتایج بسیار قانع کننده ای در زمینه تخمین وضعیت فعلی یا آینده یک سیستم دست یابد. همچنین یک روش سازگار و انعطاف پذیر برای مدل کردن موقعیت های غیرقطعی و یک مدل گرافیکی مبتنی بر ادراک مستقیم از اندرکنش میان علل و معلول های مختلف ارائه می نماید. همچنین یک روش بسیار مفید در مدل کردن موقعیت های نامطمئن و غیرقطعی بر اساس روابط علت و معلولی است . در شبکه های عصبی یکی از روش های دست یابی مؤثر به پارامترهای بهینه ، استفاده از تنظیم بیزین ١ است که به طور اتوماتیک مقادیری مناسب که بصورت زیر نشان داده شده است استفاده شود(١٩٩٢,.MacKay).

که در آن EW مجموع مربعات وزن های شبکه و ED مجموع مربعات باقی مانده بین پاسخ شبکه و تابع هدف میباشد. نیز پارامترهای تابع هدف میباشند (پارامترهای تنظیم ). که هر یک از این پارامترها به آموزش شبکه در کاهش باقی مانده خروجیها یا حجم شبکه بستگی دارد. نکته اساسی روش تنظیم این است که پارامترهای تابع هدف را چگونه از طریق داده های آماری بیزین انتخاب و بهینه نماید. بطوریکه اگر بعنوان متغیرهای تصادفی در نظر گرفته شوند قانون بیزین بصورت فرمول زیر تعریف میشود (١٩٩٢,.MacKay).

در فرمول بالا D داده های آموزش ، M مدل شبکه و W نیز وزن شبکه میباشد. بر طبق قانون بیزین اگر از توزیع یکنواخت پیروی نمایند در این صورت احتمال زمانی ماکزیمم میشود که احتمال توزیع اولیه در معادله (٢) حداکثر به مقدار ماکزیمم خواهد رسید. با فرض اینکه باقی مانده ها و وزن ها متغیرهای تصادفی باشند و براساس قانون بیزین معادله (٣) بصورت زیر میباشد.

در صورتی که فرض شود باقی مانده ها و وزن ها از توزیع گوسین پیروی کرده داریم

برای اطمینان از اینکه بعنوان فاکتور تنظیم در معادله (٣) گردد معادله (۴-b) بصورت زیر میباشد.

اگر معادله های ۴-a و ۴ -b با هم در فرمول (٣) جایگذاری شوند آنگاه خواهیم داشت .

ماتریس Hessian تابع هدف F میباشد. در معادله (۵) روش های لگاریتم و مشتق گیری به ترتیب بکار گرفته شده است با فرض اینکه معادله تفاضلی تابع برابر صفر قرار گیرد مقدار به بیشینه شده و احتمال اولیه وزن ها مینیمم میشود. سپس و بصورت زیر بیان میشوند (١٩٩٢,.MacKay).

که در آن n تعداد نمونه ، N مقدار کل پارامترهای شبکه ، تعداد پارامترهای موثر که نسبتا اثر بیشتری در کاهش میزان خطای توابع دارند. در ابتدا بر طبق الگوریتم لونبرگ مارکوانت فرض میشود و تابع هدف )F(w با آموزش شبکه منظم بیزین به کم ترین مقدار خود میرسد. بر طبق معادلات ۶، ٧و ٨ بروزرسانی شده و سپس مقادیر بهینه توزیع اولیه بدست میاید و حداقل مقدار جدید F(w) محاسبه میگردد و در نهایت آموزش شبکه آنقدر تکرار میشود تا به همگرایی برسد
١٩٩٧,.Foresee. نمونه ایی از ساختار شبکه چهار لایه ای متشکل از یک لایه ورودی، یک لایه مخفی، و یک لایه خروجی در شکل (٣) نشان داده شده است .

برنامه ریزی بیان ژن
روش برنامه ریزی بیان ژن ، در سال ١٩٩٩ توسط فریرا ارایه شد )۲۰۰۱,.Ferreira(. این روش ترکیبی از روش های برنامه ریزی ژنتیک (GP) و الگوریتم ژنتیک بوده (GA) که در آن ، کروموزوم های خطی و ساده با طول ثابت ، مشابه با آنچه که در الگوریتم ژنتیک استفاده می شود و ساختارهای شاخه ای با اندازه ها و اشکال متفاوت ، مشابه با درختان تجزیه در برنامه ریزی ژنتیک ، ترکیب می شوند. از آنجاییکه در این روش تمام ساختارهای شاخه ای با اندازه و اشکال متفاوت ، در کروموزوم های خطی با طول ثابت کدگذاری میشوند، سبب گردیده که در این روش فنوتیپ و ژنوتیپ از هم جدا شوند و سیستم بتواند از تمام مزایای تکاملی به سبب وجود آنها بهره مند شود. اکنون باوجوداینکه فنوتیپ در GEP، همان نوع از ساختارهای شاخه ای مورد استفاده در GP را شامل می شود، اما ساختارهای شاخه ای که به وسیله GEP استنتاج می شوند (که بیان درختی نیز نامیده می شود) مبین تمامی ژنوم های مستقل هستند.
به طور خلاصه میتوان گفت در GEP به سازیها در یک ساختار خطی اتفاق افتاده و سپس به صورت ساختار درختی بیان می شود و این موجب می شود تنها ژنوم اصلاح شده به نسل بعد منتقل شده و نیازی به ساختارهای سنگین برای تکثیر و جهش وجود نداشته باشد(فریرا، ٢٠٠١). در این روش پدیده های مختلف با استفاده از مجموعه ای از توابع و مجموعه ای از ترمینال ها، مدل سازی میشوند. مجموعه توابع ، معمولا شامل توابع اصلی حسابی {. ,× ,- ,+}، توابع مثلثاتی یا هر نوع تابع ریاضی دیگر
{… ,exp, log, sin, cos ,x٢ ,√} و یا توابع تعریف شده توسط کاربر است که برای تفسیر مدل مناسب میباشند.
مجموعه ترمینال ها، از مقادیر ثابت و متغیرهای مستقل مساله تشکیل شده اند (٢٠٠١,.Ferreira). برای به کارگیری روش برنامه ریزی بیان ژن از نرم افزار ۴.٠ GenXproTools
استفاده گردید. برای کسب اطلاعات بیشتر می توان به (٢٠١٢,.Ghorbani et al) مراجعه نمود.
ماشین بردار پشتیبان
اولین کاربرد این روش در مسائل آب توسط دیباک و همکاران در سال ٢٠٠١ با مدل سازی بارندگی- رواناب ارائه شد. ماشین بردار پشتیبان یک سیستم یادگیری کار آمد بر مبنای تئوری بهینه سازی مقید است که از اصل استقرای کمینه سازی خطای ساختاری استفاده کرده و منجر به یک جواب بهینه کلی میگردد. در مدل رگرسیون SVM تابعی مرتبط با متغیر وابسته Y که خود تابعی از چند متغیر مستقل x است ، برآورد میشود. مشابه سایر مسائل رگرسیونی فرض میشود رابطه میان متغیرهای مستقل و وابسته با تابع جبری مانند F(x) به علاوه مقداری اغتشاش (خطای مجاز ε) مشخص شود.

چنانچه W بردار ضرایب و b ثابت مشخصه های تابع رگرسیونی و نیز تابع کرنل باشد، آنگاه هدف پیدا کردن فرم تابعی برای F(x) است . این مهم با آموزش مدل SVM توسط مجموعه ای از نمونه ها (مجموعه آموزش ) محقق میشود. برای محاسبه w و b لازم است تابع خطا (معادله ١١) در مدل SVM رگرسیونی با در نظر گرفتن شرایط مندرج (قیود) در معادله (١٢) بهینه شود

در معادلات بالا C عددی صحیح و مثبت است ، که عامل تعیین جریمه در هنگام رخ دادن خطای آموزش مدل میباشد، تابع کرنل ، N تعداد نمونه ها و دو مشخصه متغیرهای کمبود هستند. در نهایت تابع SVM رگرسیونی را میتوان به فرم زیر باز نویسی کرد:

در معادله (١٣)، میانگین ضرایب لاگرانژ می باشد.
محاسبه در فضای مشخصه آن ممکن است بسیار پیچیده باشد. برای حل این مشکل روند معمول در مدل SVM رگرسیون انتخاب یک تابع کرنل است . میتوان توابع مختلف کرنل برای ساخت انواع مختلف SVM رگرسیونی را به کار برد. در١مطالعات هیدرولوژی عمدتا از تابع کرنل پایه شعاعی (RBF) استفاده میگردد
(اسکندری و نوری، ١٣٨٩)، که رابطه آن به صورت ژیر میباشد .

فرآیند محاسبات این مدل ، با کدنویسی در محیط متلب ، انجام شد و پارامتر ها از طریق سعی و خطا بهینه گردیدند.
رگرسیون خطی چند متغیره
تحلیل رگرسیون روشی آماری است که در آن از رابطه بین دو یا چند متغیر کمی (متغیرهای مستقل و یا پیش بینی کننده ) برای پیش بینی متغیر وابسته (متغیر پاسخ ) استفاده میشود . یک مدل رگرسیون خطی چند متغیره به صورت زیر بیان میشود:

که در آن ضرایب رگرسیون (پارامترهای رگرسیون )، متغیر مستقل ، خروج از مرکز و N تعداد متغیرهای مستقل است . به منظور تخمین ضرایب رگرسیون از روش حداقل مربعات استفاده می شود (بنیحبیب و همکاران ، ١٣٨٩).
معیارهای ارزیابی
به منظور ارزیابی دقت و کارایی مدل ها، از نمایه های ضریب همبستگی (CC )، ریشه میانگین مربعات خطا ( RMSE)، ضریب ناش ساتکلیف NS و بایاس (Bias) به صورت زیر محاسبه شد. بهترین مقادیر برای این چهار معیار به ترتیب یک ، صفر، یک و صفر می باشند.

در روابط بالا، به ترتیب مقادیر مشاهداتی محاسباتی در گام زمانی i ام ،N تعداد گام های زمانی، x- وy- نیز به ترتیب میانگین مقادیر مشاهداتی و محاسباتی می باشد. یک نکته مهم در آموزش شبکه های عصبی نرمال سازی داده ها قبل از استفاده در مدل می باشد این عمل خصوصا وقتی دامنه تغییرات ورودی ها زیاد باشد کمک شایانی به آموزش بهتر و سریع تر مدل می کند.
اصولا واردکردن داده ها بصورت خام باعث کاهش سرعت و دقت شبکه می شود (٢٠٠٧,.Xu et al). برای نرمال سازی داده های تحقیق از رابطه زیر استفاده شده است :

این فقط قسمتی از متن مقاله است . جهت دریافت کل متن مقاله ، لطفا آن را خریداری نمایید
word قابل ویرایش - قیمت 12700 تومان در 28 صفحه
127,000 ریال – خرید و دانلود
سایر مقالات موجود در این موضوع
دیدگاه خود را مطرح فرمایید . وظیفه ماست که به سوالات شما پاسخ دهیم

پاسخ دیدگاه شما ایمیل خواهد شد