بخشی از مقاله
خلاصه
استفاده از مدلهاي ترکیبی در ش رایط ضعف مدلهاي داده محور و مفهومی رویکردي جدید و درحال پیشرفت در زمینه مدلسازي هیدرولو ژیک میباشد. مدلهاي مبتنی بر رواب ط تجربی و روشهاي دادهکاوي داراي مش کلاتی نظیر نداشتن درك فیزیکی نسبت به سیستم و وابستگی کامل به منطقه مورد کاربرد میباشند. از طرفی مدلهاي ریاضی با توجه به فرضیات ساده کننده بکار گرفته شده در ساختار آنها و ناتوانی در مدلسازي تمامی فرآیندهاي حاکم در حوزه از دقت کافی برخور دار نیستند.
یکی از راهکارهاي پیشرو براي حل این مشکلات ترکیب مدلها میباشد. در این مقاله شبکه عصبی مصنوعی و مد ل مفهومی HBV برا ي شبیهسازي رواناب روزانه در زیرحوزه پلاسجان در بالادست حو زهآبریز زاینده رود به شکل متوالی مور د ترکیب قرار گرفتهاند. روش ارائه شده توانسته است در شرایط ی که آماره نش- ساتکلیف در مرحله صحتسنجی براي مدل شبکه عصبی مصنوعی و مدل مفهومی HBV به ترتیب برابر 0/472 و 0/325 بوده است باعث بهبود عملکرد تا مقدار نش- سات کلیف 0/65 گردد. نتایج این مطالعه نشا ن دهنده مؤثر بودن تو سعه مدلهاي ترکیبی متوالی میباشد.
1. مقدمه
مدلهاي هیدرولوژیک داراي کاربردهاي فراوانی در مدیریت منابع آبی هستند. از جمله این کاربردها میتوان به اس تفاده در مطالعه اثرات تغییر اقلیم، مدیریت مخازن، بازسازي، تولید دادههاي رواناب و ... اشاره کرد. از این رو تلاشهاي مستمري براي بهبود دقت این مدلها در حال انجام است. مدل-هاي هیدرولوژیک را میتوان به سه دسته مدلهاي فیزیک ی، ریاضی و تجربی دستهبندي کرد
مدلهاي فیزیکی بر اساس روابط مشابهت، سیستم واقعی را در ابعاد کوچکتر شبیهسازي میکنند. در مدلهاي ریاضی میان ورودي و خروجی روابطی ریاضی بر اسا س قوانین فیزیکی ح اکم بر سیستم برقرار میشود. در حالی که در مدلهاي تجربی برقراري این رابطه مبتنی بر اصول فیزیکی مشخصی نبوده و بر اسا س روشهاي آماري یا داده کاوي بدست میآید. مدلهاي تجربی با تو جه به پیشرفت علوم کامپیوتر و روشهاي دادهکاوي و همچنین سادگی آنها در کاربرد در سال هاي اخیر بسیار مورد توجه قرار گرفتهاند.
یکی از رویکردهاي جدید در مدلسازي هیدرلو ژیک ترکیب مدله ا با یکدیگر میباش د. در ادبیات موضو ع این مسئله با نامهاي متفاوتی مانند Bagging، Boosting، modular models ,ensemble methods ,committee machine و model fusion همراه شده است . نقطه مشترك در این تعاریف توسعه مجموعهاي از مدلها و تر کیب آنها به منظور رسیدن به مدلی با کارایی بهتر میباشد .
کروزو و سولماتین - 2009 - مدلهاي ترکیبی ر ا در سه دسته طبقهبندي نمودند. دسته اول مدلهاي داده محوري هستند که در ترکیب آنها از اطلاعات هیدرولوژی ک استفاده شده است. از جمله رویکردهایی که در این دسته از مدلها قرار میگیرند میتوان به جداسازي فضاي متغیرهاي ورودي به زیر فضاهاي مشابهتر با استفاده از اطلاعات هیدرولوژیک، اشاره کرد. دسته دوم مدلهایی هستند که در بخشهایی از مدلهاي مفهومی یا داده محور از تکنیکهاي داده کاوي استفاده شده است و در نهایت دسته سوم مدل هایی هستند که در آنها چند مدل به موزات هم و یا در راستاي هم قرار میگیرند.
در مدلهاي موازي چندین مدل به شبیهسازي رفتار سیستم میپردازند و در نهایت خروج ی آنها با یکدیگر جمع میشود ولی در مدلهاي متوالی خروجی یک مدل به عنوان ورودي مدل دیگر مورد اس تفاده قرار میگیرد و یا مدل بعدي خر وجی مدل قیل را مورد اصلاح قرار میدهد .
از جمله کارهاي انجام شده در زمینه مدلهاي ترکیبی میتوان به آبراهات و سی - 2002 - ، شمسالدین و همکاران - 2005 - ،آنکتیل و لاوزون - 2004 - و عراقینژاد و همکاران - 2011 - اشاره کرد
آبراهات و سی - 2002 - شش روش ترکیب داده را براي ترکیب مدلهاي شبکه عصبی مصنوعی به منظور پیشبینی جریان در دو حوزه آبریز در انگلستان بکار بردند .
شمسالدین و همکاران - 2005 - پنج مدل بارش- رواناب را با استفاده از تعریف یک ساختار شبکه عصبی مصنوعی چند لایه با استفاده از توابع انتقال مختلف به منظور پیش بینی رواناب در 8 زیرح وزه محاسباتی با ی کدیگر ترکیب کردند
آنکتیل و لا وزون - 2004 - روشهاي مختلف Generalization شبکههاي عصبی مص نوعی را در 6 حوزه آبریز به منظور پی شبینی جریان به کار بردند و در نهایت استفاده همزمان از Bayesian r egularization یا stop-training همراه با bagging یا boosting را پیشنهاد دا دند
عراقینژاد و همکاران - 2011 - ر وشهاي تولید و ترکیب مجموعه شبکههاي عصبی مصنوعی را به منظور پیش بینی جریان مورد بحث قرار دادند و روش خود را که یک روش احتمالاتی مبتنی بر K-NN است ارائه کردند .
در این میان یکی از روشهاي مورد توجه توسعه روشهایی مبتنی بر تفکیک فضاي متغیرهاي ورودي به فضاي همگنتر میباشد. توسعه این روشها با هدف بهبود مشکلی که ناه مگنی و پراکندگی دادهها در به کارگیري روشهاي داده محور ایجاد مینماید، صورت گرفته اس ت. سولماتین و سیک - 2006 - رو شهاي مختلف توسه مدلهاي m odular را مورد بررسی ق رار دادند و روش خود را که مبتی بر Model Tr ee است، به نام M5flex ارائه دادند
کروزو و سولماتین - - 2007 روشهاي م ختلف تفکیک فضاي ورودي را به منظور پیشبینی جریان در دو حوزه آبریز مقایسه کردند
سولماتین و همکاران - 2008 - روشهاي مبتنی بر یادگیري نمونه را با شبکه عصبی مصنوع ی و همچنین مدلهاي مفهومی مورد مقایسه قرار دادند
در این مطالعه تلاش گردیده است در راستاي شبیهسازي رواناب روزانه از تکنیک ت وسعه مدلهاي محل ی بهره گرفته شود. بدین منظور با استفاده از الگوریت م خوشهبندي k-means فضاي متغیرهاي ورودي با توجه به رواناب شبیهسازي شده توسط مدل مفهومی HBV-light خوشهبندي و تفکیک شده است. سپس بر دادههاي قرار گرفته در هر خوشه یک شبکه عصبی مصنوعی برازش داده شد و در نهای ت با تجمیع خروجیهاي شبکههاي مختلف هیدروگراف رواناب شبیهسازي گردید. مطالبی که در ادامه آورده میشود به ترتیب شامل شرحی بر الگوریتمهاي مورد استفاده، معرفی منطقه مورد مطالعه، بحث در مورد نتایج و جمع بندي است.
2. روششناسی
در این قسمت رو شهاي مورد استفاده در این مقاله به اختصار توضیح داده م یشوند. در ابتدا مدل مفهومی HB V-light معرفی میگرد . سپس مفاهیم روش خوشهبندي k-means و شاخ صهاي فصلی که در الگوریتم توسعه داده شده مورد استفاده قرار گرفتهاند به اختصار توضیح داده می شود و به دنبال آن الگوریتم توسعه داده شده معرفی میگردد.
.1-2 مدل مفهو می HBV-light
مدل HBV در سال 1976 توسط Bergstr om پیشنهاد شده است. این مدل یک مدل مفهومی ه یدرولوژیکی است که به طور وسیعی براي پیش بینی هاي هیدرولوژیک ی و مطالعات توازن آبی به کار می رود. این مدل به صورت مفهومی1، نیمه گ سترده2 و پیوسته3 عمل می کند. در مدل HBV بارش، دما و تبخیر پتانسیل به عنوان ورودي مدل مورد استفاده قرار میگیرد.
در این مدل بارش ورودي بر اساس دماي آستانه به دو بخش باران و برف تقسیم و ذوب برف بر اسا س یک رابطه درجه- روز محاسبه میشود. مجموع بارش و برف ذوب شده به دو شکل ذخیره در خاك و آب زیرزمینی درنظر گرفته شده و در نهایت رواناب محاسباتی توسط یک تابع مثلثی روندیابی میشود. در این پژوهش از مدل HBV-light ویرایش دوم که بر اساس HBV-6 تهیه شده، استفاده شده است .
مد ل با استفاده از الگ وریتم ژنتیک کالیبراسیون گردید و مدل کالیبره شده جهت ترکیب با شبکه عصبی مصنوعی مورد استفاده قرار گرفت.
جدول -1 آمارههاي ارزیابی مدلH BV-light در مرحله کالیبراسیون و صحت سنجی
.2-2 شاخصهاي فصلی
نیلسون و همکاران - 2006 - شاخصهاي فصلی را به عنوان ورودي شبکه عص بی مصنوعی ارائه دادند. علت ارائه این شاخصها فصلی بودن و دورهاي بودن تغییرات جریان میباشد .[14] براي منظور کردن ای ن اطلاعات در مدلهاي شبکه عصبی مصنوعی و بطور کل ی مدلهاي داده محور دو شاخص ارائه گردید که یک ی به شکل سینوس ی و دیگري به شکل کسینوسی میباشد. در مطالعه حاضر مقادیر این شاخصها به شکل روزانه به عنوان ورودي مدلها مورد استفاده قرار گرفت. این مقادیر از دو معادله 1 و 2 پیروي میکنند. در معادلات 1 و 2 تعداد روزهاي سال براي سالهاي کبیسه 366 وبراي سالهاي دیگر 3 65 است.
.3-2 روش خوشهبندي k-means
این روش نخستین بار توسط هاپکنیز در سال 1954 ارائه گردید .[15] اساس این الگوریتم بدین شکل است که بافرض مجموعه دادهاي به صورت {X1,..,XN} که شامل N داده مشاهداتی D بعدي است به دنبال تقسیم دادهها به تعداد k خوشه با بهینهسازي معادله 3 میباشد. فرض کنید مرکز هر خوشه با μk نشان داده شود. هدف نسبت دادن نقاط به د سته ها - خوشهها - است به گونهاي که م جموع مربعات فاصله هر نقطه تا نزدیکترین بردار μk حداقل باشد. با تع ریف متغیر باینري rnk می توان تابع هدف را به صورت معادله 3 تعریف کرد. اگر Xn متعلق به د سته k باشد مقدار rnk برابر 1 و در غیر این صورت برابر صفر است.