بخشی از مقاله
*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***
ارزیابی روشهای نوین محاسباتی در برآورد تبخیر و تعرق روزانه (مطالعه موردی دشت ناز- ساری)
چکیده:
تبخیر و تعرق گیاه مرجع ETO یکی از پارامترهای کلیدی در مطالعات هیدرولوژی و مدیریت منابع آب میباشـد، از ایـن رو روشهای مختلفی برای برآورد ETO پیشنهاد شده است. در مطالعه حاضر به منظور دستیابی به تخمین میزان تبخیر و تعرق گیاه مرجع، از روش رگرسیون چند متغیره (MLR) و روشهای نوین هوش مصـنوعی شـامل، شـبکه عصـبی پرسـپترون چنـد لایـه (MLP) و سیستم استنتاج فازی- عصبی تطبیقی (ANFIS) استفاده شده است. نتایج پژوهش نشـان مـی دهـد، زمـانی کـه از 4 پارامتر برای ورودی مدل استفاده شود، مدلهای شبکه عصبی MLP و رگرسیونی MLR از دقت و کارایی بالاتری در شبیهسازی تبخیر و تعرق گیاه مرجع برخوردارند در حالیکه با کاهش پارامتر ورودی به 3 و کمتر، مدل شبکه عصبی ANFIS در مقایسـه بـا دو مدل دیگر دارای دقت بیشتری در برآورد این پارامتر مهم اقلیمی میباشد.
واژههای کلیدی: تبخیر تعرق مرجع، رگرسیون چند متغیره، شبکه عصبی MLP، سیستم استنتاج فازی- عصبی
.1 مقدمه
تبخیر و تعرق یکی از مهمترین پارامترهایی است که دانستن آن جهت برآورد آب مورد نیاز گیاه و طراحی سیستمهای آبیاری و برنامهریزی منابع آبی ضروری است. تعیین دقیق مقدار آبی که برای تبخیر و تعرق گیاه مصرف میشود، از عوامل اساسی در برنامهریزی و طراحی ظرفیت سامانههای آبیاری میباشد. با توجه به اهمیت تعیین تبخیر و تعرق در مدیریت منابع آبی، شناخت و بررسی روشهای تعیین تبخیر تعرق و عوامل موثر مربوط به آن میتواند در برنامهریزی و مدیریت صحیح منابع آبی کشور نقش مهمی را ایفا نماید. تبخیر و تعرق فرآیندی پیچیده و غیر خطی است، زیرا این پدیده تحت تأثیر پارامترهای همچون دما، رطوبت، سرعت باد، تابش و غیره وابسته میباشد، که پارامترهای اخیر نیز بر یکدیگر تأثیر میگذارند. بنابراین تهیه یک مدل ریاضی برای آن با در نظر گرفتن تمام فاکتورهای اقلیمی موثر در آن، کاری مشکل و در صورت امکان یا با خطاهای قابل توجهی روبه روست یا نیاز به اطلاعات زیادی دارد که اندازهگیری آن مشکل و وقتگیر میباشد. از این گذشته هر مدل ریاضی برای یک اقلیم خاصی تهیه شده و برای آن اقلیم معتبر است. مدلهای هوشمند ابزار کارآمدی برای مدلسازی سیستمهای غیر خطی میباشد15]، 18 و.[19 بنابراین با توجه به ماهیت مسئله تبخیر و تعرق مرجع، استفاده از مدلهای هوش مصنوعی برای تعیین آن مناسب میباشد از این رو در طی سالیان اخیر تحقیقات متعددی در ارتباط با تخمین تبخیر و تعرق از روی دادههای هواشناسی با استفاده از روشهای هوشمند در نقاط مختلف دنیا انجام گرفته است. زانتی و همکاران (2007) قابلیت شبکههای عصبی مصنوعی را برای تخمین تبخیر و تعرق گیاه مرجع در ایالات ریودوژانیروی آرژانتین با استفاده از حداکثر و حداقل دمای هوا مورد بررسی قرار دادند، با توجه به نتایج بدست آمده از ANN، نتیجه گرفته شد که فقط با بکارگیری حداکثر و حداقل دما، میتوان مقادیر ETO را در این منطقه تخمین زد. قبائی سوق و همکاران (1389) از روش رگرسیون گام به گام و گاماتست به پیش پردازش و انتخاب ترکیب بهینه از پارامترهای ورودی جهت شبیهسازی تبخیر و تعرق روزانه به کمک شبکه عصبی MLP استفاده نمودند . آنها با مرجع قرار دادن روش فائو پنمن مانتیث، عملکرد مدلهای مختلف جهت تخمین تبخیر روزانه مورد ارزیابی و بررسی قرار دادند. نتایج ارزیابی نشان داد که هر سه مدل از دقت بالایی برای شبیهسازی تبخیر تعرق روزانه برخوردارند. لین و همکاران (2008)، با استفاده از تکنیک ANFIS مقدار تبخیر و تعرق را محاسبه و نتایج را با روش زمین آمار کریجینگ پهنهبندی نمودند. در این تحقیق ANFIS به دلیل کاهش پارامترهای ورودی و سرعت محاسبات، روشی متمایز از سایر روشها معرفی شد. مقدم نیا و همکاران ( (2009، دو مدل شبکه عصبی مصنوعی و سیستم استنتاج فازی- عصبی تطبیقی را برای تعیین تبخیر روزانه از تشت با استفاده از دادههای ایستگاه هواشناسی نزدیک مخزن چاه در سیستان شامل دمای هوا، سرعت باد، کمبود فشار بخار اشباع و رطوبت نسبی مورد مقایسه قرار دادند. هدف از این تحقیق بررسی امکان استفاده از کارآمدی و توانایی رگرسیون چند متغیره((MLR، شبکههای عصبی (MLP) و سیستم استنتاج تطبیقی عصبی- فازی (ANFIS) در ایجاد نگاشت بین پارامترهای هواشناسی و تبخیر و تعرق گیاه مرجع و مقایسه نتایج آنها با مدل فائو پنمن مانتیث 56 میباشد. در این مطالعه از دادههای هواشناسی متداول مانند متوسط دمای هوا، متوسط رطوبت نسبی، سرعت باد و ساعت آفتابی بصورت روزانه، در ایستگاه هواشناسی دشت ناز ساری که قابل اندازهگیری هستند استفاده شده است.
.2 مواد و روش
.1-2 منطقه مورد مطالعه
برای محاسبه تبخیر و تعرق مرجع به صورت روزانه در این تحقیق از دادههای مرجع روزانه ایستگاه هواشناسی دشتناز واقع در شهرستان ساری در استان مازندران استفاده شد. این مکان در موقعیت جغرافیایی به عرضَ36º 37 شمالی وََََ11طول 53º شرقی و ارتفاع 16 متری از سطح دریا قرار دارد. میانگین درجه حرارت سالیانه آن 17/7 درجه سانتیگراد و متوسط بارش آن نیز حدود 638/2 میلیمتر در سال است. از این رو این اقلیم براساس اقلیمنمای دومارتن، مرطوب ارزیابی شد. دادههای مورد استفاده شامل: دمای متوسط (Ta)، رطوبت نسبی (RH)، ساعت آفتابی (Rs) و سرعت باد در ارتفاع دو متری (U2) به صورت روزانه از ابتدای سال 1383 تا سال 1390 میباشد که از سازمان هواشناسی کشور اخذ گردید. از آنجاییکه خروجی کار به منظور محاسبه تبخیر و تعرق گیاه گندم (بعنوان کشت غالب منطقه) میباشد از این رو آمارهای روزانه از ماه آذر تا دهه دوم ماه خرداد که طول دوره رشد گندم در منطقه مورد اشاره میباشد استفاده گردید. در این پژوهش پس از مرور انجام شده بر منابع و آزمون حساسیت سنجی بین هر یک از پارامترهای موجود[ 9 ] و همچنین با توجه به حجم عملیات مدل سازی، 6 سناریو انتخاب گردید، ساختار ریاضی مدل-های طراحیشده در جدول (1) ذکر شده است.
.2-2 محاسبه ETO
روش موسوم به فائو پنمن مانتیث تکامل یافتهی روش ترکیبی پنمن مانتیث 1965 است که توسط آلن و همکاران برای محاسبه تبخیر و تعرق در نشریه شماره 56 سازمان فائو با نام EPM56 به صورت رابطه 1 ارائه شده است. با استفاده از این روش میتوان ETO را به صورت ماهانه، 10 روزه و روزانه محاسبه کرد.
در رابطه 1، EPM56 تبخیر و تعرق گیاه مرجع (mm.day-1)، شیب منحنی فشار بخار اشباع((kPaC-1، Rn تابش خالص در سطح پوشش گیاهی (MJ m-2 d-1)، ضریب سایکرومتری رطوبتی((kPaC-1، Tmean میانگین دمای روزانه (oc)، U2 سرعت باد در ارتفاع دو متری (m s-1)، es فشار بخار اشباع (kPa)، ea فشار بخار (kPa) واقعی است.
.3-2 رگرسیون خطی چند متغیره((MLR
با این روش میتوان همزمان به تحلیل و بررسی چندین متغیر مختلف پرداخت. برای بدست آوردن نتایج مطلوب از طریق MLR، نمودارها باید زیاد و دقیق باشند . زیرا این روش در مقابل اطلاعات نادرست، حساسیت بالایی دارد و ورودی چنین دادههایی ممکن است منجر به بروز خطاهای بزرگ در نتایج بدست آمده شود. رگرسیون چند متغیره در حقیقت، ارتباط بین یک سری از متغیرهای پیشگو را با متغیر پاسخ مورد نظر بیان میکند. در صورت وجود متغیر مستقل X1, X2, ...,Xn اگر بخواهیم ارتباط خطی بین آنها برقرار باشد:
که در این رابطه، از مقادیر a1, a2, ...,an با عنوان ضریب رگرسیون یاد میشود. این ضرایب، ضرایب نامشخصی هستند که در حقیقت، مسئول برآورد پارامتر پاسخ هستند2]و.[7 تجزیه و تحلیل آماری با بکارگیری نرمافزار MINITAB.16 به روش گام به گام (Stepwise) صورت گرفت. تبخیر و تعرق مرجع محاسبه شده به وسیله رابطه فائو پنمن مانتیث بعنوان متغیر وابسته و عوامل موثر در آن به عنوان متغیرهای مستقل در نظر گرفته شدند. در این مدل 80 درصد دادهها برای ارائه و آموزش مدل و 20 درصد دادهها برای تست مدل بکارگرفته شدند.
.4-2 سیستم شبکه عصبی mlp
یکی از مهمترین و اساسیترین مؤلفههای هوش مصنوعی، شبکههای عصبی مصنوعی یا ANN میباشند که مغز را الگوی پردازش قرار میدهند. شبکه عصبی شامل شبکه ها یا مدلهای بسیاری ازقبیل، مدل عصبی بولنی، مدل آدالاین، مدل پرسپترون، مدل عصبی آماری (پسخور و پیشخور، رگرسیون عمومی)، مدل هاپفیلد و... میباشد. که در این تحقیق از مدل پرسپترون چند لایه استفاده گردیده است. پرسپترون چندلایه، پرکاربردترین نوع شبکه عصبی میباشد. این بدان دلیل است که پرسپترون چندلایه میتواند به عنوان یک تخمین زننده تابعی، بین ورودیها و خروجیها تطابق ایجاد نماید. این شبکه می تواند با به کارگیری تعداد کافی از لایههای پرسپترونی در شبکه و تعداد مناسبی از پرسپترونها در هر لایه، طبقهبندیهای پیچیدهای را انجام دهد. پژوهشگرانی مانند نیلسن1 و سیبنکو2 در سال (1987) و سپس هارنیک3 در (1989)، نشان دادند که شبکه MLP دارای یک لایه میانی با تابع تبدیل سیگموئید (تابع S شکل) و یک تابع تبدیل خطی در لایه خروجی ، قادر به تقریب تمامی پدیده های مورد نظر است، به شرط اینکه دارای تعداد نرون کافی در لایه میانی باشد .[6 ] در این تحقیق قبل از اینکه مقادیر عددی مربوط به تبخیر تعرق مرجع وارد مدل شوند، بایستی این مقادیر توسط روابط مربوطه نرمال شوند. درادامه از رابطه (3) برای نرمالسازی دادهها استفاده شد.
: norm مقدار استاندارد شده شده ورودی، : میانگین دادهها، max و : min به ترتیب مقدار حداکثر و حداقل دادهها میباشد (نبیزاده و همکاران، .(1389 در ادامه برای شبیهسازی ETO با انتخاب یک شبکه پرسپترون چند لایه با الگوریتم پس انتشار خطا (BP) برگزیده شد. در این پژوهش از یک لایه مخفی با تابعهای انتقال سیگموئید، تانژاد هیپوربولیک سیگموئید و سکانت هیپربولیک و تعداد نرونهای مختلف در لایه میانی استفاده شد؛ و به صورت تصادفی برای هر یک از مراحل آموزش، آزمون و تأیید به ترتیب 70 ،15 و 15درصد مجموع کل دادهها استفاده گردید. تعداد گامهای پیش فرض در آموزش شبکه عصبی چند لایه 100000 گام و تغییرات نرون لایه میانی بین 1 تا 40 در نظر گرفته شد. این تعداد نرون با توجه به کاربرد بیشتر آنها در شبکه عصبی انتخاب گردید. کلیه مراحل کار با کد نویسی در محیط نرمافزار MATLAB 2012.b (8) اجرا گردید.
.5-2 سیستم استنتاج فازی- عصبی تطبیق (ANFIS)
در سال 1993، جانگ4 برای اولین بار با مد نظر قرار دادن تواناییهای تئوری فازی که مبتنی بر قواعد منطقی بوده و همچنین روش شبکه عصبی مصنوعی که توانایی استخراج دانش از اطلاعات عددی را دارند، سیستم استنتاج فازی- عصبی تطبیقی (ANFIS) را ارائه نمود. ساختار شبکه ANFIS از ترکیب دو ساختار شبکه عصبی و سیستم فازی تشکیل شده است. به منظور سادهسازی، فرض میشود که سیستم استنتاجی مورد نظر دو ورودی x و y و یک خروجی z دارد. برای یک مدل فازی تاکاگی- سوگنو درجه اول، میتوان یک مجموعه قانون نمونه را با دو قانون اگر-آنگاه فازی به صورت زیر بیان کرد:
قانون اول: اگر x برابر A1 و y برابر B1 باشد آنگاه z1 p1 x q1 y r1 قانون دوم: : اگر x برابر A2 و y برابر B2 باشد آنگاه z2 p2 x q2 y r2 که pi، qi و)i=1,2( ri پارامترهای خطی تالی مدل فازی تاکاگی- سوگنو درجه اول هستند .[10 ]
در این تحقیق، برای تعیین ساختار بهینه شبکه فازی- عصبی در ابتدا کل دادههای مدلها و ترکیبات ورودی قبل از ورود به شبکه، به دو دسته آموزش 80 ) درصد) و آزمون 20 ) درصد) تقسیم شده و به شبکه اعمال شد. برای افراز بخش مقدم قواعد فازی، در این مطالعه از روش منقطعسازی شبکهای استفاده شده است. نوع توابع عضویت دادههای ورودی از بین توابع عضویت مثلثی((Tri، ذوزنقهای((Trap، زنگولهای((Gbell، گوسی((Gauss ، گوسی ترکیبی (Gauss2) و درجه عضویت آنها از 2 تا 6 انتخاب میگردد. تعیین مقدار بهینه تابع عضویت و درجه آن بر اساس روش سعی و خطا بدست میآید. برای تابع عضویت خروجی از مدل خطی استفاده میشود. الگوریتم آموزشی سیستم از نوع الگوریتم هیبریدی و تلورانس خطای آموزش برابر صفر در نظر گرفته میشود. در نهایت از میان شبکههای بهینه مربوط به توابع عضویت مختلف، یک شبکه به عنوان شبکه برتر انتخاب میشود. تمام مراحل با کد نویسی در محیط نرمافزار MATLAB 2012.b (8) انجام شد و برای استفاده اصلاح گردید.
.6-2 ارزیابی نتایج مورد استفاده
در مدلسازی، همواره استفاده از مدلی ترجیح داده میشود، که خطای کمتری داشته باشد. برای انتخاب بهترین مدل، آمارههای مختلفی مورد استفاده قرار میگیرد و در این پژوهش از آمارههای مربع ضریب همبستگی، مجذور میانگین مربعات خطا در دو بخش واسنجی و صحت سنجی استفاده شد.
در رابطههای بالا، n تعداد دادهها، ETi مقدار تبخیر تعرق بدست آمده از هر یک از مدلها، میانگین تبخیر تعرق هر یک از مدلها، ET p مقدار تبخیر تعرق بدست آمده از مدل فائو پنمن مانتیث و میانگین تبخیر تعرق مدل فائو پنمن مانتیث میباشد. مقدار آماره ریشه میانگین مربعات خطا همواره مثبت بوده و بهترین حالت عملکرد زمانی است که مقدار آن به صفر نزدیک شود. آماره ضریب تبیین شاخصی است که میزان خطی بودن رابطه بین مقادیر اندازهگیری و محاسبه شده را نشان میدهد که هر چه مقدار آن به یک نزدیکتر باشد رابطه خطی مورد نظر مشهودتر است. در نهایت برای انتخاب مناسبترین مدل نفوذ، بر اساس معیارهای خطای ذکر شده، از روش رتبهبندی برای دادههای تست استفاده میگردد. بدین معنی که به هر یک از مدلها بر اساس معیارهای ذکر شده، رتبهای داده میشود و در پایان پس از مقایسه مجموع رتبههای به دست آمده، مناسبترین مدل برای تخمین بهترین معادله نفوذ انتخاب میشود. شیوه رتبهبندی این مدلها بدین صورت است که در هر روش، مدلی که کمترین میزان معیار خطای RMSE (بدون در نظر گرفتن علامت منفی) را دارد، پایینترین رتبه یعنی رتبه 1؛ و به مدلها یا ترکیبات ورودی دیگر در هر یک از دستههای ورودی بر حسب میزان معیار خطاهای مذکور، رتبههای 2 الی آخر تعلق میگیرد. اما در مورد معیارهای کارآیی ضریب تبیین (R2) مدل یا ترکیبی که بیشترین مقدار این معیارها را دارا است، رتبه 1 اختصاص مییابد. همچنین به مدلهایی که میزان معیار خطای آنها یکسان باشند، رتبه یکسان تعلق میگیرد. در نهایت پس از انتخاب مدلها یا ترکیبات مناسب هر روش و مقایسه بین آنها، روش برتر در برآورد تبخیر تعرق مرجع در منطقه مورد مطالعه انتخاب میگردد.[3 ]