بخشی از مقاله

*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***

برآورد تبخیر و تعرق ماهانه گیاه مرجع توسط مدل رگرسیون درختی در نواحی مختلف آب و هوایی ایران
چکیده
تبخیر و تعرق یکی از اجزاي اصلی چرخه هیدرولوژي ( آبشناسی) و تخمین نیاز آبیاري است . در سال هاي اخیر استفاده از سیستم هاي هوش مصنوعی براي برآورد پدیده هاي هیدرولوژي افزایش چشمگیري داشته است .از این رو این تحقیق با هدف امکان سنجی استفاده از مدل رگرسیون درختی در برآورد تبخیر و تعرق ماهانه گیاه مرجع((ETo و مقایسه آن با روش پنمن مانتیث فائو در سه ناحیه اقلیمی ایران انجام شد. از مزایاي مدل رگرسیون درختی نسبت به دیگر مدل هاي هوش مصنوعی از قبیل شبکه هاي عصبی، عدم نیاز به فرایند وقت گیر آزمون و خطا و نیز ارائه نتایج به¬صورت روابط ریاضی است. در مطالعه ي حاضر، متوسط ماهانه ي داده هاي حداقل و حداکثر دما، رطوبت نسبی، سرعت باد و تابش خورشیدي به عنوان داده هاي ورودي به مدل در نظر گرفته شده است. نتایج حاصله نشان داد که ضرایب تعیین مدل هاي تولید شده توسط مدل رگرسیون درختی در برآورد پارامتر تبخیر و تعرق مرجع براي نواحی گرمسیر، معتدل .و سردسیر به-ترتیب برابر است با 0/78 ، 0/80 و 0/89 که حاکی از توانایی بالاي مدل مذکور است.

واژه هاي کلیدي: تبخیر و تعرق گیاه مرجع، هوش مصنوعی، مدل رگرسیون درختی، پنمن مانتیث فائو


مقدمه
تبخیر و تعرق2 یکی از مهمترین اجزاي چرخهي آبشناسی میباشد و تخمین دقیق آن براي بسیاري از مطالعات نظیر بیلان آبی، طراحی و مدیریت سیستمهاي آبیاري، شبیه سازي تولید گیاهی و برنامه ریزي و مدیریت منابع آب ضروري است.
یکی از متداولترین روشهاي تخمین تبخیر و تعرق گیاهان زراعی، محاسبهي تبخیر و تعرق گیاه مرجع نظیر تبخیر و تعرق چمن و یا تبخیر و تعرق یونجه از یک سطح استاندارد و سپس استفاده از ضرایب گیاهی میباشد. تبخیر و تعرق میتواند بهطور مستقیم توسط لایسیمتر یا روش بیلان آب اندازه-گیري و یا با دادههاي هواشناسی تخمین زده شود.
با این وجود امکان استفاده از لایسیمتر براي اندازهگیري تبخیر و تعرق همواره میسر نیست، زیرا این روش زمان- گیر و نیازمند عملیات و برنامهریزي دقیق میباشد؛ از این رو روشهاي غیرمستقیم بر پایهي دادههاي هواشناسی براي تخمین تبخیر و تعرق گیاه مرجع استفاده میشود.
این روشها شامل معادلات تجربی و یا روشهاي پیچیدهاي مبتنی بر فرآیندهاي فیزیکی میباشند. روشهاي ترکیبی تغییرات تبخیر را با شار تابش خالص وخصوصیات انتقال آئرودینامیک یک سطح طبیعی مرتبط مینمایند(آلن و همکاران .(1998
چیو و همکاران((1995 در کشور استرالیا، نشان دادند که روش پنمن مانتیث فائو یکی از دقیقترین روش- هاي تخمین تبخیر و تعرق می باشد و میتوان از آن براي اقلیمهاي مختلف استفاده نمود .
تبخیر و تعرق فرایندي پیچیده و غیر خطی است زیرا به عوامل متعدد اقلیمی نظیر دما، رطوبت، سرعت باد، تابش، نوع و مرحلهي رشد گیاه و غیره وابسته است. در چند سال اخیر استفاده از روشهاي حل هوش مصنوعی از قبیل شبکه عصبی و درختان تصمیم گیري، بهعنوان راه کاري دقیق و سریع در بسیاري از زمینهها از جمله برآورد نیاز آبی گیاهان رایج شده است. ساختار درخت تصمیم در یادگیري ماشین، یک مدل پیش بینی کننده میباشد که حقایق مشاهده شده در مورد یک پدیده را به استنتاجهایی در مورد مقدار هدف آن پدیده ارتباط میدهد. تکنیک یادگیري ماشین براي استنتاج یک درخت تصمیم از داده ها، یادگیري درخت تصمیم نامیده می شود که یکی از رایجترین روشهاي دادهکاوي است.
زانتی و همکاران (2007) قابلیت شبکههاي عصبی مصنوعی را براي تخمین تبخیر و تعرق گیاه مرجع در یکی از ایالات آرژانتین با استفاده از حداکثر و حداقل دماي هوا مورد بررسی قرار دادند. براي آموزش شبکه از یک سري دادههاي هواشناسی روزانه (از سپتامبر 1996 تا اوت ( 2002 منطقهي مورد مطالعه استفاده شد. رحیمی-خوب((2008 عملکرد شبکه هاي عصبی مصنوعی و روش هارگریوز را در تخمین تبخیر و تعرق گیاه مرجع در 12 ایستگاه هواشناسی خوزستان مقایسه نمود. تبخیر و
تعرق گیاه مرجع با استفاده از روش پنمن مانتیث محاسبه و مبناي مقایسهي دو روش هارگریوز و شبکهي عصبی قرار گرفت. در این تحقیق نتیجه گرفته شد که شبکه هاي عصبی در برآورد تبخیر و تعرق گیاه مرجع نسبت به روش هارگریوز از دقت بیشتري برخوردارند.
تصمیمگیري درختی از جمله مدلهاي سلسله مراتبی1 است. بریمان و همکاران (1984) نشان دادند که رگرسیون و طبقهبندي درختی ابزار مفیدي براي بدست آوردن روابط بین متغیرهاي هدف و پیشبینی کننده می-باشد. ژو و همکاران((2005 با استفاده از درخت تصمیم به طبقه بندي نرم دادههاي ماهوارهاي و سنجش از دور پرداختند و به نتایج قابل قبولی نیز در این زمینه دست یافتند.
از مدل رگرسیون درختی براي پیش بینی جریان برگشتی در شبکه هاي آبیاري و زهکشی نیز استفاده شده است. نتایج حاصله از تجزیه و تحلیل آماري نشان داد که ضریب همبستگی براي مزارع تک کشت و دوکشت بالاست که نشاندهندهي تطابق خوب بین دادههاي شبیه سازي شده توسط مدل و دادههاي اندازهگیري شده بود(ماهان وهمکاران .(2008
پژوهشگران دریافتند که در پیش بینی بالا آمدن امواج بر روي سازههاي سنگچین، مدل درختی بسیار دقیقتر از فرمولهاي تجربی و منطق فازي عمل می-کند(بنکدار و همکاران. (2010
مدلهاي درختی و شبکه عصبی مصنوعی در مدل-سازي روابط عمق-دبی را با روابط (منحنیهاي) سنتی مقایسه شدند که نتایج حاکی از برتري دو روش تصمیم گیري هوشمند درختی و شبکه عصبی بودند، با این تفاوت که در جریانهاي با دبی بالا، مدل درختی پیش- بینیهاي بسیار دقیقتري ارائه داد (باچاریا و همکاران.(2003
در تحقیق حاضر مقادیر تبخیر و تعرق محاسبه شده ماهانه به روش پنمن مانتیث فائو با استفاده از دادههاي ماهانه مربوط به مراکز استانی ایران (که بر اساس تحلیل عاملی به 3 ناحیه اقلیمی سرد، معتدل و گرم تقسیم بندي می شود) با بهرهگیري از مدل رگرسیون درختی مدل- سازي شده است.
مواد و روش ها
محاسبه ETo
در مطالعهي حاضر، دادههاي اقلیمی متوسط ماهانهي حداقل و حداکثر دما، میانگین رطوبت نسبی، سرعت باد و ساعات آفتابی مربوط به کلیه ایستگاههاي سینوپتیک کشور که داراي دادههاي آماري بالاي30 سال مربوط به دورهي آماري تا سال2005 بودند براي محاسبهي تبخیر و تعرق متوسط ماهانهي گیاه مرجع مورد استفاده قرار گرفته است.

گروهبندي مراکز استانی بر اساس تحلیل خوشهاي
در تحقیق حاضر به کمک نرمافزار SPSS 16.0 و با ستفاده از 9 پارامتر هواشناسی جدول 1، بر اساس تحلیل خوشهاي،30 استان مطالعاتی گروهبندي شدند. براي این کار ابتدا بایستی دادهها استاندارد شوند .(6) لذا پس از استاندارد کردن دادهها به روش Z-SCORE، گروهبندي با روش طبقاتی تجمعی و محاسبه فاصله اقلیدسی به روش ورد انجام شد که به تدریج استانهاي مشابه طی فرایند جمعآوري در یک گروه با هم ادغام شدند.

معادله فائو پنمن مانتیث
در این تحقیق با استفاده از معادله فائو پنمن مانتیث (معادله (1 که یکی از رایجترین معادلات ترکیبی است، مقادیر تبخیروتعرق پتانسیل (ETo) یا تبخیروتعرق استاندارد محاسبه گردید. به علت عدم وجود دادههاي دقیق لایسیمتري در طولانی مدت، و بر طبق پیشنهاد نشریه 56 فائو ، از این روش به عنوان روش استاندارد جهت ارزیابی سایر روش ها استفاده شده است.

که در آن،
:ETo تبخیر و تعرق گیاه مرجع (میلیمتر بر روز)
:Rn تابش خالص ورودي به سطح گیاه (مگاژول بر مترمربع بر روز)
:G شار گرماي خاك (مگاژول بر مترمربع بر روز)
:T میانگین روزانهي دماي هوا در ارتفاع دو متري (درجه سانتیگراد)
:U2 میانگین روزانهي سرعت باد در ارتفاع دو متري (متر بر ثانیه)
:es فشار بخار اشباع (کیلو پاسکال) :ea فشار بخار واقعی (کیلو پاسکال)
:es-ea کمبود فشار بخار اشباع (کیلو پاسکال)

شیب منحنی فشار بخار (کیلو پاسکال بر درجهي سانتیگراد) و
:γ ضریب ثابت سایکرومتري ( کیلو پاسکل بر درجه ي سانتیگراد) میباشند.
ساختار درخت تصمیم
یک درخت معمولا از ریشه1، شاخه2 ، گره3 و برگ4 تشکیل شده است. درخت تصمیم هم بهطور مشابه از گره ها که با دایره نشان داده میشوند و شاخهها که نشاندهنده اتصال بین گرهها میباشند ، تشکیل شده است (شکل .(1 درخت تصمیم بهمنظور سادگی در رسم، معمولا از بالا به پایین کشیده میشود بهطوري که ریشه (گره اول را ریشه میگویند)در بالا قرار گیرد. انتهاي یک زنجیره ریشه- شاخه-گره را یک برگ مینامند. از هریک از گرهها دو شاخه دیگر میتوانند منشعب شوند. هر گره مربوط به یک خصوصیت معین (پارامتر ورودي مستقل) است وشاخهها به معناي بازهاي از مقادیر هستند. عمل انشعاب توسط یکی از متغیرهاي پیشبینی کننده انجام میپذیرد، و بازههاي انشعاب طوري انتخاب میشوند که مجموع مجذور انحراف از میانگین دادههاي هر گره را حداقل کنند.
هنگامیکه خروجی یک درخت، یک مجموعه گسسته از یک مجموعه مقادیر ممکن است؛ بهآن طبقه- بندي درختی1 گفته میشود (مثلا مونث یا مذکر، برنده یا بازنده). هنگامی که بتوان خروجی درخت را یک عدد حقیقی در نظر گرفت آنرا، رگرسیون درختی2 مینامند و یا بهعبارت دیگر اگر متغیرهاي ما عددي3 باشند از رگرسیون درختی، واگر مطلق و قیاسی باشند از طبقه- بندي درختی استفاده میشود. فرآیند انشعاب در هر گره بارها تکرار میشود تا به گره پایانی یا همان برگ برسد که در برگ مجموع مجذور انحراف از میانگین داده ها به حداقل میرسد، با این کار درخت بزرگی بهوجود خواهد آمد.

مزایاي مدل درختی
به دلایل زیر کار با مدل درختی پیشنهاد می شود :
این مدل بهطور مستقیم با متغیرهاي پیشبینی کننده مرتبط میباشد بنابراین نتایج مدل براي فهمیدن و شبیهسازي آسان هستند.
درختهاي تصمیمگیري غیر پارامتریک بوده و هیچ دخالتی از سوي کاربر بر روي آنها صورت نمیگیرد.
خروجی مدل از دقت بالایی برخوردار است که میتوان آنرا با سایر مدل ها مقایسه کرد. برخلاف دیگر روشهاي هوش مصنوعی ازقبیل شبکهي عصبی مصنوعی، براي آموزش به مدل نیازي به فرایند وقتگیر آزمون و خطا نیست.
فرآیند تشکیل دادن رگرسیون درختی شامل 5 مرحله است:
مرحله آغازگري4 (مقدار دهی اولیه)
در این مرحله متغیر پیشبینی کننده یا بهعبارتی دیگر گره والد انتخاب میشود، که این فرایند با استفاده از الگوریتم ID3، که بخشی از مدل رگرسیون درختی است، صورت میگیرد.
ساختن درخت: 5 این مرحله با تقسیمشدن گره والد به دو گره فرزند شروع میشود. در هر گره والد تمام موضوعات و انشعابات ممکن ارزیابی شده و سرانجام بهترین انشعاب، که در آن انحراف معیار بین دادهها به حداقل میرسد انتخاب میشود؛ که براي این منظور از فرمول زیر استفاده میشود : که در معادله مذکور،

s نشان دهنده ي شماره انشعاب یک متغیر
t گره والد
DN(s,t) انحراف گره والد t
DN(S1,tL) و DN(S2,tR) به ترتیب انحراف گره
فرزند سمت چپ و راست می باشند
و fL و fR نیز به ترتیب کسري از گره والد هستند که به-ترتیب در گره هاي tL وtR شرکت کرده اند
Yi مقدار جوابی است که به متغیر پیش بینی کننده Xi نسبت داده می شود
و میانگین حسابی جواب متغیر ها در گره والد میباشد.
بهترین انشعاب، انشعابی است که بیشترین مقدار را داشته باشد. با تکرار فرایند بالا براي هر انشعاب، درخت بزرگی شکل میگیرد که به درخت حداکثر1 معروف است که شاخهها و گرههاي زیادي دارد و کار با آن سخت میباشد؛ بنابراین براي رسیدن به یک درخت بهینه و کارآمد، باید شاخههاي اضافی را هرس کرد .
هرس کردن درخت2
دو روش هرس وجود دارد: الف- هرس قبل از شکل گیري درخت حداکثر3 ب- هرس بعد از شکل گیري درخت حداکثر4 در روش اول فرایند هرس اجازه نمیدهد شاخههاي اضافی تولید شوند و درخت فقط تا جایی توسعه مییابد که یک میزان دقت خاصی که توسط کاربر تعیین میشود در نتایج مدل حاصل شود؛ ولی در روش دوم ابتدا درخت حداکثر تشکیل میشود و سپس فرآیند هرس تا جایی که دقت مدل از مقدار تعیین شده توسط کاربر پایینتر نیاید انجام میگیرد.
انتخاب درخت بهینه5 درخت بهینه بر اساس حداقل کردن خطاي پیشبینی انتخاب میشود که دو روش براي محاسبه خطاي پیش بینی وجود دارد: الف- آزمون دستگاه مستقل ب-آزمون صحت سنجی روش اول هنگامی مورد استفاده قرار میگیرد که تعداد دادههاي زیادي داشته باشیم در غیر اینصورت از روش دوم استفاده میشود .
توابع عملکرد
براي ارزیابی عملکرد مدل رگرسیون درختی در پیش بینی تبخیر و تعرق از پارامترهاي جذر میانگین مربعات خطا (RMSE) ،شاخص پراکندگی (SA) و پارامتر انحراف((Bias استفاده می شود که از روابط زیر قابل محاسبه هستند.

که در آن مقدار تبخیر تعرق بدست آمده از روش پنمن مانتیث فائو، میانگین مقادیر واقعی مقدار تخمینی بدست آمده از مدل رگرسیون درختی، میانگین مقادیر تخمینی مدل و n نیز در معادله بالا تعداد مشاهدات می باشد . از ضریب نکویی برازش( ) نیز براي مقایسه داده هاي پیش بینی شده توسط مدل و مقادیر محاسبه شده توسط روش پنمن مانتیث فائو استفاده شده است .

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید