بخشی از مقاله

*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***

مقایسه دقت مدلهای خبره و روشهای تجربی در شبیهسازی تبخیرتعرق مرجع
چکیده
در این مطالعه قابلیت عملکرد روش برنامهریزی بیان ژن 1(GEP) و مدل درختی M5 به عنوان روشهای هوشمند و معادلات تجربی ریچی و هارگریوز-سامانی در تخمین تبخیرتعرق مرجع (ET0) ماهانه مورد ارزیابی قرار گرفت. برای این منظور میانگین ماهانهی دادههای اقلیمی شامل حداقل و حداکثر دما، رطوبت نسبی، سرعت باد و طول ساعات آفتابی ایستگاه سینوپتیک زنجان برای تخمین ET0؛ به عنوان ورودی مدلهای GEP و M5 مورد استفاده قرار گرفت. مقادیر ET0 با استفاده از معادله پنمن مونتیث-فائو 56 به عنوان مقادیر مبنا محاسبه شد. برای ارزیابی دقت مدلها از آمارههای ریشه میانگین مربعات خطا (RMSE) و ضریب تبیین (R2) استفاده شد. نتایج نشان داد که مدلهای خبره دارای دقت بالاتری نسبت به روشهای تجربی بودند. در این میان مدل رگرسیونی M5 بهطور نسبی نتایج دقیقتری نسبت به مدل GEP تولید نمود و همچنین معادله تجربی ریچی دارای خطای کمتری نسبت به معادله هارگریوز-سامانی بود. با توجه به قابلیت مدلهای M5 و GEP در استخراج روابط غیرخطی و خطی، به خوبی میتوان از این معادلهها برای تخمین به جای روشهای تجربی استفاده نمود.
کلمات کلیدی: تبخیرتعرق، مدل درختی M5، مدل GEP، هارگریوز، ریچی


مقدمه
تبخیرتعرق یکی از مهمترین فرایندها در چرخه هیدرولوژیکی به شمار میآید. از آنجا که موجودیت منابع آب برای کشاورزی در بسیاری از مناطق جهان به دلایل مختلفی همچون رشد جمعیت، تغییر اقلیم و کاهش کیفیت روز به روز محدودتر میشود، بنابراین تخمین دقیق تبخیرتعرق الزامی میباشد. تاکنون روشهای متعددی برای محاسبه تبخیرتعرق بر مبنای دادههای اقلیمی پیشنهاد شده است. بهطور کلی ترکیب معادلههای توازن انرژی و آئرودینامیک به این لحاظ که اساس آنها بر روابط منطقی و مبنای فیزیکی استوار است، دقیقترین نتایج را حاصل مینماید .(Jensen et al., 1990) سازمان خواروبار جهانی (FAO) روش پنمن-مونتیث-فائو (PMF-56) 56 را به عنوان روش استاندار در محاسبه تبخیرتعرق (ET0) معرفی نموده است ( Allen .(et al., 1998 مهمترین محدودیت در کاربرد مدل PMF-56 نیاز به پارامترهای اقلیمی زیادی است که ممکن است برای یک منطقه خاص در دسترس نباشند. از اینرو روشهای تجربی و نیمهتجربی زیادی نیز برای تخمین ET0 با استفاده از دادههای محدودتر، ابداع شدهاند. یکی از این روشها، معادلهی هارگریوز-سامانی (1982) است که به عنوان یکی از گزینههای مناسب برای مناطق با داده اقلیمی کمیاب پیشنهاد شده است. این روش فقط از دادههای بیشینه و کمینه دمای هوا و نیز تابش برونزمینی بهره میبرد و چون تابش برونزمینی میتواند بهصورت تئوری محاسبه شود، بنابراین تنها پارامترهای مورد نیاز این روش حداقل و حداکثر دمای هوا میباشد .(Droogers and Allen, 2002) از نقاط ضعف روشهای تجربی میتوان گفت که این روشها عموما منطقه-پایه بوده و فقط تحت شرایط اقلیمی و اگرونومیکی ویژه دارای اعتبار میباشند .(Wang et al., 2013) در سالهای اخیر استفاده از روشهای هوش محاسباتی در زمینه مسائل مهندسی آب با استقبال خوبی از سوی پژوهشگران مواجه شده است. در همین زمینه تخمین تبخیرتعرق مرجع به وسیله روشهای دادهکاوی به تواتر انجام پذیرفته است ( Izadifar and .(Elshorbagy, 2010 مدل برنامهریزی بیان ژن (GEP) یکی از این روشهاست که در مطالعات هیدرولوژیکی به صورت موفقیتآمیزی مورد استفاده قرار گرفته است. در یکی از این بررسیها برای شبیهسازی ET0 در ایالات متحده امریکا روش GEP به کار برده شد .(Guven et al., 2008) نتایج مطالعات نشان داده که مدل GEP در مقایسه با مدل شبکه عصبی مصنوعی و روشهای آماری از دقت بهتری در تخمین تبخیر تعرق ساعتی برخوردار است .(Izadifar and Elshorbagy, 2010) شیری و همکاران (2012) مدلهای GEP، سیستم استنتاج تطبیقی عصبی-فازی (ANFIS) و روشهای تجربی هارگریوز-سامانی و پریستلی-تیلور را برای تخمین تبخیر تعرق مرجع در شمال اسپانیا با هم مقایسه نمودند. نتایج حاکی از آن بود که GEP به ترتیب دقیقتر از ANFIS، پریستلی-تیلور و هارگریوز-سامانی بود. همچنین بررسیهای محققین در مقایسه نتایج روش برنامهریزی بیان ژن و روشهای هارگریوز-سامانی و نیز بلینی-کریدل نشان داد که مدل برنامهریزی بیان ژن میتواند بخوبی جایگزین این روشهای تجربی شود .(Traore and Guven; 2012, 2013) در سالهای مدل درختی M5 در مطالعات هیدرولوژیکی مانند پیشبینی سیلاب (Solomatine and Xue, 2004) و مدلسازی رسوب ( Bhattacharya and Solomatine, (2006 به صورت موفقیتآمیزی مورد استفاده قرار گرفته است. بررسیهای محققان، کارایی استفاده از مدل درختی M5 در تخمین تبخیر-تعرق مرجع روزانه (ستاری و همکاران، (1392 و همچنین مدلسازی تبخیر-تعرق مرجع با استفاده از مقادیر تبخیر از تشت (Rahimikhoob et al., 2013) را به خوبی نشان داده است. رحیمیخوب (2014) توانایی مدلهای M5 و شبکه عصبی مصنوعی پرسپترون چندلایه را در تخمین تبخیرتعرق مرجع در یک منطقه خشک مورد بررسی قرار داد. نتایج این تحقیق نشان داد که هر دو مدل برای این منطقه دارای دقت قابل قبول میباشند، اما مدل M5 با تولید معادلات رگرسیونی خطی ساده قابلیت کاربرد بیشتری دارد. هدف از این تحقیق شبیهسازی تبخیرتعرق مرجع ماهانه به وسیلهی مدل درختی M5 و مدل تکاملی GEP و همچنین مقایسه نتایج این مدلها با روشهای تجربی هارگریوز-سامانی و ریچی با استفاده از دادههای اقلیمی ماهانه برای ایستگاه سینوپتیک زنجان میباشد.
مواد و روشها
مدل درختی M5
مدل درختی M5 که در ابتدا توسط Quinlan (1992) پایهریزی شده، یک درخت تصمیم دودویی یا باینری است که دارای توابع رگرسیونی خطی در گرههای پایانهای (برگها) میباشد. این توابع میتوانند بین متغیرهای مستقل و وابسته ایجاد ارتباط نموده و صفات عددی پیوسته را پیشبینی نمایند. تولید نسل در این مدل شامل دو مرحله است. مرحله اول شامل استفاده از یک شاخص تفکیک و جداسازی برای ایجاد یک درخت تصمیم است. شاخص تفکیک برای الگوریتم مدل درختی M5 بر اساس ارزیابی انحراف استاندارد مقادیر کلاسی است که به هر گره میرسد. انحراف استاندار به عنوان معیاری از خطا در آن گره است که کاهش مورد انتظار در این خطا به عنوان نتیجهای از آزمایش هر صفت در آن گره را محاسبه میکند. فرمول محاسبه کاهش خطای استاندارد (SDR) به صورت زیر تعریف شده است:

که بیانگر یک مجموعه از نمونههاست که به هر گره اختصاص مییابد، نمایانگر زیرمجموعهای از نمونههاست که دارای امین خروجی مجموعهی بالقوه است و انحراف استاندارد است .(Pal and Deswal, 2009)
به دلیل فرآیند تفکیک و انشعاب مقدار انحراف استاندارد دادهها در گرههای فرزند (گرههای پایینتر) کمتر از مقدار آن در گره والد میباشد .(Rahimikhoob et al., 2013) پس از آزمودن تمامی تفکیکهای ممکن، تفکیکی که موجب کاهش انحراف استاندارد مورد انتظار به حداکثر مقدار خود گردد، انتخاب میشود. با اینحال این تقسیمبندی غالبا موجب ایجاد یک ساختار درختی بزرگ میشود که احتمالا بیشآموزش و یا ضعف قابلیت تعمیم مدل را به دنبال دارد. برای غلبه بر این مشکل در مرحله دوم درخت ایجاد شده هرس شده و سپس زیر شاخههای اصلاح شده به وسیله توابع رگرسیونی خطی جایگزین میشوند .(Quinlan, 1992) این روش ایجاد مدل درختی، فضای پارامتری را به زیرفضاهایی تجزیه نموده و در هرکدام از آنها یک مدل رگرسیونی به وجود میآورد.

برنامهریزی بیان ژن (GEP)
برنامهریزی بیان ژن که اولین بار به وسیله (2001) Ferreira معرفی شد، یک الگوریتم تکاملی است که برنامههای کامپیوتری را استنتاج نموده و مدلهای ریاضیاتی را از دادههای آزمایشی پیشبینی میکند. الگوریتم این روش مشابه روش برنامهریزی ژنتیک (GP) است با این تفاوت که در این روش از رشتههای کاراکتری با طول ثابت که کروموزوم نامیده میشوند برای ارائه برنامههای کامپیوتری که بعدا به صورت بیان درختی اظهار میشوند استفاده میشود .(Ferreira, 2001, 2006) از مزیتهای رویکرد GEP آن است که ایجاد تنوع ژنتیکی بسیار سادهسازی شده است و دیگر نقطه قوت آن سرشت منحصربفرد و مولتیژنیک آن میباشد که برنامههای بسیار پیچیده را نیز استنتاج و استخراج میکند GEP .(Ferreira, 2006., Kisi and Shiri, 2011) در مقایسه با روش GP، 100 تا 10000 برابر سریعتر میباشد .(Ferreira, 2001) برای آمادهسازی این مدل چند مرحله اساسی وجود دارد. در گام اول تابع برازش باید تعریف شود. بر مبنای نتایج گزارش شده (Shiri et al., 2012) کاربرد تابع برازش ریشه میانگین مربعات خطا (RMSE) دقیقترین نتایج را در مدلسازی ET0 حاصل نموده است. مرحله دوم شامل انتخاب مجموعه ترمینالها و مجموعه توابع برای ایجاد کروموزومهاست. مجموعه ترمینالها که در این مطالعه شامل متغیرهای اقلیمی برای هر مدل GEP است در جدول شماره 3 ارائه شده است. برای انتخاب توابع مناسب در مجموعه توابع نیز از تجربههای محققین (Guven et al., 2008; Shiri et al., 2012) استفاده شد. مرحله سوم تعیین برخی پارامترهای کنترلی اجرای برنامه است. مرحله چهارم عبارت است از انتخاب تابع اتصال. در این مقاله تابع اتصال جمع برای ایجاد پیوند بین زیر درختها مورد استفاده قرار گرفت. در گام آخر عملگرهای ژنتیکی انتخاب میشوند. نحوه انتخاب پارامترهای کنترلی و عملگرهای ژنتیکی در جدول 1 نمایش داده شده است.

معادله پنمن- مونتیث فائو (PMF-56) 56
از آنجا که روش پنمن-مونتیث فائو 56 دارای مبنای فیزیکی است و پارامترهای فیزیولوژیکی و آئرودینامیکی را هم زمـان در نظـر گرفته است، به عنوان بهترین روش تعیین توصیه شده است بنابراین در ایـن مطالعـه از ایـن روش بـه عنـوان روش مبنـا بـرای محاسبه استفاده شد :(Allen et al., 1998)


که ET0 تبخیرتعرق مرجع (mm day-1)، ∆ شیب تابع فشار بخار اشباع (kPa ˚C-1)، Rn تابش خورشـیدی خـالص ( MJ m-1 (day-1، G چگالی شار گرمای خاک (MJ m -2 day-1)، γ ثابت سایکرومتری (kPa ˚C-1)، T میـانگین دمـای هـوا (˚C)، U2 میانگین 24 ساعتهی سرعت باد در ارتفاع 2 متـری (m s-1)، es فشـار بخـار اشـباع (kPa) و ea فشـار بخـار واقعـی محـیط (kPa) میباشد.
معادله هارگریوز-سامانی
این معادله یکی از سادهترین روشهای تجربی تخمین میباشد که به صورت معادله 2 بیـان مـیشـود


که ET0 تبخیرتعرق مرجع Tmax و Tmin به ترتیب میانگین حداکثر و حداقل دمای ماهانـه هـوا (°C) و Ra تـابش برونزمینی (mm day-1) میباشد.
معادله ریچی:
این روش نیز یکی از روشهای تجربی تخمین تبخیرتعرق مرجع میباشد که به وسیله (Jones and Ritchie; 1990) ارائه شده است:


که ET0 تبخیرتعرق مرجع به ترتیب میانگین حداکثر و حداقل دمای ماهانـه هـوا (°C) و Rs تـابش خورشیدی (MJ m-2 day-1) میباشد که مقدار به صورت زیر محاسبه میشود:

در این تحقیق میانگین ماهانه پارامترهای هواشناسی حـداقل و حـداکثر دمـا ( Tmax, Tmin)، رطوبـت ( RH)، سـرعت بـاد (U2) و ساعات آفتابی (SUN) برای محاسبه تبخیر-تعرق مرجع ماهانه در ایستگاه سـینوپتیک زنجـان بـا طـول جغرافیـایی 48 درجـه و 29 دقیقه شرقی، عرض جغرافیایی 36 درجه و 41 دقیقه شمالی و ارتفاع 1663 متر از سطح دریـا بـا طـول دوره آمـاری 16 سـال 1995) میلادی تا (2005 بهکار برده شد.
برای ارزیابی توانایی مدل های GEP و M5 از ترکیب های مختلف پارامترهـای اقلیمـی بـه عنـوان ورودی اسـتفاده گردیـد. % 70 داده ها برای آموزش و % 30 باقی مانده جهت آزمون مدل های مورد استفاده اختصـاص یافـت. در مرحلـه تسـت مـدل بـا اسـتفاده از داده هایی که در آموزش شرکت داده نشده بودند، روابط خطی (M5) و غیرخطی (GEP) پیشبینی مقادیر ET0 توسط هر کـدام از مدل ها استخراج شد. به منظور ارزیابی اعتبـار نتـایج، شـاخص هـای آمـاری ضـریب تبیـین (R2) و جـذر میـانگین مربعـات خطـا (RMSE) برای دادههایی که در مرحله آموزش از آنها استفاده نشده بود، به کار برده شد.

در این رابطه ها به ترتیب مقادیر ET0 محاسبه شده به روش PMF-56 و میانگین آن، ̂ شبیهسازی شده ET0 و میانگین آن برای تعداد نمونه میباشند. برای اجرای مدل M5 از نرمافزار WEKA (3.7.10) و برای شبیه سازی ET0 به روش GEP از نرمافزار GeneXproTools (4.0) استفاده شد. همچنین برای برازش روشهای تجربی و رسم نمودارها صفحه گسترده Excell به کار برده شد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید