بخشی از مقاله
*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***
کاربرد مدل M5 در برآورد تبخير- تعرق مرجع در ايستگاههاي شيراز و کرمانشاه
چکيده
دراين تحقيق توانايي مدل درختي M5 براي تخمين تبخير- تعرق مرجع در دو ايستگاه هواشناسي شيراز و کرمانشاه مورد ارزيابي قرار گرفت . دادههاي مورد استفاده شامل متغيرهاي متوسط دماي هوا ، ساعت آفتابي، بارش، دماي نقطه شبنم ، رطوبت نسبي، سرعت باد و فشار بخار واقعي روزانه بود. در اين تحقيق دو روش پنمن -مانتيث و هارگرويز-ساماني به منظور مقايسه انتخاب و عملکرد مدل درختي M5 به عنوان روشي جديد براي برآورد تبخير-تعرق بررسي شد. نتايج نشان داد که در هر دو ايستگاه، مدل درختي M5 در تخمين تبخير- تعرق پتانسيل نسبت به هر دو روش داراي عملکرد مناسبي بود اما توانايي آن در تخمين تبخير- تعرق به روش پنمن -مانتيث (ايستگاه شيراز: ، ايستگاه کرمانشاه: ) نسبت به روش هارگرويز- ساماني(ايستگاه شيراز: ) ايستگاه کرمانشاه: ) بالاتر شد. آناليز حساسيت نشان داد در روش پنمن -مانتيث در ايستگاه شيراز متغيرهاي متوسط دماي هوا، ساعت آفتابي، دماي نقطه شبنم ، متوسط سرعت باد و در ايستگاه کرمانشاه دماي هوا، ساعت آفتابي ، متوسط سرعت باد، رطوبت نسبي و دماي نقطه شبنم ، بيشترين تاثير را داشتند.
واژه هاي کليدي: آناليز حساسيت ، پنمن -مانتيث ، داده کاوي، مدل درختي، هارگرويز- ساماني
مقدمه
روش استاندارد مورد استفاده براي تعيين تبخير- تعرق گياه مرجع ، روش لايسيمتري است که در صورت عدم دسترسي، از روشهاي تجربي استفاده ميشود. برخي روشهاي تجربي از اصول فيزيکي مي- کنند و بعضي از روشهـاي آماري و از همبستـگي آمـاري بين تبخير- تعرق و چند متغير محدود استفاده ميکنند (شارما، ١٩٨٥). عملـکرد روشهاي تجـربي در شـرايط اقليـمي مختـلف ارزيـابي شـده اسـت (آلـن و شـرايط اقليمي مختلف ارزيابي شده است (آلن و همکاران، ١٩٩٨؛ کاتول و همکاران،١٩٩٢؛ آماتيا و همکاران،١٩٩٥؛ اسميت و همکاران، ١٩٩٦؛ ونتورا وهمکاران، ١٩٩٩؛ برنجينا و گاويلان، ٢٠٠٥). نتايج تحقيقات نشان داد که معادله پنمن - مانتيث به عنوان يک معادله استاندارد جهاني براي تخمين ETo٢ برتر شد (آلـن و همـکاران، ١٩٩٨). در مـعادله پنمن - مانتيث به دادههاي دماي بيشينه وکمينه هوا، رطوبت بيشينه وکمينه (يا فشاربخار واقعي )، سرعت باد در ارتفاع ٢ متري و تابش خورشيد(يا ساعات آفتابي ) نياز است . درحاليکه داده دماي هوا در بيشتر ايستگاههاي هواشناسي سراسر جهان قابل دسترس است ، ساير متغيرها هميشه در دسترس نيستند(دروگرز و آلن ،٢٠٠٢). از طرفي خطاهاي تصادفي و يا سيستماتيک در متغيرهاي هواشناسي درتخمين ETo، باعث خطاهاي مشهودي در برآورد مي شود(مير وهمکاران،١٩٨٩). در اين شرايط ، گزينه ديگر استفاده از روشهاي تخمين ETo است که فقط به داده دما اکتفا مي کنند. ليکن در چنين شرايطي معادله ي تجربي (هارگريوز و ساماني ،١٩٨٢) به عنوان يکي از روشهاي مناسب براي مناطق با داده کم که عمدتا داده روزانه دما موجود باشد، پيشنهاد شد. معادله ي هارگرويز- ساماني فقط به داده دماي بيشينه و کمينه و تابش برون - زميني نياز دارد و چون تابش برونزميني مي تواند بصورت تئوري محاسبه شود(دروگرز و آلن ،٢٠٠٢)، تنها متغير مورد نياز، دماي هوا است . تبخير- تعرق به روش هارگرويز-ساماني را مي توان بصورت روزانه محاسبه کرد، هر چند در مقياس هفتگي و ماهيانه نتايج بهتري بدست آمد (جنسن و همکاران، ١٩٩٠؛ چويسنل و همکاران، ١٩٩٢؛ دروگرز و آلن ،٢٠٠٢؛ هارگريوز و آلن ،٢٠٠٣).
در سالهاي اخير از تکنيک هاي بسياري به منظور برآورد متغيرهاي هواشناسي استفاده شد که اغلب اين تکنيک ها داده محور بوده و سعي نمودند با داشتن اطلاعاتي در مورد روابط بين دادهها دريک سري زماني بلند مدت به تشخيص الگوي آن متغير پرداخته تا بتوانند به نحوي متغير مورد نظر را که دسترسي به آن در برخي مناطق ميسر نيست برآورد نمايند. از جمله آنها ميتوان به شبکه هاي عصبي مصنوعي اشاره نمود. معمولا شبکه هاي عصبي آموزش داده ميشوند تا يک ورودي خاص به هدف خروجي خاصي برسد. شبکه براساس مقايسه مقدار خروجي و هدف مقايسه ميشود تا زمانيکه جمع مربع اختلافات بين مقادير هدف و خروجي حداقل گردد.
رهيافت ديگري که اخيرا بر اساس تکنيک هاي دادهکاوي براي تخمين تبخير- تعرق مرجع ارائه شده است ، مدل درختي M5 بود که در مطالعات منابع آب به کارگرفته شد. بيشتر کاربردهاي مدل درختي M5 در منابع علمي عمدتا ناظر بر پيش بيني است ، اما اين روش براي مسائل طبقه بندي نيز عملکرد رضايت بخشي داشت (پال،٢٠٠٦).
دادهکاوي (DM١) اغلب بصورت فرآيند استخراج اطلاعات معتبر، از پيش تعيين شده و قابل فهم براي پايگاههاي بزرگ داده تعريف مي شود تا تصميمات تجاري را بهبود داده و بهينه نمايد(براها و شيلويسي،٢٠٠٢) در ساير تعاريف ، دادهکاوي بصورت تشخيص ساختار در داده است که اين ساختار، الگوها، مدلهاي آماري يا پيش بيني داده و روابط بين بخش هاي داده را طراحي مي نمايد (فياد و اتوروسامي، ٢٠٠٢). داده - کاوي در طيف وسيعي از رشته هاي علوم اجتماعي و زيست محيطي براي پيش بيني بکارگرفته شده و طي سال - هاي اخير دادهکاوي در تحليل ساير انواع دادههاي علمي مانند بيوانفورماتيک ، نجوم و پزشکي نيز تجربه شد (لي و لي شو،٢٠٠٤).
ترزي و همکاران (٢٠٠٥) از روشها دادهکاوي براي مدلسازي تبخيراز تشت استفاده نمودند و با بکارگيري الگوريتم ژنتيک دماي هوا، دماي آب و رطوبت نسبي را بعنوان موثرترين عوامل دمايي گزارش نمودند.
آنها با استفاده از الگوريتم هاي MRules٥،Kstar وجدول تصميم مدلهايي را توسعه داده و نشان دادند که مدل Kstar در مقايسه با ساير مدلها نتايج بهتري داشت . ترزي در سال ٢٠٠٧ با بکارگيري دادههاي هواشناسي درياچه ي اگيردير واقع در ترکيه متغيرهاي دماي هوا، دماي آب، تابش خورشيد و رطوبت نسبي را به عنوان عوامل مؤثر بر تبخير از تشت تعيين نمود. در اين مطالعه ، از الگوريتم - هاي دادهکاوي جدول تصميم ، Kstar، M5،Rules M5، شبکه عصبي و روشهاي رگرسيوني استفاده شد و مقايسه نتايج آنها با مقادير اندازهگيري شده تشت تبخير روزانه نشان داد که الگوريتم M5 بهترين عملکرد را در تخمين تبخير از تشت داشت .
پال و دسوال (٢٠٠٩) از مدل درختي M5 براي مدلسازي تبخير- تعرق مرجع در ايستگاه ديويس کاليفرنيا استفاده کردند و توانايي اين مدل را با روشها پنمن - مانتيث و هارگريوز-ساماني کاليبره شده مقايسه نمودند.
نتايج نشان داد که مدل درختي M5 در پيش بيني تبخير- تعرق مرجع در مقايسه با پنمن -مانتيث و هارگريوز ساماني کاليبره شده همبستگي خوبي دارد. علاوه بر اين ، مهم ترين متغيرهاي موثر بر پيش بيني تبخيرتعرق مرجع با استفاده از اين مدل شامل تابش خورشيد، متوسط دما ، رطوبت نسبي و سرعت باد بود.
پژوهش حاضر با هدف ارزيابي توانايي مدل درختي M5 در تخمين تبخير- تعرق مرجع با استفاده از روشهاي پنمن -مانتيث و هارگريوز-ساماني بود و موثرترين متغيرهاي موثر در تخمين تبخير- تعرق مرجع با استفاده از آناليز حساسيت در دوايستگاه شيراز و کرمانشاه را تعيين نمود
مواد و روشها
در این پژوهش از داده روزانه ایستگاه هواشناسی شیراز ( به ارتفاق 1488 متر و عرض جغرافیایی و طول جغرافيايي ) و ايستگاه هواشناسي کرمانشاه (به ارتفاع ١٣١٨.٦ متر و عرض جغرافيايي و طول جغرافيايي ) طي دوره ٢٠٠٢-١٩٩٥ استفاده شد. سري داده استفاده شده شامل متوسط دماي هوا (C)، دماي نقطه شبنم (C)، متوسط رطوبت نسبي (%)، ساعات آفتابي (ساعت )، متوسط سرعت باد (متربرثانيه )، بارش (ميلي - متر)، فشار بخار واقعي (ميلي بار) و تبخير- تعرق (ميلي متر بر روز) محاسبه شده از رابطه ي پنمن -مانتيث و هارگرويز-ساماني بود. از %٧٠ داده براي آموزش مدل با استفاده از مدل درختي M5 و از ٣٠% سري داده براي صحت سنجي مدل استفاده گرديد. به منظور اجراي مدل از نرم افزار دادهکاوي وکا١ نسخه ٣.٦.٤ استفاده شده است .
اين نرمافزار، يک واسط همگون براي بسياري از الگوريتم هاي يادگيري متفاوت، فراهم کرده است که از طريق آن روشهاي پيش پردازش، پس پردازش و ارزيابي نتايج طرحهاي يادگيري روي همه مجموعه هاي داده موجود، قابل اعمال است . نرم افزار وکا، پياده سازي الگوريتم هاي مختلف يادگيري را فراهم ميکند و به آساني ميتوان آنها را به مجموعه داده خود اعمال کرد.
براي تخمين تبخير-تعرق مرجع ، پنج متغير ورودي شامل متوسط دما، ساعات آفتابي ، متوسط رطوبت نسبي ،متوسط سرعت باد و فشاربخار واقعي استفاده شد.
ضمنا هر گونه داده با مقادير گمشده از سري داده حذف گرديد.
لازم به ذکر است در صورت دسترسي به داده هاي لايسيمتري معتبر و منتشر شده، اين داده ها به عنوان مبناي مقايسه مورد استفاده قرار ميگرفت که قطعا بر دقت تحليل ها مي افزود.
معادلات ١و٢ به ترتيب مربوط به روشهاي پنمن - مانتيث فائو٥٦ و هارگريوز-ساماني مي باشد.
که ETo، تبخيرتعرق گياه مرجع ، Rn، تابش خالص روزانه ،G ، شار حرارتي روزانه ي خاک ،Ta ، متوسط دماي هواي روزانه در ارتفاع ٢متري U2متوسط سرعت باد در ارتفاع ٢ متري ،es ،فشاربخار اشباع فشاربخار واقعي شيب فشاربخار اشباع در مقابل منحني دما ،ثابت سايکرومتري . در اين مطالعه و ea با استفاده از معادلات ارائه شده بوسيله آلن وهمکاران(١٩٩٨)محاسبه شدند. شارحرارتي خاک (G) در دوره زماني محاسبه ٢٤ ساعت صفر درنظرگرفته شد(آلن و همکاران،١٩٩٨). Tn,Tx,RH براي محاسبه ي es,ea و استفاده شدهاند. تابش روزانه خورشيد(Rs) با استفاده از فرمول آنگستروم که تابش خورشيد را به تابش برونزميني و نسبت مدت روشنايي خورشيد مرتبط ميکند محاسبه گرديد.
روش هارگرويز-ساماني از طريق معادله زير تعريف شد(هارگريوز،١٩٩٤):
که0 ET، تبخيرتعرق گياه مرجع محاسبه شده بوسيله معادله هارگريوز تابش برونزميني معادل آب محاسبه شده طبق آنچه توسط آلن و همکاران(١٩٩٨) محاسبه شده و دماي بيشينه ، کمينه و متوسط دماي روزانه است .
مدل درختي M5
الگوريتم M5 رايج ترين الگوريتم از خانواده درخت هاي تصميم گيري ميباشد. مدل درختي M5 يک الگوريتم پيش بيني عددي ميباشد( ژانگ و تساي، ٢٠٠٧).
مدلهاي درختي همانند درخت هاي رگرسيوني براي داده - هاي زياد موثرميباشند. به هر حال مدلهاي درختي معمولا بسيار کوچک تر و دقيق تر از درخت هاي رگرسيوني ميباشند (کوئينلن ،١٩٩٢). در ابتدا الگوريتم مدل درختي M5 با تقسيم کردن فضاي نمونه ، بصورت بازگشتي يک درخت رگرسيوني ميسازد. اين تقسيم - سازي براي کمينه کردن تغييرات زيرمجموعه هاي دروني مقادير از ريشه تا گره و از مسير شاخه ها صورت ميگيرد.
تغييرات بوسيله ي انحراف معيار مقاديري که از ريشه به هر گره رسيدهاند، با محاسبه ي کاهش خطاي مورد انتظار که از آزمايش هرصفت در آن گره حاصل ميشود، اندازه - گيري ميشود. صفتي که ميزان کاهش خطاي مورد انتظار را بيشينه کند، انتخاب ميشود. فرآيند جداسازي در صورتي که مقادير خروجي تمامي نمونه هايي که به گره مورد نظر ميرسند تغييرات ناچيزي داشته باشد و يا تعداد کمي از نمونه ها باقي بمانند، متوقف ميشود. کاهش انحراف معيار با استفاده از رابطه زير محاسبه ميشود.
که T بيانگر نمونه هايي است که به گره ميرسد؛ Ti بيانگر مجموعه هايي هستند که از تقسيم کردن گره براساس صفت انتخابي به دست آمده - اند؛ sd بيانگر انحراف معيار است . پس از ايجاد درخت ، براي هر گره داخلي، يک مدل رگرسيون خطي چندگانه ساخته ميشود. اين مدل براساس دادههاي وابسته به آن گره و تمام صفاتي که در زير درخت با ريشه آن گره مورد استفاده قرار گرفته اند، ايجاد ميشود. در مرحله بعد، مدلهاي رگرسيون خطي، با کنارگذاشتن صفاتي که حذف آنها باعث کاهش ميانگين خطا ميشود، سادهسازي ميشوند. بعد از اين سادهسازي، هر زير درخت براي انجام عمليات هرسکردن مورد بررسي قرار ميگيرد. اگر خطاي تخمين زده شده براي مدل خطي در ريشه زير درخت ، کوچک تر يا مساوي ميانگين خطاي درخت باشد، زيردرخت هرس ميشود.
شکل ١ نحوهي انشعاب مدل را بصورت شماتيک نشان ميدهد
بعد از عمليات هرسکردن، ناپيوستگي زيادي بين مدلهاي خطي مجاور در برگهاي درخت هرس شده، ايجاد ميشود. در فرآيند هموارسازي در M5، مدل نهايي در يک برگ از ترکيب کردن مدل بدست آمده در آن برگ با مدلهاي موجود در مسير ريشه تا برگ مربوطه بدست ميآيد. آزمايش هاي انجام شده توسط Wang و Witten نشان داده است که هموارسازي به ميزان زيادي دقت پيش گوييها را بهبود ميبخشد(بنکدار و شهيدي،١٣٨٨).
همانطور که قبلا بيان شد، يک مدل خطي براي هر گره داخلي، براي فرآيند هموارسازي مورد نياز است .قبل از هرسنمودن يک مدل براي هر گره درخت هرس نشده محاسبه مي شود. مدل شکل کلي زير را دارد:
که a1,a2 ...ak. مقادير صفات مي باشند.