بخشی از مقاله

*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***

برآورد تبخير تعرق مرجع روزانه با حداقل داده هاي هواشناسي در اقليم هاي نيمه خشک منتخب ايران


تخمين صحيح و دقيق تبخير-تعرق تأثير بسزايي در مديريت و برنامه ريزي صحيح منابع آب به ويژه در مناطق نيمه خشک و خشک دارد. روش هاي متعددي براي برآورد تبخير-تعرق توسط محققان ارائه شده است . از جمله اين روش ها ميتوان به انواع معادلات تجربي و روش هاي داده محور اشاره کرد. در اين مطالعه از سه روش داده محور شبکه هاي تطبيقي مبتني بر سيستم استنتاج فازي (ANFIS)، مدل درختي (M5) و ماشين هاي بردار پشتيبان (SVM) و پنج معادله تجربي براي تخمين تبخير-تعرق روزانه در هشت اقليم نيمه خشک ايران استفاده شده است . براي اين منظور از داده هاي هواشناسي حداکثر و حداقل دما، رطوبت نسبي، سرعت باد و ساعات آفتابي و ١١ ترکيب مختلف اين متغيرها بين سال هاي ١٩٨٠ تا ٢٠٠٩ به عنوان ورودي بــه روش هاي داده محور بــراي مدل سازي تبخير-تعرق بهره گرفته شد که ٨٠% داده ها براي آموزش و ٢٠% آن ها براي آزمون مدل ها استفاده شد. سپس نتايج حاصله با مقادير به دست آمده از معادله استاندارد پنمن - مانتيث فائو ٥٦ مقايسه شدند. عملکرد روش هاي مورد نظر با استفاده از شاخص هاي آماري ميانگين مربعات خطا (RMSE)، ضريب تبيين (R2) و شاخص توافق (d) مورد بررسي قرار گرفت . روش هاي ماشين بردار پشتيبان و شبکه تطبيقي مبتني بر سيستم استنتاج فازي در نه ترکيب متغيرهاي هواشناسي بهترين عملکرد را با RMSE بين ٠.٢٤ تا ١.٥٥ ميليمتر بر روز ارائه دادند. RMSE معادلات تجربي در دامنه بين ٠.٧١ تا ٥.٩٦ ميليمتر بر روز متغير بودند و از ميان آن ها معادلات بلاني - کريدل و مک گاينس -بردنه در غالب ايستگاه ها بالاترين دقت را داشتند.
همچنين روش M5 نسبت به دو روش ANFIS و SVM در مواجهه با وروديهاي مختلف در اقليم هاي مطالعاتي عملکرد پايين تري را از خود نشان داد.
کلمات کليدي: تبخير-تعرق مرجع روزانه ، معادلات تجربي، اقليم نيمه خشک ، ANFIS،SVM ، M5.



١- مقدمه
امروزه رشد جمعيت و نياز بيش از پيش به منابع آب شيرين باعث چالش جدي در ايجاد منابع آب پايدار شده است . در اين راستا متخصصان به دو رويکرد عمده توليد آب و استفاده بهينه از منابع آب توجه زيادي داشته اند. برنامه ريزي، بهينه سازي و شبيه سازي در حوضه منابع آب نيازمند شناسايي و برآورد صحيح پارامترهاي مختلفي از جمله تبخير-تعرق ميباشد. اندازه گيري دقيق تبخير- تعرق نيازمند ابزاري گرانقيمت ميباشد که امکان استفاده از آن ها در همه نقاط وجود ندارد. از اين رو محققان همواره به دنبال روابط و روش هاي کاربردي، کم هزينه و با دقت مناسب براي برآورد صحيح مقدار اين پارامتر بوده اند. روش هاي متعددي براي برآورد صحيح تبخير-تعرق در سراسر دنيا توسعه داده شده است . از جمله اين روش ها ميتوان به معادلات تجربي پريستلي-تيلور، بلاني-کريدل ، مک گاينس -بردنه و روش هاي داده محور از جمله شبکه هاي عصبي مصنوعي، ماشين بردار پشتيبان و مدل هاي درختي اشاره نمود. يکي از مشکلات عمده معادلات تجربي انعطاف پذيري پايين در برخورد با داده هاي مختلف است که منجر به نتايج ضعيف معادلات ميگردد.
روش هاي داده محور با توجه به انعطاف پذيري بــالا، در مــدل سازي شرايط مختلف يک پديده توانايي خوبي را دارا هستند.
(٢٠٠٩) Kisi and Ciman از روش ماشين بردار پشتيبان (SVM) و شبکه عصبي مصنوعي (ANN) براي مدل سازي تبخير-تعرق در منطقه اي در ايالت کاليفرنيا استفاده نمودند. در اين تحقيق از ET بدست آمده از معادله استاندارد پنمن -مانتيث فائو ٥٦ داده هاي oبه عنوان ورودي هاي SVM و ANN استفاده گرديد. نتايج نشان داد که SVM در هر سطح داده ورودي به مدل نتايج بهتري نسبت به ANN دارد. (٢٠٠٩) .Douglas et al در مطالعه اي بر روي تيپ هاي زمين هاي داراي پوشش فلوريدا، مدل هاي تخمين تبخير- تعرق پتانسيل تورک، پنمن و پريستلي-تيلور را با يکديگر مقايسه کردند. در اين مقايسه از ١٨ ايستگاه همديد با مدت زمان هاي متفاوت در چهار منطقه سطح آزاد آب ، تالاب ، پوشش چمن و باغات مرکبات استفاده شد. حاصل اين مقايسه ، تأييد روش پريستلي-تيلور در تخمين تبخير-تعرق پتانسيل در مقابل دو روش ديگر در مقياس روزانه بود. (٢٠١٢) .Adeloye et al در تحقيقي پيش بيني تبخير- تعرق مرجع توسط شبکه هاي عصبي خود سازمان دهنده مورد ارزيابي قراردادند. در اين مطالعه از داده هاي روزانه سينوپتيک بين سال هاي ٢٠٠٦-١٩٩٧ ايستگاه هواشناسي دانشگاه ادينبورگ 3 انگلستان به عنوان ورودي هاي مدل هاي شبکه عصبي SOM و تجربي استفاده شد. نتايج حاکي از توانايي بالاي شبکه هاي عصبي مصنوعي و معادله تجربي هارگريوز در تخمين صحيح تبخير-تعرق پتانسيل بوده است . بختياري و همکاران (١٣٨٨) دو مدل تبخير-
تعرق پنمن -مانتيث فائو ٥٦ و پنمن -مانتيث انجمن مهندسين عمران آمريکا ASCE را براي بازه هاي ساعتي در اقليم گرم خشک کرمان مورد ارزيابي قرار دادند. در اين مطالعه داده هاي خرجي از دو مدل با داده هاي به دست آمده از لايسيمتر وزني الکتروني طي ماه هاي فروردين لغايت شهريورماه ١٣٨٤ مورد مقايسه قرار گرفت . نتايج نشان داد که هر دو مدل در هر ماه مقدار کمتري تبخير-تعرق را نسبت به داده هاي لايسيمتر در مقياس ساعتي برآورد کرده اند.
شهابيفر و همکاران (١٣٨٩) در مطالعه اي به ارزيابي و مقايسه هفت روش تخمين تبخير-تعرق با داده هاي لايسيمتر در شرايط گلخانه اي براي گياه چمن پرداختند. در اين تحقيق کليه داده هاي هواشناسي به صورت دستي در محيط گلخانه موسسه تحقيقات گياه پزشکي کشور طي مدت زمان اسفندماه ١٣٨٥ تا خردادماه ١٣٨٦ به صورت روزانه برداشت گرديد. نتايج حاکي از اين بود که معادله پنمن -مانتيث فائو داراي بيش ترين دقت و روش بلاني-کريدل کمترين دقت را براي شرايط گلخانه اي دارا است . رحيمي خوب و محمودي (١٣٩٠) با مطالعه بر روي تبخير-تعرق واقعي حوضه معرف امامه به ارزيابي شبکه هاي عصبي مصنوعي در برآورد اين پارامتر با حداقل داده هاي ورودي هواشناسي و هيدرولوژيک پرداختند. ميزان تبخير-تعرق واقعي از طريق معادله بيلان آب حوضه محاسبه شد که شبکه عصبي مصنوعي با ورودي هاي کامل داده هاي هواشناسي بهترين نتايج را ارائه نمود. شاهدي و زارعي (١٣٩٠) به مقايسه عملکرد مدل هاي تجربي تبخير-تعرق بر روي اقليم مرطوب استان مازندران پرداختند.
اين محققان از چهار معادله تورنت وايت ، پنمن ، بلاني-کريدل و هارگريوز-ساماني به عنوان مدل هاي مورد ارزيابي و از خروجي هاي مدل فائو پنمن -مانتيث به عنوان مدل مبنا و داده هاي هواشناسي ١٠ ساله چهار ايستگاه اين استان استفاده شد. نتايج نشان دهنده عملکرد بهتر معادله بلاني-کريدل با کمترين خطا و بيش ترين همبستگي با مدل پنمن -مانتيث فائو بود. احمدزاده قره گويز و همکاران (١٣٨٩) دقت شبکه هاي عصبي مصنوعي، ANFIS و معادلات تجربي را در برآورد تبخير-تعرق گياه مرجع در مناطق بسيار خشک را مورد مطالعه قرار دادند. نتايج حاکي از برتري مدل ANFIS٤ با ورودي هاي دماي حداکثر، سرعت باد و تابش نسبت به ساير مدل ها بود. سلطاني و همکاران (١٣٩١) در مطالعه اي از آمار روزانه هواشناسي ٢٥ ساله (٢٠٠٨-١٩٨٤) چهار اقليم بسيار خشک ، خشک ، نيمه خشک و مرطوب ايران و معادله پنمن -مانتيث به عنوان معادله استاندارد تبخير-تعرق استفاده نمودند. نتايج نشان داد که مدل هاي کاهش داده شده پنمن -مانتيث نسبت به شبکه عصبي مصنوعي و روابط هارگريوز و تورک عملکرد بهتري دارند. مرادي و همکاران (١٣٩١) با استفاده از معادله استاندارد پنمن -مانتيث فائو تبخير-تعرق ساعتي گياه مرجع را براي منطقه خشک فريمان با استفاده از داده هاي سال هاي ٢٠٠٩-٢٠٠٨ محاسبه نمود و عملکرد مدل تبخير-تعرق ASCE و ANFIS را در برابر مدل پنمن -مانتيث فائو مورد آزمون قرارداد. نتايج نشان دهنده آن بود که مدل ANFIS با سه ورودي تابش ، رطوبت نسبي و دما داراي بهترين دقت و عملکرد است . اسلاميان و همکاران (٢٠٠٩) نيز توانايي روش SVM و ANN در مدل سازي تبخير-تعرق در محيط گلخانه را بررسي کردند.
در اين مدل سازي از داده هاي هواشناسي در درون گلخانه دانشگاه صنعتي اصفهان طي سپتامبر ٢٠٠٧ تا سپتامبر ٢٠٠٨ و داده هاي مربوط به تبخير-تعرق مرجع از داده هاي تشت تبخير استفاده شد.
نتايج نشان داد که هر دو روش مورد مقايسه با عملکرد خوبي مدل سازي انجام دادند اما SVM داراي عملکرد بالاتري بود. يکي از مشکلاتي که در بسياري از مناطق از جمله مناطق نيمه خشک وجود دارد، محدوديت دسترسي به انواع متغيرهاي هواشناسي است . هدف از انجام اين تحقيق بررسي و ارزيابي چندين روش داده محور براي مدل سازي و پيش بيني مقادير تبخير تعرق بر اساس حداقل داده هاي اقليمي در اقليم هاي نيمه خشک منتخب ايران بوده است . بنابراين لازم بوده که ترکيبات مختلف ورودي با ساختارهاي مختلف روش هاي داده محور مورد بررسي قرار گيرد و در نهايت مناسبترين روش براي مدل سازي در مناطق مطالعاتي با حداقل داده هاي مورد نياز ارائه گردد. همچنين در اين مطالعه سعي شده تا عملکرد روش هاي داده محور ANFIS،SVM و M٥ در برآورد تبخير-تعرق با حداقل داده هاي هواشناسي و معادلات تجربي پرکاربرد پريستلي-تيلور، هارگريوز- ساماني، مک گاينس - بردنه ، بلاني-کريدل و جنسن - هيز مورد بررسي قرار گرفته و مناسبترين آن ها براي مناطق مطالعاتي ارائه گردد.
٢- مواد و روش ها
٢-١- مشخصات ايستگاه هاي سينوپتيک مناطق منتخب نيمه خشک
در اين مطالعه از داده هاي هواشناسي هشت ايستگاه سينوپتيک که در طبقه بندي اقليمي دومارتن پيشرفته داراي اقليم نيمه خشک بودند استفاده گرديد. موقعيت ايستگاه هاي سينوپتيک منتخب در شکل ١ و مشخصات آن ها در جدول ١ ارائه شده است . داده هاي هواشناسي حداکثر و حداقل دما، رطوبت نسبي، سرعت باد و ساعات آفتابي در مقياس روزانه در دوره ٣٠ ساله (٢٠٠٩-١٩٨٠) از سازمان هواشناسي کشور جمع آوري گرديده است که ٢٤ سال از آن ها به عنوان داده هاي آموزش (٢٠٠٣-١٩٨٠) و ٦ سال به عنوان داده هاي آزمون (٢٠٠٩-٢٠٠٤) قرار داده شد.

٢-٢- روش هاي داده محور
٢-٢-١-شبکه تطبيقي مبتني بر سيستم استنتاج فازي (ANFIS)
اگرچه ANN يک ابزار قدرتمند براي مدل سازي پديده هاي مختلف طبيعي است ، اما نقص هايي هم در آن ديده ميشود. ترکيب شبکه هاي عصبي مصنوعي و منطق فازي ميتواند باعث هم کوشي در بهبود سرعت ، دامنه خطا و تطبيق پذيري گردد. ANFIS با ترکيب قواعد پايه سيستم فازي با توانايي يادگيري شبکه هاي عصبي توسعه يافته است . مدل ANFIS ارائه شده يک شبکه عصبي چند لايه بر پايه سيستم فازي با پنج لايه ميباشد. در اين ساختار، گره هاي ورودي و خروجي به ترتيب نشان دهنده وروديها و پاسخ هاي خروجي است و در لايه هاي مخفي گره هاي عملگر به عنوان توابع عضويت و قواعد وجود دارند. نمونه اين معماري در شکل ٢ نشان داده شده است که در آن دايره نشان دهنده گره هاي ثابت و مربع نشان دهنده گره هاي تطبيق پذير ميباشد. در اين شکل ، دو ورودي x و y و يک خروجي z نشان داده شده است .
در بسيــاري از مدل هاي فازي مدل Sugeno بدليل تفسيرپذيــري، قابليت محاسباتي بالا و ساخته شده توسط روش هاي بهينه و تطبيق پذير، در دامنه وسيعي بکار برده ميشود. براي اولين دستورالعمل مدل فازي Sugeno، يک مجموعــه قــاعده با دو قانون اگــر-آنگاه فازي بــه صورت ذيل ميتوان بررسي کرد (١٩٩٣ ,Shing and Jang):

که Ai و Bi مجموعه هاي فازي ابتدايي و pi و qi و ri پارامترهاي طراحي هستند که در هنگام فرآيند آموزش ، تعيين ميگردند. معماري ANFIS شامل پنج لايه ميباشد:
لايه ١: درجه عضويت هر متغير ورودي در هر گره از اين لايه تعيين ميشود که اين تابع عضويت در رابطه ١ نشان داده شده است .

که μAi و μBi ميتوانند هرگونه تابع عضويت فازي قبول کنند.
لايه ٢: اين لايه شامل گره هايي است که ضرب در سيگنال هاي ورودي ميگردد و نتايج را به خارج ميفرستد. هر گره در اين لايه
ميـــزان درجــه تطابق وروديهــا با قاعده (وزن ) را توسط رابطه ٢

اندازه گيري ميکند.

ايه ٣: iامين گره در اين لايه نسبت وزن iامين قاعده به مجموع وزن هاي قواعد (رابطه ٣) را محاسبه ميکند که مقدار نرمال شده وزن ها است .

لايه ٤: گره i در اين لايه سهم iامين قاعده را در ايجاد خروجي مدل محاسبه ميکند (رابطه ٤). پارامترهاي اين لايه را پارامترهاي برآيند نيز ميگويند.

لايه ٥: اين لايه را لايه خروجي نيز ميگويند و تنها گره آن خروجي نهايي است که مجموعه همه سيگنال هاي ورودي را محاسبه ميکند (رابطه ٥)


٢-٢-٢- مدل درختي M5
مدل M5 يکي از زيرشاخه هاي ماشين هاي آموزش (آموزش تجربي ) مرتبط با ساخت يا بازبيني مدل ها در تعداد زياد نمونه هاي آزمايشي است که به تخمين مسائل رايج مثل داده هاي گم شده و نويزها مي پردازد (١٩٩٢ ,Quinlan). اولين بار مدل M5 توسط (١٩٩٢) Quinlan ارائه گرديد و پس از آن توسط وانگ و وايتن (١٩٩٧) تحت نام 'M5 احيا و بهبود بخشيده شد. مجموعه داده هاي آموزشي T داراي همبستگي در يک برگ (زير مجموعه ) هستند يا توسط بعضي از آزمون ها مجموعه T به يکسري زيرمجموعه متناظر با خروجي هاي آزمون تقسيم ميگردند و همان مرحله بر روي زيرمجموعه ها به صورت بازگشتي اعمال مي گردد. اين تقسيم شديد، اغلب توليد يک ساختار دقيق مي کند که بايد به سمت عقب هرس گردد (به طور مثال جابجايي يک زيرمجموعه با يک برگ ). اولين قدم در ساخت يک مدل درختي، محاسبه انحراف معيار مقادير هدف در مجموعه داده هاي T است . برآيند آزمون ، تقسيم شدن مجموعه T است . اگر از انحراف معيار داده هاي هدف در مجموعه Ti به عنوان شاخص خطا استفاده گردد، انتظار مي رود که ميزان خطاي حاصل از آزمون کاهش يابد که اين انحراف معيار به شکل رابطه ٦ نوشته مي شود:

که T نشان دهنده يک دسته نمونه ها است که به برگ مي رسد؛ Ti نشان دهنده زيرمجموعه اي از نمونه ها است که داراي iامين خروجي از مجموعه بالقوه است و sd نشان دهنده انحراف معيار است .
براي تخمين خطاي يک مدل به دست آمده از داده هاي آموزشي،M٥ در ابتدا ميانگين باقيمانده هاي مدل را محاسبه مي نمايد. يک مدل خطي چند متغيره براي داده هاي موجود درون هر برگ يا گره درخت تصميم گيري با استفاده از تکنيک هاي رگرسيون استاندارد ساخته مي شود اما به جاي استفاده از همه پارامترهاي ورودي، اين مدل به پارامترهايي محصور مي گردد که توسط آزمون ها و يا مدل هاي خطي به زير درخت ها در گره ها ارجاع داده شده باشند. سپس اين مدل ها با استفاده از حذف پارامترها براي حداقل کردن خطاهاي تخميني، ساده مي گردند که به اين فرآيند ساده سازي ميگويند. M٥ با توجه به کمترين ميزان خطا، مدل ساده شده بالادستي يا مدل زير درخت را به عنوان مدل نهايي براي گره انتخاب مي کند و مدل هاي ديگر را حذف ميکند اين فرايند هرس ناميده ميشود. اگر مدل خطي انتخاب شده باشد زيردرخت موجود در اين گره به يک برگ تبديل مي گردد. مقدار پيش بينيشده در برگ ، مقادير محاسبه شده توسط مدل در آن برگ است . زماني که مقدار يک متغير با استفاده از يک مدل درختي پيش بيني شد، توسط فرآيند هموارسازي مقدار تعيين شده توسط مدل در مناسب ترين برگ اصلاح مي گردد تا مقادير پيش بينيشده در گره ها در طول مسيري از ريشه تا برگ انعکاس يابد. اگر متغيري در ادامه شاخه Si در زير درخت S باشد، ni تعداد موارد آموزشي در Si،PV)Si( مقدار پيش بينيشده در Si و مقدار تعيين شده توسط مدل در S (مقدار پيش بيني ذخيره شده ) است که توسط رابطه ٧ برآورد ميشود (١٩٩٢ ,Quinlan).

که در آن K ثابت هموارسازي است و مقدار آن ١٥ فرض ميشود.
٢-٢-٣-ماشين بردار خطي پشتيبان (SVM)
ماشين بردار پشتيبان (SVM)، يک روش طبقه بندي گرفته شده از تئوري آموزش آماري است و اولين بار توسط واپنيک ٥ معرفي گرديد.
SVMها ميتوانند براي مسائل مربوط به طبقه بندي و رگرسيون مورد استفاده قرار گيرند. ميتوان ماشين بردار پشتيبان را شبيه به شبکه هاي عصبي مصنوعي، مانند يک شبکه با دو لايه که وزن ها در اولين لايه غير خطي و در دومين لايه خطي هستند ارائه نمود. رگرسيون بردار پشتيبان (SVR) براي توصيف رگرسيون در SVMها استفاده ميگردد. تخمين رگرسيون با SVR، تخمين تابعي مطابق دسته داده هاي گرفته شده از است که xi بردارهاي ورودي، yi مقادير خروجي و n تعداد کل دسته داده ها ميباشد. تــابــع رگرسيون خطي استفاده شــده تابــع شماره ٨ ميباشد

که تابع غير خطي که توسط آن x به فضاي ويژه نگاشت ميگردد، b و  نشان دهنده بردار وزن و ضريبي است که بايد از داده ها تخمين زده شود. ضرايب b و با استفاده از کوچک سازي جمع ريسک هاي تجربي (اولين مولفه تابع ٩) و مولفه مرکب (دومين مولفه تابع ٩) تخمين زده ميشود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید