بخشی از مقاله
*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***
مدل شبکه عصبی مصنوعی تبخیر ماهانه از تشت با استفاده از دادههاي هواشناسی- مطالعه موردي منطقه حاشیه دریاي خزر
چکیده
تبخیر یکی از مؤلفههاي اصلی چرخه آب در طبیعت بوده و تعیین دقیق آن براي بسیاري مطالعات مثل بیلان آبی حوزه، طرح ریزي و مدیریت منابع آب حائز اهمیت است. تبخیر به دلیل اثرات متقابل عوامل متعدد اقلیمی، پدیده پیچیده و غیر خطی است و لذا براي تخمین آن باید از مدلهاي پیشرفته استفاده کرد. در این تحقیق، هشت نوع ترکیب پارامترهاي هواشناسی بعنوان دادههاي ورودي براي برآورد تبخیر از تشت با استفاده از شبکههاي عصبی براي منطقه شمال کشور مورد بررسی قرار گرفت.
دادههاي اندازهگیري شده هواشناسی براي یک دوره ده ساله 1996) تا (2003 از 8 ایستگاه هواشناسی واقع در حاشیه دریاي خزر جمعآوري شد. نتایج نشان داد، پارامترهاي دماي بیشینه و کمینه هوا، رطوبت نسبی، سرعت باد و ساعات آفتابی، حداقل دادههاي هواشناسی براي برآورد تبخیر از تشت هستند. میانگین جذر مربع خطا (RMSE) و ضریب تعیین (R2) بین مقادیر بدست آمده از مدل شبکه عصبی با وروديهاي فوق و مقادیر واقعی به ترتیب 0/32 میلیمتر در روز و 0/93 بودند. ترسیم مقادیر برآورد شده و واقعی نشان داد، 76 درصد دادهها در محدوده ±15% خطا واقع میشوند.
کلمات کلیدي: تبخیر از تشت، شبکههاي عصبی مصنوعی،
-1 مقدمه
تبخیر یکی از فرآیندهاي اصلی گردش آب در طبیعت بوده و برآورد دقیق آن براي تعیین بیلان آبی حوزهها، برنامهریزي آبیاري و مدیریت منابع آب اساسی است. از تشتهاي تبخیر در مناطق زیادي در دنیا به عنوان وسیله اندازهگیري مستقیم تبخیر از سطح آب استفاده میشود و به علت سهولت تفسیر دادههاي آن در سراسر دنیا به عنوان شاخصی براي تعیین تبخیر از دریاچهها و مخازن آب کاربرد دارد .(Irmak et al., 2002) تشت تبخیر، ترکیب وزنی پارامترهاي دما، رطوبت هوا، سرعت باد و تابش خورشید را بر شدت تبخیر از سطح آب اندازهگیري میکند و همین ترکیب بر تبخیر و تعرق گیاهان موثر است .(Allen et al., 1998) از این رو همبستگی زیادي بین تبخیر از تشت و تبخیر و تعرق گیاهان وجود دارد .(Grismer et al., 2002) لذا با اعمال ضریبی در مقادیر تبخیر از تشت، تبخیر و تعرق گیاه با دقت خوبی برآورد میشود
.(Allen et al., 1998)
توزیع زمانی و مکانی ایستگاههاي تبخیر سنجی در بسیاري از مناطق دنیا و همچنین در ایران محدود است و خیلی از ایستگاهها تازه تأسیس بوده و فاقد آمارهاي دراز مدتاند. از طرفی توزیع مکانی این ایستگاهها در بیشتر مناطق در حدي نیست که بتوان تغییرات مکانی تبخیر از تشت را پهنهبندي کرد. ولی بر خلاف ایستگاههاي تبخیر سنجی، ایستگاههاي هواشناسی که در آن پارامترهاي مثل دما، رطوبت هوا و سرعت باد اندازه گیري میشوند، توزیع زمانی و مکانی بهتري دارند. از این رو روشهاي تحلیلی و تجربی زیادي براي پیشبینی تبخیر از سطح آزاد آب و تبخیر از تشت با استفاده از دادههاي هواشناسی ارائه شده است. شدت تبخیر تابعی از تابش رسیده به زمین، دما، رطوبت و سرعت باد است. تأثیر این پارامترها بر روي میزان تبخیر بصورت مستقل نیست بلکه تأتیرات متقابل بر همدیگر دارند، بطور مثال باد باعث تغییر رطوبت هوا شده و کاهش رطوبت، افزایش تبخیر را بدنبال دارد و در این شرایط دماي سطح تبخیر کاهش یافته و بر روي دما و رطوبت هوا تأثیر میگذارد.
Penman (1948) با ترکیب دو مؤلفه انرژي تابش خالص خورشید و مشخصات آیرودینامک هوا یک معادله تحلیلی براي برآورد تبخیر از سطح آب ارائه داد. این معادله به عنوان یک روش متداول براي تخمین پتانسیل تبخیر از سطح آزاد آب در مطالعات مهندسی منابع آب استفاده میشود. معادله پنمن نیاز به دادههاي اندازهگیري شده دماي هوا، تابش خالص خورشید، کمبود فشار بخار هوا و سرعت باد دارد. متأسفانه ایستگاههاي کمی وجود دارد که تمامی این پارامترها را اندازهگیري کند. در این شرایط لازم است، معادلات ساده و تجربی که دادههاي کمی نیاز داشته باشد، بررسی شود.
امکانات و تجهیزات اندازهگیري پارامترهاي هواشناسی در حوزههاي مختلف ایران متفاوت است. در برخی مناطق توزیع مکانی ایستگاههاي هواشناسی در حد مناسب بوده و در آنها پارامترهاي متعدد هواشناسی اندازهگیري میشود ولی در مناطق دور افتاده علاوه بر تراکم کم ایستگاههاي هواشناسی، فقط چند پارامتر ساده مثل دما و رطوبت هوا اندازهگیري میشوند. لذا لازم است در تدوین مدلهاي تبخیر از سطح آب، پارامترهاي مختلف هواشناسی از نظر نوع داده و تعداد وروديهاي آن مورد بررسی قرار گیرند. تدوین مدلهایی با تعداد ورودي کم و ساده هواشناسی براي تخمین تبخیر، این امکان را براي مناطق دور افتاده فراهم میکند تا حداقل ایستگاههاي هواشناسی ساده در آنها توسعه یافته تا بتوان تغییرات مکانی یک پدیده را بررسی کرد.
در سالهاي اخیر به دلیل پیچیدگی و روابط غیر خطی بین تبخیر و تعرق و عوامل موثر آن، توجهات زیادي به استفاده از مدلهاي شبکه عصبی شده است. این مدلها قادرند، یک نگاشت غیر خطی را با دقت خوبی انجام دهند. از جمله مدلهاي شبکه عصبی تبخیر و تعرق که نتایج بسیار مطلوبی داشتند، میتوان مدلهاي (2002) Kumar et al.، )2003) Sudheer et al.، (2007) Zanetti,، )2008a( Rahimikhoob و Rahimikhoob (2008b) را نام برد. در دهه اخیر، مدلهاي مختلف شبکه عصبی مصنوعی براي تخمین تبخیر از سطح آب با استفاده از دادههاي هواشناسی توسعه یافتند. دقت و کارایی این مدلها به نوع و تعداد ورودي آنها بستگی دارد. در این زمینه تحقیقات زیادي انجام شده است. Bruton et al. (2000) یک مدل شبکه عصبی براي تعیین تبخیر روزانه از تشت با استفاده از دادههاي روزانه اندازهگیري شده در ایستگاههاي هواشناسی تدوین کردند.
دادههاي ورودي مدل آنها شامل بارندگی، دما، رطوبت نسبی، تابش خورشید و سرعت باد بودند. ضریب تعیین و ریشه میانگین مربع خطاي مدل تدوین شده آنها بترتیب 0/71 و 1/1 میلیمتر در روز برآورد شده بود. Keskin and Terzi (2006) دادههاي ایستگاه هواشناسی نزدیک دریاچهاي در غرب ترکیه را براي تعیین تبخیر روزانه از تشت با استفاده از مدل شبکه عصبی مورد بررسی قرار دادند. نتایج تحقیق آنها نشان داد که بهترین ساختار مدل با 4 داده ورودي شامل دماي هوا، دماي سطح آب، تابش خورشید و فشار هوا بدست میآید و دادههاي سرعت باد و رطوبت نسبی هوا همبستگی کمی با شدت تبخیر در ناحیه مورد بررسی آنها دارند. ضریب تعیین و میانگین مربع خطاي مدل تدوین شده آنها بترتیب 0/77 و 1/61 میلیمتر در روز برآورد شدند. آنها نتایج مدل شبکه تدوین شده فوق را با نتایج روش پنمن مقایسه کرده و نشان دادند، نتایج حاصل از مدل شبکه عصبی همبستگی بیشتري با مقادیر اندازهگیري شده تبخیر از تشت نسبت به روش پنمن دارد.
هدف این تحقیق تعیین حداقل داده هواشناسی براي برآورد تبخیر از تشت با استفاده از مدلهاي شبکه عصبی براي منطقه حاشیه دریاي خزر است. ایستگاههاي هواشناسی منطقه فوق غیر خودکار بوده و دادههاي هواشناسی توسط دیدهبانان برداشت شده و بصورت دستی ثبت میگردد و لذا بروز خطا اجتناب ناپذیر است. خطاي متغیرهاي ورودي باعث انتشار خطا در نتیجه خروجی مدل میگردد. خطاي اندازهگیري پارامترهاي هواشناسی تصادفی بوده و در طی روزهاي مختلف، هم از نظر اندازه و هم از نظر علامت ثابت نیستند. یکی از خاصیتهاي این خطا، خنثی شدن آن توسط همدیگر در دورههاي زمانی طولانی است. از این رو در این تحقیق براي اطمینان بیشتر به صحت دادهها، متوسط ماهانه آنها استفاده شدند.
-2 مواد و روشها
-1-2 منطقه مورد مطالعه و منابع دادهها
منطقه حاشیه دریاي خزر واقع در شمال کشور، محدوده مورد مطالعه این تحقیق است. این منطقه داراي بارشهاي قابل ملاحظه و دماي معتدل است. بر اساس طبقه بندي اقلیمی دومارتن، نواحی غربی دریاي خزر بسیار مرطوب، نواحی مرکزي مرطوب و نواحی شرقی آن مدیترانهاي هستند. در این تحقیق آمارهاي هواشناسی 8 ایستگاه شامل آمل، آستارا، بابلسر، قائمشهر، نوشهر، رامسر، رشت و ساري به مدت 10 سال از سال 1996 تا 2005 جمعآوري شد. مشخصات جغرافیایی این ایستگاهها در جدول 1 و توزیع مکانی آنها در شکل 1 ملاحظه میشود. این ایستگاهها کل حاشیه دریاي خزر را پوشش میدهند و علاوه بر اندازهگیري پارامترهاي هواشناسی، مجهز به دستگاه تشت تبخیر نیز هستند. دماي بیشینه (Tmax) و کمینه روزانه هوا ( (Tmin، میانگین روزانه رطوبت نسبی هوا (RHmean) و سرعت باد (u) و ساعات واقعی روزانه آفتاب (n) پارامترهایی بودند که از ایستگاههاي فوق جمعآوري و متوسط ماهانه آنها بعنوان متغیرهاي ورودي مدلهاي شبکه عصبی استفاده شدند. همچنین متوسط ماهانه تبخیر از تشت، خروجی مدلها را تشکیل دادند.
-2-2 مدل شبکه عصبی مصنوعی
در این تحقیق از شبکه هاي چند لایه پیشرونده با الگوریتم آموزشی پس انتشار خطا که جزء روشهاي آموزش با ناظر است، استفاده شد.
ساختار این شبکه شامل یک لایه ورودي، یک لایه میانی و یک لایه خروجی است. در هر لایه یک یا چند عنصر پردازشگر (نرون) وجود دارد که با تمامی نرونهاي لایه بعدي با اتصالات وزندار بهم مربوط میشوند. بردار دادههاي ورودي مدل به نرونهاي لایه اول نگاشت میشوند و در این لایه هیچگونه پردازشی انجام نمیگیرد و نرونهاي لایه خروجی به بردار خروجی مدل نگاشت میگردند. تعداد نرونهاي لایههاي ورودي و خروجی بستگی به تعداد متغیرهاي ورودي و خروجی مدل دارد ولی انتخاب تعداد نرونهاي لایه میانی بصورت سعی و خطا تعیین میشود. در این بررسی، ساختارهاي مختلفی از پارامترهاي هواشناسی موثر بر تبخیر بعنوان ورودي مدلهاي شبکه عصبی مورد بررسی قرار گرفت و تبخیر اندازهگیري شده از تشت تبخیر، خروجی این مدلها را تشکیل داد. در شبکههاي عصبی، نرونهاي هر لایه به کلیه نرونهاي لایه قبل از طریق یک اتصال جهت دار مرتبط میشوند.
به هر یک از این اتصالات وزنی داده میشود که مقدار آن تعیین کننده تأثیر هر نرون بر روي نرون لایه خروجی است. مجموع وزنی مقادیر ورودي به هر نرون محاسبه و در یک تابع ریاضی قرار میگیرد و خروجی نرون از طرق این تابع محاسبه میشود. این تابع ریاضی را اصطلاحاً تابع تحریک، تابع آستانه و یا تابع انتقال نامند.
توابع سیگموئید (S) و تانژانت هیپربولیک (TH) رایجترین توابع هستند (Hornik et al., 1989) و در این تحقیق بهترین آن براي برآورد تبخیر تعیین شد.
وزنهاي ارتباط دهنده نرونهاي شبکه، با آموزش تعیین میشوند و در شبکههاي چند لایه از الگوریتم آموزش پس انتشار خطا استفاده میگردد. این الگوریتم داراي توابعی مختلف بوده که تفاوت آنها بر نحوه تنظیم وزنهاي ارتباط دهنده لایههاي شبکه عصبی است.
توابع لونبرگ مارکوارت(LM) 1 و کانجوگیت گرادیان(CG) 2 از رایجترین توابع آموزشاند Hagan and Menhaj, 1994) و .(Tan and Van Cauwenberghe, 1999 این توابع براي تعیین بهترین اوزان شبکه عصبی ارزیابی شدند و بهترین آن انتخاب شد.
در مرحله آموزش شبکه عصبی ابتدا مقادیر تصادفی براي وزنها انتخاب میشود و خروجی شبکه بدست میآید. خطاي بین خروجی شبکه با مقدار مطلوب آن به سمت عقب انتشار مییابد و بر این اساس، وزنها تعدیل میشوند. این فرایند تکرار مییابد تا خروجی شبکه به یک مقدار قابل قبولی برسد. در صورت تکرار زیاد فرایند آموزش، اوزان شبکه به صورتی تعدیل میشوند که فقط براي دادههایی که براي آموزش استفاده شدند، عملکرد خوبی دارند. ولی براي دادههایی که در آموزش شبکه از آنها استفاده نشده، عملکرد ضعیفی خواهند داشت. این اتفاق را آموزش بیش از حد گویند. براي جلوگیري از آموزش بیش از حد و تصمیم براي توقف مرحله آموزش از یک سري داده به عنوان دادههاي ارزیابی استفاده میشود. پس از هر بار تکرار فرایند یادگیري، شبکه با اوزان جدید براي دادههاي ارزیابی اجرا میشود. بطور معمول در مراحل اولیه آموزش، خطاي برآورد خروجی مدل براي دادههاي ارزیابی کاهش مییابد. ولی زمانی که آموزش بیش از حد دادهها اتفاق میافتد، این خطا افزایش مییابد. با شروع این خطا، آموزش دادهها متوقف شده و لذا وزنهاي شبکه در شرایط حداقل خطا براي دادههاي ارزیابی تعیین میشوند.
به عبارتی شبکه با استفاده از دادههاي آموزش و ارزیابی، آموزش میبینند. بعد از آموزش، شبکه با دادههایی که در آموزش و ارزیابی از آنها استفاده نشده، آزمایش شده و عملکرد آن با استفاده از شاخصهاي آماري بررسی میگردد. در این تحقیق، دادههاي سالهاي 1996 تا 2003 (در کل 768 داده براي 8 ایستگاه) براي آموزش و ارزیابی مدلهاي شبکه عصبی و دو سال باقیمانده 2004 و 2005 (در کل 192 داده براي 8 ایستگاه) به آزمون مدلها اختصاص یافتند. از میان دادههاي آموزش و ارزیابی، 70 درصد آن به آموزش و 30 درصد بقیه به ارزیابی شبکه اختصاص داده شدند.
در مرحله شروع این تحقیق، مدل شبکه عصبی با حداقل داده هواشناسی شامل دماي بیشینه و کمینه هوا و تابش بیرون زمینی3 ساخته شد و با نماد ANN1 نامگذاري گردید. تابش بیرون زمینی، داده اندازهگیري نیست بلکه براي هر روز معین و موقعیت مکانی با استفاده از معادله زیر تعیین میشود :(Allen et al., 1998)
در رابطه فوق، Ra تابش بیرون زمینی (مگاژول بر متر مربع در روز)،
GSC ثابت خورشیدي (برابر 0/0820 مگاژول بر متر مربع در روز)، dr معکوس فاصله نسبی زمین و خورشید4، ωs زاویه ساعتی غروب خورشید5 (رادیان)، ϕ عرض جغرافیایی (رادیان) و δ زاویه میل خورشید6 (رادیان) هستند. پارامترهاي dr وδ تابع روز شمار سال7 و ωs تابع عرض جغرافیایی و روز شمار سال هستند و براي تعیین آنها از روابط توصیه شده Allen et al. ( 1998) استفاده شد. پارامترRa اثر فصلی تابش خورشید را منعکس میکند، از این رو به عنوان یک ورودي ثابت در تمامی مدلهاي شبکه عصبی تدوین یافته در این تحقیق، استفاده شد. سپس با اضافه کردن دادههاي رطوبت نسبی هوا، سرعت باد و نسبت ساعات آفتابی روزانه ( ( nN به ورودي مدل ANN1 به ترتیبی که در جدول 2 آمده، مدلهاي ANN2، ANN3 و ANN4 ساخته شدند. این چنین ساختار ورودي دادهها به شناخت تأثیر داده هواشناسی بر روي شدت تبخیر کمک میکند. نسبت ساعات آفتابی روزانه، معرف ابرناکی هوا و شدت تابش رسیده به زمین است و بدیهی است بر شدت تبخیر موثر است. این پارامتر از نسبت ساعات واقعی آفتاب روزانه بر حداکثر ساعات آفتابی روزانه بدست میآید. حداکثر ساعات آفتابی روزانه تابعی از عرض جغرافیایی و موقع روز از سال است و با استفاده از معادله ارائه شده Allen et al. (1998) محاسبه شد. ورودي مدلهاي ANN5، ANN6 و ANN7 با اضافه شدن ترکیبهاي دوتایی پارامترهاي رطوبت نسبی هوا، سرعت باد و نسبت ساعات آفتابی روزانه به مدل ANN1 ساخته شدند و سرانجام ورودي آخرین مدل (ANN8) با ترکیب تمامی پارامترهاي هواشناسی فوق آموزش و ارزیابی گردید.
-3-2 شاخصهاي آماري عملکرد مدلهاي شبکههاي عصبی
تعیین میزان دقت و چگونگی عملکرد مدلهاي شبکههاي عصبی طراحی شده در این تحقیق، با استفاده از شاخصهاي کمی آماري و ترسیم نمودار انجام شد. آمارههاي ضریب تعیین (R2)، ریشه میانگین مربعات خطا (RMSE) و میانگین انحراف خطا (MBE) شاخصهاي مورد استفاده بودند:
در روابط فوق، Pi مقادیر برآورد شده مدل، متوسط مقادیر برآورد شده مدل، Oi مقادیر واقعی، متوسط مقادیر واقعی و N تعداد مشاهداتاند. علاوه بر شاخصهاي فوق، با رسم پراکنش مقادیر مشاهده شده در برابر مقادیر برآورد شده همراه با ترسیم دو خط ±15% خطا پیرامون بهترین خط برازش (خط(1:1، چگونگی مدلها ارزیابی شدند.