بخشی از مقاله
*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***
توسعه مدل ترکيبي رگرسيون چندگانه - تحليل مولفه ها و عامل هاي اصلي (MLR-PCA) در پيش بيني تبخير-تعرق مرجع ( مطالعه موردي : ايستگاه کرمان )
چکيده
تبخير-تعرق مرجع يکي از پارامترهاي مهم در مديريت آبياري گياهان است . تبخير-تعرق مرجع يک پديده چندمتغيره و پيچيده مي باشد که چنـدين متغير هيدرولوژيکي آن را تحت تاثير قرار مي دهند و معمولا بر مبناي پايگاه داده هاي هواشناسي چندساله با استفاده از مدل هاي نيمه تجربي برآورد مـي - شود. اهميت کاربردي تخمين دقيق تبخير- تعرق مرجع ، پيچيدگي و ناشناخته بودن رياضيات پديده ، لزوم استفاده از روش هاي جديد داده کاوي را نـشان مي دهد. به همين دليل در اين مقاله ، امکان برآورد تبخير-تعرق مرجع با استفاده از مدل ترکيبي رگرسيون چندگانه و تحليل مولفه هـاي اصـلي (MLR-PCA) بررسي شد و اهميت نسبي متغيرهاي موثر بر تبخير-تعرق مرجع با استفاده از تحليل عاملي مورد ارزيابي قرار گرفت . داده هاي هواشناسي روزانـه سال هاي ٢٠٠٥-١٩٩٦ ايستگاه سينوپتيک کرمان در اين تحليل استفاده شد. دو مولفه PC1 و PC2 که ٨٠ درصد واريانس کل را شـرح دادنـد بـه عنوان مولفه هاي اصلي و بقيه به عنوان اختلال در نظر گرفته شدند. با استفاده از مولفه هاي اصلي استخراج شده ، مدل رگرسـيون خطـي چندگانـه بـراي تخمين تبخير-تعرق مرجع ارائه شد. آماره t براي مقدار ثابت و براي هر يک از مولفه هاي اصلي تعيين گرديد که طبق نتايج ، تمامي ضرايب در سـطح ٥ درصد معني دار بودند. طبق نتايج ، PC1 اهميت بيشتري نسبت به مولفه ديگر دارد و در مرحله بعـدي PC2 داراي اهميـت مـي باشـد و بنـابراين مقـادير متغيرهاي شدت تابش ، رطوبت نسبي ، ساعات آفتابي ، دماي حداقل و دماي حداکثر براي برآورد تبخير-تعرق از اهميت بيشتري نسبت بـه سـاير متغيرهـا برخوردارند. مقادير ضريب همبستگي روش هاي MLR-PCA و MLR بر اساس مبناي مقايسه اي فائو-پنمن -مانتيـث در مرحلـه آزمـون ، بـه ترتيـب ٠.٨٢٠ و ٠.٨٤٠ بدست آمد که اين مقادير اختلاف چنداني نداشته و بيانگر توانايي روش PCA کاهش تعداد متغيرهاي مورد استفاده است .
واژه هاي کليدي : تبخير-تعرق مرجع ، فائو- پنمن - مانتيث ، رگرسيون چندگانه ، تحليل مولفه اصلي ، تحليل عاملي
مقدمه
تمامي پديده هاي هيدرولوژيکي به طور طبيعي پديده هاي تصادفي هستند. اين پديده ها را مي توان با استفاده از تعدادي متغير تعيين کـرد تکبه خيمرم-کتعن راقس پت يادن يمتهغيردرهالبواژييکدي گچرنددارباعييهمابسست گکي ـه زيتاحدـيت با تشــانثير چندين متغير عمل مي کند. به طـور کلـي ، متغيرهـايي کـه در فرآينـد تبخير-تعرق اثرگذارند، بارندگي ، سرعت باد، تابش خورشـيدي ، فـشار سطحي ، رطوبت ، سـاعات آفتـابي ، ابرنـاکي ، همرفـت ٤ (انتقـال افقـي گرماي محسوس و رطوبت )، پوشش زمين ، خصوصيات خاک و گياه و مقدار آب مي باشد (٢٢). برآورد دقيق نياز آبي گياهان يکي از راه هاي کاهش تلفات آب در مزارع مي باشد (٩). بنابراين شناخت تاثير نـسبي متغيرها بر تبخير-تعرق مرجع ٥ (ETo) در رابطـه بـا مـديريت آبيـاري بسيار مهم مي باشد. از آنجايي که اکثر متغيرهاي تاثيرگـذار در تمـامي ايستگاه ها اندازه گيري نمي شود، بنابراين تحليل داده هاي موجود بـراي درک اهميت نسبي اين متغيرها لازم است . يکي از روش هاي آمـاري چندمتغيره ٦ که امروزه به طور وسيعي مورد استفاده قرار مي گيرد، روش تحليل مولفه اصلي ١ (PCA) و تحليل عامل اصلي ٢ (PFA) مي باشد.
اين روش بين مجموعه اي بزرگ از داده هاي به ظاهر بي ارتباط ، رابطه خاصي را تحت يک مدل فرضي برقرار مي کند، سپس هر متغير را بـه صورت ترکيب خطي از فاکتورهاي پنهان تبديل مي کند. هدف اصـلي روش تحليل عاملي ، يافتن روش مختصر و به دست آوردن اطلاعـات مفيد از تعداد زيادي متغير مورد مشاهده بـا فراوانـي بالاسـت . در ايـن روش متغيرها به مجموعه هـاي کـوچکتري از عامـل هـا بـا کمتـرين اطلاعات از دست رفته و موثرترين اطلاعات مـوثر بـر پديـده تبـديل مي شوند. در تحليل عـاملي ، متغيرهـايي کـه در يـک عامـل تعريـف مي شوند، به يکديگر کاملا وابسته اند و اين وابستگي ، عامل را بوجـود مي آورد. از طرفي متغيرهاي هر عامل هـيچ وابـستگي بـه متغيرهـاي عامل هاي ديگر ندارد (١٤). در سال هاي اخير روش هاي آمـاري چنـد متغيره در موضوعات مرتبط با منابع آب ، هيدرولوژي و محـيط زيـست به طور گسترده اي استفاده شده اند. اخيرا، استفاده از روش هـاي PCA و PFA براي کاهش تعداد متغيرهاي ورودي و تفسير بهتر نتـايج بـه دست آمده از تحليل داده هاي کيفيت آب ، رواج يافتـه اسـت (٢٥). از روش PFA براي تعيين الگوهاي زماني و مکاني بـارش هـاي روزانـه (١)، شناخت عوامل موثر بر سـيلاب (١٣)، تعيـين عامـل هـاي مهـم اقليمي موثر بر دبي اوج (٣)، ارزيابي کيفيت زمـاني و مکـاني جريـان سطحي (٢٦)، پيش بينـي مکـاني محتـواي خـاک (٢٧)، پـيش بينـي جريان آب با استفاده از MLR-PCA (٢٤) و مطالعه شبکه ايـستگاه - هاي باران سنجي و تعيين ايستگاه هايي که مي توان آنها را حذف کـرد (٢٣)، استفاده شده است . همچنين در مطالعـات مختلـف ، روش هـاي PCA و PFA در استخراج الگوهاي زماني و مکاني بـراي متغيرهـاي مختلف هواشناسي به کار گرفته شدند (٢١). منطقـه بنـدي بارنـدگي زمستانه در ناحيه جنوب مرکزي ايران (استان هـاي فـارس ، بوشـهر و کهگيلويه و بويراحمـد) (١٠)، شناسـايي الگوهـاي زمـاني - مکـاني و پهنه بندي رژيم هاي دمايي ماهانه (٦) با استفاده از PCA انجام شـده است . با استفاده از داده هاي اقليمي شامل بارش ، نـم نـسبي ، سـاعات آفتابي ، ميانگين دما، ميانگين کمينه ي دما، ميـانگين بيـشينه ي دمـا و فشار تراز ايستگاه در ايستگاه سنندج و انجام تحليل مولفه هاي اصـلي روي اين داده ها، تيپ هـاي هـم ديـد هـوا بـه دسـت آمـد (٨). بـراي استخراج مولفه هاي اصلي و کاهش حجـم داده هـا در ارزيـابي امکـان پيش بيني دماي زمستانه سطح آب خلـيج فـارس بـا اسـتفاده از مـدل رگرسـيون چندگانـه (١١) و پـيش بينـي ميـانگين غلظـت روزانـه مونوکسيدکربن در هواي شهر تهـران بـا اسـتفاده از دو مـدل شـبکه عصبي مصنوعي و رگرسيون خطي چندمتغيره از روش PCA اسـتفاده شده است (١٢). در تمامي اين موارد استفاده از PCA منجر به بهبـود
دقت در تحليل نتايج و داده هاي آماري شده است و نتـايج تحقيقـات سابق نشان دهنده کارآئي مناسب تکنيک تحليل مولفـه هـا و عوامـل اصلي در مدلسازي پديده هاي هيدرولوژيکي و اقليم شناسـي مختلـف است . از تحليل مولفه هاي اصلي براي تشخيص چهره استفاده گرديده است و نتايج نشان داد که اين روش براي مجموعـه داده هـاي بـزرگ مناسب تر مي باشد و راندمان محاسباتي بالاتري را ايجاد مي کند (٣٢).
تحليل مولفه هاي اصلي به عنوان ابزاري براي کنتـرل فرآينـد آمـاري چندگانه تعيين خطا در مواردي که با حجم زيادي از اطلاعـات روبـرو هستيم ، استفاده گرديده است (١٨). قبل از طبقه بندي طيفي ستارگان با شبکه عصبي غيرخطي از PCA بـراي پـيش فرآيندسـازي داده هـا استفاده گرديده است و بيان شده است که اين فن باعث مـي شـود تـا پايداري شبکه ، طبقه بندي و همگرايي آن افزايش يابد (٣١). مطالعات مختلفي براي برآورد ETo با اسـتفاده از روش هـاي شـبکه عـصبي و رگرسيون خطي چندگانه و مقايسه بين اين روش ها انجام شـده اسـت (١٩ و ٢٨). عليرغم تحقيقات وسيعي کـه در زمينـه مدلـسازي ETo صورت گرفته است ، تاکنون از روش هاي PCA و PFA در ترکيب بـا روش رگرسيون خطي چندگانه براي برآورد ETo استفاده نشده است و به همين دليل در اين تحقيق ، امکان توسعه مـدل ترکيبـي رگرسـيون چندگانه - تحليل مولفه ها و عامل هاي اصلي در برآورد ETo، در قالـب مطالعه موردي ، ايستگاه سينوپتيک کرمان بررسي شد و اهميت نسبي متغيرهاي موثر بر تبخير-تعرق مرجع مورد ارزيابي قرار گرفـت . بـدين منظور با توجه به آمار و اطلاعـات در دسـترس و از اطلاعـات روزانـه ثبت شده در سازمان هواشناسي کشور در فاصله سال هاي ١٩٩٦ تـا ٢٠٠٥ ميلادي اسـتفاده گرديـد. در ادامـه مشخـصات منطقـه مـورد مطالعه و داده هاي تحقيق ، روش تحقيق و نتايج و بحـث ارائـه شـده است .
مواد و روش ها
منطقه مورد مطالعه و و داده هاي تحقيق
استان کرمان در جنوب شرقي ايران و بين ٥٣ درجه و ٢٦ دقيقه تا ٥٩ درجه و ٢٩ دقيقه طول شرقي و ٢٥ درجه و ٥٥ دقيقه تا ٣٢ درجه عرض شمالي قرار دارد و بـا ١٨٥٦٧٥ کيلومترمربـع وسـعت ، ١١ درصد از خاک کشورمان را به خود اختصاص داده است . بر اساس نتايج تحقيق دين پژوه (١٧)، که کل ايـران را بـه سـه اقلـيم بـسيار خشک ، خشک و نيمه خشک و مرطـوب تقـسيم بنـدي کـرده اسـت ، دسته بندي اقليمي براي ايستگاه سينوپتيک کرمان انجام گرفت که بر اساس آن ، اين ايستگاه داراي اقليم بـسيار خـشک مـي باشـد. در ايـن تحقيق ، از آمار و اطلاعات موجـود از ايـستگاه سـينوپتيک کرمـان در سازمان هواشناسي کـشور، اسـتفاده گرديـد. بـه دليـل نـاقص بـودن اطلاعات روزانه ثبت شده قبل از سال ١٩٩٦ و يا حتـي عـدم وجـود آمار در بعضي سال ها از اطلاعات روزانه ثبت شده سازمان هواشناسـي کشور بـين سـال هـاي ١٩٩٦ تـا ٢٠٠٥ مـيلادي اسـتفاده گرديـد. متغيرهاي مورد استفاده در ايـن تحقيـق دمـاي حـداقل ، دمـاي حداکثر ، دماي نقطه شبنم ، رطوبت نسبي (%)، سـرعت بـاد (m.s)، شدت تابش (day.MJ.m2) و سـاعات آفتـابي (hr) مـي باشـد.
سازمان فائو، معادلة فائو-پنمن - مانتيث ١ (F-P-M) را به عنوان روش استاندارد ساخت پايگاه داده هاي ETo در ايستگاه هاي فاقـد اطلاعـات لايسيمتري براي ارزيابي و واسنجي معادلات ديگر توصيه کرده است .
روش F-P-M داراي پاية فيزيکي قوي مي باشد و براي تخمين درست ETo در سرتاسر دنيا استفاده شده است (١٥). در ايـن تحقيـق ، روش F-P-M به عنوان روش استاندارد براي برآورد ETo و مقايسه نتايج در نظر گرفته شد. طبق تعريف استاندارد ارائه شـده بـراي تبخيـر-تعـرق مرجع در استفاده از معادله فائو - پنمن مانتیث باید از داده های ایستگاه هواشناسی مرجع استفاده شود .
تحقيق از آمار ايـستگاه سـينوپتيک اسـتفاده شـده و ايـن ايـستگاه در منطقه غير کشاورزي و بدون پوشش واقع است ، لذا از شـرايط مرجـع ، براي برآورد تبخير-تعرق برخوردار نيست ، بنابراين لازم است که قبـل از به کارگيري داده هاي اين ايستگاه نسبت به شرايط مرجـع تـصحيح شوند. بدين منظـور از روش توصـيه شـده در دسـتورالعمل 56-FAO
استفاده شد (١٥). به دليل آنکه وارد کـردن داده هـا بـه صـورت خـام باعث کاهش سرعت و دقت مـدل مـي شـود، در ايـن تحقيـق بـراي جلوگيري از ايجاد مشکلات عددي ، نرمال سازي داده ها در محـدوده ي ه١ا.ي٠ تسا ٩ي ٠ماانجي مموگرردف ات .تفآامدوهز انشجاممدگلرفبـت اساو اسز ٥٥٠٠ ددررصصــدد باقزيـده اده -ر مرحله آزمون مدل استفاده شد.
تحليل مولفه هاي اصلي
تحليل مولفه اصلي و تحليل عاملي از روش هاي آماري چندمتغيره هستند که مي توان از آنها براي کاهش پيچيـدگي تحليـل متغيرهـاي اوليه مسئله در مواردي که با حجم زيادي از اطلاعات روبرو هستيم و همچنين براي تفسير بهتر اطلاعات استفاده نمود (١٦). با ايـن روش ، متغيرهاي اوليه به مولفه هاي جديد و مستقل (بـا ضـرايب همبـستگي صفر براي هر دو مولفه ) تبديل مي شوند و سپس از اين مولفـه هـا بـه جاي متغيرهاي اوليه استفاده مي گردد. مولفه هاي جديد، ترکيبي خطي از متغيرهاي اوليه هستند (٢٠). به علاوه چون در تشکيل مولفه هـا از تمام متغيرها استفاده مي گردد، در نتيجه اطلاعات متغيرهاي اوليـه بـا کمترين تلفات به وسيله مولفه هاي حاصل ارائـه مـي شـود و باعـث از دست دادن جنبه هاي اطلاعاتي داده هاي اصلي نمي شـود (٢٢). روش کار براي ايجاد مولفه هاي اصلي و تعيين متغيرهاي اصلي بـه صـورت زير مي باشد.
الف - محاسبه فاکتور KMO
از آنجايي که روش هـاي PCA و PFA مـستلزم وجـود و قبـول فرضياتي دربـاره جامعـه مـورد مطالعـه نيـست ، از روش هـاي آمـاري ناپارامتري مي باشند که لازم است امکان استفاده از روش هاي مـذکور و نتايج به دست آمـده از آنهـا بـه وسـيله عامـل KMO٢ يـا آزمـون بارتلت ٣، مشخص شود. مقدار KMO بين صفر تا يک تغيير مي کنـد.
اين عامل با استفاده از ضرايب همبستگي ساده ٤ و جزئي ٥ طبق رابطه ١ محاسبه مي شود. در رابطه ١، rij و aij ضـرايب همبـستگي سـاده و جزئي بين متغيرهاي i و j است . با توجه بـه رابطـه ١ مقـادير بزرگتـر KMO مستلزم کوچک بودن ضرايب همبـستگي جزئـي مـي باشـد و بيانگر دقت محاسبات مربوطه ، با استفاده از PCA و PFA است .
در صورتي که اين عامل بزرگتـر از 0.5 بـه دسـت آيـد، نـشان - دهنده ي امکان اجراي اين دو روش بر داده هاي اصلي مي باشد (٢٩).
ب- استاندارد نمودن متغيرهاي ورودي : در اين مرحلـه داده هـاي ورودي بر اساس فرمول زير به نحوي استاندارد مـي شـوند کـه داراي ميانگين صفر و انحراف معيار يک باشند.
در اين فرمول ، Z معادل مقادير استاندارد شده داده ها، X داده هاي ورودي ، μ ميانگين هر متغير و σ نيز مقادير انحراف معيـار بـراي هـر متغير است (١٢).
ج- محاسبه ماتريس همبستگي (R) براي متغيرهاي اوليـه : ايـن ماتريس ، که ماتريسي متقارن است ، ميزان تغييرات در نمونه و ميـزان همبستگي P متغير را با هم نشان مي دهد. عضوهاي روي قطر اصلي ايـن مـاتريس ، واريـانس متغيرهـاي ورودي و بقيـه درايـه هـاي ايـن ماتريس ، کوواريانس بين متغيرهاي ورودي است . چون براي تـشکيل اين ماتريس از داده هاي استاندارد شده استفاده شده است ، بـه همـين دليل اين ماتريس ، معادل ماتريس همبستگي بـين متغيرهـاي ورودي است (١٢).
د- محاسبه مقادير ويژه (λ) و بردارهاي ويژه مربوطه از مـاتريس همبستگي : بدين منظور معادله زير حل مي شود:
IP يک ماتريس واحد با بعد P*P مي باشد. بنابراين مي تـوان p مقــدار ويــژه مرتــب شــده را بدســت آورد، بطوري که مجموع مقادير ويژه برابر بـا p باشـد. هـر مقـدار ويـژه بـا اطلاعات مربوط به آن (بردارهاي ويژه ) ويژگي هاي يک مولفه را ارائه مي دهد. هر مولفه نيز درصدي از اطلاعاتي که توسط متغيرهاي اوليـه بيان مي شود را دربرمي گيرد و معادل بـا بخـشي از اطلاعـات مـسئله است که به صورت عدد و رقم در متغيرهاي اوليه نهفته است . هر چـه کميت عددي مقادير ويژه بزرگتر باشد، بيـانگر ايـن اسـت کـه مولفـه ايجـادي از آن نيـز درصـد بيـشتري از اطلاعـات متغيرهـاي اوليـه را دربرمـي گيـرد (١٢). اولـين مولفـه بيـشترين واريـانس و آخـرين آن کمترين مقدار واريانس را نشان مي دهد. انتخاب چنـد مولفـه اول کـه بيشترين مقدار واريانس را دارند و به عنوان مولفه هاي اصـلي شـناخته مي شوند، از اساسي ترين اقدامات در تجزيه و تحليل مولفه هاي اصـلي مي باشد. با انتخاب چند مولفه اصلي اول ، ساير مولفه هـا از محاسـبات بعدي حذف مي شوند و بنابراين بايد دقـت زيـادي در انتخـاب آسـتانه حذف نمود. Screet plot يکي از روش هاي تـشخيص آسـتانه حـذف مي باشد که در آن مقادير ويژه در مقابل شماره مولفه ها رسم مي شـود
(١٠). در اين روش ، مرز بين مولفه هاي اصلي و غيراصلي محلي است که نمودار ميل به خطي شدن مي نمايد يعني محلي که مقادير ويژه در مقابل تغيير شماره مولفه ، تغيير چنداني ننمايد (١٠).
ه- اجراي چرخش مناسب روي ماتريس ضرايب مولفه هـا: چـون در تشکيل هر مولفه از تمام متغيرهاي اوليه استفاده مـي شـود، تفـسير مولفه ها مشکل خواهد بود. به اين دليل روش هايي براي تفسير ساده - تر مولفه ها به وجود آمده است . اين روش ها، همان چرخش مولفـه هـا هستند که به دو نوع چرخش عمودي و مايل تقسيم مي شوند. به دليل اينکه در روش چرخش عمودي ، استقلال بين مولفه ها حفظ مي شـود، اين نوع چرخش بيشتر مورد استفاده قرار مي گيرد. در مطالعات علمـي بيشتر از چرخش وريماکس استفاده مي شـود کـه يکـي از روش هـاي چرخش عمودي است (٣٠). اين روش نسبت به بقيه روش هـا نتـايج بهتري را ايجاد مي کند و به عنوان چرخش استاندارد توصيه مي گـردد.
استفاده از چرخش وريماکس براي تفـسير بهتـر نتـايج ، PFA ناميـده میشود . برای اجرای تحلیل مولفه های اصلی و تحلیل عامل اصلی از نرم افزار های اماری مختلفی میتوان بهره گرفت و در این تحقيق از نرم افـزار آمـاري ١٧ SPSS Statistic بـراي ايـن منظـور استفاده گرديد.
مدل رگرسيون خطي چند گانه در فرم ماتريسي را مـي تـوان بـه صورت معادله زير نشان داد:
در معادله ٤، β ماتريس ضـرايب رگرسـيون ، e مـاتريس خطـاي برازش و Y ماتريس پاسخ (متغيـر وابـسته ) و X مـاتريس متغيرهـاي مستقل مي باشند. با حل معادله ٤ بر حسب β خواهيم داشت :
که در رابطه ٥، ́X ترانهـاده مـاتريس X اسـت . بـراي محاسـبه معکوس لازم اسـت متغيرهـاي مـستقل همبـستگي زيـادي داشته باشند، زيرا در اين صورت ماتريس را نمي توان معکوس کرد و باعث افـزايش خطـا در اثـر گـرد کـردن داده هـا و محاسـبات مي شود. براي رفع اين مشکل بايد قبـل از سـاخت مـدل رگرسـيوني ، همبستگي بين متغيرهاي مستقل را از بين برد. در اين خصوص ، روش مناسب ، استفاده از تحليل مؤلفه هاي اصـلي روي متغيرهـاي مـستقل ورودي به مدل است . در اين تحقيق پس از رفع مشکل همبستگي در متغيرهاي مستقل ، مدلي مناسب با استفاده از روش رگرسـيون خطـي چندمتغيره براي پيش بينـي تبخيـر-تعـرق مرجـع توسـعه يافتـه و در محاسبات رگرسيوني از الگوريتم گام به گام ٢ استفاده شد. در اين روش ورود متغيرها به مدل رگرسيون به صورت مرحله اي ، از مهم ترين متغير تا کم اهميت ترين آنها، صورت مي گيرد. معيار ميزان اهميت متغيـر در مدل ، مقدار سطح معني داري يا آماره t متناظر با آن در جـدول آزمـون معني داري متغيرها است (٢ و ١٢). بررسي اوليه نـشان داد کـه بـين متغيرهاي ورودي مورد استفاده در اين تحقيق همبستگي معنـي داري وجود دارد که براي از بين بردن اين مـشکل ، از روش PCA اسـتفاده شد.
معيارهاي ارزيابي عملکرد
به منظور مقايسه و ارزيابي عملکـرد مـدل هـاي مـورد بررسـي از پارامترهاي ميانگين مربعات خطا٣ (RMSE)، خطاي مطلق ميانگين ٤ (MAE) و ضريب همبستگي (r) استفاده مي گردد. فرمول هـاي ارائـه شده براي اين پارامترها بصورت زير مي باشد:
در اين معادلات ، N تعداد نمونه ها، Pi معـادل مقـادير پـيش بينـي شده ETo از مـدل ، Oi مقـادير محاسـبه شـده ETo از روش F-P-M مي باشند. پارامترهاي RMSE و MAE هم بعد با پارامترهايي هستند که از آنها بدست آمده اند و r بدون بعد است .
پارامترهاي ذکر شده هيچ اطلاعـي در مـورد نحـوه توزيـع خطـا نمي دهند. به اين منظور براي ارزيـابي مـدل هـا از شـاخص ميـانگين قدرمطلق خطاي نسبي (MARE)1 و تحليل آسـتانه خطـا (TS)2 نيـز استفاده و نمودار پراکندگي خطاي مطلق نسبي نيز استفاده مـي گـردد.
اين دو معيار، نه تنها شاخص عملکرد را بـصورت جملاتـي از مقـادير برآوردشده ارائه مي دهند بلکـه توزيـع خطـا را نيـز نـشان مـي دهنـد.
شاخص TSX براي مقدار x درصد از برآوردها، نشان دهنده توزيع خطا در مقادير برآورد شده براي هر مدل مي باشد. اين شاخص که برحسب درصد تعريف مي شود براي مقادير مختلـف قـدرمطلق خطـاي نـسبي ارائه مي شود. مقدار TS براي x درصد از برآوردها طبق رابطـه ٨ بـه - دست مي آيد (٤):
که در آن Yx تعداد پيش بيني شده (از کل تعداد n) براي هر مقدار مطلق خطاي نسبي کمتر از x درصد مي باشد (٤).
نتايج و بحث
در ابتدا نتايج روش تحليل مولفه هاي اصلي ارائه شده و در ادامـه نتـايج تحليـل عـاملي ، رگرسـيون چندگانـه ترکيبـي و ارزش نــسبي متغيرهاي مستقل ارائه شده است .
پيش پردازش متغيرهـاي ورودي بـه مـدل رگرسـيوني بـا PCA
براي بررسي امکان اجـراي آنـاليز مولفـه هـاي اصـلي از آزمـون بارتلت استفاده شـد. مقـدار0.613=KMO امکـان اجـراي PCA را تأييد کرد. براي اجراي اين روش ، پس از استاندارد کـردن متغيرهـاي ورودي مـاتريس متقـارن همبـستگي از مرتبـه ٧ (معـادل بـا تعـداد متغيرهاي ورودي ) تشکيل شد که نتايج آن در جدول (١) ارائـه شـده است . با حل دستگاه معادله (٣)، ٧ مقدار ويـژه و بـه ازاي هـر مقـدار ويژه ٧ بردار ويژه ، حاصل مي شود که با اسـتفاده از آنهـا، مولفـه هـاي اصلي از متغيرهاي اوليه به دست مـي آيـد. مشخـصات هـر مولفـه در جدول (٢) آورده شده است . در جدول (٣) مقادير بردارهاي ويژه آمـده است که ضرايب هر مولفـه را بـراي محاسـبه آنهـا تعيـين مـي کنـد.
همانطور که در جدول (٢) نشان داده شده است ، مقـدار اولـين مولفـه برابر ٣.٧٦٨ مي باشد که ٥٣.٨٣٤ درصد از کل واريانس موجـود در سري داده ها را توجيه مي نمايـد. دومـين مقـدار ويـژه نيـز ٢٦.٣١٨ درصد از کل واريانس را توجيه مي نمايند و ايـن دو مولفـه حـدود ٨٠ درصد کل پراکندگي داده هاي اصلي را بيان مي کنند. بنـابراين ، تقريبـا مي توان دو و سه مولفه اول را به عنوان مولفه اصلي قلمـداد نمـود. در عين حال ، انتخاب آستانه حذف فقط بر اساس قضاوت تخميني دقيـق نبوده و لازم است که آزمون هاي ديگري نيـز انجـام گيـرد. هـدف از آزمون هاي بعدي ، پيدا کردن يک مبنـاي فيزيکـي بـراي هـر يـک از مولفه هاي اصلي مي باشد. براي پيدا نمودن آستانه حذف ، تعداد دو، سه و چهار مولفه اصلي (مولفه هاي داوطلب ) در نظر گرفته شـد و آزمـون لازم براي تشخيص تعداد مولفه هاي مطلوب براي نگهداري به عمـل آمد. براي اين منظور، عوامل بارگذاري ٣ مربوط به هر يک از مولفه هـا به روش وريماکس دوران داده شدند و وابستگي هر يک از مولفه هاي دوران داده شده به ETo مورد ارزيابي قرار گرفـت . در ايـن تحقيـق از (٤) آمده است . با توجه به جدول (٤)، ضرايب ٠.٧٢٦ و ٠.٦٥٤ بـه دوران دو مولفه اول نتايج مطلوبي به دست آمد که نتايج آن در جدول ترتيب بيانگر همبستگي مولفه اول و دوم با ETo مي باشـند. بنـابراين مولفه اول نسبت به مولفه اصلي دوم هميستگي بيشتري بـا ETo دارد و متغيرهايي که در اين مولفه بارگـذاري بزرگتـري دارنـد همبـستگي بيشتري را با ETo نشان مي دهند. مقـادير دوران داده شـده بارگـذاري مولفه اول نشان مي دهد که متغيرهاي شدت تـابش ، رطوبـت نـسبي ، دماي حداکثر و ساعات آفتابي همبستگي زيادي با تبخير-تعرق دارنـد و همبستگي بقيه عوامل (دماي حداقل ، دماي نقطـه شـبنم و سـرعت باد) در اين مولفه ، کم مي باشد. در مقابل ، بردارهـاي دوران داده شـده بارگذاري متناظر با مولفه دوم همبستگي زيادي بـا متغيرهـاي دمـاي نقطه شبنم ، سرعت باد و دماي حداقل دارد. در شـکل (١) بارگـذاري دو مولفه اول نشان داده شده است که با استفاده از بردارهـاي ويـژه از مولفه هاي اول و دوم جدول (٣) تشکيل شده اسـت . در اولـين مولفـه بيشترين بارگذاري ها مربوط به متغيرهاي دماي حداکثر، دماي حداقل ، رطوبت نسبي ، شدت تابش و ساعات آفتابي مـي باشـد. در مولفـه دوم بيشترين بارگذاري مربوط به متغير دماي نقطه شبنم مي باشد. با توجه به جدول (٣)، براي تشکيل مولفه اول بايـستي مقـادير متغيـر دمـاي حـداقل (Tmin) را در ضـريب ٠.٨٢٠، مقـادير متغيـر دمـاي حـداکثر (Tmax) را در ضريب ٠.٩٤٢ و به همين ترتيب مقادير بقيه متغيرها را در ضرايب مربوطه ضرب کرد. بدين صورت مولفه هايي حاصـل مـي شوند که مي توان از آنها به جاي متغيرهاي اوليه به عنوان ورودي بـه مدل رگرسيون استفاده نمود. طبق بحث انجام شده ، از بردارها ي ويژه به دست آمده در جدول (٣)، دو مولفه اصلي به صـورت روابـط (٩) و (١٠) استخراج گرديد. در ايـن روابـط متغيرهـاي به ترتيب بيانگر دماي حداقل ، دمـاي حـداکثر، دماي نقطه شبنم ، رطوبت نسبي ، سرعت باد و شدت تابش مي باشند.
ساخت مدل رگرسيوني
مقادير به دست آمده از PC1 و PC2 به عنوان متغيرهاي مستقل (برآوردکننـده ) وارد مـدل رگرسـيون خطـي چندگانـه گرديـد. معادلـه رگرسيون خطي چندگانه با وارد کـردن دو مولفـه اصـلي بـه صـورت معادله (١١) به دست آمد.
در اين روش آماره t براي مقدار ثابت و براي هـر يـک از مولفـه - هــاي PC1 و PC2 بــه ترتيــب برابــر ٥٠.١٣٧-، ١٥١.٠٠٦ و ٤٤.٣٢٦ تعيين گرديد. با استفاده از جدول t، بـراي سـطح معنـي دار ٥% و درجه آزادي ١٨٢٦، مقدار 1.645=t به دست مي آيد. مقايسه بين آماره ها و مقدار به دست آمده از جدول t نشان مي دهد که تمامي ضرايب در سطح ٥% معني دار مي باشند. بزرگي قدر مطلق آماره t نيـز اهميت آن را در مدل MLR-PCA نشان مـي دهـد. از ايـن ديـدگاه ، PC1 اهميت بيشتري نسبت به مولفه ديگـر دارد و در مرحلـه بعـدي ، PC2 داراي اهميت مي باشند. بنابراين مقادير متغيرهاي شدت تـابش ، رطوبت نسبي ، ساعات آفتابي ، دمـاي حـداقل و دمـاي حـداکثر بـراي برآورد ETo از اهميت بيشتري برخوردارند. همچنين به منظور مقايسه نتايج روش MLR-PCA بـا مقـادير حاصـل از روش MLR تمـامي متغيرهاي مورد استفاده در اين تحقيق وارد مدل رگرسـيوني و معادلـه (١٢) براي آن ارائه گرديد. مطابق معادله (١٢) مقـادير آمـاره t بـراي مقدار ثابت و براي هر يک از متغيرهاي دمـاي حـداکثر، سـرعت بـاد، شدت تابش ، رطوبت نسبي ، ساعات آفتابي ، دماي حداقل و دماي نقطه شبنم به ترتيب برابـر ٣٨.٣٧٨-، ٤٧.٧١٠، ٥١.٥٤٢، ٥١.٥٨٨، ٢٤.١٩٢، ٢٢.١٩٠-، ١٣.٨٤٥- و ٣٠.٩٥٣ تعيـــين گرديـــد.