مقاله توسعه مدل ترکیبی رگرسیون چندگانه – تحلیل مولفه ها و عامل های اصلی (MLR-PCA) در پیش بینی تبخیر-تعرق مرجع ( مطالعه موردی : ایستگاه کرمان )

word قابل ویرایش
22 صفحه
دسته : اطلاعیه ها
12700 تومان
127,000 ریال – خرید و دانلود

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

توسعه مدل ترکیبی رگرسیون چندگانه – تحلیل مولفه ها و عامل های اصلی (MLR-PCA) در پیش بینی تبخیر-تعرق مرجع ( مطالعه موردی : ایستگاه کرمان )

چکیده
تبخیر-تعرق مرجع یکی از پارامترهای مهم در مدیریت آبیاری گیاهان است . تبخیر-تعرق مرجع یک پدیده چندمتغیره و پیچیده می باشد که چنـدین متغیر هیدرولوژیکی آن را تحت تاثیر قرار می دهند و معمولا بر مبنای پایگاه داده های هواشناسی چندساله با استفاده از مدل های نیمه تجربی برآورد مـی – شود. اهمیت کاربردی تخمین دقیق تبخیر- تعرق مرجع ، پیچیدگی و ناشناخته بودن ریاضیات پدیده ، لزوم استفاده از روش های جدید داده کاوی را نـشان می دهد. به همین دلیل در این مقاله ، امکان برآورد تبخیر-تعرق مرجع با استفاده از مدل ترکیبی رگرسیون چندگانه و تحلیل مولفه هـای اصـلی (MLR-PCA) بررسی شد و اهمیت نسبی متغیرهای موثر بر تبخیر-تعرق مرجع با استفاده از تحلیل عاملی مورد ارزیابی قرار گرفت . داده های هواشناسی روزانـه سال های ٢٠٠۵-١٩٩۶ ایستگاه سینوپتیک کرمان در این تحلیل استفاده شد. دو مولفه PC1 و PC2 که ٨٠ درصد واریانس کل را شـرح دادنـد بـه عنوان مولفه های اصلی و بقیه به عنوان اختلال در نظر گرفته شدند. با استفاده از مولفه های اصلی استخراج شده ، مدل رگرسـیون خطـی چندگانـه بـرای تخمین تبخیر-تعرق مرجع ارائه شد. آماره t برای مقدار ثابت و برای هر یک از مولفه های اصلی تعیین گردید که طبق نتایج ، تمامی ضرایب در سـطح ۵ درصد معنی دار بودند. طبق نتایج ، PC1 اهمیت بیشتری نسبت به مولفه دیگر دارد و در مرحله بعـدی PC2 دارای اهمیـت مـی باشـد و بنـابراین مقـادیر متغیرهای شدت تابش ، رطوبت نسبی ، ساعات آفتابی ، دمای حداقل و دمای حداکثر برای برآورد تبخیر-تعرق از اهمیت بیشتری نسبت بـه سـایر متغیرهـا برخوردارند. مقادیر ضریب همبستگی روش های MLR-PCA و MLR بر اساس مبنای مقایسه ای فائو-پنمن -مانتیـث در مرحلـه آزمـون ، بـه ترتیـب ٠.٨٢٠ و ٠.٨۴٠ بدست آمد که این مقادیر اختلاف چندانی نداشته و بیانگر توانایی روش PCA کاهش تعداد متغیرهای مورد استفاده است .
واژه های کلیدی : تبخیر-تعرق مرجع ، فائو- پنمن – مانتیث ، رگرسیون چندگانه ، تحلیل مولفه اصلی ، تحلیل عاملی

مقدمه
تمامی پدیده های هیدرولوژیکی به طور طبیعی پدیده های تصادفی هستند. این پدیده ها را می توان با استفاده از تعدادی متغیر تعیین کـرد تکبه خیمرم-کتعن راقس پت یادن یمتهغیردرهالبواژییکدی گچرنددارباعییهمابسست گکی ـه زیتاحدـیت با تشــانثیر چندین متغیر عمل می کند. به طـور کلـی ، متغیرهـایی کـه در فرآینـد تبخیر-تعرق اثرگذارند، بارندگی ، سرعت باد، تابش خورشـیدی ، فـشار سطحی ، رطوبت ، سـاعات آفتـابی ، ابرنـاکی ، همرفـت ۴ (انتقـال افقـی گرمای محسوس و رطوبت )، پوشش زمین ، خصوصیات خاک و گیاه و مقدار آب می باشد (٢٢). برآورد دقیق نیاز آبی گیاهان یکی از راه های کاهش تلفات آب در مزارع می باشد (٩). بنابراین شناخت تاثیر نـسبی متغیرها بر تبخیر-تعرق مرجع ۵ (ETo) در رابطـه بـا مـدیریت آبیـاری بسیار مهم می باشد. از آنجایی که اکثر متغیرهای تاثیرگـذار در تمـامی ایستگاه ها اندازه گیری نمی شود، بنابراین تحلیل داده های موجود بـرای درک اهمیت نسبی این متغیرها لازم است . یکی از روش های آمـاری چندمتغیره ۶ که امروزه به طور وسیعی مورد استفاده قرار می گیرد، روش تحلیل مولفه اصلی ١ (PCA) و تحلیل عامل اصلی ٢ (PFA) می باشد.
این روش بین مجموعه ای بزرگ از داده های به ظاهر بی ارتباط ، رابطه خاصی را تحت یک مدل فرضی برقرار می کند، سپس هر متغیر را بـه صورت ترکیب خطی از فاکتورهای پنهان تبدیل می کند. هدف اصـلی روش تحلیل عاملی ، یافتن روش مختصر و به دست آوردن اطلاعـات مفید از تعداد زیادی متغیر مورد مشاهده بـا فراوانـی بالاسـت . در ایـن روش متغیرها به مجموعه هـای کـوچکتری از عامـل هـا بـا کمتـرین اطلاعات از دست رفته و موثرترین اطلاعات مـوثر بـر پدیـده تبـدیل می شوند. در تحلیل عـاملی ، متغیرهـایی کـه در یـک عامـل تعریـف می شوند، به یکدیگر کاملا وابسته اند و این وابستگی ، عامل را بوجـود می آورد. از طرفی متغیرهای هر عامل هـیچ وابـستگی بـه متغیرهـای عامل های دیگر ندارد (١۴). در سال های اخیر روش های آمـاری چنـد متغیره در موضوعات مرتبط با منابع آب ، هیدرولوژی و محـیط زیـست به طور گسترده ای استفاده شده اند. اخیرا، استفاده از روش هـای PCA و PFA برای کاهش تعداد متغیرهای ورودی و تفسیر بهتر نتـایج بـه دست آمده از تحلیل داده های کیفیت آب ، رواج یافتـه اسـت (٢۵). از روش PFA برای تعیین الگوهای زمانی و مکانی بـارش هـای روزانـه (١)، شناخت عوامل موثر بر سـیلاب (١٣)، تعیـین عامـل هـای مهـم اقلیمی موثر بر دبی اوج (٣)، ارزیابی کیفیت زمـانی و مکـانی جریـان سطحی (٢۶)، پیش بینـی مکـانی محتـوای خـاک (٢٧)، پـیش بینـی جریان آب با استفاده از MLR-PCA (٢۴) و مطالعه شبکه ایـستگاه – های باران سنجی و تعیین ایستگاه هایی که می توان آنها را حذف کـرد (٢٣)، استفاده شده است . همچنین در مطالعـات مختلـف ، روش هـای PCA و PFA در استخراج الگوهای زمانی و مکانی بـرای متغیرهـای مختلف هواشناسی به کار گرفته شدند (٢١). منطقـه بنـدی بارنـدگی زمستانه در ناحیه جنوب مرکزی ایران (استان هـای فـارس ، بوشـهر و کهگیلویه و بویراحمـد) (١٠)، شناسـایی الگوهـای زمـانی – مکـانی و پهنه بندی رژیم های دمایی ماهانه (۶) با استفاده از PCA انجام شـده است . با استفاده از داده های اقلیمی شامل بارش ، نـم نـسبی ، سـاعات آفتابی ، میانگین دما، میانگین کمینه ی دما، میـانگین بیـشینه ی دمـا و فشار تراز ایستگاه در ایستگاه سنندج و انجام تحلیل مولفه های اصـلی روی این داده ها، تیپ هـای هـم دیـد هـوا بـه دسـت آمـد (٨). بـرای استخراج مولفه های اصلی و کاهش حجـم داده هـا در ارزیـابی امکـان پیش بینی دمای زمستانه سطح آب خلـیج فـارس بـا اسـتفاده از مـدل رگرسـیون چندگانـه (١١) و پـیش بینـی میـانگین غلظـت روزانـه مونوکسیدکربن در هوای شهر تهـران بـا اسـتفاده از دو مـدل شـبکه عصبی مصنوعی و رگرسیون خطی چندمتغیره از روش PCA اسـتفاده شده است (١٢). در تمامی این موارد استفاده از PCA منجر به بهبـود
دقت در تحلیل نتایج و داده های آماری شده است و نتـایج تحقیقـات سابق نشان دهنده کارآئی مناسب تکنیک تحلیل مولفـه هـا و عوامـل اصلی در مدلسازی پدیده های هیدرولوژیکی و اقلیم شناسـی مختلـف است . از تحلیل مولفه های اصلی برای تشخیص چهره استفاده گردیده است و نتایج نشان داد که این روش برای مجموعـه داده هـای بـزرگ مناسب تر می باشد و راندمان محاسباتی بالاتری را ایجاد می کند (٣٢).
تحلیل مولفه های اصلی به عنوان ابزاری برای کنتـرل فرآینـد آمـاری چندگانه تعیین خطا در مواردی که با حجم زیادی از اطلاعـات روبـرو هستیم ، استفاده گردیده است (١٨). قبل از طبقه بندی طیفی ستارگان با شبکه عصبی غیرخطی از PCA بـرای پـیش فرآیندسـازی داده هـا استفاده گردیده است و بیان شده است که این فن باعث مـی شـود تـا پایداری شبکه ، طبقه بندی و همگرایی آن افزایش یابد (٣١). مطالعات مختلفی برای برآورد ETo با اسـتفاده از روش هـای شـبکه عـصبی و رگرسیون خطی چندگانه و مقایسه بین این روش ها انجام شـده اسـت (١٩ و ٢٨). علیرغم تحقیقات وسیعی کـه در زمینـه مدلـسازی ETo صورت گرفته است ، تاکنون از روش های PCA و PFA در ترکیب بـا روش رگرسیون خطی چندگانه برای برآورد ETo استفاده نشده است و به همین دلیل در این تحقیق ، امکان توسعه مـدل ترکیبـی رگرسـیون چندگانه – تحلیل مولفه ها و عامل های اصلی در برآورد ETo، در قالـب مطالعه موردی ، ایستگاه سینوپتیک کرمان بررسی شد و اهمیت نسبی متغیرهای موثر بر تبخیر-تعرق مرجع مورد ارزیابی قرار گرفـت . بـدین منظور با توجه به آمار و اطلاعـات در دسـترس و از اطلاعـات روزانـه ثبت شده در سازمان هواشناسی کشور در فاصله سال های ١٩٩۶ تـا ٢٠٠۵ میلادی اسـتفاده گردیـد. در ادامـه مشخـصات منطقـه مـورد مطالعه و داده های تحقیق ، روش تحقیق و نتایج و بحـث ارائـه شـده است .

مواد و روش ها
منطقه مورد مطالعه و و داده های تحقیق
استان کرمان در جنوب شرقی ایران و بین ۵٣ درجه و ٢۶ دقیقه تا ۵٩ درجه و ٢٩ دقیقه طول شرقی و ٢۵ درجه و ۵۵ دقیقه تا ٣٢ درجه عرض شمالی قرار دارد و بـا ١٨۵۶٧۵ کیلومترمربـع وسـعت ، ١١ درصد از خاک کشورمان را به خود اختصاص داده است . بر اساس نتایج تحقیق دین پژوه (١٧)، که کل ایـران را بـه سـه اقلـیم بـسیار خشک ، خشک و نیمه خشک و مرطـوب تقـسیم بنـدی کـرده اسـت ، دسته بندی اقلیمی برای ایستگاه سینوپتیک کرمان انجام گرفت که بر اساس آن ، این ایستگاه دارای اقلیم بـسیار خـشک مـی باشـد. در ایـن تحقیق ، از آمار و اطلاعات موجـود از ایـستگاه سـینوپتیک کرمـان در سازمان هواشناسی کـشور، اسـتفاده گردیـد. بـه دلیـل نـاقص بـودن اطلاعات روزانه ثبت شده قبل از سال ١٩٩۶ و یا حتـی عـدم وجـود آمار در بعضی سال ها از اطلاعات روزانه ثبت شده سازمان هواشناسـی کشور بـین سـال هـای ١٩٩۶ تـا ٢٠٠۵ مـیلادی اسـتفاده گردیـد. متغیرهای مورد استفاده در ایـن تحقیـق دمـای حـداقل ، دمـای حداکثر ، دمای نقطه شبنم ، رطوبت نسبی (%)، سـرعت بـاد (m.s)، شدت تابش (day.MJ.m2) و سـاعات آفتـابی (hr) مـی باشـد.
سازمان فائو، معادله فائو-پنمن – مانتیث ١ (F-P-M) را به عنوان روش استاندارد ساخت پایگاه داده های ETo در ایستگاه های فاقـد اطلاعـات لایسیمتری برای ارزیابی و واسنجی معادلات دیگر توصیه کرده است .
روش F-P-M دارای پایه فیزیکی قوی می باشد و برای تخمین درست ETo در سرتاسر دنیا استفاده شده است (١۵). در ایـن تحقیـق ، روش F-P-M به عنوان روش استاندارد برای برآورد ETo و مقایسه نتایج در نظر گرفته شد. طبق تعریف استاندارد ارائه شـده بـرای تبخیـر-تعـرق مرجع در استفاده از معادله فائو – پنمن مانتیث باید از داده های ایستگاه هواشناسی مرجع استفاده شود .
تحقیق از آمار ایـستگاه سـینوپتیک اسـتفاده شـده و ایـن ایـستگاه در منطقه غیر کشاورزی و بدون پوشش واقع است ، لذا از شـرایط مرجـع ، برای برآورد تبخیر-تعرق برخوردار نیست ، بنابراین لازم است که قبـل از به کارگیری داده های این ایستگاه نسبت به شرایط مرجـع تـصحیح شوند. بدین منظـور از روش توصـیه شـده در دسـتورالعمل ۵۶-FAO
استفاده شد (١۵). به دلیل آنکه وارد کـردن داده هـا بـه صـورت خـام باعث کاهش سرعت و دقت مـدل مـی شـود، در ایـن تحقیـق بـرای جلوگیری از ایجاد مشکلات عددی ، نرمال سازی داده ها در محـدوده ی ه١ا.ی٠ تسا ٩ی ٠ماانجی مموگرردف ات .تفآامدوهز انشجاممدگلرفبـت اساو اسز ۵۵٠٠ ددررصصــدد باقزیـده اده -ر مرحله آزمون مدل استفاده شد.

تحلیل مولفه های اصلی
تحلیل مولفه اصلی و تحلیل عاملی از روش های آماری چندمتغیره هستند که می توان از آنها برای کاهش پیچیـدگی تحلیـل متغیرهـای اولیه مسئله در مواردی که با حجم زیادی از اطلاعات روبرو هستیم و همچنین برای تفسیر بهتر اطلاعات استفاده نمود (١۶). با ایـن روش ، متغیرهای اولیه به مولفه های جدید و مستقل (بـا ضـرایب همبـستگی صفر برای هر دو مولفه ) تبدیل می شوند و سپس از این مولفـه هـا بـه جای متغیرهای اولیه استفاده می گردد. مولفه های جدید، ترکیبی خطی از متغیرهای اولیه هستند (٢٠). به علاوه چون در تشکیل مولفه هـا از تمام متغیرها استفاده می گردد، در نتیجه اطلاعات متغیرهای اولیـه بـا کمترین تلفات به وسیله مولفه های حاصل ارائـه مـی شـود و باعـث از دست دادن جنبه های اطلاعاتی داده های اصلی نمی شـود (٢٢). روش کار برای ایجاد مولفه های اصلی و تعیین متغیرهای اصلی بـه صـورت زیر می باشد.
الف – محاسبه فاکتور KMO
از آنجایی که روش هـای PCA و PFA مـستلزم وجـود و قبـول فرضیاتی دربـاره جامعـه مـورد مطالعـه نیـست ، از روش هـای آمـاری ناپارامتری می باشند که لازم است امکان استفاده از روش های مـذکور و نتایج به دست آمـده از آنهـا بـه وسـیله عامـل KMO٢ یـا آزمـون بارتلت ٣، مشخص شود. مقدار KMO بین صفر تا یک تغییر می کنـد.
این عامل با استفاده از ضرایب همبستگی ساده ۴ و جزئی ۵ طبق رابطه ١ محاسبه می شود. در رابطه ١، rij و aij ضـرایب همبـستگی سـاده و جزئی بین متغیرهای i و j است . با توجه بـه رابطـه ١ مقـادیر بزرگتـر KMO مستلزم کوچک بودن ضرایب همبـستگی جزئـی مـی باشـد و بیانگر دقت محاسبات مربوطه ، با استفاده از PCA و PFA است .

در صورتی که این عامل بزرگتـر از ۰٫۵ بـه دسـت آیـد، نـشان – دهنده ی امکان اجرای این دو روش بر داده های اصلی می باشد (٢٩).
ب- استاندارد نمودن متغیرهای ورودی : در این مرحلـه داده هـای ورودی بر اساس فرمول زیر به نحوی استاندارد مـی شـوند کـه دارای میانگین صفر و انحراف معیار یک باشند.

در این فرمول ، Z معادل مقادیر استاندارد شده داده ها، X داده های ورودی ، μ میانگین هر متغیر و σ نیز مقادیر انحراف معیـار بـرای هـر متغیر است (١٢).
ج- محاسبه ماتریس همبستگی (R) برای متغیرهای اولیـه : ایـن ماتریس ، که ماتریسی متقارن است ، میزان تغییرات در نمونه و میـزان همبستگی P متغیر را با هم نشان می دهد. عضوهای روی قطر اصلی ایـن مـاتریس ، واریـانس متغیرهـای ورودی و بقیـه درایـه هـای ایـن ماتریس ، کوواریانس بین متغیرهای ورودی است . چون برای تـشکیل این ماتریس از داده های استاندارد شده استفاده شده است ، بـه همـین دلیل این ماتریس ، معادل ماتریس همبستگی بـین متغیرهـای ورودی است (١٢).
د- محاسبه مقادیر ویژه (λ) و بردارهای ویژه مربوطه از مـاتریس همبستگی : بدین منظور معادله زیر حل می شود:

IP یک ماتریس واحد با بعد P*P می باشد. بنابراین می تـوان p مقــدار ویــژه مرتــب شــده را بدســت آورد، بطوری که مجموع مقادیر ویژه برابر بـا p باشـد. هـر مقـدار ویـژه بـا اطلاعات مربوط به آن (بردارهای ویژه ) ویژگی های یک مولفه را ارائه می دهد. هر مولفه نیز درصدی از اطلاعاتی که توسط متغیرهای اولیـه بیان می شود را دربرمی گیرد و معادل بـا بخـشی از اطلاعـات مـسئله است که به صورت عدد و رقم در متغیرهای اولیه نهفته است . هر چـه کمیت عددی مقادیر ویژه بزرگتر باشد، بیـانگر ایـن اسـت کـه مولفـه ایجـادی از آن نیـز درصـد بیـشتری از اطلاعـات متغیرهـای اولیـه را دربرمـی گیـرد (١٢). اولـین مولفـه بیـشترین واریـانس و آخـرین آن کمترین مقدار واریانس را نشان می دهد. انتخاب چنـد مولفـه اول کـه بیشترین مقدار واریانس را دارند و به عنوان مولفه های اصـلی شـناخته می شوند، از اساسی ترین اقدامات در تجزیه و تحلیل مولفه های اصـلی می باشد. با انتخاب چند مولفه اصلی اول ، سایر مولفه هـا از محاسـبات بعدی حذف می شوند و بنابراین باید دقـت زیـادی در انتخـاب آسـتانه حذف نمود. Screet plot یکی از روش های تـشخیص آسـتانه حـذف می باشد که در آن مقادیر ویژه در مقابل شماره مولفه ها رسم می شـود
(١٠). در این روش ، مرز بین مولفه های اصلی و غیراصلی محلی است که نمودار میل به خطی شدن می نماید یعنی محلی که مقادیر ویژه در مقابل تغییر شماره مولفه ، تغییر چندانی ننماید (١٠).
ه- اجرای چرخش مناسب روی ماتریس ضرایب مولفه هـا: چـون در تشکیل هر مولفه از تمام متغیرهای اولیه استفاده مـی شـود، تفـسیر مولفه ها مشکل خواهد بود. به این دلیل روش هایی برای تفسیر ساده – تر مولفه ها به وجود آمده است . این روش ها، همان چرخش مولفـه هـا هستند که به دو نوع چرخش عمودی و مایل تقسیم می شوند. به دلیل اینکه در روش چرخش عمودی ، استقلال بین مولفه ها حفظ می شـود، این نوع چرخش بیشتر مورد استفاده قرار می گیرد. در مطالعات علمـی بیشتر از چرخش وریماکس استفاده می شـود کـه یکـی از روش هـای چرخش عمودی است (٣٠). این روش نسبت به بقیه روش هـا نتـایج بهتری را ایجاد می کند و به عنوان چرخش استاندارد توصیه می گـردد.
استفاده از چرخش وریماکس برای تفـسیر بهتـر نتـایج ، PFA نامیـده میشود . برای اجرای تحلیل مولفه های اصلی و تحلیل عامل اصلی از نرم افزار های اماری مختلفی میتوان بهره گرفت و در این تحقیق از نرم افـزار آمـاری ١٧ SPSS Statistic بـرای ایـن منظـور استفاده گردید.

مدل رگرسیون خطی چند گانه در فرم ماتریسی را مـی تـوان بـه صورت معادله زیر نشان داد:

در معادله ۴، β ماتریس ضـرایب رگرسـیون ، e مـاتریس خطـای برازش و Y ماتریس پاسخ (متغیـر وابـسته ) و X مـاتریس متغیرهـای مستقل می باشند. با حل معادله ۴ بر حسب β خواهیم داشت :

که در رابطه ۵، ́X ترانهـاده مـاتریس X اسـت . بـرای محاسـبه معکوس لازم اسـت متغیرهـای مـستقل همبـستگی زیـادی داشته باشند، زیرا در این صورت ماتریس را نمی توان معکوس کرد و باعث افـزایش خطـا در اثـر گـرد کـردن داده هـا و محاسـبات می شود. برای رفع این مشکل باید قبـل از سـاخت مـدل رگرسـیونی ، همبستگی بین متغیرهای مستقل را از بین برد. در این خصوص ، روش مناسب ، استفاده از تحلیل مؤلفه های اصـلی روی متغیرهـای مـستقل ورودی به مدل است . در این تحقیق پس از رفع مشکل همبستگی در متغیرهای مستقل ، مدلی مناسب با استفاده از روش رگرسـیون خطـی چندمتغیره برای پیش بینـی تبخیـر-تعـرق مرجـع توسـعه یافتـه و در محاسبات رگرسیونی از الگوریتم گام به گام ٢ استفاده شد. در این روش ورود متغیرها به مدل رگرسیون به صورت مرحله ای ، از مهم ترین متغیر تا کم اهمیت ترین آنها، صورت می گیرد. معیار میزان اهمیت متغیـر در مدل ، مقدار سطح معنی داری یا آماره t متناظر با آن در جـدول آزمـون معنی داری متغیرها است (٢ و ١٢). بررسی اولیه نـشان داد کـه بـین متغیرهای ورودی مورد استفاده در این تحقیق همبستگی معنـی داری وجود دارد که برای از بین بردن این مـشکل ، از روش PCA اسـتفاده شد.
معیارهای ارزیابی عملکرد
به منظور مقایسه و ارزیابی عملکـرد مـدل هـای مـورد بررسـی از پارامترهای میانگین مربعات خطا٣ (RMSE)، خطای مطلق میانگین ۴ (MAE) و ضریب همبستگی (r) استفاده می گردد. فرمول هـای ارائـه شده برای این پارامترها بصورت زیر می باشد:

در این معادلات ، N تعداد نمونه ها، Pi معـادل مقـادیر پـیش بینـی شده ETo از مـدل ، Oi مقـادیر محاسـبه شـده ETo از روش F-P-M می باشند. پارامترهای RMSE و MAE هم بعد با پارامترهایی هستند که از آنها بدست آمده اند و r بدون بعد است .
پارامترهای ذکر شده هیچ اطلاعـی در مـورد نحـوه توزیـع خطـا نمی دهند. به این منظور برای ارزیـابی مـدل هـا از شـاخص میـانگین قدرمطلق خطای نسبی (MARE)1 و تحلیل آسـتانه خطـا (TS)2 نیـز استفاده و نمودار پراکندگی خطای مطلق نسبی نیز استفاده مـی گـردد.
این دو معیار، نه تنها شاخص عملکرد را بـصورت جملاتـی از مقـادیر برآوردشده ارائه می دهند بلکـه توزیـع خطـا را نیـز نـشان مـی دهنـد.
شاخص TSX برای مقدار x درصد از برآوردها، نشان دهنده توزیع خطا در مقادیر برآورد شده برای هر مدل می باشد. این شاخص که برحسب درصد تعریف می شود برای مقادیر مختلـف قـدرمطلق خطـای نـسبی ارائه می شود. مقدار TS برای x درصد از برآوردها طبق رابطـه ٨ بـه – دست می آید (۴):

که در آن Yx تعداد پیش بینی شده (از کل تعداد n) برای هر مقدار مطلق خطای نسبی کمتر از x درصد می باشد (۴).

نتایج و بحث
در ابتدا نتایج روش تحلیل مولفه های اصلی ارائه شده و در ادامـه نتـایج تحلیـل عـاملی ، رگرسـیون چندگانـه ترکیبـی و ارزش نــسبی متغیرهای مستقل ارائه شده است .
پیش پردازش متغیرهـای ورودی بـه مـدل رگرسـیونی بـا PCA
برای بررسی امکان اجـرای آنـالیز مولفـه هـای اصـلی از آزمـون بارتلت استفاده شـد. مقـدار۰٫۶۱۳=KMO امکـان اجـرای PCA را تأیید کرد. برای اجرای این روش ، پس از استاندارد کـردن متغیرهـای ورودی مـاتریس متقـارن همبـستگی از مرتبـه ٧ (معـادل بـا تعـداد متغیرهای ورودی ) تشکیل شد که نتایج آن در جدول (١) ارائـه شـده است . با حل دستگاه معادله (٣)، ٧ مقدار ویـژه و بـه ازای هـر مقـدار ویژه ٧ بردار ویژه ، حاصل می شود که با اسـتفاده از آنهـا، مولفـه هـای اصلی از متغیرهای اولیه به دست مـی آیـد. مشخـصات هـر مولفـه در جدول (٢) آورده شده است . در جدول (٣) مقادیر بردارهای ویژه آمـده است که ضرایب هر مولفـه را بـرای محاسـبه آنهـا تعیـین مـی کنـد.
همانطور که در جدول (٢) نشان داده شده است ، مقـدار اولـین مولفـه برابر ٣.٧۶٨ می باشد که ۵٣.٨٣۴ درصد از کل واریانس موجـود در سری داده ها را توجیه می نمایـد. دومـین مقـدار ویـژه نیـز ٢۶.٣١٨ درصد از کل واریانس را توجیه می نمایند و ایـن دو مولفـه حـدود ٨٠ درصد کل پراکندگی داده های اصلی را بیان می کنند. بنـابراین ، تقریبـا می توان دو و سه مولفه اول را به عنوان مولفه اصلی قلمـداد نمـود. در عین حال ، انتخاب آستانه حذف فقط بر اساس قضاوت تخمینی دقیـق نبوده و لازم است که آزمون های دیگری نیـز انجـام گیـرد. هـدف از آزمون های بعدی ، پیدا کردن یک مبنـای فیزیکـی بـرای هـر یـک از مولفه های اصلی می باشد. برای پیدا نمودن آستانه حذف ، تعداد دو، سه و چهار مولفه اصلی (مولفه های داوطلب ) در نظر گرفته شـد و آزمـون لازم برای تشخیص تعداد مولفه های مطلوب برای نگهداری به عمـل آمد. برای این منظور، عوامل بارگذاری ٣ مربوط به هر یک از مولفه هـا به روش وریماکس دوران داده شدند و وابستگی هر یک از مولفه های دوران داده شده به ETo مورد ارزیابی قرار گرفـت . در ایـن تحقیـق از (۴) آمده است . با توجه به جدول (۴)، ضرایب ٠.٧٢۶ و ٠.۶۵۴ بـه دوران دو مولفه اول نتایج مطلوبی به دست آمد که نتایج آن در جدول ترتیب بیانگر همبستگی مولفه اول و دوم با ETo می باشـند. بنـابراین مولفه اول نسبت به مولفه اصلی دوم همیستگی بیشتری بـا ETo دارد و متغیرهایی که در این مولفه بارگـذاری بزرگتـری دارنـد همبـستگی بیشتری را با ETo نشان می دهند. مقـادیر دوران داده شـده بارگـذاری مولفه اول نشان می دهد که متغیرهای شدت تـابش ، رطوبـت نـسبی ، دمای حداکثر و ساعات آفتابی همبستگی زیادی با تبخیر-تعرق دارنـد و همبستگی بقیه عوامل (دمای حداقل ، دمای نقطـه شـبنم و سـرعت باد) در این مولفه ، کم می باشد. در مقابل ، بردارهـای دوران داده شـده بارگذاری متناظر با مولفه دوم همبستگی زیادی بـا متغیرهـای دمـای نقطه شبنم ، سرعت باد و دمای حداقل دارد. در شـکل (١) بارگـذاری دو مولفه اول نشان داده شده است که با استفاده از بردارهـای ویـژه از مولفه های اول و دوم جدول (٣) تشکیل شده اسـت . در اولـین مولفـه بیشترین بارگذاری ها مربوط به متغیرهای دمای حداکثر، دمای حداقل ، رطوبت نسبی ، شدت تابش و ساعات آفتابی مـی باشـد. در مولفـه دوم بیشترین بارگذاری مربوط به متغیر دمای نقطه شبنم می باشد. با توجه به جدول (٣)، برای تشکیل مولفه اول بایـستی مقـادیر متغیـر دمـای حـداقل (Tmin) را در ضـریب ٠.٨٢٠، مقـادیر متغیـر دمـای حـداکثر (Tmax) را در ضریب ٠.٩۴٢ و به همین ترتیب مقادیر بقیه متغیرها را در ضرایب مربوطه ضرب کرد. بدین صورت مولفه هایی حاصـل مـی شوند که می توان از آنها به جای متغیرهای اولیه به عنوان ورودی بـه مدل رگرسیون استفاده نمود. طبق بحث انجام شده ، از بردارها ی ویژه به دست آمده در جدول (٣)، دو مولفه اصلی به صـورت روابـط (٩) و (١٠) استخراج گردید. در ایـن روابـط متغیرهـای به ترتیب بیانگر دمای حداقل ، دمـای حـداکثر، دمای نقطه شبنم ، رطوبت نسبی ، سرعت باد و شدت تابش می باشند.

ساخت مدل رگرسیونی
مقادیر به دست آمده از PC1 و PC2 به عنوان متغیرهای مستقل (برآوردکننـده ) وارد مـدل رگرسـیون خطـی چندگانـه گردیـد. معادلـه رگرسیون خطی چندگانه با وارد کـردن دو مولفـه اصـلی بـه صـورت معادله (١١) به دست آمد.

در این روش آماره t برای مقدار ثابت و برای هـر یـک از مولفـه – هــای PC1 و PC2 بــه ترتیــب برابــر ۵٠.١٣٧-، ١۵١.٠٠۶ و ۴۴.٣٢۶ تعیین گردید. با استفاده از جدول t، بـرای سـطح معنـی دار ۵% و درجه آزادی ١٨٢۶، مقدار ۱٫۶۴۵=t به دست می آید. مقایسه بین آماره ها و مقدار به دست آمده از جدول t نشان می دهد که تمامی ضرایب در سطح ۵% معنی دار می باشند. بزرگی قدر مطلق آماره t نیـز اهمیت آن را در مدل MLR-PCA نشان مـی دهـد. از ایـن دیـدگاه ، PC1 اهمیت بیشتری نسبت به مولفه دیگـر دارد و در مرحلـه بعـدی ، PC2 دارای اهمیت می باشند. بنابراین مقادیر متغیرهای شدت تـابش ، رطوبت نسبی ، ساعات آفتابی ، دمـای حـداقل و دمـای حـداکثر بـرای برآورد ETo از اهمیت بیشتری برخوردارند. همچنین به منظور مقایسه نتایج روش MLR-PCA بـا مقـادیر حاصـل از روش MLR تمـامی متغیرهای مورد استفاده در این تحقیق وارد مدل رگرسـیونی و معادلـه (١٢) برای آن ارائه گردید. مطابق معادله (١٢) مقـادیر آمـاره t بـرای مقدار ثابت و برای هر یک از متغیرهای دمـای حـداکثر، سـرعت بـاد، شدت تابش ، رطوبت نسبی ، ساعات آفتابی ، دمای حداقل و دمای نقطه شبنم به ترتیب برابـر ٣٨.٣٧٨-، ۴٧.٧١٠، ۵١.۵۴٢، ۵١.۵٨٨، ٢۴.١٩٢، ٢٢.١٩٠-، ١٣.٨۴۵- و ٣٠.٩۵٣ تعیـــین گردیـــد.

این فقط قسمتی از متن مقاله است . جهت دریافت کل متن مقاله ، لطفا آن را خریداری نمایید
word قابل ویرایش - قیمت 12700 تومان در 22 صفحه
127,000 ریال – خرید و دانلود
سایر مقالات موجود در این موضوع
دیدگاه خود را مطرح فرمایید . وظیفه ماست که به سوالات شما پاسخ دهیم

پاسخ دیدگاه شما ایمیل خواهد شد