بخشی از مقاله

چکیده

پیش بینی دبی جریان به عنوان یکی از مطرح ترین چالش های مدیریت منابع آب در دهه های اخیر بوده به طوری که محققان روشهای متفاوتی را برای این امر در مقالات مختلف ارائه نموده و به کار گرفته اند. تمامی پدیدههای هیدرولوژیکی به طور طبیعی پدیده های تصادفی هستند. این پدیدهها را میتوان با استفاده از تعدادی متغیر تعیین کرد که ممکن است این متغیرها با یکدیگر دارای همبستگی زیادی باشند. مولفههای زیادی بر میزان دبی موثر است ولی اندازهگیری تمامی این مؤلفهها در حوزههای آبخیز فراهم نمیباشد. از طرفی هدف از مدل سازی استفاده از رواب برای حوزه های با کمبود اطلاعات می باشد. بدین منظور از متغیرهای سهل الوصول بارش، دما و تبخیر که از متغیرهای اصلی موثر بر دبی نیز می باشند در تحقیق فعلی استفاده گردید. با توجه به اینکه مقادیر قبلی بارش، دما و رطوبت نیز از عوامل موثر بر تغییرات دبی می باشد از این عوامل نیز در پیش بینی دبی استفاده گردید. در مجموع 9 متغیر انتخاب گردید و به کمک تجزیه و تحلیل مولفه های اصلی اقدام به تعیین سهم هر کدام از عوامل بر تغییرات دبی گردید. در نهایت با استفاده از رگرسیون اقدام به مدل سازی دبی گردید.
کلمات کلیدی: دبی، مدلسازی، مولفه های اصلی، رودخانه
مقدمه

پیش بینی دبی جریان به عنوان یکی از مطرح ترین چالش های مدیریت منابع آب در دهه های اخیر بوده به طوری که محققان روشهای متفاوتی را برای این امر در مقالات مختلف ارائه نموده و به کار گرفته اند. تمامی پدیدههای هیدرولوژیکی به طور طبیعی پدیده های تصادفی هستند. این پدیدهها را میتوان با استفاده از تعدادی متغیر تعیین کرد که ممکن است این متغیرها با یکدیگر دارای همبستگی زیادی باشند - سیفی و همکاران، . - 1389 بررسی مجموعه دادهها، ساده سازی و یافتن الگو ی حاکم بر متغیرها مهمترین مرحله از فرآیند مدلسازی و حل مساله است. در سالهای اخیر روشهای آماری چند متغیره در موضوعات مرتب با منابع آب، هیدرو لوژی و محی زیست به طور گستردهای استفاده شدهاند. روشهای چند متغیره رفتار همزمان چندین متغیر را مورد بررسی قرار می دهند و ساختار همبستگی متغیرها را درون گروه در نظر می گیرند - نیرومند، . - 2007 از آنجایی که اکثر متغیرهای تأثیرگذار در تمامی ایستگاهها اندازه گیری نمی-شود، بنابراین تحلیل دادههای موجود برای درک اهمیت نسبی این متغیرها لازم است. یکی از روشهای آماری چندمتغیره که امروزه به طور وسیعی مورد استفاده قرار میگیرد، روش تحلیل عامل اصلی PFA و تحلیل مولفه اصلی PCA میباشد - ایونگ، . - 2005 روش مؤلفههای اصلی ابزاری ریاضی است که متغیرهای مؤثر را مشخص میکند. تحلیل مولفه اصلی به تبیین ساختار واریانس ،کوواریانس به کمک چند ترکیب خطی از متغیرهای اصلی سر و کار دارد. اهداف کلی آن عبارتند از 1: کاهش حجم داده ها ؛ :2 تعیین و تفسیر آنها.

اخیراً، استفاده از روش های PCA بر ای کاهش تعداد متغیرها ی ورودی و تفسیر بهتر نتایج به دست آمده از تحلیل دادههای آب، رواج یافته است. یکی از کاربردهای مهم تحلیل مولفه های اصلی، در رگرسیون است. با استفاده از تحلیل مولفه های اصلی می توان تعداد زیادی متغیر توضیحی - متغیر مستقل - همبسته را با تعداد محدودی متغیر توضیحی جدید که مولفه های اصلی نامیده می شوند و ناهمبسته اند، جایگزین نمود. به این ترتیب نه تنها بعد مساله تقلیل می یابد بلکه مساله چند همخطی پیش نمی آید - لیو و همکاران، . - 2005 این روش بین مجموعهای بزرگ از دادههای به ظاهر بی ارتباط، رابطه خاصی را تحت یک مدل فرضی برقرار میکند، سپس هر متغیر را به صورت ترکیب خطی از فاکتورهای پنهان تبدیل میکنددر این روش متغیرها به مجموعه های کوچکتری از عامل ها با کمترین اطلاعات از دست رفته و موثرترین اطلاعات موثر بر پدیده تبدیل میشوند .در تحلیل عاملی، متغیرهایی که در یک عامل تعریف می شوند، به یکدیگر کاملاً وابسته اند و این وابستگی، عامل را بوجود میآورد .از طرفی متغیرهای هر عامل هیچ وابستگی به متغیرهای عاملهای دیگر ندارد - یزدان خواه، . - 1386

خام چین مقدم و همکاران - 1389 - با پهنه بندی حداکثر بارش روزانه ایران از کلیه ایستگاههای بارانسنج کشورکه زیر نظر سازمان هواشناسی کشور و وزارت نیروست استفاده نمود. روش مؤلفههای اصلی برای حذف متغیرهای غیرضروری به کار گرفته شد که ضرورت فق 6 متغیرارتفاع، میانگین وانحراف معیار بارش سالانه و حداکثر روزانه و نسبت بارش زمستان به بهار از 21 متغیر تأیید شد . نوری و همکاران - 1389 - با پیش بینی ماهانه جریان با استفاده از ماشین بردار پشتیبان بر مبنای آنالیز مؤلفه اصلی با استفاده از 18 متغیر ورودی به مدل، نشان داد که پیش پردازش متغیرهای ورودی به مدل با استفاده ازPCA بهبود عملکرد مدل را به همراه داشته است. یو و یانگ - 1996 - روش PCA و آنالیز خوشه ای را برای داده های جریان روزانه 34 ایستگاه جریان سنجی بکار بردند و نتایج آنها نشان داد که روش تجزیه خوشه ای سلسله مراتبی وارد و غیر سلسله مراتبی k-mean بطور قابل قبولی می تواند برای تفکیک مناطق همگن بکار رود و در نهایت سه ناحیه همگن برای منطقه بدست آوردند. لی و چونگ - 2009 - از معادلات رگرسیونی برای تخمین دبی رودخانه استفاده نمودند. آنها از دو روش برای محاسبه دبی، یکی براساس میانگین سرعت و دیگری مبتنی بر منحنی سنجه در رودخانه مورد بررسی استفاده کردند. نتایج آنها نشان داد روش محاسبه دبی براساس سرعت دقت بالاتری را نشان داده است.

مواد و روشکار

PCA روش تقسیم یک ماتریس تشابه به یک مجموعه محورها یا مؤلفههای متعامد عمودی است که هر کدام از این محورها یک PC نامیده میشود به این روش مؤلفهها را وزن دهی کرده و برای هر کدام یک مقدار ویژه بیان میکند Pezhman - و همکاران، . - 2009 مقدار ویژه هر محور برابر واریانس محاسبهشده برای آن محور است. درPCA مقادیر ویژه ماتریس تشابه بر اساس روند نزولی استخراج میشود به طوری که محورهای - مؤلفههای - متناظر PCA به طور متوالی مقادیر تغییرات را از بزرگتر تا کوچکتر در ماتریس نشان میدهند. بنابراین نخستین محورهای PCA که واحدهای نمونهبرداری روی آنها مکانیابی خواهد شد،بیشترین درصد مجموع تغییرات قابل تعریف را نشان خواهند داد Moghadam - و همکاران، . - 2003 اگر چه p متغیر برای مطالعه تغییرپذیری کل سیستم لازم است، ولی اغلب این تغییرپذیری را میتوان با تعداد کمتر مثلاً k مؤلفه اصلی بیان نمود . - k< p - در این صورت میزان اطلاعی که در k مؤلفه وجود دارد تقریباً مانند میزان اطلاع در p متغیر اولیه است. هر یک از k مؤلفه خود ترکیب خطی از چند متغیر اولیه است . بنابراین k مؤلفه اصلی را میتوان به جای p متغیر اولیه به کار برد.

مجموعه دادههای اولیه شاملp متغیر است که به مجموعهای از دادههای شاملk مؤلفه اصلی - ترکیب خطی متغیرهای مؤثر - کاهش داده میشود - چین مقدم و همکاران، . - 1389 مؤلفههای اصلی از نظر جبری ترکیبات خطی ویژه p متغیر تصادفی x1, x2 ,..., xp است . این ترکیبات خطی از نظر هندسی انتخاب یک دستگاه مختصات جدید را نشان میدهد که از دوران دستگاه اولیه با x1, x2 ,..., xp به عنوان محورهای مختصات به دست میآید. محورهای جدید جهتها را با بیشترین تغییرپذیری نشان میدهد. این جهتها بردارهای ویژه ماتریس کوواریانس - - یا ماتریس همبستگی - - است که بیان سادهتری از ساختمان کوواریانس را فراهم میکند . مؤلفههای اصلی تنها به ماتریس کوواریانس - - یا ماتریس همبستگی - - مربوط به p متغیرx1, x2 ,..., xp بستگی دارد . مقادیر ویژه و بردارهای ویژه را محاسبه و با این فرض که مجموع, واریانس متغیرها مساوی مجموع مقادیر ویژه است، مبادرت به تعیین سهم واریانس هر مؤلفه از کل مینماید .بردارهای ویژه جهت مؤلفهها و مقادیر ویژه با اندازه آنها متناسب است .اگر واحد اندازهگیری دادهها متفاوت باشد، طبق توصیههای انجامشده از ماتریس همبستگی - - استفاده میشود - نیرومند، 1378 و Jollife، . - 2002
 شکل - 1 - نقاطی را روی دو محور مختصات X1 و X2 نشان میدهد برای تعیین جهت عمومی نقاط، یک بیضی رسم میشود تا همبستگی بین متغیرها مشخص شود.

شکل -1 انتقال دادهها به عوامل اساسی

برخی از نقاط خارج بیضی و البته تجمع تعداد زیادی از آنها روی قطر اصلی بیضی مشاهده است جهت اصلی پراکنش نقاط نه در امتداد X1 و نه در امتداد X2 بلکه بین آنها و بیشتر در  امتداد قطر اصلی بیضی است  میشود .این محور PC1    نامیده میشود  که اولین جزء اصلی تغییرپذیری X1 وX 2 است.  دومین جزء PC2    در امتداد قطر فرعی بیضی است که دقیقًا بر PC1 عمود بوده و باقی تغییرات درX 1 و X2 را شرح میدهد.1 PCو PC2 دو محور جدید برای شرح X 1 و X2 میباشند بنابراین میتوان گفت X1 و X2 ترکیبی خطی از PC1 و PC2 است یعنی:

همچنین میتوان ارزش مؤلفههای اساسی را با استفاده از معادلات زیر به دست آورد:

به طوری که wi  ضریب رگرسیون اجزای اساسی روی متغیرها است.
مراحل تحلیل مؤلفههای اصلی

مرحله :1 به دست آوردن اطلاعات

مرحله:2 کسر نمودن میانگین: برای این که آنالیز اجزای اصلی به طور صحیح کار کند باید میانگین را در هر بعد از دادهها کم کرد. کاستن میانگین یعنی میانگین سراسر هر بعد از مجموعه دادهها را کم کردن.

مرحله :3محاسبه ماتریس کوواریانس

مرحله :4 محاسبه بردارهای مشخصه و مقادیر ویژه از ماتریس کوواریانس

مرحله :5 متراکم سازی

مرحله :6 وقتی که جزای اصلی را انتخاب شد - بردارهای مشخصه - . دادهها حفظ و به شکل یک بردار ویژگی نشان داده میشوند و ترانهاده بردار محاسبه می شود.

مرحله :7 مدلسازی رگرسیونی دبی با استفاده از مولفه های اصلی استخراجی

نتایج مدلسازی رگرسیونی

بعد از اینکه دادهها با انجام تبدیلات آماری نرمال گردید به منظور انجام مدلسازی وارد نرمافزارSPSS گردید. در ابتدا دادهها به دو دسته 70 درصد و 30 درصد جهت مدلسازی و اعتبارسنجی تقسیم گردیدند. تمام فرضیات مدلسازی رگرسیونی از جمله عدم هم خطی بین متغیرها و نرمال سازی باقیماندهها رویدادهها آزمون گردید و سپس اقدام به انجام مراحل مدلسازی

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید