مقاله ارزیابی کارایی مدل حداقل مربعات ماشین بردار پشتیبان در پیشبینی سطح ایستابی (مطالعه موردی: دشت رامهرمز)

word قابل ویرایش
20 صفحه
دسته : اطلاعیه ها
12700 تومان
127,000 ریال – خرید و دانلود

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

ارزیابی کارایی مدل حداقل مربعات ماشین بردار پشتیبان در پیشبینی سطح ایستابی (مطالعه موردی: دشت رامهرمز)
چکیده:
با توجه به شرایط موجود بر اقلیمهای خشک و نیمه خشک مانند کمبود بارندگی و میزان تبخیر بالا، مدیریت صحیح و کارآمد بر منابع آب موجود اجتنابناپذیر است. مدیریت منابع آب زیرزمینی به عنوان پر مصرفترین منبع قابل استحصال آب یکی از ضرورتهای تحقیقات مدرن است. در این مقاله، با استفاده از اطلاعات کمی چاههای مشاهداتی و پارامترهای هواشناسی دشت رامهرمز در استان خوزستان در دورهی ۵ ساله، به ارزیابی عملکرد آزمون گاما و مقایسه دقت مدلهای حداقل مربعات ماشین بردار پشتیبان (LS-SVM) و شبکه عصبی مصنوعی بهمنظور تخمین سطح ایستابی پرداخته شد. ابتدا با استفاده از روش آزمون گاما از میان پارامترهای تأثیرگذار بر سطح ایستابی، پارامترهای بهینه ورودی جهت مدلسازی تخمین سطح ایستابی از میان ۱۲۷ ترکیب معین، تعیین گردید. ۵ ترکیب برتر با حداقل مقدار آماره گاما نسبت به ترکیبهای دیگر بهدست آمد. سپس ترکیبهای بهینه با استفاده از مدل حداقل مربعات ماشین بردار پشتیبان با توابع کرنل مختلف و شبکه عصبی مصنوعی مورد ارزیابی قرار گرفتند. نتایج ۴ ترکیب نشان دهنده عملکرد دقیق مدل LSSVM-RBF ، که در بهترین ترکیب با پارامتر مربوط به تابع (۲=۴/۹۹) RBF و شاخصهای عملکرد RMSE=0/3401) و (R2=0/999 نسبت به مدل ANN برتری داشت و نیز بیانگر پیش پردازش بهینه آزمون گاما بود.
واژه های کلیدی: حداقل مربعات ماشین بردار پشتیبان، آزمون گاما، سطح آب زیرزمینی، دشت رامهرمز

مقدمه
شرایط اقلیمی خشک و نیمهخشک حاکم بر کشور ایران، محدودیتهای آبی در بخش آب سطحی و زیرزمینی را موجب گردیده است. از طرفی دیگر کاهش میزان بارندگی به جهت خشکسالی در چندین سال اخیر، اعمال مدیریت صحیح و کاربردی بر این منابع را ضرورت بخشیده است. از آنجا که منابع آب زیرزمینی بیشترین درصد مصرف را به خود اختصاص دادهاند، تحقیقات را به سوی مدیریت این منابع کشانده است.
بهطوریکه شناخت صحیح و بهرهبرداری اصولی از آنها میتواند در توسعه پایدار فعالیتهای اجتماعی و اقتصادی یک منطقه، از جمله کشور ما به حساب آید .Izadi et al. (2008) در مناطق خشک و نیمهخشک آبهای زیرزمینی به عنوان تنها منبع مورد اعتماد محسوب میگردند. با توجه به اینکه ریزشهای جوی در زمانهای محدود اتفاق میافتد، لذا جریانهای سطحی عمومًا به صورت سیلابی و پس از هر بارش مشاهده و سپس قطع میگردند. بنابراین کلیهی برنامهریزیهای کوتاه- مدت و بلندمدت تأمین آب در مناطق خشک و نیمهخشک نیز بر مبنای حجم آب زیرزمینی در دسترس میباشد .Mirzaei et al. (2011)
مدلهای رایجی که در این زمینه توسعه یافتهاند از جمله مدلهای رگرسیونی با سری زمانی، مدلهای فیزیکی و مدل- های جدید رایانهای را میتوان نام برد. مدلهای رایانهای به دلیل سرعت پردازش بالا و دقت خوب و هزینه کم نسبت به مدلهای دیگر گسترش زیادی یافته اند و از دیگر مزایای این مدلها جعبه سیاه بودن آنها است که برای شبیهسازی پارامتر- های منابع آب با وجود طبیعت پیچیده و غیر پویا نیاز به شناخت فیزیک مسئله ندارند. از جمله تحقیقات بسیاری که در زمینه برآورد سطح ایستابی صورت گرفتهاند میتوان به تحقیقات Khashei-Siuki et al.(2013)، ZareAbyaneh et al.(2011) و Izadi et al. (2008) اشاره نمود.

تشخیص رفتار آبخوان به ازای تغییر در پارامترهای تغذیه و پارامترهای تبخیر، میتواند در تصمیمگیری در شرایط خاص مؤثر باشد. از نگاهی دیگر پارامترهای بسیاری بر پدیدههای هیدرولوژیکی مؤثرند و تعیین میزان تأثیر این پارامترها نا-

مشخص است. در این صورت تعیین بهترین ترکیب از پارامتر- های ورودی به مدلهای هوشمند امری وقتگیر میباشد.
کاربرد روشهای نوین در این راستا از مراحل سعی و خطا کاسته و به روند مدلسازی سرعت میبخشد.
در این تحقیق از روش آزمون گاما۱ در مرحله پیشپردازش مدل استفاده گردید. این آزمون نخستین بار توسط کانسکر در سال ۱۹۹۷ به صورت خلاصه معرفی گردید و در سالهای بعد توسط دورانت، جونس و همکاران و ایوانس با جزئیات مورد بررسی قرار گرفت .Remesan et al.(2008) این روش یک ابزار مدلسازی غیرخطی است که به کمک آن میتوان ترکیب مناسب از پارامترهای ورودی را بهمنظور مدلسازی دادههای خروجی و ایجاد یک مدل هموار قبل از ایجاد مدل بررسی نمود. به طوری که با بررسی خطا در هر ترکیب ورودی، یک معیار مناسب برای قضاوت در مورد آنها فراهم میگردد و در نهایت ترکیبی که دارای کمترین مقدار خطا برای مدلسازی بهینه خروجی است، بهعنوان ترکیب بهینه ورودی مورد استفاده قرار میگیرد .Moghaddamnia et al.(2009) در انتخاب بهینه پارامترهای ورودی به منظور مدلسازی مقاومت برشی خاک، از این آزمون استفاده نمودند که نتایج نشاندهنده کارآیی، دقت بالای این روش در انتخاب، کاهش حجم محاسبهها و صرفهجویی در وقت و هزینهها بود .Besalatpour et al.(2013) این آزمون در پیشپردازش میان ۳۱ ترکیب مختلف از پارامترهای ورودی جهت مدلسازی تابش خورشیدی مورد استفاده قرار گرفت، همچنین با استفاده از آزمون M تعداد دادههای مورد نیاز برای آموزش مدل نیز تعیین گردید و در ادامه این روش با روش رگرسیون محلی((LLR و شبکه عصبی مصنوعی۲ مقایسه گردید که نتایج کاربردی بودن این روش را نشان داد Ghabaei Sough
.et al.(2011)

همچنین بهمنظور پیشبینی تبخیر و تعرق پتانسیل از پیشپردازش آزمون گاما در مدلهای حداقل مربعات ماشین بردار پشتیبان و سیستم استنتاج تطبیقی عصبی- فازی۳ و شبکه عصبی مصنوعی استفاده نمودند که نتایج نشاندهنده دقت بالای GT-LSSVM و کاهش مراحل سعی و خطا در مدلسازی بود .Seifi and Riahi Madvar (2012) در پیدا کردن پارامترهای اثرگذار بر تبخیر و تعرق پتانسیل روزانه ایستگاه سینوپتیک شیراز، دقت این روش با روش رگرسیون گام به گام (نوع گزینش پیشرونده(۴ مقایسه گردید که در نهایت دقت بالاتر این روش نسبت به روش FS نشان داده شد
.Ghabaei Sough et al.(2010)

در بخش مدلسازی تخمین سطح ایستابی در تحقیق مذکور از مدل پیشنهادی حداقل مربعات ماشین بردار پشتیبان۵ استفاده گردید. در ابتدا روش ماشین بردار پشتیبان۶ در سال ۱۹۹۲ توسط وپنیک۷ معرفی گردید که بر پایهی تئوری یادگیری آماری۸ بنا نهاده شده است. در سال ۱۹۹۹، سویکنز۹ و وندوال۱۰ مدل حداقل مربعات ماشین بردار پشتیبان را معرفی نمودند .Suykens et al., (2002) این مدل محدودیتهای یکسانی با روش ماشین بردار پشتیبان کلاسیک دارد اما نسبت به این روش از پیچیدگی محاسباتی کمتر و دقت و سرعت بالاتری برخوردار است. این مدل در مسائل طبقهبندی و هم مسائل رگرسیونی استفاده شده است. البته در مسائل رگرسیونی به ویژه مسائل علوم آب تحقیقات کمی صورت گرفته است.
در تحقیقی با استفاده از این مدل به پیشبینی کوتاهمدت سری زمانی هواشناسی (مثل تابش خورشیدی، دمای هوا، رطوبت نسبی و (… پرداخته شد، در ادامه نتایج را با نتایج به- دست آمده از روشهای مختلف شبکههای عصبی مصنوعی(شبکه معمولی، پرسپترون چند لایه، توابع پایهی شعاعی۱۱ و شبکه عصبی احتمالاتی) مقایسه نمودند و در مدل LS-SVM به عنوان مدل برتر معرفی گردید Mellit et al. (2013)
دقت این مدل را در مدلسازی تبخیر و تعرق مرجع ( Kisi, (2012 مورد بررسی قرار داد. نتایج این روش را با مدلهای تجربی و مدل ANN مقایسه نموده و در نهایت نتایج بیانگر دقت این مدل نسبت به روشهای دیگر بود. امکانسنجی استفاده از این مدل در پیشبینی سری زمانی هیدرولوژیکی غیر خطی در مقایسه با روشهای آماری رگرسیون خطی چند- گانه (MLR) و روش اکتشافی مانند شبکه عصبی (NNBP) بررسی شده است، که نتایج نشاندهنده دقت پیشبینی بالای این مدل پیشنهادی بود .H.Hwang et al. (2012) در تحقیقی نیز بهمنظور پیشبینی دادههای سری زمانی غیر خطی کیفیت آب از این مدل استفاده گردید و نتایج با مدل شبکه عصبی RBF و BP مقایسه شد که نتایج دقت بالاتر مدل حداقل مربعات ماشین بردار پشتیبان را نشان داد .Tan et al.(2012)
در ادامه مطالعه، به منظور مقایسه کارآیی مدل پیشنهادی از مدل ANN استفاده گردید. در مطالعات منابع آب، شبکه عصبی از سال ۱۹۹۲ توسط فرنچ مورد استفاده قرار گرفت و از آن پس بهطور روزافزونی در این علوم به کار گرفته شد French .et al.(1992) از جمله تحقیقاتی که در زمینه کاربرد مدلهای شبکه عصبی در پیش بینی سطح آب زیرزمینی کم عمق با استفاده از پارامترهای هواشناسی و هیدروژئولوژی پرداخته شده است میتوان، به تحقیقات ( Mohtasham et al., 2010 ؛ (Ioannis et al., 2005 اشاره نمود.
در تحقیقی نیز با استفاده از شبکه عصبی به پیشبینی سطح آب زیرزمینی در دشت نیشابور پرداخته شد و بهترین مدل حاصله ارائه گردید .Izadi et al.(2007) همچنین تحقیقی دیگر نیز به توانایی شبکه عصبی مصنوعی در پیشبینی پارامترهای آبخوان مانند ضریب انتقال و آبدهی ویژه اشاره دارد
.Samani et al.(2007) در برآورد سطح ایستابی آبخوان دشت نیشابور، عملکرد مدلهای ANN و ANFIS و رگرسیونی بررسی گردید که نتایج کارآیی مدل ANN را در فصل تابستان نشان داد .Khashei-Siuki et al.(2013)
در این تحقیق ارائه شده روشی نوین در مرحله پیش- پردازش مدلهای هوشمند و مدلی برتر در جهت مدلسازی دقیقتر در برآورد سطح ایستابی ارائه گردید.
مواد و روشها
منطقه مورد مطالعه
دشت رامهرمز در محدوده حوضه آبریز درجه ۳ جراحی با نام محدوده مطالعاتی رامهرمز قرار گرفته است. این محدوده در فاصله حدود ۹۰ کیلومتری شرق اهواز در مسیر ارتباطی اهواز- بهبهان و اهواز – باغملک با وسعت کل ۱۸۴۲ کیلومتر مربع قرار دارد. دشت رامهرمز در استان خوزستان با مساحت ۵۴۸ کیلومتر مربع بین طولهای جغرافیایی ۴۹۱۶ و ۴۹۱۸شرقی و عرضهای جغرافیایی۳۱۳۶ و ۳۰۵۹ شمالی محدوده اصلی بیلان آبخوان را تشکیل می دهد. رودخانه اعلاء که منبع اصلی تأمین آب مورد نیاز آبیاری منطقه می باشد در قسمت میانی دشت و از شمال شرق تا جنوب دشت جریان دارد که در جنوب دشت پس از اتصال به رودخانه مارون، رودخانه جراحی را تشکیل میدهد. اکثر مناطق دشت توسط آبرفتهای جوان پوشیده شده است که این آبرفت دارای ضخامت نسبتاَ کم (حداکثر ۱۳۰ متر) با دانهبندی متوسط تا دانه ریز بوده و یک آبخوان آزاد را تشکیل می دهد. نمایی از محدوده دشت در شکل (۱) ملاحظه میگردد :

جمعآوری دادهها
به دلیل اهمیت تغییرات سطح آب در بازهی زمانی ماهانه، برای تخمین سطح ایستابی آب زیرزمینی از اطلاعات سطح ایستابی ماهانه ۶۳ چاه مشاهداتی از سال ۸۵-۸۹ در سطح دشت استفاده گردید. در این تحقیق از بارندگی ماهانه به عنوان پارامتر تأثیرگذار بر تغذیه آبخوان و پارامترهای متوسط رطوبت نسبی ماهانه و دمای متوسط ماهانه به عنوان پارامترهای مؤثر بر تبخیر از دشت و سطح ایستابی ماهانه به عنوان ورودی به مدل استفاده گردید. بهمنظور تعیین پارامترهای رطوبت نسبی و بارندگی مربوط به هر چاه مشاهدهای به صورت ماهانه از نرم-افزارArcGIS9.3 استفاده شد. در این تحقیق از پارامترهایی تأثیرگذار در جهت برآورد سطح ایستابی از جمله Z-1 (سطح ایستابی در چاه مشاهدهای در یک ماه قبل)، Z-3 (سطح ایستابی در چاه مشاهدهای مربوط به سه ماه قبل)، Pt-1
(مجموع بارندگی در ماه قبل)، Pt-2 (مجموع بارندگی مربوط به دو ماه قبل)، Pt (مجموع بارندگی در ماه موردنظر)، Rh-a (متوسط درصد رطوبت نسبی ماهانه)، Ta (متوسط دمای ماهانه) و C (مختصات جغرافیایی) به عنوان پارامترهای ورودی در مدلسازی استفاده گردید. در این تحقیق سعی گردیده است تأثیر پارامترهای فوق که در منطقه تاکنون بررسی نشدهاند، بررسی شود.

آزمون گاما
این آزمون نشاندهنده آن قسمت از واریانس خروجی است که نمیتوان با اعمال هر مدل هموار بر ورودیها محاسبه شود.
برای درکی بهتر از این آزمون، چنانچه فرض شود دو نقطه x و x در فضای ورودی متناظر با خروجیهای y و y’ به هم نزدیک شوند باید در فضای خروجی نیز این دو نقطه به هم نزدیک گردند در غیر اینصورت، نزدیک نبودن این دو نقطه ناشی از اختلافی خواهد بود که توسط خطاها ایجاد میشود.
پس میتوان گفت محاسبه گاما شکل سادهای از انحراف خطا به شمار میآید که مقدار خطای برآورد شده (واریانس خطا) را با توجه به دادههای مستقیم نشان میدهد. در ابتدا فرض میشود مجموعهای از دادههای ورودی xi و خروجی yi مشاهده شده از پدیدهای را به صورت رابطه [۱] در اختیار داریم:

x R M بردار ورودی و y  R بردار خروجی است.

M تعداد سری مجموعه دادههای مشاهده شده را نشان می- دهد. پس آزمون گاما با فرض عدم قطعیت و پذیرش مقدار خطا در به دست آوردن خروجی از دادههای ورودی به دلیل پیچیدگی و غیرخطی بودن پدیدههای مدلسازی، این خطا به صورت رابطه [۲] نشان داده میشود:

f نشان دهنده تابع همواری است که برای مدلسازی دادهها استفاده میگردد. r نشان دهنده متغیر تصادفی نمایش خطا است. این خطا ممکن است به دلایل عدم دقت اندازهگیریها و هموار نبودن ارتباط اساسی بین ورودی و خروجی به وجود آید .Jones et al ., (2002) اگر میزان خطا زیاد باشد باید از هر- گونه تلاش در جهت ایجاد مدلی هموار جلوگیری نمود. فرض میگردد میانگین خطا (r) صفر است. علیرغم نامعلوم بودن f، مشروط به شرایط مطمئن، آزمون گاما تخمینی از واریانس خطا (r) میباشد.  (مقدار آماره گاما) بر اساس k امین همسایههای نزدیک xN[i,k] برای هر بردار ورودی xi است. پس آماره گاما از تابع دلتا مخصوص بردارهای ورودی به دست میآید:

که … نشان دهنده فاصله اقلیدسی است و تابع مربوطه گاما برای هر مقدار خروجی yi متناظر با بردار ورودی در رابطه [۱] بر اساس معادله [۴] به دست میآید:

که مقدار y معین برای kامین همسایه نزدیک بردار ورودی xi در رابطه [۱] است. میزان p را میتوان بین ۱۰-۵۰ انتخاب کرد .Jones et al.(2002) با ایجاد رابظه رگرسیونی خطی بین مجموعه های رابطه خط رگرسیونی در رابطه [۵] بهدست میآید:

وقتی به سمت صفر میل نماید مقدار آماره گاما به صورت رابطه [۶] نشان داده میشود:

وقتی که مقدار گاما صفر باشد هیچ محدودیتی برای ساخت یک مدل خوب وجود نخواهد داشت، بنابراین از نقاطی که دارای مقدار گامای کمتر در مقایسه با دیگر متغیرها هستند برای مدلسازی استفاده خواهد شد ( Moghaddamnia et .(al., 2009 محاسبه شیب نیز به عنوان یک پارامتر بیبعد هم میتواند اطلاعات مفیدی در رابطه با پیچیدگی مدل ارائه نماید .Besalatpour et al. (2013) نسبت v نیز بررسی شکلی را که وابسته به دامنه خروجی است میسر میسازد، و خروجی مناسب برای توابع ساده را مدلسازی میکند که به صورت رابطه [۷] محاسبه میگردد:

۲ (y )واریانس خروجی را نشان میدهد. این نسبت بین ۰ – ۱ تغییر میکند، که هرچه میزان آن به صفر نزدیکتر باشد
بیانگر برآوردی مناسبتر از خروجی y است. با استفاده از آزمون M میتوان تعداد موردنیاز دادهها را برای بخش آموزش تعیین نمود. در این تحقیق از نرمافزار WinGamma استفاده شد.

مدل LS-SVM
چارچوب رگرسیون حداقل مربعات ماشین بردار پشتیبان به صورت زیر توضیح داده میشود:
مجموعه دادههای {xi , y i }iN۱ داده شده است که x i R p به عنوان بردار ورودی و y i R به عنوان بردار خروجی معرفی میشوند. تابع رگرسیون غیر خطی در مسائل تخمین به صورت [۸] میباشد:

w و b به ترتیب مقادیر وزنها و بایاس تابع رگرسیون هستند. (x) ترسیم غیر خطی ورودیها در فضای ویژگی با ابعاد بالا است. حال مسئله رگرسیون غیر خطی بر اساس معادله بهینهسازی در رابطه [۹] حل میگردد:

بر اساس محدودیت :

پارامتر تنطیم کننده خطا است و e میزان خطا را نشان میدهد. حل با استفاده از شکل لاگرانژی از تابع هدف اصلی:

ضریب لاگرانژ است. بر اساس شرایط کان-تاکر

با استفاده از شرایط KKT مدل حداقل مربعات ماشین بردار پشتیبان به منظور تابع تخمین به صورت رابطه [۱۳]
نتیجه میگردد:

K(xi , xj) تابع کرنل نامیده میشود که با تبعیت از شرایط Mercer به عنوان تابعی با ایجاد ضرب داخلی در فضای ویژگی معرفی میشود .Seifi (2010)

برای حل، تعیین پارامتر تنظیم کننده  و تعیین ۰ پارامتر مربوط به تابع کرنل ( مربوط به کرنل ( RBF نیاز است.
انتخاب بهترین تابع کرنل به وسیلهی سعی و خطا امکانپذیر است. در این تحقیق از سه تابع کرنل مختلف استفاده شده است (جدول:(۱

این فقط قسمتی از متن مقاله است . جهت دریافت کل متن مقاله ، لطفا آن را خریداری نمایید
word قابل ویرایش - قیمت 12700 تومان در 20 صفحه
127,000 ریال – خرید و دانلود
سایر مقالات موجود در این موضوع
دیدگاه خود را مطرح فرمایید . وظیفه ماست که به سوالات شما پاسخ دهیم

پاسخ دیدگاه شما ایمیل خواهد شد