بخشی از مقاله

*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***

ارزیابی کارایی مدل حداقل مربعات ماشین بردار پشتیبان در پیشبینی سطح ایستابی (مطالعه موردي: دشت رامهرمز)
چکیده:
با توجه به شرایط موجود بر اقلیمهاي خشک و نیمه خشک مانند کمبود بارندگی و میزان تبخیر بالا، مدیریت صحیح و کارآمد بر منابع آب موجود اجتنابناپذیر است. مدیریت منابع آب زیرزمینی به عنوان پر مصرفترین منبع قابل استحصال آب یکی از ضرورتهاي تحقیقات مدرن است. در این مقاله، با استفاده از اطلاعات کمی چاههاي مشاهداتی و پارامترهاي هواشناسی دشت رامهرمز در استان خوزستان در دورهي 5 ساله، به ارزیابی عملکرد آزمون گاما و مقایسه دقت مدلهاي حداقل مربعات ماشین بردار پشتیبان (LS-SVM) و شبکه عصبی مصنوعی بهمنظور تخمین سطح ایستابی پرداخته شد. ابتدا با استفاده از روش آزمون گاما از میان پارامترهاي تأثیرگذار بر سطح ایستابی، پارامترهاي بهینه ورودي جهت مدلسازي تخمین سطح ایستابی از میان 127 ترکیب معین، تعیین گردید. 5 ترکیب برتر با حداقل مقدار آماره گاما نسبت به ترکیبهاي دیگر بهدست آمد. سپس ترکیبهاي بهینه با استفاده از مدل حداقل مربعات ماشین بردار پشتیبان با توابع کرنل مختلف و شبکه عصبی مصنوعی مورد ارزیابی قرار گرفتند. نتایج 4 ترکیب نشان دهنده عملکرد دقیق مدل LSSVM-RBF ، که در بهترین ترکیب با پارامتر مربوط به تابع (2=4/99) RBF و شاخصهاي عملکرد RMSE=0/3401) و (R2=0/999 نسبت به مدل ANN برتري داشت و نیز بیانگر پیش پردازش بهینه آزمون گاما بود.
واژه هاي کلیدي: حداقل مربعات ماشین بردار پشتیبان، آزمون گاما، سطح آب زیرزمینی، دشت رامهرمز

مقدمه
شرایط اقلیمی خشک و نیمهخشک حاکم بر کشور ایران، محدودیتهاي آبی در بخش آب سطحی و زیرزمینی را موجب گردیده است. از طرفی دیگر کاهش میزان بارندگی به جهت خشکسالی در چندین سال اخیر، اعمال مدیریت صحیح و کاربردي بر این منابع را ضرورت بخشیده است. از آنجا که منابع آب زیرزمینی بیشترین درصد مصرف را به خود اختصاص دادهاند، تحقیقات را به سوي مدیریت این منابع کشانده است.
بهطوريکه شناخت صحیح و بهرهبرداري اصولی از آنها میتواند در توسعه پایدار فعالیتهاي اجتماعی و اقتصادي یک منطقه، از جمله کشور ما به حساب آید .Izadi et al. (2008) در مناطق خشک و نیمهخشک آبهاي زیرزمینی به عنوان تنها منبع مورد اعتماد محسوب میگردند. با توجه به اینکه ریزشهاي جوي در زمانهاي محدود اتفاق میافتد، لذا جریانهاي سطحی عمومًا به صورت سیلابی و پس از هر بارش مشاهده و سپس قطع میگردند. بنابراین کلیهي برنامهریزيهاي کوتاه- مدت و بلندمدت تأمین آب در مناطق خشک و نیمهخشک نیز بر مبناي حجم آب زیرزمینی در دسترس میباشد .Mirzaei et al. (2011)
مدلهاي رایجی که در این زمینه توسعه یافتهاند از جمله مدلهاي رگرسیونی با سري زمانی، مدلهاي فیزیکی و مدل- هاي جدید رایانهاي را میتوان نام برد. مدلهاي رایانهاي به دلیل سرعت پردازش بالا و دقت خوب و هزینه کم نسبت به مدلهاي دیگر گسترش زیادي یافته اند و از دیگر مزایاي این مدلها جعبه سیاه بودن آنها است که براي شبیهسازي پارامتر- هاي منابع آب با وجود طبیعت پیچیده و غیر پویا نیاز به شناخت فیزیک مسئله ندارند. از جمله تحقیقات بسیاري که در زمینه برآورد سطح ایستابی صورت گرفتهاند میتوان به تحقیقات Khashei-Siuki et al.(2013)، ZareAbyaneh et al.(2011) و Izadi et al. (2008) اشاره نمود.

تشخیص رفتار آبخوان به ازاي تغییر در پارامترهاي تغذیه و پارامترهاي تبخیر، میتواند در تصمیمگیري در شرایط خاص مؤثر باشد. از نگاهی دیگر پارامترهاي بسیاري بر پدیدههاي هیدرولوژیکی مؤثرند و تعیین میزان تأثیر این پارامترها نا-

مشخص است. در این صورت تعیین بهترین ترکیب از پارامتر- هاي ورودي به مدلهاي هوشمند امري وقتگیر میباشد.
کاربرد روشهاي نوین در این راستا از مراحل سعی و خطا کاسته و به روند مدلسازي سرعت میبخشد.
در این تحقیق از روش آزمون گاما1 در مرحله پیشپردازش مدل استفاده گردید. این آزمون نخستین بار توسط کانسکر در سال 1997 به صورت خلاصه معرفی گردید و در سالهاي بعد توسط دورانت، جونس و همکاران و ایوانس با جزئیات مورد بررسی قرار گرفت .Remesan et al.(2008) این روش یک ابزار مدلسازي غیرخطی است که به کمک آن میتوان ترکیب مناسب از پارامترهاي ورودي را بهمنظور مدلسازي دادههاي خروجی و ایجاد یک مدل هموار قبل از ایجاد مدل بررسی نمود. به طوري که با بررسی خطا در هر ترکیب ورودي، یک معیار مناسب براي قضاوت در مورد آنها فراهم میگردد و در نهایت ترکیبی که داراي کمترین مقدار خطا براي مدلسازي بهینه خروجی است، بهعنوان ترکیب بهینه ورودي مورد استفاده قرار میگیرد .Moghaddamnia et al.(2009) در انتخاب بهینه پارامترهاي ورودي به منظور مدلسازي مقاومت برشی خاك، از این آزمون استفاده نمودند که نتایج نشاندهنده کارآیی، دقت بالاي این روش در انتخاب، کاهش حجم محاسبهها و صرفهجویی در وقت و هزینهها بود .Besalatpour et al.(2013) این آزمون در پیشپردازش میان 31 ترکیب مختلف از پارامترهاي ورودي جهت مدلسازي تابش خورشیدي مورد استفاده قرار گرفت، همچنین با استفاده از آزمون M تعداد دادههاي مورد نیاز براي آموزش مدل نیز تعیین گردید و در ادامه این روش با روش رگرسیون محلی((LLR و شبکه عصبی مصنوعی2 مقایسه گردید که نتایج کاربردي بودن این روش را نشان داد Ghabaei Sough
.et al.(2011)


همچنین بهمنظور پیشبینی تبخیر و تعرق پتانسیل از پیشپردازش آزمون گاما در مدلهاي حداقل مربعات ماشین بردار پشتیبان و سیستم استنتاج تطبیقی عصبی- فازي3 و شبکه عصبی مصنوعی استفاده نمودند که نتایج نشاندهنده دقت بالاي GT-LSSVM و کاهش مراحل سعی و خطا در مدلسازي بود .Seifi and Riahi Madvar (2012) در پیدا کردن پارامترهاي اثرگذار بر تبخیر و تعرق پتانسیل روزانه ایستگاه سینوپتیک شیراز، دقت این روش با روش رگرسیون گام به گام (نوع گزینش پیشرونده(4 مقایسه گردید که در نهایت دقت بالاتر این روش نسبت به روش FS نشان داده شد
.Ghabaei Sough et al.(2010)

در بخش مدلسازي تخمین سطح ایستابی در تحقیق مذکور از مدل پیشنهادي حداقل مربعات ماشین بردار پشتیبان5 استفاده گردید. در ابتدا روش ماشین بردار پشتیبان6 در سال 1992 توسط وپنیک7 معرفی گردید که بر پایهي تئوري یادگیري آماري8 بنا نهاده شده است. در سال 1999، سویکنز9 و وندوال10 مدل حداقل مربعات ماشین بردار پشتیبان را معرفی نمودند .Suykens et al., (2002) این مدل محدودیتهاي یکسانی با روش ماشین بردار پشتیبان کلاسیک دارد اما نسبت به این روش از پیچیدگی محاسباتی کمتر و دقت و سرعت بالاتري برخوردار است. این مدل در مسائل طبقهبندي و هم مسائل رگرسیونی استفاده شده است. البته در مسائل رگرسیونی به ویژه مسائل علوم آب تحقیقات کمی صورت گرفته است.
در تحقیقی با استفاده از این مدل به پیشبینی کوتاهمدت سري زمانی هواشناسی (مثل تابش خورشیدي، دماي هوا، رطوبت نسبی و (… پرداخته شد، در ادامه نتایج را با نتایج به- دست آمده از روشهاي مختلف شبکههاي عصبی مصنوعی(شبکه معمولی، پرسپترون چند لایه، توابع پایهي شعاعی11 و شبکه عصبی احتمالاتی) مقایسه نمودند و در مدل LS-SVM به عنوان مدل برتر معرفی گردید Mellit et al. (2013)
دقت این مدل را در مدلسازي تبخیر و تعرق مرجع ( Kisi, (2012 مورد بررسی قرار داد. نتایج این روش را با مدلهاي تجربی و مدل ANN مقایسه نموده و در نهایت نتایج بیانگر دقت این مدل نسبت به روشهاي دیگر بود. امکانسنجی استفاده از این مدل در پیشبینی سري زمانی هیدرولوژیکی غیر خطی در مقایسه با روشهاي آماري رگرسیون خطی چند- گانه (MLR) و روش اکتشافی مانند شبکه عصبی (NNBP) بررسی شده است، که نتایج نشاندهنده دقت پیشبینی بالاي این مدل پیشنهادي بود .H.Hwang et al. (2012) در تحقیقی نیز بهمنظور پیشبینی دادههاي سري زمانی غیر خطی کیفیت آب از این مدل استفاده گردید و نتایج با مدل شبکه عصبی RBF و BP مقایسه شد که نتایج دقت بالاتر مدل حداقل مربعات ماشین بردار پشتیبان را نشان داد .Tan et al.(2012)
در ادامه مطالعه، به منظور مقایسه کارآیی مدل پیشنهادي از مدل ANN استفاده گردید. در مطالعات منابع آب، شبکه عصبی از سال 1992 توسط فرنچ مورد استفاده قرار گرفت و از آن پس بهطور روزافزونی در این علوم به کار گرفته شد French .et al.(1992) از جمله تحقیقاتی که در زمینه کاربرد مدلهاي شبکه عصبی در پیش بینی سطح آب زیرزمینی کم عمق با استفاده از پارامترهاي هواشناسی و هیدروژئولوژي پرداخته شده است میتوان، به تحقیقات ( Mohtasham et al., 2010 ؛ (Ioannis et al., 2005 اشاره نمود.
در تحقیقی نیز با استفاده از شبکه عصبی به پیشبینی سطح آب زیرزمینی در دشت نیشابور پرداخته شد و بهترین مدل حاصله ارائه گردید .Izadi et al.(2007) همچنین تحقیقی دیگر نیز به توانایی شبکه عصبی مصنوعی در پیشبینی پارامترهاي آبخوان مانند ضریب انتقال و آبدهی ویژه اشاره دارد
.Samani et al.(2007) در برآورد سطح ایستابی آبخوان دشت نیشابور، عملکرد مدلهاي ANN و ANFIS و رگرسیونی بررسی گردید که نتایج کارآیی مدل ANN را در فصل تابستان نشان داد .Khashei-Siuki et al.(2013)
در این تحقیق ارائه شده روشی نوین در مرحله پیش- پردازش مدلهاي هوشمند و مدلی برتر در جهت مدلسازي دقیقتر در برآورد سطح ایستابی ارائه گردید.
مواد و روشها
منطقه مورد مطالعه
دشت رامهرمز در محدوده حوضه آبریز درجه 3 جراحی با نام محدوده مطالعاتی رامهرمز قرار گرفته است. این محدوده در فاصله حدود 90 کیلومتري شرق اهواز در مسیر ارتباطی اهواز- بهبهان و اهواز – باغملک با وسعت کل 1842 کیلومتر مربع قرار دارد. دشت رامهرمز در استان خوزستان با مساحت 548 کیلومتر مربع بین طولهاي جغرافیایی 4916 و 4918شرقی و عرضهاي جغرافیایی3136 و 3059 شمالی محدوده اصلی بیلان آبخوان را تشکیل می دهد. رودخانه اعلاء که منبع اصلی تأمین آب مورد نیاز آبیاري منطقه می باشد در قسمت میانی دشت و از شمال شرق تا جنوب دشت جریان دارد که در جنوب دشت پس از اتصال به رودخانه مارون، رودخانه جراحی را تشکیل میدهد. اکثر مناطق دشت توسط آبرفتهاي جوان پوشیده شده است که این آبرفت داراي ضخامت نسبتاَ کم (حداکثر 130 متر) با دانهبندي متوسط تا دانه ریز بوده و یک آبخوان آزاد را تشکیل می دهد. نمایی از محدوده دشت در شکل (1) ملاحظه میگردد :

جمعآوري دادهها
به دلیل اهمیت تغییرات سطح آب در بازهي زمانی ماهانه، براي تخمین سطح ایستابی آب زیرزمینی از اطلاعات سطح ایستابی ماهانه 63 چاه مشاهداتی از سال 85-89 در سطح دشت استفاده گردید. در این تحقیق از بارندگی ماهانه به عنوان پارامتر تأثیرگذار بر تغذیه آبخوان و پارامترهاي متوسط رطوبت نسبی ماهانه و دماي متوسط ماهانه به عنوان پارامترهاي مؤثر بر تبخیر از دشت و سطح ایستابی ماهانه به عنوان ورودي به مدل استفاده گردید. بهمنظور تعیین پارامترهاي رطوبت نسبی و بارندگی مربوط به هر چاه مشاهدهاي به صورت ماهانه از نرم-افزارArcGIS9.3 استفاده شد. در این تحقیق از پارامترهایی تأثیرگذار در جهت برآورد سطح ایستابی از جمله Z-1 (سطح ایستابی در چاه مشاهدهاي در یک ماه قبل)، Z-3 (سطح ایستابی در چاه مشاهدهاي مربوط به سه ماه قبل)، Pt-1
(مجموع بارندگی در ماه قبل)، Pt-2 (مجموع بارندگی مربوط به دو ماه قبل)، Pt (مجموع بارندگی در ماه موردنظر)، Rh-a (متوسط درصد رطوبت نسبی ماهانه)، Ta (متوسط دماي ماهانه) و C (مختصات جغرافیایی) به عنوان پارامترهاي ورودي در مدلسازي استفاده گردید. در این تحقیق سعی گردیده است تأثیر پارامترهاي فوق که در منطقه تاکنون بررسی نشدهاند، بررسی شود.

آزمون گاما
این آزمون نشاندهنده آن قسمت از واریانس خروجی است که نمیتوان با اعمال هر مدل هموار بر وروديها محاسبه شود.
براي درکی بهتر از این آزمون، چنانچه فرض شود دو نقطه x و x در فضاي ورودي متناظر با خروجیهاي y و y' به هم نزدیک شوند باید در فضاي خروجی نیز این دو نقطه به هم نزدیک گردند در غیر اینصورت، نزدیک نبودن این دو نقطه ناشی از اختلافی خواهد بود که توسط خطاها ایجاد میشود.
پس میتوان گفت محاسبه گاما شکل سادهاي از انحراف خطا به شمار میآید که مقدار خطاي برآورد شده (واریانس خطا) را با توجه به دادههاي مستقیم نشان میدهد. در ابتدا فرض میشود مجموعهاي از دادههاي ورودي xi و خروجی yi مشاهده شده از پدیدهاي را به صورت رابطه [1] در اختیار داریم:

x R M بردار ورودي و y  R بردار خروجی است.

M تعداد سري مجموعه دادههاي مشاهده شده را نشان می- دهد. پس آزمون گاما با فرض عدم قطعیت و پذیرش مقدار خطا در به دست آوردن خروجی از دادههاي ورودي به دلیل پیچیدگی و غیرخطی بودن پدیدههاي مدلسازي، این خطا به صورت رابطه [2] نشان داده میشود:

f نشان دهنده تابع همواري است که براي مدلسازي دادهها استفاده میگردد. r نشان دهنده متغیر تصادفی نمایش خطا است. این خطا ممکن است به دلایل عدم دقت اندازهگیريها و هموار نبودن ارتباط اساسی بین ورودي و خروجی به وجود آید .Jones et al ., (2002) اگر میزان خطا زیاد باشد باید از هر- گونه تلاش در جهت ایجاد مدلی هموار جلوگیري نمود. فرض میگردد میانگین خطا (r) صفر است. علیرغم نامعلوم بودن f، مشروط به شرایط مطمئن، آزمون گاما تخمینی از واریانس خطا (r) میباشد.  (مقدار آماره گاما) بر اساس k امین همسایههاي نزدیک xN[i,k] براي هر بردار ورودي xi است. پس آماره گاما از تابع دلتا مخصوص بردارهاي ورودي به دست میآید:

که … نشان دهنده فاصله اقلیدسی است و تابع مربوطه گاما براي هر مقدار خروجی yi متناظر با بردار ورودي در رابطه [1] بر اساس معادله [4] به دست میآید:

که مقدار y معین براي kامین همسایه نزدیک بردار ورودي xi در رابطه [1] است. میزان p را میتوان بین 10-50 انتخاب کرد .Jones et al.(2002) با ایجاد رابظه رگرسیونی خطی بین مجموعه هاي رابطه خط رگرسیونی در رابطه [5] بهدست میآید:

وقتی به سمت صفر میل نماید مقدار آماره گاما به صورت رابطه [6] نشان داده میشود:

وقتی که مقدار گاما صفر باشد هیچ محدودیتی براي ساخت یک مدل خوب وجود نخواهد داشت، بنابراین از نقاطی که داراي مقدار گاماي کمتر در مقایسه با دیگر متغیرها هستند براي مدلسازي استفاده خواهد شد ( Moghaddamnia et .(al., 2009 محاسبه شیب نیز به عنوان یک پارامتر بیبعد هم میتواند اطلاعات مفیدي در رابطه با پیچیدگی مدل ارائه نماید .Besalatpour et al. (2013) نسبت v نیز بررسی شکلی را که وابسته به دامنه خروجی است میسر میسازد، و خروجی مناسب براي توابع ساده را مدلسازي میکند که به صورت رابطه [7] محاسبه میگردد:

2 (y )واریانس خروجی را نشان میدهد. این نسبت بین 0 - 1 تغییر میکند، که هرچه میزان آن به صفر نزدیکتر باشد
بیانگر برآوردي مناسبتر از خروجی y است. با استفاده از آزمون M میتوان تعداد موردنیاز دادهها را براي بخش آموزش تعیین نمود. در این تحقیق از نرمافزار WinGamma استفاده شد.

مدل LS-SVM
چارچوب رگرسیون حداقل مربعات ماشین بردار پشتیبان به صورت زیر توضیح داده میشود:
مجموعه دادههاي {xi , y i }iN1 داده شده است که x i R p به عنوان بردار ورودي و y i R به عنوان بردار خروجی معرفی میشوند. تابع رگرسیون غیر خطی در مسائل تخمین به صورت [8] میباشد:

w و b به ترتیب مقادیر وزنها و بایاس تابع رگرسیون هستند. (x) ترسیم غیر خطی وروديها در فضاي ویژگی با ابعاد بالا است. حال مسئله رگرسیون غیر خطی بر اساس معادله بهینهسازي در رابطه [9] حل میگردد:

بر اساس محدودیت :

پارامتر تنطیم کننده خطا است و e میزان خطا را نشان میدهد. حل با استفاده از شکل لاگرانژي از تابع هدف اصلی:

ضریب لاگرانژ است. بر اساس شرایط کان-تاکر

با استفاده از شرایط KKT مدل حداقل مربعات ماشین بردار پشتیبان به منظور تابع تخمین به صورت رابطه [13]
نتیجه میگردد:

K(xi , xj) تابع کرنل نامیده میشود که با تبعیت از شرایط Mercer به عنوان تابعی با ایجاد ضرب داخلی در فضاي ویژگی معرفی میشود .Seifi (2010)

براي حل، تعیین پارامتر تنظیم کننده  و تعیین 0 پارامتر مربوط به تابع کرنل ( مربوط به کرنل ( RBF نیاز است.
انتخاب بهترین تابع کرنل به وسیلهي سعی و خطا امکانپذیر است. در این تحقیق از سه تابع کرنل مختلف استفاده شده است (جدول:(1

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید