بخشی از مقاله

*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***

پیش بینی حجم رسوبات معلق با استفاده از مدل های GMDH و SVM بر مبنای آنالیز مؤلفه اصلی

چکیده
پیش بینی حجم رسوبات حمل شده توسط رودخانه ها در مطالعات مهندسی رودخانه و مدیریت صحیح یک حوزه آبریز امری ضروری است. هدف از این مطالعه پیش بینی ماهانه حجم رسوبات معلق با استفاده از رویکرد استقرایی (GMDH) و مدل ماشین بردار پشتیبان (SVM) می باشد. همچنین بهترین ترکیب از متغیرهای ورودی با استفاده از آنالیز مؤلفه اصلی (PCA) مشخص شده است. منطقه مورد مطالعه رودخانه دویرج از رودخانه های مرزی کشور ایران می باشد. نتایج حاصل از توسعه مدل های GMDH و SVM حاکی از عملکرد بالای این دو مدل در پیش بینی حجم رسوبات معلق در منطقه مورد مطالعه است.
واژه های کلیدی: پیش بینی رسوب معلق، رویکرد استقرایی، ماشین بردار پشتیبان، رودخانه دویرج.


مقدمه
انتقال رسوب در رودخانه از نقطه نظر آلودگی، قابلیت کشتیرانی کانال، پرشدن مخازن، طول عمر تجهیزات هیدروالکتریکی و زیبایی رودخانه ها یکی از مسائل خیلی مهم است. برای مدل کردن یک سیستم می بایست روابط ریاضی صریح بین متغیرها بطور دقیق معلوم باشد. در اغلب سیستم ها این روابط نامعلوم هستند و استخراج چنین مدل سازی صریحی بسیار مشکل است. در این حالت می توان از روشهای محاسبات نرم که داده محور هستند و محاسبات را در شرایط غیردقیق انجام می دهند، استفاده نمود[۱۲[. در دهه های اخیر، توسعه تکنیک های هوش مصنوعی مانند شبکه های عصبی مصنوعی، ماشین های بردار پشتیبان و ... به عنوان پیش بینی کننده های پدیده های هیدرولوژیکی، تحول عظیمی در پیش بینی ها به وجود آورده است [۸-۱۴[. مدل فراذهني GMDH یک رویکرد خودسازماندهی می باشد که به تدریج مدلهای پیچیده تری در طول ارزیابی عملکرد مجموعه داده های ورودی و خروجی تولید می کند. مدل ماشین بردار پشتیبان در گستره الگوریتم های دسته بندی و رگرسیون قرار می گیرد که با استفاده از اصول تئوری یادگیری آماری توسط واپنیک (۱۹۹۵) فرموله می شود [۱۳.[ در سال های اخیر محققین توانسته اند با استفاده از روشهای ابزار محاسبات نرم به عنوان یک ابزار جدید حجم رسوبات معلق در رودخانه های مختلف را پیش بینی کنند.
جی و یو (۲۰۱۱) از ماشین بردار پشتیبان و شبکه عصبی برای پیش بینی بار رسوب معلق رودخانه کائوپینگ تایوان استفاده کردند. نتایج نشان داد مدل ماشین بردار پشتیبان از توانایی بیشتری نسبت به مدل شبکه عصبی برخوردار است [۷ [. سیمن " (۲۰۰۸) به منظور پیش بینی غلظت رسوب معلق از مدل SVM و کرنل گوسی استفاده کرد. نتاج این مطالعه نشان داد مدل SVM می تواند بار رسوب را بدون ایجاد مقادیر منفی پیش بینی نماید [۵ GMDH . [ نیز کاربردهای موفقیت آمیزی در مهندسی، علوم و اقتصاد شامل شناسائی قوانین فیزیکی، پیش بینی کوتاه مدت فرایندها، شناسائی الگوها در متغیرهای گسسته و پیوسته داشته است [۹.[ نیکولاو و هیتوشی (۲۰۰۳) از این روش برای مدلسازی سری های زمانی در شاخه های مختلف علمی مانند اکولوژی، هواشناسی و اقتصادی استفاده کردند [۱۰. [ نریمان زاده و همکاران (۲۰۰۲) از این روش برای بهینه سازی چندمنظوره دینامیک حرارتی موتورهای سوخت هواپیما بهره گرفتند [۹. [ قادری و همکاران (۱۳۸۹) از این روش در مدلسازی بهره برداری هوشمند از مخازن استفاده نمودند [۱.[ هوانگ (۲۰۰۶) برای پیش بینی قیمت فروش ارتباطات مخابراتی از ترکیب GHMD با منطق فازی استفاده نمود [۶ [. یکی از مسائل مهم در زمینه مدل سازی با استفاده از تکنیکهای هوش مصنوعی انتخاب بهترین ترکیب از متغیرهای ورودی می باشد [۲-۴[. برای این منظور تا به حال از روشهای مختلف مانند آزمون گاما ، الگوریتم ژنتیک و ... استفاده شده است. روش آنالیز مؤلفه اصلی یکی از روشهایی است که اخیرا برای این منظور مورد توجه بسیاری از هیدرولوژیستها قرار گرفته است. نوری و همکاران (۲۰۱۱) به بررسی نقش پیش پردازش پارامترهای ورودی به روشهای
GT ,PCA و روش رگرسیون گام به گام بر عملکرد مدل ماشین بردار پشتیبان جهت پیش بینی جریان پرداختند. نتایج نشان دهنده نقش مؤثر پیش پردازش در تعیین متغیرهای ورودی می باشد[۱۱[در این مطالعه از مدل های SVM و GMDH برای پیش بینی حجم رسوب معلق ماهانه رودخانه دویرج در دوره آماری ۲۰۰۴-۱۹۹۹ استفاده شده است.در این راستا از روش آنالیز مؤلفه اصلی جهت تعیین بهترین ترکیب ورودی از متغیرها استفاده شده است.

مواد و روشها
ماشین بردار پشتیبان
ماشین های بردار پشتیبان دسته ای از روش های یادگیری با ناظر هستند که برای مسائل طبقه بندی و رگرسیونی به کار می روند. این روش در سال ۱۹۹۵ توسط واینیک" و همکارانش معرفی شد و بر پایه نظریه ی یادگیری محاسباتی توسعه یافته است [۱۳[. در حالتی که داده ها بصورت خطی به شکل معادله زیر قابل ارائه می باشند:

که در آن خروجی معادله، ; ارزش طبقه نمونه آموزشی و • نشان دهنده ضرب داخلی است. در معادله (۱)، پارامترهای تعیین کننده ابر صفحه هستند. اگر داده ها به صورت خطی قابل تفکیک نباشند، معادله (۱) به معادله زیر تغییر می یابد:

دو نمونه از مدل های SVM تعریف شده است که عبارتند از: الف) مدل های رگرسیونی SVM نوع اول که به مدل های مشهورند ب) مدل های رگرسیونی مشهورند [۳[در این مطالعه از مدلv - SVM با تابع کرنل RBF استفاده شده است.
روش دسته بندی گروهی داده (GMDH)
GMDH روشی برای شناسایی سیستم های غیر خطی با متغیرهای ورودی زیاد می باشد که شکل ریاضی آن توسط شبکه ای متوالی از توصیفات جزئی بیان می شود. ارتباط بین متغیرهای ورودی خروجی را می توان با سری توابع ولترا که مشابه با چند جمله ای گسسته شده کولموگروف-گابور می باشد بیان نمود.


که بردار متغیر های ورودی و بردار وزنها می باشند. چند جمله ای کولموگروف-گابور می تواند هر توالی تصادفی ایستا را تقریب بزند و توسط هر روش تطبیقی یا یک سیستم معادلات نرمال گوسین قابل محاسبه است GMDH یک شبکه پیشرونده چند لایه می باشد که از یک سری نرونهای پشتیبانی تشکیل شده است. نرونهای پشتیبانی حداقل دارای دو ورودی هستند.
آنالیز مؤلفه های اصلی
بر اساس تعریف ارائه شده از تحلیل مؤلفه های اصلی، هدف از این تحلیل انتقال مجموعه داده X با ابعاد M به داده Y با ابعاد l است. بنابرین فرض بر این است که ماتریس X از بردارهای , تشکیل شده که هر کدام به صورت ستونی در ماتریس قرار داده شده است. بنابرین با توجه به ابعاد بردارها ( M ) ماتریس داده ها به صورت M XN است. عدم همبستگی بدان معنی است که شاخصها هر کدام جنبه های مجزایی از داده ها را بیان کنند. در یک جامعه، كل مشخصات با همدیگر وابستگی دارند و یا به عبارتی هر یک از آنان شامل بخشی از اطلاعات موجود در یک یا چند مشخصه دیگر می باشد. بنابراین تنها بایستی مشخصاتی مورد بررسی قرار گیرند که اعضا جامعه را از هم متمایز می کنند. این اعضا به صورتی انتخاب می شوند که تغییرات (واریانس) کمتری را منعکس کنند. هر مؤلفه اصلی با دنباله زیر نشان داده میشود:

که در این رابطه به ترتیب مؤلفه مورد نظر، متغیر اولیه و ضرایب مربوط به متغیرهای اولیه می باشد. این ضرایب با استفاده از معادله ۵ تعیین می شوند.


معرفی منطقه مورد مطالعه
رودخانه دویرج از رودخانه های مرزی کشور محسوب می گردد که در محدوده استان ایلام و در شهرستانهای دهلران و آبدانان واقع شده است. محدوده مورد مطالعه دارای مختصات جغرافیایی ۱۶ و ۴۷ تا ۴۰ و ۴۷ طول شرقی و ۳۴ و ۳۲ تا ۰۵ و ۳۳ عرض شمالی می باشد. که از شمال به کبیر کوه و در جنوب به موسیان، در شرق به کوه دال پری و حوضه آبخیز رودخانه چيخواب و از غرب به دینار کوه و دهلران محدود می شود.

بررسی عملکرد مدل های SVM و GMDH

عملکرد مدل های پیش بینی با استفاده از معیارهای آماری ضریب همبستگی و ریشه میانگین مربعات خطا (RMSE) مورد بررسی قرار گرفته است. معیارهای آماری ذکر شده با استفاده از روابط زیر محاسبه می شوند:


در این روابط بترتیب مقادیر مشاهده شده و پیش بینی شده در زمان i ,
, میانگین مقادیر مشاهده شده و شبیه سازی شده و n تعداد نمونه ها می باشد.
تعیین ترکیب ورودی به روش PCA
برای پیش بینی رسوب معلق، ورودی های بارش و رواناب روزانه متناظر با رسوب و همچنین تاثیر مقادیر بارش و دبی جریان روزهای گذشته )تا ۴ روز قبل(

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید