مقاله ارزیابی دقت مدل ماشین بردار پشتیبان و مدل هیبریدی الگوریتم ژنتیک و ماشین بردار پشتیبان با توابع زیان مختلف در پیشبینی تبخیر-تعرق مرجع

word قابل ویرایش
18 صفحه
دسته : اطلاعیه ها
12700 تومان
127,000 ریال – خرید و دانلود

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

ارزیابی دقت مدل ماشین بردار پشتیبان و مدل هیبریدی الگوریتم ژنتیک و ماشین بردار پشتیبان با توابع زیان مختلف در پیشبینی تبخیر-تعرق مرجع
چکیده
الگوریتم ژنتیک جستجویی در مسائل بهینهسازی برگرفته از تکامل ژنتیکی میباشد. ماشین بردار دستهبندی کنندهای است که از تئوری یادگیری آماری استفاده میکند. در این تحقیق با هدف مقایسه دقت مدل ماشین بردار پشتیبان و مدل هیبریدی الگوریتم ژنتیک و ماشین بردار پشتیبان در پیشبینی تبخیر-تعرق مرجع (ETo) روزانه، از تابع کرنل شعاعی و تابع زیان اپسیلون درجه دوم استفاده شد. برای این منظور دادههای اقلیمی روزانه شامل ساعات آفتابی، حداکثر و حداقل دمای هوا، رطوبت نسبی سرعت باد، طی سالهای (۲۰۱۰ – ۲۰۰۰) در ایستگاه سینوپتیک اهواز برای تخمین ETo بهعنوان ورودی مدلها استفاده شد. مقادیر ETo نیز با روش استاندارد فائو-پنمن-مانتیث به عنوان مقادیر مبنا محاسبه شد. مقدار ضریب تبیین و ریشه میانگین مربعات خطا در بخش پیشبینی برای مدل GA-SVR با تابع زیان اپسیلون به ترتیب ۰/۹۹۹۹ و ۰/۰۰۱۶، برای مدل-GA SVR با تابع زیان درجه دوم به ترتیب ۰/۹۹۹۸ و ۰/۰۰۱۸، برای مدل SVR با تابع زیان اپسیلون به ترتیب ۰/۹۸۸ و ۰/۰۲۲و برای مدل SVR با تابع زیان درجه دوم به ترتیب ۰/۹۸۰ و ۰/۰۲۶ محاسبه شد. نتایج بیانگر کارایی و دقت بالای مدل-GA SVRبا هر دو تابع زیان اپسیلون و درجه دوم نسبت به مدل SVR با هر دو تابع زیان در پیشبینی تبخیر-تعرق مرجع میباشد. کلمات کلیدی: تبخیر-تعرق مرجع، ماشین بردار پشتیبان، الگوریتم ژنتیک، تابع زیان

.۱ مقدمه
ایران کشوری با اقلیم خشک و نیمه خشک از توزیع نامناسب زمانی و مکانی بارشهای جوی برخوردار میباشد. در چنین شرایط اقلیمی بارشهای جوی تکافوی نیازهای آبی مصرف کنندگان بخشهای مختلف را نداشته و از این روست که مدیریت منابع آب محدود کشور به ویژه در بخش کشاورزی که بیشترین سهم در بین مصرف کنندگان مختلف را داراست از دغدغههای اصلی مدیران بخش آب و کشاورزی کشور میباشد. برآورد صحیح و دقیق نیاز آبی گیاه در بخش کشاورزی زمینه را برای طراحی و اجرای دقیق پروژههای عمرانی و سازههای آبی از یک سو و بهره برداری بهینه منابع آب محدود کشور فراهم خواهد آورد. چه بسا عدم پیشبینی دقیق آب مورد تقاضا که براساس برآورد مقدار تبخیر-تعرق صورت میگیرد، پروژههای عمرانی تامین آب کشاورزی را با مشکل مواجه سازد ( ستاری و همکاران، .(۱۳۹۲ تبخیر-تعرق به عنوان یکی از اجزای مهم چرخه هیدرولوژیک نقش بسیار بزرگی در بررسی بیلان حوضههای آبریز دارد (علیپور، ۱۳۹۲؛ گوین، .(۲۰۰۴ مقدار تبخیر-تعرق مرجع ETo را میتوان بصورت مستقیم با استفاده از لایسیمتر اندازهگیری نمود و یا از روابط تجربی ارائه شده همچون پنمن مانتیث محاسبه نمود. گرچه لایسیمتر اندازهگیری نسبتا دقیقی از میزان تبخیر-تعرق ارائه میدهد اما در عمل کارگذاری آن هزینههای زیادی به دنبال داشته و صرفه اقتصادی آن کم است (ستاری و همکاران، .(۱۳۹۲ تا به حال روشهای زیادی مبتنی بر دادههای هواشناسی برای شرایط مختلف جغرافیایی و اقلیمی با هدف محاسبهی ETo تدوین شده است. محققین بسیاری در سراسر دنیا روش فائو پنمن-مانتیث را در مقایسه با لایسیمتر به عنوان دقیقترین روش برای برآورد تبخیر-تعرق گیاه مرجع معرفی نمودند، همچنین در حدود سال ۱۹۷۰، سازمان خواربار جهانی (FAO)، معادله پنمن-مانتیث (PM) را به عنوان روش استاندارد برای برآورد تبخیر-تعرق و اعتبارسنجی معادلات دیگر بیان کرد ( آلن و همکاران، .(۱۹۹۸ بنابراین در این تحقیق نیز روش فائو پنمن-مانتیث به عنوان روش مبنا مورد استفاده قرار گرفته است. در سالهای اخیر مدلهای هوشمند بهعنوان روشهای جدید برای مدلسازی روابط پیچیده مورد استفاده قرار گرفتهاند از جمله این روشها، مدلهای ماشین بردار پشتیبان و نظایر آن است که در سایر علوم مهندسی کاربرد زیادی پیدا کرده است (کیسی، ۲۰۰۹؛ یانگ، SVM .(2009 یک مجموعه از روشهای یادگیری با نظارت است که برای دستهبندی و رگرسیون استفاده میگردد و بر پایهی تئوری یادگیری آماری واپنیک و حداقل سازی احتمال زیان معرفی گردید. مبنای کاری ماشین بردار پشتیبان، دسته بندی خطی دادههاست. الگوریتم ماشین بردار پشتیبان در سال ۱۹۹۵ توسط وپنیک ریاضیدان روسی ابداع شد. (وپنیک، ۱۹۹۵؛ سیفی، ۱۳۹۲؛ کاکائی لفدانی، ۱۳۹۳؛). رویکرد ماشین بردار پشتیبان (SVM) به این صورت است که در فاز آموزش، سعی میشود که مرز تصمیمگیری به گونهای انتخاب گردد که حداقل فاصله آن با هر یک از دستههای موردنظر ماکزیمم گردد. این نوع انتخاب باعث میشود که تصمیمگیری در عمل، شرایط نویزی را به خوبی تحمل کند و پاسخدهی خوبی داشته باشد. SVM روشی برای طبقهبندی دوتائی در فضای ویژگیهای دلخواه است و از این رو تمایل به بهبود پیشبینیها در برخی از مطالعات موردی به ویژه در مسائل مبتنی بر رگرسیون مانند دادهها دارد (پای و هونگ، ۲۰۰۷؛ ولبرگ، .(۲۰۰۶ از مدل خبره SVM بیشتر در مسائل هیدرولوژیکی و منابع آب استفاده شده است. بهزاد و همکاران (۲۰۰۹)، از مدل SVM با استفاده از مسئله بهینه سازی دوگانه برای پیشبینی رواناب روزانه از رودخانه بختیاری با استفاده از دادههای هواشناسی و بارندگی استفاده نمودند و نتایج آن را با مدل ANN و GA-ANN مقایسه کردند. روش SVM مقادیر RMSE کمتری نسبت به دو روش دیگر داشت و روشی سریعتر و با دقت بالاتر بود. SVM به عنوان یک روش موفق در مطالعات هیدرولوژی و منابع آب مانند پیشبینی رواناب (آسفا و همکاران، (۲۰۰۶، پیشبینی سیلاب(لیانگ و سیوپرگاسم، ۲۰۰۲؛ یو و همکاران، (۲۰۰۶، کنترل آب زیرزمینی ( آسفا وهمکاران، (۲۰۰۴ و پیشبینی نرخ شکست لولهها (کلانکی و همکاران، (۱۳۹۲a استفاده گردید. در زمینه تبخیر-تعرق نیز توانایی SVM در اصلاح دقت برآورد تبخیر روزانه در مخازن چاه نیمه زابل مورد بررسی قرار گرفت (مقدمنیا و همکاران، .(۲۰۰۸ گنجعلیخانی و همکاران (۱۳۹۲)، از روش ماشین بردار پشتیبان برای محاسبه تبخیر-تعرق مرجع استفاده کردند. نتایج نشان داد که مدل ماشین بردار پشتیبان در برآورد تبخیر-تعرق روزانه دقت قابل قبولی دارد. اسلامیان و همکاران (۲۰۰۹)، برای برآورد تبخیر از گلخانه در مدل SVM و ANN استفاده و نتایج دو مدل را با یکدیگر مقایسه کردند. مقادیر ضرایب همبستگی برای ANN و SVM بترتیب ۰/۹۲ و۰/۹۶ و مقادیر راندمان بترتیب ۰/۸۳ و ۰/۹۱ بدست آمد که این مقادیر بیانگر توانایی دو مدل SVM و ANN در برآورد تبخیر در گلخانه بود. به هر حال مشابه با هر مدل ریاضی و آماری، مدلهای SVM نیز دارای معایبی هستند. یافتن ترکیب بهینه برای پارامترهای ورودی به مدل SVM با روش سعی و خطا یکی از معایب در توسعه این مدلها میباشد و ممکن است مانع یافتن مدل بهینه توسط SVM شود. استفاده از مدل بهینه سازی الگوریتم ژنتیک یکی از راههای یافتن بهینه ترین ترکیب برای پارامترهای ورودی به مدل SVM میباشد. الگوریتم ژنتیک نیز یکی از الگوریتمهای بهینهسازی عددی میباشد که از طبیعت الهام گرفته است و اغلب گزینه خوبی برای تکنیکهای پیشبینی بر مبنای رگرسیون است. الگوریتمهای ژنتیک، روشهای وفقی هستند که میتوانند برای حل مسائل جستجو و بهینه سازی مورد استفاده قرار بگیرند. این الگوریتمها براساس فرضیه تکاملی داروین استوار میباشند که طی چندین نسل، جوامع طبیعی براساس اصول انتخاب طبیعی و جستجوی برازندهترین افراد بازسازی میشوند. این تعریف اولیه از الگوریتم ژنتیک اولین بار توسط هالند ارائه شد (هالند، ۱۹۷۵ ؛ اسمیخانی، .(۱۳۸۹ تاکنون پژوهشهای مختلفی در زمینه برآورد تبخیرو تعرق انجام پذیرفته، ولی در بیشتر این پژوهشها به استفاده از روشهای تجربی و یا استفاده از یک روش هوشمند عصبی بسنده شده است. این در حالی است که تبخیرو تعرق یک متغییر زمانی غیرخطی است و زمان حل مساله با بزرگتر شدن ابعاد زمانی آن به طور نمایی رشد میکند (زارع ابیانه، ۲۰۱۰؛ زارع ابیانه، .(۱۳۹۰ بررسیهای صورت گرفته نشان داد که الگوریتم ژنتیک عملکرد خوبی از نظر زمان حل و کیفیت جوابهای به دست آمده در حل سریهای زمانی داشته است (آیتک، ۲۰۰۸؛ کیم، .(۲۰۰۸ الگوریتم ژنتیک (GA)، شبکههای عصبی مصنوعی و سیستمهای استنتاج فازی از الگوریتمهای فراابتکاری معروف هستند که به اعتقاد کیسی (۲۰۰۷) از روشهای معتبر برآورد تبخیر و تعرق محسوب میشوند. زارع ابیانه و همکاران (۱۳۹۰)، به محاسبهی تبخیر-تعرق واقعی گیاه سیر با استفاده از دو مدل فراابتکاری ترکیبی شامل تلفیق عصبی-ژنتیک و عصبی-فازی در کنار شبکه عصبی مصنوعی پرداختند. نتایج مدلسازی نشان از برتری روش تلفیقی عصبی-ژنتیک در مقایسه با دو روش عصبی و عصبی-فازی داشت بطوریکه الگوریتم ژنتیک در ترکیب با شبکه عصبی توانست خطای آزمون شبکه را نسبت به عصبی-فازی به میزان ۲۴ درصد کاهش دهد. مهماندوست و همکاران (۱۳۹۳)، به ارزیابی تابع زیان اپسیلون و تابع زیان درجه دوم در پیشبینی هدایت هیدرولیکی اشباع خاک با استفاده از مدل ماشین بردار پشتیبان و مدل هیبریدی الگوریتم ژنتیک و ماشین بردار پشتیبان پرداختند. نتایج نشان داد مدل GA-SVR نسبت به مدل SVR دقت بالاتری دارد و تابع اپسیلون دارای دقت نسبتا بهتری نسبت به تابع درجه دوم میباشد، اما از نظر زمان اجرا، تابع زیان درجه دوم نسبت به تابع زیان اپسیلون برتری قابل توجهی دارد. کلانکی و همکاران (۱۳۹۲b)، برای پیش بینی نرخ شکست لوله های شبکه توزیع آب شهری، با استفاده از تکنیک تلفیقی SVM و الگوریتم ژنتیک به بررسی و مقایسه بین انواع توابع کرنل و توابع زیان در ماشین بردار پشتیبان پرداختند. نتایج حاصل از این مقایسات برتری توابع کرنل شعاعی و توابع زیان دو جمله ای را نشان داد. هدف اصلی این تحقیق، ازریابی و مقایسهی دقت مدلهای ماشین بردار پشتیبان رگرسیونی و مدل هیبریدی الگوریتم ژنتیک و ماشین بردار پشتیبان رگرسیونی با دوتابع زیان اپسیلون و درجه دوم برای برآورد ETo روزانه در ایستگاه سینوپتیک اهواز میباشد.

.۲ ابزار و روش
اهواز از شهرهای مهم استان خوزستان میباشد. ایستگاه سینوپتیک اهواز در طول جغرافیایی ۴۸/۷۴ درجه و عرض جغرافیایی ۳۱/۳۴ درجه و با ارتفاع ۲۲/۵ متر از سطح دریا قرار گرفته است. دادههای مورد نیاز در این مطالعه از ایستگاه سینوپتیک اهواز وابسته به سازمان هواشناسی واقع در استان خوزستان جمعآوری شده است، این دادهها از اداره هواشناسی کل کشور گرفته شده است. این دادههای هواشناسی شامل حداکثر و حداقل دمای هوا، رطوبت نسبی، ساعات آفتابی و سرعت باد در مقیاس روزانه در ایستگاه سینوپتیک اهواز با دوره آماری ده ساله ۲۰۰۰) تا(۲۰۱۰ است. ارتفاعات اندازه گیری پارامترهای فوق ۲ متر (دمای هوا و رطوبت نسبی) و ۱۰ متر (سرعت باد) بالای سطح زمین است. برای تبدیل سرعت باد از ارتفاع ۱۰ متری به ارتفاع ۲ متری از معادلهی آلن و همکاران استفاده شده است که معادلهی آن به صورت رابطه ۱ است (آلن وهمکاران،:(۱۹۹۸

در رابطه ( (۱، Uz سرعت باد در ارتفاع Z، U2 سرعت باد در ارتفاع ۲ متری و Z ارتفاعی است که سرعت باد در آن اندازهگیری شده است. مشخصات جغرافیایی و متوسط پارامترهای هواشناسی در طول این دورهی آماری در جدول ۱ آورده شده است. شکل ۱ موقعیت ایستگاه هواشناسی سینوپتیک اهواز را نشان میدهد.

سپس داده های مذکور در محاسبه مقدار تبخیر-تعرق مرجع روزانه مورد استفاده قرار گرفت. روش مبنا برای محاسبه مقدار تبخیر-تعرق مرجع روزانه، روش فائو پنمن-مانتیث میباشد. همچنین در این تحقیق توانایی و دقت مدل ماشین بردار پشتیبان رگرسیونی (SVR) و مدل هیبریدی الگوریتم ژنتیک و ماشین بردار پشتیبان رگرسیونی (GA-SVR) با تابع زیان اپسیلون و درجه دوم در پیشبینی تبخیر-تعرق مرجع روزانه مورد بررسی قرار گرفته و نتایج حاصل از مدلها با نتایج تبخیر-تعرق مرجع حاصل از معادلهی فائو پنمن-مانتیث مقایسه شده است. مقادیر روزانهی ساعات آفتابی، حداکثر و حداقل دمای هوا، رطوبت نسبی و سرعت باد طی سالهای ۲۰۱۰ -۲۰۰۰ به عنوان دادههای ورودی مدل، و تبخیر-تعرق مرجع روزانه محاسبه شده توسط دادههای هواشناسی طی سالهای ۲۰۱۰-۲۰۰۰ با روش استاندارد فائو پنمن–مانتیث به عنوان داده خروجی به مدلها معرفی گردید. ۷۰ درصد دادهها یعنی حدود ۲۵۰۰ دادهی هواشناسی روزانه برای آموزش، ۲۰ درصد دادهها حدود ۸۰۰ دادهی هواشناسی روزانه برای آزمون و ۱۰ درصد دادهها حدود ۳۵۵ دادهی هواشناسی روزانه برای صحتسنجی در مدلها مورد استفاده قرار گرفت. در مدل SVR جهت تدوین و اجرای مدل نیاز به تنظیم پارامترهای C، ε وσ برای مدل با تابع زیان اپسیلون و پارامترهای C وσ برای مدل با تابع زیان درجه دوم میباشد. برای پیدا کردن مناسبترین ترکیب این پارامترها از روش سعی و خطا استفاده شد و ترکیبی که کمترین مقدار خطا را و بالاترین مقدار ضریب همبستگی را ایجاد میکرد، انتخاب گردید. میتوان گفت از جمله نواقص SVR یافتن ترکیب بهینه این پارامترها با روش سعی و خطا میباشد. به همین علت در مدل هیبریدی الگوریتم ژنتیک و ماشین بردار پشتیبان رگرسیونی (GA-SVR) جهت یافتن بهینه ترین ترکیب از مدل GA استفاده شد. در تدوین GA تعداد جمعیت اولیه انتخابی ۲۰، نوع ترکیب تک نقطهای، نرخ انتخاب ۰/۵، نرخ جهش ۰/۲۵ و تعداد تکرار ۲۵۰ لحاظ گردید. الگوریتم ژنتیک با استفاده از ترکیبات مختلف پارامترها در تکرارهای مورد نظر به مقدار خطای مشخصی همگرا می شود. در این مطالعه جهت استفاده از تابع کرنل، دادهها پس از نرمال سازی مورد استفاده قرار گرفتند. برای نوشتن و اجرای کدها از نرم افزار متلب استفاده گردید. با معرفی ماتریسهای دادههای ورودی (حداکثر و حداقل دمای هوا، رطوبت نسبی، ساعات آفتابی و سرعت باد در مقیاس روزانه) و خروجی (تبخیر-تعرق مرجع روزانه محاسبه شده با روش استاندارد فائو پنمن–مانتیث)، انتخاب تابع کرنل و تابع زیان مورد نظر و معرفی مقادیر پارامترهای تنظیمی، هر دو مدل برای پیشبینی تبخیر-تعرق مرجع تدوین و اجرا گردید. با استفاده از تحلیلهای آماری و شاخصهایی چون ضریب همبستگی (R2)، ریشه میانگین مربعات خطا (RMSE) و ریشه میانگین مربعات خطای نرمال (NRMSE) نسبت به انتخاب برترین مدل اقدام گردید.

معادله فائو پنمن-مانتیث (FAO-PM)
محققین بسیاری در سراسر دنیا روش فائو-پنمن-مانتیث را که به صورت تئوری براساس توازن انرژی روی یک سطح مرطوب پوشیده از گیاه ارائه گردیده است، به عنوان دقیقترین روش برای برآورد تبخیر-تعرق گیاه مرجع که در حال حاضر اساس محاسبات نیازآبی میباشد، معرفی نمودهاند. آنچه در معادله فائو-پنمن-مانتیث محاسبه میشود نیازآبی مرجع و یا نیاز آبی یک گیاه فرضی است که به نام ETo معروف است (ستاری وهمکاران، .(۱۳۹۲ معادلهی آن به صورت رابطه ی ۲ است (آلن وهمکاران، :(۱۹۹۸

در رابطه ی (۲)، ETo تبخیر و تعرق گیاه مرجع (mm/day)، T متوسط دمای هوا در ارتفاع دو متری از سطح زمین (℃)، U2 سرعت باد در ارتفاع ۲ متری (m/s)، Rn شار تابش خالص در سطح پوشش گیاهی (MJ/m2/day)؛ (ea − es) کمبود فشار بخار هوا در ارتفاع ۲ متری (KPa/℃)، ∆ شیب منحنی فشار بخار (KPa/℃) و γ ضریب رطوبتی (KPa/℃) و G شار گرمایی به داخل خاک (MJ/m2.d) میباشند.

ماشین بردار پشتیبان
روش ماشین بردار پشتیبان اولین بار توسط وپنیک (۱۹۹۵) و به عنوان روشی برای دستهبندی حجم زیادی از داده ها ارائه شده است. ایدهی اصلی این روش برای دستهبندی دادهها و برآورد روابط رگرسیونی موجود میان دادهها میباشد. بنابراین ماشین بردار پشتیبان یک روش یادگیری ماشین است که برای دسته بندی و رگرسیون استفاده می گردد و بر پایهی تئوری یادگیری آماری و حداقل سازی احتمال زیان معرفی گردید (واپنیک، .(۱۹۹۵ ماشین بردار رگرسیونی روشی برای تخمین تابع به وسیله نگاشت از فضای ورودی به فضایی با مقادیر حقیقی مبتنی بر دادههای آموزشی میباشد. مشابه با ماشین بردار دستهبندی کننده، ماشین بردار رگرسیونی همان خصوصیات حداکثر سازی حاشیه را دارا بوده و در آن از توابع کرنل برای نگاشتهای غیرخطی استفاده می گردد. تابعی که برای محاسبه ماشین بردار پشتیبان رگرسیونی بکار می رود به صورت نگاشتی از فضای ورودی xi به فضای هدف yi بوده که این تابع به فرم رابطه (۳) خواهد بود.

که w معرف بردار وزن و b معرف بایاس است. در ماشین بردار پشتیبان رگرسیونی هدف تخمین پارامتر های wو b برای به دست آوردن بهترین نتیجه است. در ماشین بردار پشتیبان رگرسیونی اختلاف میان دادههای واقعی و دادههای نتایج با ε نمایش یافته و از متغییر های ξ۵ نیز برای اجازه دادن مقداری خطا بر که اثر عواملی مانند نویز به وجود می آید در نظر گرفته شده است، اگر متغییرهای اسلک به کار برده نشود در صورت وجود نویز الگوریتم از تخمین باز میماند (اسمولا و اسکولکوف، .(۱۹۹۸ حاشیه به صورت تعریف گردیده و برای حداکثرسازی حاشیه با حداقل سازی ‖w‖۲، حاشیه حداکثر می گردد. این عملیات در معادله (۴) و (۵) آورده شده که اساس و پایه عملیات برای ماشین بردار رگرسیونی است (واپنیک، .(۲۰۱۰

C تعیین کننده مبادلهای میان اندازه حاشیه و مقدار خطا در آموزش بوده و باهدف کنترل سر ریز آموزشی۶میباشد.کار کردن با فضای ویژگی با ابعاد بالا مشکل بوده و می تواند پر هزینه باشد در نتیجه از توابع کرنل استفاده میکنیم. تابع کرنل، یک جداکننده خطی متکی بر ضرب داخلی بردارهاست که به صورت k(xi,xj)=xiTxj می گردد.
تابع کرنل معادل با ضرب داخلی در فضای ویژگی میباشد. بدین ترتیب به جای محاسبات پر هزینه در فضای ویژگی از تابع کرنل استفاده میگردد. که در اینجا w برابر معادله (۶) میباشد.

در نهایت تابع ماشین بردار پشتیبان رگرسیونی با تاثیر توابع کرنل برابر با معادله (۷) میشود (یو و همکاران، .(۲۰۰۶

از جمله پرکاربردترین توابع هستهای (کرنل) تابع هسته گاوسی۷ یا RBF8 می باشد که در رایطه (۸) نشان داده شده است. در این مطالعه جهت استفاده از تابع کرنل، دادهها پس از نرمال سازی مورد استفاده قرار گرفتند.

که در این معادلات xi بردارهای پشتیبان، xj داد ههای آموزشی و ℴ پهنای باند کرنل تابع پایه شعاع می باشد. برای کمینه کردن خطا و به حداقل رساندن مخاطرات هدف پیدا کردن تابعی به فرم (۹) است تا این مخاطرات را به حداقل رساند.

c(x, y, f(x)) اشاره به تابع هزینه داشته و چگونگی جریمه شدن تابع تخمین را بر اساس دادههای تجربی معین می کند. Remp معرف خطای تجربی.۹میباشد. تابع زیان تعیین کننده چگونگی جریمه شدن دادهها درحین تخمین میباشد. با توجه به پیش فرض بودن دو نوع تابع زیان اپسیلون(ε)۱۰ و تابع زیان درجه دوم۱۱ که در این مطالعه مورد استفاده قرار می گیرد در ذیل ارائه می گردد. در شکل ۲ نمودارهای این توابع مشاهده میگردد.

مقدار تابع زیان اپسیلون ومقدار تابع زیان درجه دوم به ترتیب از معادلات((۱۰ و (۱۱) به دست میآید.

توابعی که برای محاسبهی ماشین بردار پشتیبان رگرسیونی بکار رفته است به صورت نگاشتی از فضای ورودی xi به فضای هدف yi میباشد.

الگوریتم ژنتیک
الگوریتم ژنتیک، بر مبنای تکامل تدریجی داروین، توسط » جان هالند۱۲ « پایه گذاری شده است. روال بهینه یابی در الگوریتم ژنتیک بر اساس یک روند تصادفی هدایت شده استوار است. در این روش هر عضو از جمعیت۱۳ (جواب) به صورت رشته ترکیبی از متغیرها نشان داده می شود که به هر یک از متغیر ها، ژن و به رشته مرکب از ژن ها کروموزوم گفته می شود. در واقع ابتدا برای تعدادی از جواب ها که جمعیت نامیده می شوند، مجموعه ای از پارامترهای هدف به صورت تصادفی تولید می شود. پس از اجرای برنامه شبیه ساز عددی که معرف برازش آن مجموعه از اطلاعات است، مقدار برازندگی۱۴ به آن عضو از جمعیت نسبت داده میشود. این عمل برای تک تک اعضای ایجاد شده تکرار می شود، سپس با فراخوانی عملگرهای الگوریتم ژنتیک از جمله ترکیب۱۵، جهش۱۶ و انتخاب۱۷و با حفظ بخشی از جمعیت برتر، نسل بعد شکل می گیرد و این روال تا برآورده شدن یکی از شروط توقف ادامه خواهد یافت (مهماندوست و همکاران، .(۱۳۹۳ در واقع در فرایند تولید نسل جدید، سه عملگر انتخاب، ترکیب و جهش دخالت دارند. عملگر انتخاب تعیین میکند که کدام کروموزومها برای مشارکت در تولید نسل آینده انتخاب شوند. عملگر ترکیب، به صورت تعویض ژنها بین یک جفت از کروموزومهای جامعه تعریف میشود. سه روش برای انجام ترکیب توسط گلدبرگ شرح داده شده است که عبارتند از: ترکیب یک نقطهای، دو نقطهای و یکنواخت. جهش شامل ایجاد تغییرات تصادفی در اطلاعات یک ژن میباشد. هدف از به کارگیری این عملگر در الگوریتم ژنتیک، ایجاد تغییرات در کروموزومهاست تا با گستردهتر شدن فضای جستجو از حاصل شدن جوابهای بهینه محلی ( و نه سراسری) اجتناب شود (گلدبرگ، .(۱۹۸۹ در تدوین GA تعداد جمعیت اولیه انتخابی ۲۰، نوع ترکیب تک نقطهای، نرخ انتخاب ۰/۵، نرخ جهش ۰/۲۵ و تعداد تکرار ۲۵۰ لحاظ گردید. تابع (۱۱)، تابع هدف۱۸ مورد استفاده در الگوریتم ژنتیک را ارائه می دهد.

در این معادله f میانگین خطا، n تعداد دادههای تست، ytest مقادیر آزمایشی و ymodel مقادیر پیش بینی شده توسط مدل می باشد. الگوریتم ژنتیک با استفاده از ترکیبات مختلف پارامترها در تکرارهای مورد نظر به مقدار خطای مشخصی همگرا می شود. برای نوشتن و اجرای کدها از نرم افزار متلب استفاده گردید.

این فقط قسمتی از متن مقاله است . جهت دریافت کل متن مقاله ، لطفا آن را خریداری نمایید
word قابل ویرایش - قیمت 12700 تومان در 18 صفحه
127,000 ریال – خرید و دانلود
سایر مقالات موجود در این موضوع
دیدگاه خود را مطرح فرمایید . وظیفه ماست که به سوالات شما پاسخ دهیم

پاسخ دیدگاه شما ایمیل خواهد شد