بخشی از مقاله

چکیده 

مسئله یادگیري ماشین این است که کامپیوتر بتواند به تدریج و با افزایش دادهها، کارایی بهتري در انجام وظیفهي مورد نظر پیدا نموده و پژوهشگران بر آناند که روشهاي یادگیري نوینی به وجود بیاورند و امکانپذیري و کیفیت یادگیري را براي تکنیکهاي پیشنهادي مطالعه کنند و در سوي دیگر عدهاي از پژوهشگران سعی میکنند روشهاي یادگیري ماشینی را بر مسائل تازهاي اعمال کنند پس هدف یادگیري ماشین عبارت است از:

چگونه میتوان برنامهاي نوشت که از طریق تجربه، یادگیري کند و عملکرد خود را بهتر نماید و یکی از بارزترین الگوریتمهاي یادگیري ماشین همان شبکههاي عصبی مصنوعی هستند که با توجه به حجم بالاي اطلاعات در بانکهاي داده و یافتن اطلاعات مفید و مناسب در آنها ضرورت پیدا کرده.

از سویی دیگر یادگیري شبکه عصبی مصنوعی، یکی از پرکاربردترین و کارآمدترین متدهاي یادگیري اﺳﺘﻘﺮاﯾﯽ براي پردازشها میباشند . هدف این مقاله، اراﺋﻪ کارا بودن روش یادگیري شبکه عصبی RBF به عنوان روشی مناسب و قوي براي دادههایی با حجم بالا، نسبت به شبکه عصبی و شبکه عصبی چند لایه میباشد. در روش تحقیق، ارزیابی از ﻋﻤﻠﮑﺮدﻫﺎي الگوریتم-هاي یادگیري ماشین یعنی انواع شبکه عصبی انجام گردیده و سرانجام در بخش یافتهها و نتایج تجربی الگوریتم یادگیري شبکه عصبی RBF نسبت به رقیبهاي خود یعنی شبکه عصبی چند لایه و ﺷﺒﮑﻪ ﻋﺼﺒﯽ مصنوعی توانست به نتایج بهتري دست یابد.

-1 مقدمه

-1-1 شرح مسئله کاري

هرچه زمان میگذرد اطلاعات بیشتري جمع آوري شده و در بانکهاي داده ذخیره میگردد به گونهاي که حجم دادههاي ثبت شده بطور متوسط هر پنج سال نیز دو برابر میشود و ضرورت وجود ابزاري براي پردازش دادههاي ذخیره شده و نمایش اطلاعات مفید حاصل از این پردازشها مهم نمایان میشود. استخراج اطلاعات مناسب از میان انبوه دادهها و تبدیل آنها به دانش مورد نیاز سازمانها، بویژه در تصمیم - گیريهاي سازمانی، نیازمند استفاده از روشهاي نوین در این حوزه است یعنی تحقیقات انجام شده بیانگر این است که سازمانها کمتر از یک درصد از دادههاي خود را براي تحلیل بکار میبرنند پس اهمیت دادهکاوي دو چندان میگردد. دادهکاوي به مفهوم استخراج اطلاعات نهان و یا الگوها و روابط مشخص در حجم زیادي از دادهها در یک یا چند بانک اطلاعاتی بزرگ است.

که پایگاهها و مجموعه حجیم دادهها را در پی کشف و استخراج، مورد تحلیل قرار میدهد. این گونه مطالعات و کاوشها را می توان همان امتداد و استمرار دانش کهن و فراگیر آماردانست که ممکن است مدلهاي آماري، الگوریتمهاي ریاضی و روشهاي یاد گیرنده 1 باشند که کار خود را به صورت خودکار و براساس تجربه اي که از طریق شبکههاي عصبی 2به دست میآورند، بهبود بخشیده و تفاوت عمده در مقیاس، وسعت، گوناگونی زمینهها ، کاربردها، ابعاد و اندازههاي دادههاي امروزي است که شیوههاي ماشینی مربوط به یادگیري، مدلسازي و آموزش را طلب مینماید .

دادهکاوي در اواخر دهه 1980 میلادي پدیدار گشت که هدف آن همان، استخراج و تحلیل مقدار زیادي داده است و به منظور کشف قوانین و الگوهاي معنیدار، افزایش ارزش اصلی آنها و انتقال دادهها بصورت دانش و پیش گویی از آینده میباشد و از پیشرفتهاي هوش مصنوعی و آمار نیز بهره میگیرد. یعنی داده کاوي وارث روشهاي آماري میباشد که با تغییر و گسترش آنان براي متناسبسازي با حجم دادهها بهکار می - روند. ازجمله کاربردهاي دادهکاوي میتوان به بررسی و جایگزینی دادههاي مفقود شده، بانکداري، تشخیص و حذف دادههاي تکراري و اضافه،کارخانهداري، تجارت الکترونیک،نرمال سازي دادههاکشف، جرایم، تبدیل دادههاي پیوسته به گسسته، ارزیابی میزان ریسک و فروش محصولات فشردهسازي دادهها، بازاریابی و غیره اشاره کرد. [1] [2]

-2 -1 ادبیات و پیشینه تحقیق

یکی از کاربردهاي موفق یادگیرنده هاي تنبل برروي مبحث یادگیرندههاي چندتایی بود، که توسط زنوبی مطرح شده است

ایده اصلی یادگیرندههاي چندتایی این بوده که با کمک مجموعه اي از کلاسه کنندههاي منفرد و ساختن کلاسه کننده دقیقتري که ازاین مجموعه حاصل میشود، دقت کلاسه کننده را افزایش دهد.

دییتریچ از سه طریق مختلف افزایش دقت در کلاسه کنندههاي چندتایی را نسبت به یادگیرنده هاي تنبل به اثبات رسانده است

اولین دلیل همان آماري است و در این مقاله الگوریتم یادگیري به عنوان جستجوي فضا تعریف شده باشد و مشکل هنگامی بوجود میآید که مقدار دادههاي آموزشی موجود در مقایسه با اندازه فضاي فرضیه بسیار کوچک باشد. بدون اطلاعات کافی، الگوریتم یادگیري میتواند فرضیه مختلف را به همان دقت و صحت براي همه دادهها بیان کند. ساخت گروه، این الگوریتم می تواند به طور متوسط رأي خود را اعلام کرده و خطر ابتلا به انتخاب طبقهبندي نادرست را کاهش دهد.

دومین دلیل از نقطه نظر محاسباتی است. بسیاري از الگوریتمهاي یادگیري با انجام برخی از اشکال جستجوي محلی کار میکنند و ممکن است در بهینه محلی گیر کند و اگر به اندازه کافی داده ها را آموزش بدهیم، آنگاه ممکن است الگوریتم یادگیري جهت پیدا کردن بهترین فرضیه، مشکل محاسباتی پیدا کند. با ساخت گروهها و اجراي جستجوي محلی از نقاط مختلف ممکن است تقریب بهتري نسبت به ردهبندي انفرادي فراهم آید و سومین دلیل هم نمایشی است. در اکثر کاربردهاي یادگیري ماشین، عملکرد واقعی نمیتواند توسط هریک از فرضیه ها ارائه شود. با وزن دهی به فرضیهها و انتخاب تک تک آنها و انتخابفضاهايکوچکترتوسطگروههامیتوانفضارابهتوابعقابلنمایش-تقسیمبنديکرده و آنها را به نمایش گذاشته.

کلاسه کنندههاي چندتایی به سه دﺳﺘﻪ کلی بگینگ، بوستینگ و استکینگ تقسیم بندي میشوند. براي اولین بار فرن و برودلی کلاسه کننده هاي چندتایی را به یادگیرنده هاي تنبل آمیختند و یک مکانیزم خاص بوستینگ براي درختهاي تصمیم گیري تنبل ارائه دادند

در این کار این دو محقق درختهاي تصمیم گیري تنبل را ﺑﺎ روشهاي یادگیري چندتایی ترکیب کردند و الگوریتمی مبتنی بر بوستینگ ارائه دادند، که براي هر داده تستی بوده و براساس متد درخت تصمیم گیري تنبل، روشهاي آموزش چندتایی را پیاده سازي کرده است

همچنین آنها نشان دادند که این روش جدید دقت قابل ملاحظه و قابل فهم تري خواهد داشت. همچنین، آنها براي رفع محدودیت یادگیري که براي نمونه هاي وارد شده پیش میآمد یک استراتژي "قطع کردن شاخه هاي درخت مبتنی بر فاصله" را بیان کردند که نتایج نشان داده است که این استراتژي دقت را در هر دو روش آموزش چندتایی و منفرد در درخت تصمیم گیري بالا میبرد و ثابت کردند هنگامی که یادگیرندههاي زرنگ تلاش می کنند تا یک مرز تصمیم گیر بهینه براي تمام داده ها بسازند روشهاي یادگیري تنبل در پی آن هستند که براي هر نمونه وارد شده بهترین جواب محلی را با استفاده از نمونه هاي اطراف نمونه وارد شده پیدا کنند. همچنین نشان دادند الگوریتمی که برپایه بوستینگ، جهت بهتر کردن درخت تصمیم گیري تنبل براي هر داده تست ارائه شده ، کارآیی بهتري نسبت به کلاسه کننده پایه درخت تصمیم گیري تنبل دارد.

-2 روش تحقیق

در روش تحقیق مبنا را بر تعریف رویکردي هریک از الگورتیم هاي یادگیري که به نوعی دال بر قیاس رویکردي آنان میباشد نیز قرار دادیم.

-1 -2 الگورتیمهاي یادگیري ماشین

سه نوع اصلی از الگوریتم هاي یادگیري ماشین عبارتند از: 

الف - یادگیري نظارت شده

در این نوع از الگوریتم ها که بار اصلی یادگیري ماشین را بر دوش دارند با دو نوع از متغیرها سروکارداشته که نوع اول، متغیرهاي مستقل نامیده شده، یعنی یک یا چند متغیر هست که قرار است بر اساس مقادیر آنها، یک متغیر دیگر را پیش بینی کرده مانند: سن مشتریان براي پیش بینی خرید یک کالا درآمد و نوع دوم هم متغیرهاي وابسته یا هدف یا خروجی هستند و قرار است مقادیر آنها را به کمک این الگوریتم ها پیش بینی کرده. براي این منظور باید تابعی ایجادکرده که وروديها2 را گرفته و خروجی موردنظر را تولید کند. فرآیند یافتن این تابع که در حقیقت کشف رابطهاي بین متغیرهاي مستقل و متغیرهاي وابسته است را فرآیند آموزش3 گفته که روي دادههاي موجود یعنی دادههایی که هم متغیرهاي م ستقل و هم متغیرهاي وابسته آنها معلوم هستند نیز برقرار هستند مانند درختهاي تصمیم، جنگلهاي تصادفی.

ب - یادگیري بدون ناظر

در این نوع از الگوریتمها، متغیر هدف نداشته و خروجی الگوریتم، نامشخص است. مانند گروهبندي خودکار یک جمعیت

ج - یادگیري تقویت شونده

نوع سوم از الگوریتمها که شاید بتوان آنها را در گروه الگوریتمهاي بدون ناظر هم دسته بندي کرد، همان یادگیري تقویت شونده هستند. در این نوع از الگوریتم ها، یک ماشین 4، براي گرفتن یک تصمیم خاص، آموزش داده میشود و ماشین بر اساس موقعیت فعلی 5 و عکس العملهاي مجاز6، یک تصمیم را میگیرد که در دفعات اول، این تصمیم میتواند کاملاً تصادفی باشد و به ازاي هر عکس العمل، یا رفتاري که بروز میدهد، سیستم یک فیدبک یا بازخورد یا امتیاز به آن میدهد و از روي این فیدبک، ماشین متوجه می شود که تصمیم درست را اتخاذ کرده یا نه، که در دفعات بعد در آن موقعیت، همان عملکرد را تکرار کند یاعملکرد و رفتار دیگري را امتحان کند. مانند فرآیند تصمیمگیري مارکوف، الگوریتمهاي شبکه هاي عصبی. مهم-ترین الگوریتمهاي یادگیري ماشین در قالب جداول 1و2 عبارتند از:

جدول -1 الگورتیم هاي یادگیري ماشین UnSupervised

-3 شبکه عصبی مصنوعی

-1-3 مروري بر شبکه عصبی مصنوعی

در شبکه هاي عصبی مصنوعی نیز بلوكهاي ساختاري و یا نرونها ، دﺳﺘﮕﺎهﻫﺎي محاسباتی خیلی ساده اي هستند و ارتباط بین نرون ها عملکرد شبکه را تعیین میکند و هدف از آموزش شبکههاي عصبی مصنوعی تعیین ارتباط مناسب، ﺟﻬﺖ حل مسائل ﻣﺨﺘﻠﻒ است. در واقع شبکههاي عصبی مصنوعی نیز با ایده گرفتن از رفتار شبکه عصبی بیولوژیکی شکل یافته است. در اینهاشبکهنیز عموماً لایههاي موازي نرونها را دﯾﺪه که نرونهاي هر لایه نقش خاصی را ایفا ﻣﯽﮐﻨﻨﺪ. معمولاً وروديهایی که از خارج به شبکه عصبی داده می شوند، به دستهاي از نرون ها که در یک لایه ﻣﺮﺗﺐ شدهاند، اعمال میشود.

این وروديها با وزن هاي خاص جمع شده و به تابع تحریک هر نرون فرستاده میشوند که این اقدام به پردازش جمع وزن دار ورودي هاي اعمال شده و به نرون ختم میشود و خروجی نرون را به لایه هاي بعدي و نهایتاً به لایه خروجیفرستدمی که جواب شبکه نسبت به ورودي هاي اعمال شده به آن است. اگر چه نرونهاي بیولوژیکی از نرون هاي مصنوعی که توسط مدارهاي الکتریکی ساخته می شوند ، بسیار کندتر هستند، اما عملکرد مغز خیلی سریعتر از عملکرد یک کامپیوتر معمولی است .

علت اصلی این پدیده بیشتر ب ه خاطر ساختار کاملاً موازي نرونهاي عصبی مغز است و این بدان معنی است که همه نروناه معمولاً به طور همزمان کار میکنند واسخپ می دهند. شبکههاي عصبی مصنوعی با وجود اینکه با سیستم عصبی طبیعی قابل مقایسه نیستند، ویژگیهایی دارند که آنها را در بعضی از کاربرد ها مانند تفکیک الگو، رباتیک، کنترل و به طور کلی در هر جا که نیاز به یادگیري یک نگاشت خطی و یا غیر خطی باشد ممتاز می-نماید .[8] به بیان دیگر شبکههاي عصبی مصنوعی، در واقع نوعی سیستم پردازش اطلاعات هستند که از تعمیم یافتن مدلهاي ریاضی شبکههاي عصبی انسان بر مبناي فرضیات جدول 3 توسعه یافته اند:

جدول -3 فرضیات لازم براي تعمیم یافتن مدل هاي ریاضی شبکههاي عصبی انسان

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید