بخشی از پاورپوینت

--- پاورپوینت شامل تصاویر میباشد ----

اسلاید 1 :

مقدمه:

 طبقه بندی یکی از پرتکرارترین وظایف ایجاد تصمیم در فعالیت های انسان است

 بسیاری مسائل می توانند به عنوان مسائل طبقه بندی تلقی شود. مثلا

 پیش بینی ورشکستگی

 دادن وام

 تشخیص پزشکی

 تشخیص کاراکتر دست خط

 تشخیص گفتار

 طبقه بندی کننده های آماری مبتنی بر تئوری تصمیم بیزین هستند

اسلاید 2 :

شبکه های عصبی یک ابزار مهم برای طبقه بندی محسوب می شود

مزیت های شبکه های عصبی

روش های خود تطبیقی برای مبنای داده هستند

می تواند هر تابعی را با دقت دلخواه تخمین بزند

مدل های غیر خطی هستند

در تخمین احتمالات عقبی (posterior probability) توانا هستند

تعدادی از مسائل با توجه به شبکه های عصبی هنوز به طور موفقیت آمیزی حل نشده اند

اسلاید 3 :

شبکه های عصبی و طبقه بندی کننده های مرسوم

طبقه کننده های آماری مبتنی بر تئوری تصمیم بیزین هستند, که احتمالات عقبی نقش اصلی را بازی می‌کند

کد کردن مختلف اعضای خروجی :

مسئله طبقه بندی دو-گروه

اگر شی متعلق به کلاس 1 باشد, خروجی به صورت 1

اگر شی متعلق به کلاس 2 باشد, خروجی به صورت 1-

تابع جدا کننده زیر را داریم :

اسلاید 4 :

ØRaudys ثابت کرد با کنترل هدفمند پیچیدگی پرسپترون تک لایه, مرزهای تصمیم طبقه بندی کننده, برابر یا نزدیک 7 طبقه بندی کننده آماری زیر هستند :

طبقه بندی کننده فاصله Enclidean

تابع جدا کننده خطی Fisher

تابع جدا کننده خطی Fisher با شبه وارونه سازی ماتریس کواریانس

تابع جدا کننده خطی Fisher تعمیم بافته

منظم کردن تحلیل جدا کننده خطی

طبقه بندی کننده حداقل خطای تجربی

طبقه بندی کننده حداکثر اختلاف

اسلاید 5 :

رگرسیون دو حالته (Logistic Regression) ابزار طبقه بندی کننده مهم دیگر است, که در تشخیص پزشکی و مطالعات امراض همه گیر استفاده می شود.غالبا بر تحلیل جدا کننده ترجیح داده می شود

نتیجه آزمایش جامع  Minchiکه در مطالعه مقایسه ای پروژه StatLog بود و 3 روش طبقه بندی (شبکه های عصبی , طبقه بندی کننده های آماری  و یادگیری ماشین) مقایسه شده بود,  نشان داد که یک طبقه بندی کننده خوب برای همه مجموعه داده ها وجود ندارد

اسلاید 6 :

یادگیری : توانایی در تخمین رفتار با توجه به داده آموزشی

تعمیم :‌ توانایی پیش بینی خوب, فراتر از داده های آموزشی

تعدادی از موضوعات طراحی شبکه کاربردی وابسته به یادگیری و تعمیم :

اندازه شبکه

 اندازه نمونه

انتخاب مدل

انتخاب ویژگی

Underfitting : مدل ساده و غیرقابل انعطاف. مثل طبقه بندی کننده خطی

OverFitting : مدل پیچیده و انعطاف پذیر. مثل شبکه های عصبی

دو پدیده بالا از طریق تجزیه Bias-plus-Variance تحلیل می‌شود

 

اسلاید 7 :

بایاس : اختلاف بین خروجی تابع اصلی با تابعی که تخمین زده شده است

واریانس : حساسیت تابع تخمینی به مجموعه داده های آموزشی

مثالی از بایاس و واریانس

اسلاید 8 :

حالت مطلوب این است که بایاس و واریانس کم باشند اما به طور همزمان غیر ممکن است

یک مدل خوب بایستی به خوبی بین بایاس مدل و واریانس مدل تعادل برقرار کند

کارهای انجام گرفته در این حوزه :

üGeman : کار بروی trade off بین بایاس و واریانس تحت تابع هدف دو جمله ای

Wolpert‌:‌ توسعه مفهوم بایاس-به علاوه- واریانس در مفهوم بیزین

Dietterich and Kong‌:‌ نسخه متفاوتی از بایاس-واریانس برای توابع 0-1 از مسائل طبقه بندی

اسلاید 9 :

یک مشکل رایج Overfitting است که ناشی از واریانس بالاست در تعمیم است.

Dietterich نشان داد که واریانس فاکتور مهم‏تری از Bias در کارایی پیش‏بینی است.

Breiman نشان داد روش‏های کلاس‏بندی شبکه عصبی جزء روش‏های ناپایدار هستند:

به این معنی که تغییر کوچک در داده‏ی آموزشی سبب تغییر بزرگ در نتیجه تست خواهد شد.

بنابراین بیشترین تلاش در زمینه کاهش Overfittingاست.

اسلاید 10 :

تعمیم و کلاس‏بندی

یک نتیجه بسیار مهم از Dietterich این بودکه الگوریتم‏های بهینه در مرحله آموزش نتایج مناسبی را بر روی داده تست ندارند.

 

در متن اصلی پاورپوینت به هم ریختگی وجود ندارد. برای مطالعه بیشتر پاورپوینت آن را خریداری کنید