بخشی از پاورپوینت
--- پاورپوینت شامل تصاویر میباشد ----
اسلاید 1 :
مقدمه:
طبقه بندی یکی از پرتکرارترین وظایف ایجاد تصمیم در فعالیت های انسان است
بسیاری مسائل می توانند به عنوان مسائل طبقه بندی تلقی شود. مثلا
پیش بینی ورشکستگی
دادن وام
تشخیص پزشکی
تشخیص کاراکتر دست خط
تشخیص گفتار
طبقه بندی کننده های آماری مبتنی بر تئوری تصمیم بیزین هستند
اسلاید 2 :
شبکه های عصبی یک ابزار مهم برای طبقه بندی محسوب می شود
مزیت های شبکه های عصبی
روش های خود تطبیقی برای مبنای داده هستند
می تواند هر تابعی را با دقت دلخواه تخمین بزند
مدل های غیر خطی هستند
در تخمین احتمالات عقبی (posterior probability) توانا هستند
تعدادی از مسائل با توجه به شبکه های عصبی هنوز به طور موفقیت آمیزی حل نشده اند
اسلاید 3 :
شبکه های عصبی و طبقه بندی کننده های مرسوم
طبقه کننده های آماری مبتنی بر تئوری تصمیم بیزین هستند, که احتمالات عقبی نقش اصلی را بازی میکند
کد کردن مختلف اعضای خروجی :
مسئله طبقه بندی دو-گروه
اگر شی متعلق به کلاس 1 باشد, خروجی به صورت 1
اگر شی متعلق به کلاس 2 باشد, خروجی به صورت 1-
تابع جدا کننده زیر را داریم :
اسلاید 4 :
ØRaudys ثابت کرد با کنترل هدفمند پیچیدگی پرسپترون تک لایه, مرزهای تصمیم طبقه بندی کننده, برابر یا نزدیک 7 طبقه بندی کننده آماری زیر هستند :
طبقه بندی کننده فاصله Enclidean
تابع جدا کننده خطی Fisher
تابع جدا کننده خطی Fisher با شبه وارونه سازی ماتریس کواریانس
تابع جدا کننده خطی Fisher تعمیم بافته
منظم کردن تحلیل جدا کننده خطی
طبقه بندی کننده حداقل خطای تجربی
طبقه بندی کننده حداکثر اختلاف
اسلاید 5 :
رگرسیون دو حالته (Logistic Regression) ابزار طبقه بندی کننده مهم دیگر است, که در تشخیص پزشکی و مطالعات امراض همه گیر استفاده می شود.غالبا بر تحلیل جدا کننده ترجیح داده می شود
نتیجه آزمایش جامع Minchiکه در مطالعه مقایسه ای پروژه StatLog بود و 3 روش طبقه بندی (شبکه های عصبی , طبقه بندی کننده های آماری و یادگیری ماشین) مقایسه شده بود, نشان داد که یک طبقه بندی کننده خوب برای همه مجموعه داده ها وجود ندارد
اسلاید 6 :
یادگیری : توانایی در تخمین رفتار با توجه به داده آموزشی
تعمیم : توانایی پیش بینی خوب, فراتر از داده های آموزشی
تعدادی از موضوعات طراحی شبکه کاربردی وابسته به یادگیری و تعمیم :
اندازه شبکه
اندازه نمونه
انتخاب مدل
انتخاب ویژگی
Underfitting : مدل ساده و غیرقابل انعطاف. مثل طبقه بندی کننده خطی
OverFitting : مدل پیچیده و انعطاف پذیر. مثل شبکه های عصبی
دو پدیده بالا از طریق تجزیه Bias-plus-Variance تحلیل میشود
اسلاید 7 :
بایاس : اختلاف بین خروجی تابع اصلی با تابعی که تخمین زده شده است
واریانس : حساسیت تابع تخمینی به مجموعه داده های آموزشی
مثالی از بایاس و واریانس
اسلاید 8 :
حالت مطلوب این است که بایاس و واریانس کم باشند اما به طور همزمان غیر ممکن است
یک مدل خوب بایستی به خوبی بین بایاس مدل و واریانس مدل تعادل برقرار کند
کارهای انجام گرفته در این حوزه :
üGeman : کار بروی trade off بین بایاس و واریانس تحت تابع هدف دو جمله ای
Wolpert: توسعه مفهوم بایاس-به علاوه- واریانس در مفهوم بیزین
Dietterich and Kong: نسخه متفاوتی از بایاس-واریانس برای توابع 0-1 از مسائل طبقه بندی
اسلاید 9 :
یک مشکل رایج Overfitting است که ناشی از واریانس بالاست در تعمیم است.
Dietterich نشان داد که واریانس فاکتور مهمتری از Bias در کارایی پیشبینی است.
Breiman نشان داد روشهای کلاسبندی شبکه عصبی جزء روشهای ناپایدار هستند:
به این معنی که تغییر کوچک در دادهی آموزشی سبب تغییر بزرگ در نتیجه تست خواهد شد.
بنابراین بیشترین تلاش در زمینه کاهش Overfittingاست.
اسلاید 10 :
تعمیم و کلاسبندی
یک نتیجه بسیار مهم از Dietterich این بودکه الگوریتمهای بهینه در مرحله آموزش نتایج مناسبی را بر روی داده تست ندارند.