بخشی از پاورپوینت
اسلاید 1 :
درس:مبانی داده کاوی
اسلاید 2 :
درخت تصمیم
درخت تصمیم یک ابزار برای پشتیبانی از تصمیم است که از درختها
برای مدل کردن استفاده میکند.
درخت تصمیم درختی است که در آن نمونه ها را به نحوی دسته بندی
میکند که از ریشه به سمت پائین رشد میکنند و در نهایت به گره های
برگ میرسد.
اسلاید 3 :
يك ساختار درختي شبيه به فلوچارت دارد.
هرگره داخلى در اين درخت آزمونى را بر روى يك صفت خاصه نشان ميدهد.
هر شاخه نتيجه آزمون را نمايش ميدهد.
در هر گره برگ يك برچسب كلاس نگه دارى ميشود.
بالاترين گره در يك درخت گره ريشه است
مشخصات درخت تصمیم
اسلاید 4 :
مثال درخت تصمیم
اسلاید 5 :
مزایای درخت تصمیم
درخت تصمیم به ما این توانایی را میدهد که پیش بینی خود را در قالب یک سری قوانین بیان کنیم که برای سیستم قابل فهم باشد.
درخت تصمیم نیازی به محاسبات خیلی پیچیده برای دسته بندی داده ها ندارد.
درخت تصمیم برای انواع مختلف داده اعم از پیوسته و گسسته قابل استفاده میباشد.
درخت تصمیم این امکان را به ما میدهد تا ویژگی ها با تاثیرات بیشتر را در دسته بندی اطلاعات تشخیص بدهیم.
اسلاید 6 :
معایب درخت تصمیم
در بعضی از روشهای درخت تصمیم اگر تعداد دادههای هر کلاس کم
باشد ، آنگاه نرخ خطا برای داده های تست بالا میرود.
این روش حافظه ی زیادی را مصرف میکند زیرا برای هر گره باید معیار
کارایی را برای ویژگی های مختلف ذخیره کند تا بتواند بهترین ویژگی را
انتخاب کند.
اکثر درختهای تصمیم تنها از یک ویژگی برای شاخه زدن گره ها
استفاده میکنند درصورتی که ممکن است ویژگی ها دارای توزیع توام
باشند.
اسلاید 7 :
معيارهای انتخاب ويژگی برای درخت تصمیم
CHAID : Chi-Squared Automatic Interaction Detection
CART : Classification Regression Trees
اسلاید 8 :
CHAID
اسلاید 9 :
CHAID
الگوریتم CHAID درابتدا برای متغیرهای اسمی طراحی شده بود.
این الگوریتم با توجه به نوع برچسب کلاس از آزمون های مختلف آماری
استفاده می کند.
این الگوریتم هرگاه به حداکثر عمق تعریف شده ای برسد ویا تعداد
نمونه ها در گره جاری از مقدار تعریف شده ای کمترباشد متوقف
می شود.
الگوریتم CHAID هیچگونه هرسی را اجرا نمی کند ومی تواند مقادیر
ناقص را نیز کنترل کند.
اسلاید 10 :
مثال 1 الگوریتم CHAID
اسلاید 11 :
مثالی 2 الگوریتم CHAID
اسلاید 12 :
مثالی 3 الگوریتم CHAID
اسلاید 14 :
CART
الگوریتم CART یک درخت تصمیم دودویی است.بدین معنی که هر
گره ی داخلی بطور دقیق دارای دو انشعاب است.از معیار Towing
استفاده می کند و روشی را نیزبرای هرس کردن دارد.
یکی از ویژگی های مهمCART توانایی تولید درختان رگرسیون است.برگ
ها در چنین درختی یک عدد واقعی را به جای برچسب کلاس تخمین
می زنند.
اسلاید 15 :
مثال Regression Tree
اسلاید 16 :
Example for CART
اسلاید 17 :
باتشکر از توجه شما.
سوال؟