بخشی از پاورپوینت
--- پاورپوینت شامل تصاویر میباشد ----
اسلاید 1 :
مقدمه
- بردار ويژگي: دوتايي (X,Y) بيانگر بردار ويژگي (الگو) X است و Y برچسب كلاس مربوطه است. اجزاء X همان ويژگيهاي مورد نظر هستند.
- الگوي مرتب: اگر ويژگيهاي X داراي مقاديري از يك مجموعه مرتب باشند، X را يك الگوي مرتب (orderd)يا عددي(numerical) ميناميم .
- الگوي حتمي: اگر ويژگيهاي بردار مقاديري اختيار كنند كه داراي ترتيب طبيعي نباشند، آن را يك الگوي حتمي (Categorical) مينامند.
- ويژگيهاي عددي (مرتب) ممكن است داراي مقادير گسسته يا پيوسته باشند.
- روش هاي دسته بندي:
تك مرحله اي
چند مرحله اي
- مقادير ويژگي ها:
پيوسته
گسسته
اسلاید 2 :
معرفي درخت تصميم گيري و برخي تعاريف مورد نياز
نمايي از يك درخت تصميم گيري:
اسلاید 3 :
- ميانگين تعداد لايهها از ريشه تا گرههاي پاياني را عمق متوسط ميناميم.
- ميانگين تعداد گرههاي مياني در هر سطح درخت عرض متوسط درخت ناميده ميشود.
- اگر دو گره داخلي حداقل داراي يك كلاس مشترك باشند در اين حالت گفته ميشود كه كلاسها داراي روي هم افتادگي (O erlap) هستند.
اسلاید 4 :
نحوة انتساب كلاس به يك بردار ورودي در درخت تصميم گيري:
- بردار ورودي در گره ريشه قرار مي گيريد.
- بردار ورودي در هر گرهي كه قرار مي گيرد با توجه به ارزيابي انجام شده در يكي از شاخه ها پايين مي رود تا در يك برگ قرار بگيرد.
- برچسب برگي كه گره در آن قرار مي گيرد به عنوان برچسب بردار برگردانده مي شود.
اسلاید 5 :
مزايا:
.1قوانين توليد شده و به كارگرفته شده قابل استخراج و قابل فهم.
.2کار با داده هاي پيوسته و گسسته.
.3استفاده از نواحي تصميم گيري ساده.
.4حذف مقايسه هاي غيرضروري.
.5استفاده از ويژگي هاي متفاوت براي نمونه هاي مختلف.
.6احتياجي به تخمين تابع توزيع نيست.
اسلاید 6 :
معايب:
.1در مواردي كه هدف تخمين تابعي با مقادير پيوسته است مناسب نيستند.
.2در موارد با تعداد كلاس زياد و نمونه آموزشي كم، احتمال خطا بالاست.
.3هزينه محاسباتي بالاي توليد درخت تصميم گيري.
.4هرس كردن درخت نيز هزينه بالايي دارد.
.5در مسائلي كه كلاس هاي ورودي با نواحي مكعبي به خوبي جدا نشوند خوب عمل نمي كنند.
.6زياد شدن گره پاياني در صورت روي هم افتادگي گره ها.
.7انباشته شدن خطاي لايه ها بر روي يكديگر.
.8طراحي درخت تصميم گيري بهينه مشكل است.
اسلاید 7 :
طراحي درخت تصميم گيري
اسلاید 8 :
اهداف اصلي درختهاي تصميمگيري دستهبندي كننده:
.1دادههاي ورودي را تا حد ممكن درست دستهبندي كنند.
.2دانش آموخته شده از دادههاي آموزشي را به گونهاي عموميت ببخشند كه دادههاي ديده نشده را با بالاترين دقت ممكن دستهبندي كنند.
.3در صورت اضافه شدن دادههاي آموزشي جديد بتوان به راحتي درخت تصميمگيري را گسترش داد(داراي خاصيت افزايشي باشند).
.4ساختار درخت حاصل به سادهترين شكل ممكن باشد.
اسلاید 9 :
گامهاي لازم براي طراحي يك درخت تصميمگيري:
.1انتخاب مناسبي براي ساختار درخت.
.2انتخاب ويژگيهايي مورد نظر براي تصميمگيري در هر يك از گرههاي مياني.
.3انتخاب قانون تصميمگيري يا استراتژي مورد استفاده در هر يك از گرههاي مياني.
اسلاید 10 :
روشهاي هيوريستيك ساخت درخت تصميمگيري:
.1روشهاي پايين به بالا
.2روشهاي بالا به پايين
.3روش تركيبي
.4روشهاي رشد دهنده-هرس كننده