بخشی از پاورپوینت
--- پاورپوینت شامل تصاویر میباشد ----
اسلاید 1 :
- مقدمه اي بر داده كاوي (تعريف، تاريخچه و مفاهيم)
- جايگاه داده كاوي در فرايند كشف دانش
- جايگاه داده كاوي در سازمان
- مروری بر روشهاي داده كاوي
–طبقه بندی
–خوشه بندی
–کشف قانون همبستگی
–تشخیص و کشف خطا
–کشف الگوی ترتیبی
–
- مطالعه موردي: کاربرد داده کاوی در CRM شرکت بیمه
اسلاید 2 :
- گسترش سيستم هاي پايگاهداده و ابزارهای متعدد برای ذخيره حجم بالاي داده ها
- هزينه بالای انجام عمليات روی حجم انبوه داده از نظر نيروي انساني و مادي
- نياز به روشهايي خودکار براي کشف دانشبا کمترين دخالت کاربر
اسلاید 3 :
- از 1960
- ایجاد سيستم ها ي جمع آوري و مديريت داده ها توسط IBM, CDC
- ذخیره داده ها روی دیسک ها و کامپیوترها
- بازیابی ایستا (محاسبه کل سود یک فروشگاه در 5 سال گذشته)
- از 1980
- ایجاد زبان پرس و جو برای تهیه گزارشات از پايگاه داده
- شاخص گذاري و سازماندهي داده ها با DBMS هاي DB2 ، Oracle ، Sybase
- بازیابی پویا در سطح رکورد (ميزان فروش يك كالا در يك شعبه بصورت روزانه)
- از 1990
- ايجادپایگاه داده های چند بعدیData Warehouseو OLAP
- بازیابی پویا در چند سطح (با امكان Drill Down)
- OLAP اطلاعات کاملی از رخدادهای گذشته می دهد، ولی نمی تواند بگوید چرا اتفاق افتاده و یا پیش بینی کند.
- در حال حاضر
- ابزارهای پیشرفته مانندSPSS/Clementine, SGI, SAS
- کشف الگوهاي جديد در پايگاه داده ها
- بازیابی پویا با نگاه پیشرو به آینده
- فروش یک کالا در ماه آینده در یک شعبه خاص چقدر است؟ و چرا؟
اسلاید 4 :
“…The non-trivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data…”
Fayyad,Piatetsky-Shapiro, Smyth [1996]
اسلاید 5 :
- حجم انبوه داده (ترابایت)
–روش های آماری مبتنی بر نمونه گیری است.
- داده های با حجم زیاد و با ابعاد مختلف
–تصاویر و عکسها
–داده های ژنتیکی
- کشف اطلاعات نهفته و الگوی های ناشناخته مفید از درون حجم انبوه داده ها
–الگوي مفيد، مدلي برای توصیف ارتباط ميان زير مجموعه ای از داده هاست و معتبر ، ساده ، قابل فهم و جديد است.
- حجم بیشتر داده ها و روابط پيچيده تر
–دسترسي به اطلاعات نهفته در ميان داده ها مشکل تر
–نقش داده کاوي روشن تر
اسلاید 6 :
- نگهداری و پردازش حجم انبوه داده ها
- فرمت هاي مختلف داده
–نیاز به عمليات و تکنيک های مختلف از قبیل تعريف صفات جديد با انجام عمليات رياضي و منطقي روي صفات موجود
- مقادیر نامعتبر و بی کیفیت داده های خام
–استفاده از روشها و الگوریتم های مختلف برای پاکسازی داده
- روش های کارا برای جستجو
- بروز رسانی و یکپارچگی داده ها
اسلاید 7 :
- خرده فروشي
–تعيين الگوهاي خريد مشتريان
- بيمه
–پيشگويي ميزان خريد بيمه نامه هاي جديد توسط مشتريان
- پزشکي
–پيشگويي ميزان موفقيت اعمال جراحي بر اساس شرایط بیماران
- بانکداري
–پيش بيني الگوهاي کلاهبرداري از طريق کارتهاي اعتباري
–تشخيص مشتريان ثابت
اسلاید 8 :
- پیش بینی وقایع آینده بر اساس روند گذشته
- طبقه بندی اشیا و افراد برای شناسایی الگو
- دسته بندی اشیا و افراد بر اساس صفات و ویژگی ها
- شناسایی وقایعی که احتمال دارد همزمان رخ دهند
- شناسایی وقایعی که یکی باعث وقوع دیگری می شود
اسلاید 9 :
- طبقه بندی اشیا و افراد برای شناسایی الگو
- یادگیری نظارت شده
- درخت تصمیم
- شبکه عصبی
.....
اسلاید 10 :
- بازاریابی مستقیم
- شناخت تقلب - Fraud Detection
- شناسایی و طبقه بندی مشتری
- ارسال کاتالوگ