بخشی از پاورپوینت
--- پاورپوینت شامل تصاویر میباشد ----
اسلاید 1 :
پیش پردازش داده ها
تمیز کردن
تغیر شکل
کاهش
کاربردهای داده کاوی
روشهای داده کاوی
خوشه بندی
الگوهای تکرارشونده و قوانین انجمنی
دسته بندی و پیش بینی
نتیجه گیری
منابع مقدمه
کشف دانش در داده
اسلاید 2 :
What is DATA MINING?
کشف اطلاعات نهفته و الگوهای ناشناخته مفید از روی حجم انبوه داده ها
What is STREAM DATA MINING?
داده هایی که در جریان هستند تفسیر می کنیم
On line داده کاوی می کنیم همه data را نداریم الگوریتم های مختلفی دارد
اسلاید 3 :
Why DATA MINING?
سرعت در تحليل اطلاعات و افزايش كيفيت نتايج تحليل ها
شناسايي سريع فرصتها و تهديدها
بهره گیری از سيستمهاي داده كاوي با كاربري آسان
ايجاد امكان استفاده از ابزارهاي متنوع داده كاوي
افزایش قدرت تحليل در سازمان بهمراه افزايش صحت تحليل
ايجاد فضايي شفاف در سازمان براي تصميم گيري صحيح در تمامی رده های مدیریتی بویژه بهبود تصميم گيري مديران ارشد
اسلاید 4 :
داده هایی که روی آنها عملیات mining انجام می دهیم باید ویژگی های
زیر را دارا باشند تا خروجی مفید و قابل استفاده و اطمینانی را به ما بدهند
Accuracy Completeness Consistency Believability
Value added Interpretability Accessibility
داده ها در جهان واقعی DIRTY هستند
DIRTY بودن یعنی داده ها :
-ناقص هستند incomplete
-شلوغ هستند noisy
-متناقص هستند inconsistent
اسلاید 5 :
اصولاً هر جایی که داده وجود داشته باشد دادهکاوی نیز معنا مییابد، از قبيل:
امور تجاري و مالي، امور پزشكي، زيست پزشكي، كشف ناهنجاريها و اسناد جعلي، ارتباطات از راه دور، ورزش و سرگرمي، كتابداري و اطلاعرساني.
امروزه عملیات داده کاوی به صورت گسترده توسط تمامی شرکتهایی که مشتریان در کانون توجه آنها قرار دارند، استفاده میشود، از جمله: فروشگاهها، شرکتهای مالی، ارتباطاتی، بازاریابی و غیره.
استفاده از دادهکاوی به این شرکتها کمک میکند تا ارتباط عوامل داخلی از جمله: قیمت، محل قرارگیری محصولات و مهارت کارمندان را با عوامل خارجی از جمله: وضعیت اقتصادی، رقابت در بازار و محل جغرافیایی مشتریان کشف نمایند.
دادهکاوی پیشبینی وضع آینده بازار، گرایش مشتریان و شناخت سلیقههای عمومی آنها را برای شرکتها ممکن میسازد
اسلاید 6 :
بازار هدف
پيدا کردن الگوي خريد مشتري
برنامهریزی برای معرفی محصول جدید
دستهبندي مشتريان براساس نوع خريد
آناليز نيازهاي مشتريان
تشخيص محصولات مناسب براي دستههاي مختلف مشتريان
تشخيص فاکتورهايي براي جذب مشتريان جديد
تعيين الگوهاي خريد مشتريان
تجزيه و تحليل سبد خريد بازار
پيشگويي ميزان خريد مشتريان از طريق پست (فروش الکترونيکي)
پيشبيني الگوهاي کلاهبرداري از طريق کارتهاي اعتباري و شناسایی جرایم مالی
تشخيص مشتريان ثابت و دستهبندی و خوشهبندی مشتریان با توجه به رفتار مشابه آنها در زمینه بانکداری و بازپرداخت وام
تعيين ميزان استفاده از کارتهاي اعتباري بر اساس گروههاي اجتماعي
تحلیل اعتبار مشتریان
شناسایی فاکتورهای اصلی در ریسک بازپرداخت وام
اسلاید 7 :
تحلیل ریسک و برآورد حق بیمه مشتریان بر اساس میزان ریسک هر مشتری
پیشبینی میزان خسارت بر اساس گروههای مشتریان
مدیریت ارتباط با بیمهگذاران و تدوین استراتژی بر اساس مشتریان هدف
تعیین عوامل وفاداری و یا رویگردانی مشتریان
شناخت نیازها و الگوهای خرید سرویسهای بیمهای توسط مشتریان
شناخت تخلفات بیمهای
تعيين نوع رفتار با بيماران و تعیین روش درمان بیماریها
پيشگويي ميزان موفقيت اعمال جراحي و تعيين ميزان موفقيت روشهاي درماني در برخورد با بيماريهاي سخت
بررسی میزان تاثیر دارو بر بیماری و اثرات جانبی آن
تشخیص و پیشبینی انواع بیماریها مانند تشخیص و یا پیشبینی انواع سرطان
تجزیه و تحلیل دادههای موجود در سیستمهای اطلاعات سلامت
تحلیل عکسهای پزشکی
اسلاید 8 :
يادگيري نظارت نشده
دسته بندی طبیعی داده های نامتجانس به تعدادی خوشه براساس خصوصيات مشابه
یک ایتم داده ای را به یکی از چند خوشه تصویر می کند که این خوشه ها گروه های طبیعی هستند
پیوستگي داخلي هر دسته و همبستگي خارجي کم با سایر دسته ها
براساس نزدیکی فاصله ميان رکوردها و درصد قرار گرفتن داده هاي ورودي در خوشه ها
هدف اصلی پیدا کردن نظم در داده ها می باشد
معایب
نامناسب برای داده های با خصوصيات نامربوط و دارای افزونگي
دقت کمتر از روشهاي ديگر
اسلاید 9 :
-کشف و تولید الگوهایی که وقوع یک رخداد را براساس واقعه دیگر پیشگویی کند
-کشف وابستگی ها و ارتباطات بین داده های موجود در یک پایگاه داده
((نتیجه: دسته ای از قواعد است که به انها قواعد وابستگی گفته می شود))
Apriori
FP-tree
اسلاید 10 :
یادگیری نظارت شده((تفاوت با خوشه بندی= معین بودن خوشه ها در شروع کار))
کاوش قوانين دستهبندي
تعداد دسته ها يا کلاس هاي دسته بندي از قبل مشخص مي شود
نتيجه: توليد يک درخت تصميم يا مجموعهاي از قوانين دستهبندي، که براي فهم بهتر دادههاي موجود در پايگاه داده و همچنين دستهبندي دادههايي که در آينده به پايگاه داده اضافه ميشوند به کار ميرود.