بخشی از پاورپوینت

--- پاورپوینت شامل تصاویر میباشد ----

اسلاید 1 :

پیش پردازش داده ها

تمیز کردن
تغیر شکل
کاهش
کاربردهای داده کاوی

روشهای داده کاوی

خوشه بندی
الگوهای تکرارشونده و قوانین انجمنی
دسته بندی و پیش بینی
نتیجه گیری

منابع مقدمه

کشف دانش در داده

 

اسلاید 2 :

What is DATA MINING?

کشف اطلاعات نهفته و الگوهای ناشناخته مفید از روی حجم انبوه داده ها

What is STREAM DATA MINING?

داده هایی که در جریان هستند تفسیر می کنیم

On line        داده کاوی می کنیم                         همه data  را نداریم                                      الگوریتم های مختلفی دارد

اسلاید 3 :

  •  

Why DATA MINING?

سرعت در تحليل اطلاعات و افزايش كيفيت نتايج تحليل ها
شناسايي سريع فرصتها و تهديدها
بهره گیری از سيستمهاي داده كاوي با كاربري آسان
ايجاد امكان استفاده از ابزارهاي متنوع داده كاوي
افزایش قدرت تحليل در سازمان بهمراه افزايش صحت تحليل
ايجاد فضايي شفاف در سازمان براي تصميم گيري صحيح در تمامی رده های مدیریتی بویژه بهبود تصميم گيري مديران ارشد

اسلاید 4 :

داده هایی که روی آنها عملیات mining  انجام می دهیم باید ویژگی های

 زیر را دارا باشند تا خروجی مفید و قابل استفاده و اطمینانی را به ما بدهند

         Accuracy        Completeness         Consistency       Believability

    Value added             Interpretability                 Accessibility

داده ها در جهان واقعی DIRTY   هستند

DIRTY  بودن یعنی داده ها :

-ناقص هستند   incomplete

-شلوغ هستند       noisy

-متناقص هستند   inconsistent

اسلاید 5 :

اصولاً هر جایی که داده وجود داشته باشد داده‌کاوی نیز معنا می‌یابد، از قبيل:
امور تجاري و مالي، امور پزشكي، زيست پزشكي، كشف ناهنجاريها و اسناد جعلي، ارتباطات از راه دور، ورزش و سرگرمي، كتابداري و اطلاع‌رساني.

امروزه عملیات داده‌ کاوی به صورت گسترده توسط تمامی شرکتهایی که مشتریان در کانون توجه آنها قرار دارند، استفاده می‌شود، از جمله: فروشگاه‌ها، شرکتهای مالی، ارتباطاتی، بازاریابی و غیره.

استفاده از داده‌کاوی به این شرکتها کمک می‌کند تا ارتباط عوامل داخلی از جمله: قیمت، محل قرارگیری محصولات و مهارت کارمندان را با عوامل خارجی از جمله: وضعیت اقتصادی، رقابت در بازار و محل جغرافیایی مشتریان کشف نمایند.

داده‌کاوی پیش‌بینی وضع آینده بازار، گرایش مشتریان و شناخت سلیقه‌های عمومی آنها را برای شرکتها ممکن می‌سازد

اسلاید 6 :

بازار هدف
پيدا کردن الگوي خريد مشتري
برنامه‌ریزی برای معرفی محصول جدید
دسته‌بندي مشتريان براساس نوع خريد
آناليز نيازهاي مشتريان
تشخيص محصولات مناسب براي دسته‌هاي مختلف مشتريان
تشخيص فاکتورهايي براي جذب مشتريان جديد
تعيين الگوهاي خريد مشتريان
تجزيه و تحليل سبد خريد بازار
پيشگويي ميزان خريد مشتريان از طريق پست (فروش الکترونيکي)
پيش‌بيني الگوهاي کلاهبرداري از طريق کارتهاي اعتباري و شناسایی جرایم مالی
تشخيص مشتريان ثابت و دسته‌بندی و خوشه‌بندی مشتریان با توجه به رفتار مشابه آنها در زمینه بانکداری و بازپرداخت وام
تعيين ميزان استفاده از کارتهاي اعتباري بر اساس گروههاي اجتماعي
تحلیل اعتبار مشتریان
شناسایی فاکتورهای اصلی در ریسک بازپرداخت وام

اسلاید 7 :

تحلیل ریسک و برآورد حق بیمه مشتریان بر اساس میزان ریسک هر مشتری
پیش‌بینی میزان خسارت بر اساس گروههای مشتریان
مدیریت ارتباط با بیمه‌گذاران و تدوین استراتژی بر اساس مشتریان هدف
تعیین عوامل وفاداری و یا روی‌گردانی مشتریان
شناخت نیازها و الگوهای خرید سرویسهای بیمه‌ای توسط مشتریان
شناخت تخلفات بیمه‌ای
تعيين نوع رفتار با بيماران و تعیین روش درمان بیماریها
پيشگويي ميزان موفقيت اعمال جراحي و تعيين ميزان موفقيت روشهاي درماني در برخورد با بيماريهاي سخت
بررسی میزان تاثیر دارو بر بیماری و اثرات جانبی آن
تشخیص و پیش‌بینی انواع بیماریها مانند تشخیص و یا پیش‌بینی انواع سرطان
تجزیه و تحلیل داده‌های موجود در سیستمهای اطلاعات سلامت
تحلیل عکسهای پزشکی

اسلاید 8 :

يادگيري نظارت نشده
دسته بندی طبیعی داده های نامتجانس به تعدادی خوشه براساس خصوصيات مشابه
یک ایتم داده ای را به یکی از چند خوشه تصویر می کند که این خوشه ها گروه های طبیعی هستند
پیوستگي داخلي هر دسته و همبستگي خارجي کم با سایر دسته ها
براساس نزدیکی فاصله ميان رکوردها و درصد قرار گرفتن داده هاي ورودي در خوشه ها
هدف اصلی پیدا کردن نظم در داده ها می باشد
معایب
نامناسب برای داده های با خصوصيات نامربوط و دارای افزونگي
دقت کمتر از روشهاي ديگر

اسلاید 9 :

-کشف و تولید الگوهایی که وقوع یک رخداد را براساس واقعه دیگر پیشگویی کند
-کشف وابستگی ها و ارتباطات بین داده های موجود در یک پایگاه داده
((نتیجه: دسته ای از قواعد است که به انها قواعد وابستگی گفته می شود))


Apriori
FP-tree

اسلاید 10 :

یادگیری نظارت شده((تفاوت با خوشه بندی= معین بودن خوشه ها در شروع کار))
کاوش قوانين دسته‌بندي
تعداد دسته ها يا کلاس هاي دسته بندي از قبل مشخص مي شود
نتيجه: توليد يک درخت تصميم يا مجموعه‌اي از قوانين دسته‌بندي، که براي فهم بهتر داده‌هاي موجود در پايگاه داده و همچنين دسته‌بندي داده‌هايي که در آينده به پايگاه داده اضافه مي‌شوند به کار مي‌رود.

در متن اصلی پاورپوینت به هم ریختگی وجود ندارد. برای مطالعه بیشتر پاورپوینت آن را خریداری کنید