بخشی از پاورپوینت

--- پاورپوینت شامل تصاویر میباشد ----

اسلاید 1 :

 پايگاه داده تحليلی مخزني از اطلاعات جمع آوري شده از منابع مختلف مي باشد كه به صورت يک شماي يكپارچه ذخيره مي شود.

  پايگاه داده تحليلی شامل مراحل زير مي باشد :

 پاکسازي داده ها

  انتقال داده ها

  جمع آوري داده ها

 کاهش داده ها

اسلاید 2 :

مراحل تبديل داده خام به دانش در يک سيستم پايگاه داده تحليلی

اسلاید 3 :

پرکردن فيلدهاي خالي
 از بين بردن نويزهاي داده اي
 شناسايي داده هاي اشتباه 
 تصحيح  ناسازگاري هاي موجود در بين داده هاي ورودي
در اين بخش عمليات مختلفي براي پاک سازي داده هاي قابل انجام است:
ناديده گرفتن تاپلهاي نادرست 
 
 
 

اسلاید 4 :

در اين بخش عمليات مختلفي براي پاک سازي داده هاي قابل انجام است:
پرکردن فيلدهاي نادرست به صورت دستي
پرکردن فيلدهاي نادرست با يک مقدار مشخص
پرکردن فيلدها با توجه به نوع فيلد و داده هاي موجود
پرکردن فيلدها با نزديکترين مقدار ممکن

اسلاید 5 :

تركيب داده هاي دريافتي از منابع اطلاعاتي مختلف
استفاده از فرا داده ها براي شناسايي و حذف افزونگي داده ها
تشخيص و رفع برخوردهاي داده اي
يکپارچه سازي داده ها از سه فاز کلي تشکيل شده است:
شناسايي فيلدهاي يکسان
شناسايي افزونگي هاي موجود در داده هاي ورودي
مشخص کردن برخورد هاي داده اي

اسلاید 6 :

در اين فاز، داده هاي ورودي طي مراحل زير به شكلي كه مناسب عمل داده کاوي باشند، در مي آيند:
از بين بردن نويزهاي داده ها
تجميع داده ها
کلي سازي
نرمال سازي
افزودن فيلدهاي جديد

اسلاید 7 :

از بين بردن نويزهاي داده اي :منظور از  داده هاي نويزي، داده هايي هستند که در خارج از بازه مورد نظر قرار مي گيرند  .
 
براي اصلاح داده هاي نويزي از روشهاي زير استفاده مي شود:
استفاده از مقادير مجاور براي تعيين يک مقدار مناسب براي فيلدهاي داراي نويز
دسته بندي داده هاي موجود و مقداردهي فيلد داراي داده نويزي با استفاده از دسته نزديکتر 
ترکيب روشهاي فوق با ملاحظات انساني  

اسلاید 8 :

تجميع داده ها: تجميع داده ها به معني بدست آوردن اطلاعات جديد از ترکيب داده هاي موجود مي باشد.
 
کلي سازي: کلي سازي به معني دسته بندي داده هاي موجود براساس ماهيت و نوع آنها  است. 
 
نرمال سازي: منظور از نرمال سازي، تغيير مقياس داده ها است .
 
افزودن فيلدهاي جديد: گاهي اوقات براي سهولت عمل داده کاوي مي توان فيلدهايي به مجموعه فيلدهاي موجود اضافه کرد .
 
 

اسلاید 9 :

شامل تکنيکهايي براي نمايش کمينه اطلاعات موجود است.
اين فاز از سه بخش تشکيل مي شود:
کاهش دامنه و بعد: فيلدهاي نامربوط، نامناسب و تکراري حذف مي شوند.
فشرده سازي داده ها: از تکنيکهاي فشرده سازي براي کاهش اندازه داده ها استفاده مي شود.
کدکردن داده ها: داده ها در صورت امکان با پارامترها و اطلاعات کوچکتر جايگزين مي شوند.

اسلاید 10 :

داده کاوي فرايند کشف اطلاعات نهفته از درون حجم بسيار زياد داده هايي است که در قالب پايگاه هاي داده اي، انبارهاي داده يا هر نوع انباره اطلاعاتي ذخيره شده اند.

در متن اصلی پاورپوینت به هم ریختگی وجود ندارد. برای مطالعه بیشتر پاورپوینت آن را خریداری کنید