بخشی از پاورپوینت
اسلاید 1 :
Data Mining
داده کاوی
اسلاید 2 :
Data mining
داده(Data)
به عنوان يکي از منابع حياتي سازمان شناخته مي شود و بسياري از سازمان ها با اطلاعات و دانش سازماني خود مانند ساير دارايي هاي ارزشمندشان برخورد مي کنند .
اسلاید 3 :
Data mining
نکته: داده اطلاعاتي (Data) به اطلاعات خام سازمان اتلاق ميشود و اطلاعات Information) )به دادههاي پردازش شده. همچنين داده هاي پردازش شده پس از طبقه بندي و آناليز به دانش سازمان (Knowledge) تبديل مي گردند.
اسلاید 4 :
حال تصور نماييد، دسترسي به اطلاعات Information در شرايطي که دادهها به روش نامناسبي نگهداري شوند و يا روش ضابطه مندي جهت دستيابي به آنها وجود نداشته باشد تا چه حد مشکل است .
براي رسيدن به يک سيستم اطلاعاتي مناسب، دادهها مي بايست به صورتي منطقي طبقه بندي و ذخيره شوند تا استفاده از آن ها سادهتر بوده، با کارايي بيشتري تحليل شوند و سريعتر مورد استفاده قرار گيرند و در نتيجه مديريت بهتري بر آن ها اعمال شود.
اسلاید 5 :
تعريف
در فرهنگ لغات آماري كمبريج مفهوم داده كاوي اينچنين تبيين شده است:
" فرايند استخراج و شناسائي دانش قبلا" ناشناخته و بالقوه مفيد از داده ها ، داده كاوي ناميده ميشود، داده كاوي با استفاده از سيستم هاي خبره، روش هاي آماري و تكنيك هاي نمايش نموداري، كشف و نمايش دانش به صورت قابل درك آسان براي انسان را ميسر مي سازد
اسلاید 6 :
معرفي
اطلاعات باعث قدرت است و دانش قدرتمند تر. اکنون بيشتر از 80 درصد از دانش ما به صورت متن، مستندات و ديگر صورتهاي رسانه اي نظير ويديو و صدا نگهداري مي شود. اگر از منظر علوم کامپيوتري به اين مستندات نگاه کنيم همه ي آنها به طبيعتي غير ساختيافته وابسته اند.
اسلاید 7 :
براي دريافت دانش از اطلاعات يک متن،
بايستي ابتدا آنرا درک کند و
سپس آنرا پردازش کند تا بفهمد چه معاني و مفاهيمي در آن موجود است، چه ارتباطي ميان مفاهيم وجود دارد و
از ميان اين مفاهيم کدام جديد است و کدام قديمي.
با اين حال در اين عصر تکنولوژي، ما معتقديم که هر چيزي بايد بتواند اتوماتيک انجام شود حتي اگر اين کار " درک معني متن يا هر ديتاي ديگر" باشد.
اسلاید 8 :
داده کاوي، يک روش بسيار کاراست براي کشف اطلاعات از داده هاي ساختيافته اي که در جداول نگهداري مي شوند. داده کاوي، الگوها را از تراکنش ها، استخراج مي کند، داده را گروه بندي مي کند و نيز آنرا دسته بندي مي کند. بوسيله ي داده کاوي مي توانيم پي به وجود روابطي ميان اقلام داده اي که ديتابيس را پر کرده اند ببريم
اسلاید 9 :
در دنياي کنوني اين کمبود اطلاعات نيست که مسئله است بلکه کمبود دانشي است که از اين اطلاعات مي توان حاصل کرد. ميليونها صفحه ي وب، ميليونها کلمه در کتابخانه هاي ديجيتال و هزاران صفحه اطلاعات در هر شرکت تنها چند دست از اين منابع اطلاعاتي هستند. اما نمي توان به طور مشخص منبعي از دانش را در اين بين معرفي کرد. دانش خلاصه ي اطلاعات است و نيز نتيجه گيري و حاصل فکر و تحليل بر روي اطلاعات.
اسلاید 10 :
مثال تفهيمي در مورد داده کاوي
يکي از نمونه هاي بارز داده کاوي را مي توان در فروشگاه هاي زنجيره اي مشاهده نمود، که در آن سعي مي شود ارتباط محصولات مختلف هنگام خريد مشتريان مشخص گردد. فروشگاه هاي زنجيره اي مشتاقند بدانند که چه محصولاتي با يکديگر به فروش مي روند .
اسلاید 11 :
مثال تفهيمي در مورد داده کاوي
براي مثال طي يک عملـيات داده کاوي گستـرده در يـک فروشـگاه زنجيره اي در آمريکاي شمالي که بر روي حجـم عظيمـي از داده هاي فروش صورت گرفت، مشخص گرديد که مشترياني که تلويزيون خريداري مي کنند، غالبا میز تلویزیون نيز مي خرند.
نمونه مشابه عمليات داده کاوي را مي توان در يک شرکت بزرگ توليد و عرضه پوشاک در اروپا مشاهده نمود، به شکلي که نتايج داده کاوي مشخص مي کرد که افرادي که کراوات هاي ابريشمي خريداري مي کنند، در همان روز يا روزهاي آينده گيره کراوات مشکي رنگ نيز خريداري مي کنند.
اسلاید 15 :
تفاوت داده کاوي و آناليز هاي آماري
داده کاوي با آناليز هاي متداول آماري نيز متفاوت است؛ در زيرمي توان برخي از اصلي ترين تفاوت هاي داده کاوي و آناليز آماري را مشاهده نمود:
آمار شناسان هميشه با يک فرضيه شروع به کار مي کنند.
آنها از داده هاي عددي استفاده مي کنند.
آمارشناسان بايد رابطه هايي را ايجاد کنند که به فرضيه آنها مربوط است.
آنها مي توانند داده هاي نابجا و نادرست را در طول آناليز مشخص کنند.
آنها مي توانند نتايج کار خود را تفسير و براي مديران بيان کنند.
اسلاید 16 :
تفاوت داده کاوي و آناليز هاي آماري
داده کاوي به فرضيه احتياجي ندارد.
ابزارهاي داده کاوي از انواع مختلف داده ، نه تنها عددي مي توانند استفاده کنند.
الگوريتمهاي داده کاوي به طور اتوماتيک روابط را ايجاد مي کنند.
داده کاوي به داده هاي صحيح و درست نياز دارد.
نتايج داده کاوي نسبتا پيچيده مي باشد و نياز به متخصصاني جهت بيان آنها به مديران دارد.
اسلاید 17 :
مثال تفاوت الگوها
يک مفسر ممکن است متوجه الگوي رفتاري شود که سبب کلاهبرداري بيمه گردد. بر اساس اين فرضيه، مفسر به طرح يک سري سوال مي پردازد تا اين موضوع را بررسي کند. اگر نتايج حاصله مناسب نبود، مفسر فرضيه را اصلاح مي کند و يا با انتخاب فرضيه ديگري مجددا شروع مي کند. اين روش نه تنها وقت گير است بلکه به قدرت تجزيه و تحليل مفسر نيز بستگي دارد.
مهمتر از همه اينکه اين روش هيچ وقت الگوهاي کلاهبرداري ديگري را که مفسر به آنها مظنون نشده و در فرضيه جا نداده ، پيدا نمي کند.
اسلاید 18 :
مثال تفاوت الگوها
يک مفسر سيستم هاي داده کاوي را ساخته و پس از طي مراحلي از جمله جمع آوري داده ها، يکپارچه سازي و اخلاص داده ها به انجام عمليات داده کاوي مي پردازد.
داده کاوي تمام الگوهاي غيرعادي را که از حالت عادي و نرمال انحراف دارند و ممکن است منجر به کلاهبرداري شوند را پيدا مي کند.
نتايج داده کاوي حالت هاي مختلفي را که مفسر بايد در مراحل بعدي تحقيق کند، نشان مي دهند. در نهايت مدل هاي به دست آمده مي توانند مشترياني را که امکان کلاهبرداري دارند، پيش بيني نمايند.
اسلاید 19 :
حجم انبوه داده (ترابایت)
داده های با حجم زیاد و با ابعاد مختلف
تصاویر و عکسها
اطلاعات بانکی
کشف اطلاعات نهفته و الگوی های ناشناخته مفید از درون حجم انبوه داده ها
الگوي مفيد، مدلي برای توصیف ارتباط ميان زير مجموعه ای از داده هاست و معتبر ، ساده ، قابل فهم و جديد است.
چرا و چه وقت داده کاوي؟