بخشی از مقاله
-1 چکیده
پیشرفتهای صورتگرفته در حوزه فناوری اطلاعات تاثیرات شگرفی در صنایع مختلف گذاشته است. بدون استفاده از امکانات فراهم شده دانش فناوری اطلاعات روند تصمیمگیری، پیشبینی و تحلیل بازار در شرایط سنتی و عموما دستی انجام میشود که محدودیتهای زیادی به همراه دارد.
دانش دادهکاوی به استخراج اطلاعات و کشف اطلاعات ارزشمند از حجم انبوهی از دادهها میپردازد که در حوزه تصمیمگیری، پیشبینی و تعیین خطمشیهای یک صنعت مؤثر واقع میشود. در این مقاله به معرفی کاربردهای این دانش در صنایع مختلف پرداخته و انواع روشهای معمول دادهکاوی و مزایای استفاده از آن در صنایع مختلف را مورد بحث قرار میدهیم.
-2 مقدمه
با ورود به عصر ارتباطات و گسترش استفاده از اینترنت و حجم انبوه دادهها یکی از مسایلی که با آن روبهرو هستیم، حجم عظیم دادههایی است که در هر ثانیه و در هر دقیقه تولید میشود و برای بهره برداری از آنها و استفاده بهینه از این دادهها نیازمند فرآیندهایی برای مدیریت، کنترل، پردازش و استفاده از دادهها در جهت بهبود ساختارها و سودآوری هستیم. در بخشهای مختلف از جمله صنعت، امروزه دادهها از اهمیت بسیاری برخوردار هستند و صنایع مختلف برای افزایش بهرهوری عملیاتی، ارزیابی بازار و مشتریان، از دادهها استفاده میکنند، ولی با توجه به بزرگ بودن این دادهها از نظر حجم و تنوع با چالشهایی روبهرو هستند که ضرورت وجود تکنیکهایی برای بهرهبرداری از دادهها را بیشتر میکند.
فرآیند داده کاوی با تحلیل دادهها و کشف الگوی های پنهان از پایگاه داده های بسیار بزرگ، اطالعات گرانبهایی تولید میکنند . این فرآیند به عنوان یک مرحله ضروری از فرایند بزرگتر کشف دانش و معرفت از پایگاه دادهها اشاره دارد .
به طور کلی، هدف از داده کاوی پیشبینی هر گونه اطالعات کارآمد و یا تشریح مدل اطالعاتی مشخص برای یک عملیات فیزیکی و یا توصیفی می باشد. از طرفی ما می توانیم از این تکنولوژی برای واکاوی اطالعات، بررسی روند توسعه دانش و افزایش میزان ذخیره سازی داده ها در هر نوع پایگاه داده ای استفاده کنیم. تحقیقات انجام شده در تحلیل پایگاه دادههای صنایع از جمله صنایع تولیدی مدرن، سازمانها و شرکتهای مختلف مانند بورس، مخابرات، بانک و ... بر ضرورت بکارگیری دادهکاوی تاکید دارند.
در فرآیندهای صنعتی مدرن و در حال رشد یکی از مهم ترین بخش ها، توجه به کیفیت محصول و تطبیق آن با نیازهای بازار است که نیازمند توجه ویژه به پردازش داده ها و کنترل آن ها است. دادهکاوی در این فرآیندها در موارد زیر صورت میگیرد.
الف - نظارت بر روند صنعتی: با استفاده از تکنیک های داده کاوی درفرآیندهای صنعتی از خطاهای پیش رو، جلوگیری شده و مواردی که در آنها خطایی روی داده جداسازی می شوند.
ب - کنترل فرآیندهای صنعتی : یکی از موضوع های مورد توجه در سال های اخیر است، که با استفاده از اندازه گیری ورودی ها و خروجی ها و به کارگیری پارامترهای کنترلی، که می توانند از داده ها استخراج شوند یا اینکه به طور مستقیم تعیین شوند، به کنترل فرایند ها می پردازد.
ج - کاربردهای صنعتی بر پایه دادهها: با افزایش پیچیدگیهای صنعتی، فرآیند دادهها به عنوان هسته اصلی در موضوعات مربوط به انرژی و انفورماتیک ایفای نقش میکنند و در سیستمهای مبتنی بر شبکه، سیستمهای جدید قدرت، انرژیهای تجدید پذیر و فناوریهای ابری کاربرد فراوانی خواهند داشت. دادههای بزرگ، نحوه کار شرکت ها و سازمان ها را تحت تاثیر قرار میدهند و بخش های مختلف دولتی و خصوصی در زمینه های گوناگون تولید محصول، توسعه بازار، بهره وری عملیاتی، پیش بینی تقاضای بازار، مدیریت ارتباط مشتری، از آنها استفاده میکنند.
امروزه " مشخصات محصولگرای " کسب و کار به "مشخصات مشتریگرا" تغییر یافته است، بنابراین مشتریان داراییهای با ارزش برای سازمانها هستند. مدیریت ارتباط با مشتری مجموعهای از فرآیندها است که استراتژی کسب و کار را برای ایجاد رابطه بلند مدت و سودآور با مشتریان ممکن میسازد. برای ساخت یک استراتژی موفق، دو چیز ضروری است: یکی دادههای مشتری و دیگری فنآوری اطلاعات
با استفاده از تکنیک های داده کاوی، سازمان ها می توانند به راحتی ارزش مربوط به هر مشتری را تعیین کرده و رفتارهای آنها را پیش بینی کنند. به طور خاص، بازریابی و مدیریت مشتریان در مخابرات به عنوان یک شرکت بزرگ و مشتریگرا، اهمیت فوق العادهای دارد. مخابرات بستههای فراوانی از محصوالت را با ویژگیها و هزینههای متفاوتی به مشتریان ارائه میدهد. یکی از راهکارهای مورد استفاده بخشبندی مشتریان و تجزیه و تحلیل سبد بازار با تکنیکهای دادهکاوی است
یکی دیگر از موارد نحلیل شده توسط تکنیکهای دادهکاوی در صنایع و شرکتهای بزرگ، سنجش میزان نوآوری آن-هاست. نتایج بدست آمده از الگوریتمهای دادهکاوی پیشنهادی نشاندهنده مزایای استفاده از آنها در ارزیابی قابلیت نوآوری شرکت ها و صنایع میباشد
مطمئنا در اختیار قرار دادن سرمایه بانکها در حوزه صنعت به پیشرفت و عمران اقتصاد کمک بسزایی میکند. ابزارهای داده کاوی و استخراج اطالعات، در سیستم بانکداری جهت ارزیابی ریسک اعتبار برای وام های بی خطر [6]، بانکداری الکترونیک و تضمین امنیت آن [7] و تشخیص موارد مجرمانه مانند پولشویی [8] کاربرد دارند.
فرآیند دادهکاوی، شرکتهای بیمه را برای گرفتن تصمیمات بسیار مهم در حوزه کسب و کار کمک میکند. یکی از سیاستهای اساسی هر شرکت بیمهای مدیریت موثر دادههای مشتریان است. با توجه به حجم باالی اطالعات مشتریان، دادهکاوی ابزاری ارزشمند جهت دسترسی سریع و ساده به اطالعات محسوب میشود و برای پشتیبانی از فرآیند کنترل بیمهنامهها، وظایف مدیریتی و اجرایی و در نهایت مدیریت کارآمد دادههای مالی و سازمانی مورد استفاده قرار میگیرد
صنعت مراقبت های بهداشتی و درمانی غنی از اطلاعاتی است که به صورت دستی قابل مدیریت نیست. این مقدارحجم داده در حوزه داده کاوی برای استخراج اطالعات مفید و تولید روابط بین جوانب از اهمیت زیادی برخوردارند. امروزه ابزارهای دادهکاوی برای پیشبینی و تشخیص انواع بیماریها و عوارض آنها، مانند بیماری قلبی [10]، بیماریهای ریوی [11]، انواع سرطان [12]، پارکینسون [13] و .... به افراد و پزشکان کمک میکنند.
-3 روش تحقیق
در این تحقیق با مطالعه مقاالت و تحقیقات انجام شده در سالهای اخیر به معرفییکی از ابزارهای دانش فناوری اطلاعات تحت عنوان دادهکاوی و کاربردهای آن در صنایع مختلف میپردازیم. معرفی این ابزار و بیان فرصتها و مزایای حاصل از بکارگیری آن می تواند ایده انجام بسیاری از پروژههای مرتبط با صنایع مختلف در استان را بوجود آورد. در این مقاله با مقایسه تحقیقات انجام شده اخیر نیز بهترین روشهای دادهکاوی در هر حوزه معرفی می گردد.
در ادامه مقاله به بررسی این موارد میپردازیم: در بخش بعدی، مروری بر مفهوم دادهکاوی و انواع تکنیکهای بکار رفته در آن داریم. در بخش 4 کاربردهای دادهکاوی در صنایع و شرکتهای مختلف را بررسی خواهیم کرد. در نهایت در بخش 5 به نتیجهگیری مقاله خواهیم پرداخت.
-3-1 مروری بر مفهوم دادهکاوی
داده کاوی یعنی جستجوی خودکار حجم زیادی از دادههای ذخیره شده برای کشف الگوها و روندهایی که با تجزیه و تحلیل ساده کشف نمیشوند. داده کاوی از الگوریتمهای پیچیده ریاضی برای تقسیم داده ها و ارزیابی احتمال وقوع حوادث آینده استفاده میکند.
ویژگیهای اصلی داده کاوی عبارتند از: کشف خودکار الگوها، پیش بینی نتایج احتمالی، ایجاد اطلاعات قابل استفاده، تمرکز بر مجموعه دادهها و پایگاه دادههای بزرگ
-3-2 کشف دانش در پایگاههای داده
داده کاوی بخش اصلی کشف دانش در پایگاه داده است و شامل مراحل زیر است: انتخاب دادهها، پاالیش داده ها، تبدیل داده ها، جستجوی الگو - داده کاوی - ، و پیدا کردن بازنمایی، پیدا کردن تفسیر و یافتن ارزیابی. در شکل - 1 - فرایند کسب دانش از پایگاه دادهها به صورت شماتیک بیان شده است.
-3-3 اهداف داده کاوی
دو هدف"سطح بالای" اصلی در داده کاوی، پیش بینی و توصیف است.
1. پیش بینی شامل استفاده از برخی از متغیرها یا فیلدهای پایگاه داده، برای پیش بینی مقادیر نامشخص متغیرهای دیگر است.
2. توصیف بر پیدا کردن الگوهای قابل تفسیر برای انسان، که دادهها را توصیف کنند، متمرکز است.
-3-4 تکنیک های داده کاوی
-3-4-1 خوشه بندی:
خوشهبندی یعنی فرآیند گروه بندی داده ها در چند دسته به طوری که اشیاء داخل هر خوشه شباهت باالیی داشته باشند و اشیاء خوشه های مختلف تفاوت زیادی داشته باشند.
انواع روشهای خوشه بندی را میتوان در دو گروه زیر دستهبندی کرد:
- خوشهبندی افرازشده: تقسیم اشیاءِ داده در زیرمجموعههای ناهمپوشان - خوشهها - به طوری که هر شی داده دقیقا در یک زیر مجموعه قرار داشته باشد.
- خوشهبندی سلسله مراتبی: مجموعه ای از خوشه های تو در تو که به صورت سلسله مراتبی سازماندهی شدهاند.