بخشی از مقاله

چکیده

امروزه در دانش پزشکی جمع آوری داده های فراوان در مورد بیماری های مختلف از اهمیت فراوانی برخوردار است. مراکز پزشکی با مقاصد گوناگونی به جمع آوری این داده ها می پردازند. تحقیق روی این داده ها و به دست آوردن نتایج و الگوهای مفید در رابطه با بیماری ها، یکی از اهداف استفاده از این داده ها است. حجم زیاد این داده ها و سردرگمی حاصل از آن مشکلی است که مانع رسیدن به نتایج قابل توجه می شود. بنابراین از داده کاوی برای غلبه بر این مشکل و به دست آوردن روابط مفید بین عوامل خطر زا در بیماری ها استفاده می شود. این مقاله به معرفی داده کاوی و کاربرد آن در صنعت پزشکی - پیش بینی بیماری - با استفاده از الگوریتم های داده کاوی به همراه نرم افزارهای مرتبط با آن پرداخته است.

واژگان کلیدی: داده کاوی، درخت تصمیم، پیش بینی بیماری، دیابت

مقدمه

ذخیره سازی داده ها به کار رفت ، حجم اطلاعات ذخیره شده درآن پس از حدود 20 سال دو برابر شد و همزمان با پیشرفت فناوری اطلاعات ، حجم داده ها در پایگاه داده ها هر دو سال یک بار ، دو برابر شد و همچنان باسرعت بیش تری نسبت به گذشته حجم اطلاعات ذخیره شده بیش تر و بیش تر می شود. با وجود شبکه جهانی وب ، سیستم های یکپارچه اطلاعاتی ، سیستم های یکپارچه بانکی ، تجارت الکترونیکی و ... لحظه به لحظه به حجم داده ها در پایگاه داده ها اضافه شده و باعث به وجود آمدن انبارهای - توده های - عظیمی از داده ها شده است ، به طوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است.شدت رقابت ها در عرصه های علمی ، اجتماعی ، اقتصادی ، سیاسی و نظامی نیز اهمیت سرعت یا زمان دسترسی به اطلاعات را دو چندان کرده است.

بنا براین نیاز به طراحی سیستم هایی که قادر به اکتشاف سریع اطلاعات مورد علاقه کاربران با تاکید بر به حداقل مداخله انسانی باشند از یک سو و روی آوردن به روش های تحلیل متناسب با حجم داده های حجیم ازسوی دیگر ، به خوبی احساس می شود. در حال حاضر ، داده کاوی مهم ترین فناوری برای بهره وری موثر ، صحیح و سریع از داده های حجیم است و اهمیت آن رو به فزونی است فراگیری ماشین داده می باشد ، الگوشناسی ، هوش مصنوعی ، علم کامپیوتر ، داده کاوی پل ارتباطی میان علم آمار باشد. داده کاوی فرآیندی پیچیده جهت شناسایی الگوها و مدل های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده می باشد، به طریقی که این الگو ها و مدلها برای انسانها قابل درک باشند.

داده کاوی به صورت یک محصول قابل خریداری نمی باشد، بلکه یک رشته علمی و فرآیندی است که بایستی به صورت یک پروژه پیاده سازی شود داده ها اغلب حجیم می باشند و به تنهایی قابل استفاده نیستند، اما دانش نهفته در داده ها قابل استفاده می باشد. بنابراین بهره گیری از قدرت فرآیند داده کاوی جهت شناسایی الگوها و مدلها و نیز ارتباط عناصر مختلف در پایگاه داده جهت کشف دانش نهفته در داده ها و نهایتا تبدیل داده به اطلاعات، روز به روز ضروری تر می شود. در داده کاوی معمولا به کشف الگوهای مفید از میان داده ها اشاره می شود. منظور از الگوی مفید ، مدلی در داده ها است که ارتباط میان یک زیر مجموعه از داده ها را توصیف می کند و معتبر ، ساده ، قابل فهم و جدید است.

تعاریف داده کاوی

به معنای Mine نگاهی به ترجمه لغوی داده کاوی به ما در درک بهتر این واژه کمک می کند. واژه لاتین به معنی داده بر جستجویی Data استخراج از منابع نهفته و با ارزش زمین اطلاق می شود. ادغام این کلمه با عمیق از داده های قابل دسترس با حجم زیاد برای یافتن اطلاعات مفید که قبلا نهفته بودند، تاکید دارد داده کای دارای تعریف های مختلفی است این تعریف ها به مقدار زیادی به پیش زمینه ها و نقطه نظرهای افراد بستگی دارد. هر نویسنده، محقق و کابر با توجه به پیش زمینه ها و نقطه نظر های افراد بستگی دارد. هر نویسنده ، محقق و کاربر با توجه به دیدگاه و نوع نگرش خود تعریف های مختلفی از داده کاوی ارائه کرده اند به عنوان مثال می توان به چند تعریف داده کاوی که در ادامه آمده است اشاره کرد:

-داده کاوی استخراج اطلاعات مفهومی، ناشناخته و به صورت بالقوه مفید از پایگاه داده می باشد.

-داده کاوی علم استخراج اطلاعات مفید از پایگاه های داده یا مجموعه داده ای می باشد.

-داده کاوی عبارت است از فرایند استخراج اطلاعات معتبر، از پیش ناشناخته، قابل فهم و قابل اعتماد از پایگاه داده های بزرگ و استفاده از آن در تصمیم گیری در فعالیت های تجاری مهم.

به طور رسمی اصطلاح داده کاوی برای اولین بار توسط »فیاض« در اولین کنفرانس بین المللی » کشف دانش و داده کاوی « در سال 1995 مطرح شد. از سال 1995 داده کاوی به صورت جدی وارد مباحث آمار شد. و در سال 1996، اولین شماره مجله کشف دانش از پایگاه داده ها منتشر شد.امروزه کنفرانس های مختلفی دراین زمینه در سراسر دنیا برگزار می شود .داده کاوی حاصل تحول تدریجی در طول تاریخ بوده و از اوایل دهه90 همزمان با همه گیر شدن استفاده از پایگاه های داده ای به عنوان یک علم مطرح شده است.

کاربردهای داده کاوی

از کاربردهای کلاسیک داده کاوی است که می توان به موارد زیر اشاره کرد:

خرده فروشی:

تعیین الگوهای خرید مشتریان

تجزیه و تحلیل سبد خرید بازار پیشگویی میزان خرید مشتریان از طریق پست - فروش الکترونیکی - بیمه:

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید