بخشی از مقاله
چکیده
امروزه در دانش پزشکی جمع آوری داده های فراوان در مورد بیماریهای مختلف از اهمیت فراوانی برخوردار است. مراکز پزشکی با مقاصد گوناگون به جمع آوری این داده ها می پردازند. تحقیق روی این داده ها و به دست آوردن نتایج و الگوی مفید در رابطه با بیماری ها ،یکی از اهداف استفاده از این داده هاست.حجم زیاد این داده ها و سردرگمی برای غلبه بر این مشکل به دست آوردن روابط مفید بین عوامل خطرزا در بیماری ها استفاده می شود.
بنابرین در این مقاله به معرفی داده کاوی و ارایه روشی هوشمند برای تشخیص دیابت نوع 2 با استفاده از الگوریتم های داده کاوی به همراه نرم افزار وکا پرداخته ایم و پس از تحقیقات و آزمایشات انجام شده به نتایج زیر رسیده ایم که میزان دقت در وکا برای الگوریتم های درخت تصمیم، نزدیکترین همسایه، بیزین ساده، smo ،logistic و oner به ترتیب برابر است با %93,0394 ، 81,4385% ،%79,0023 ، 88,9391% ،%88,8363 که مدلسازی با استفاده از الگوریتم درخت تصمیم با بیش از %93 دقیق ترین روش تشخیص می باشد.
مقدمه
بدن ما برای تولید انرژی به سوخت نیاز دارد، مواد غذایی که مصرف می کنیم نهایتا به یک قند ساده به نام گلوکز تبدیل می شود؛ گلوکز وارد جریان خون و سپس سلولها شده و برای تولید انرژی ورشد بدن مورد استفاده قرار می گیرد. در صورتی که قند به جای وورد به سلول ها در خون باقی بماند، قند خون افزایش یافته و منجر به دیابت می گردد؛ علت بروز این بیماری، کمبود انسولین است. انسولین هورمونی است که از غده ی لوزالمعده - پانکراس - ترشح می شود. این ماده کلیدی، موجب ورود قند به سلول ها می شود تا قند، جهت تامین انرژی مورد استفاده قرار گیرد یا برای مصارف بعدی ذخیره گردد - . - Rajesh and sangetha ,2012
دیابت خطر ابتلا به بیماری های کلیوی، کوری، آسیب عصبی، آسیب عروق خونی و بیماری های قلبی را افزایش می دهد. دیابت به 2 شکل عمده رخ می دهد: دیابت نوع 1 که به آن دیابت وابسته به انسولین نیز می گویند و دیابت نوع 2 یا غیر وابسته به انسولین. رایج ترین شکل دیابت نوع دوم آن است - . - karthikey and begum,2013 از علل ابتلا به دیابت نوع 2 میتوان به تغییردر رژیم غذایی، پیری، شهر نشینی و افزایش شیوع چاقی و عدم فعالیت بدنی اشاره کرد - . - marcano and diegoondina,2012
دیابت در سراسر جهان در حال افزایش است - . - shawj et al,2010در سال 2012 دیابت به عنوان یکی از چهار بیماری غیر مسری که مسئول 1/5 میلیون مرگ و میر در سراسر جهان بود، در نظر گرفته شد. همچنین در سال 2008 بار اقتصادی برای این بیماری 2/35 میلیارد دلار تخمین زده شد. در صورتی که پروژه های پیگیرانه برای این بیماری در نظر گرفته نشود پیش بینی می شود که این ارقام به صورت تصاعدی افزایش خواهد یافت؛ از برآوردها، انتظار می رود که در سال 2030 بیش از 550 نفر مبتلا به این بیماری باشند که این میزان تقریبا دو برابر مبتلایان در سال 2008 است. نکته ی قابل توجه در این پیش بینی ها این است که ابتلا به دیابت بیشتر در کشورهای در حال توسعه در حال افزایش است که شرق میانه بیشترین سهم را در این مسئله دارد - . - zimmet,2008
امروزه استفاده از سیستم های هوشمند در تشخیص و درمان بیماری ها، خطاهای پزشکی را به شدت کاهش داده و در نتیجه سبب کاهش زیان های مالی و انسانی شده است. استفاده از چنین سیستم های هوشمندی که در طول چند سال ساخته شده است برای حل مشکلات مورد توجه ویژه قرار گرفته است؛ بخش مهمی از مشکلات در پزشکی مربوط به تشخیص بیماری است. معمولا تشخیص بیماری بر اساس آزمایشهای مختلفی که بر روی بیماران انجام می شود امکان پذیر است اما زمانی که تعداد پارامتر ها برای تشخیص بیماری افزایش می یابد، حتی با وجود کادر پزشکی متخصص و حرفه ای؛ روند بررسی و پیگیری بیماری بسیار مشکل و پیچیده می شود.
به همین دلیل در چند دهه ی گذشته از ابزارهای تشخیص کامپیوتری برای این اهداف استفاده می شود. این ابزارها تا حد زیادی به پزشکان در زمینه های مختلف از جمله: حذف بی نظمی داده ها و در نتیجه کاهش خطاهای انسانی و ارائه ی اطلاعات و جزئیات پزشکی مورد نیاز، یاری رسانده اند - خلیل نژاد و بیدگلی،. - 1390 در چند سال گذشته، استفاده از تکنیک های هوشمند در طبقه بندی بیماری افزایش یافته و مطالعات تحقیقاتی زیادی در پیش بینی پزشکی حیاتی انجام شده است ولی هیچ کدام کاملا جوابگو نبودند. یکی از این روش های مهم که برای استنتاج داده 1ها استفاده می شود داده کاوی 2است. داده کاوی فرایند تجزیه و تحلیل داده ها از دیدگاه های مختلف و خلاصه ی آن به اطلاعات3 مفید است.
اطلاعاتی که می توان برای مقاصد پزشکی، علمی، صنعتی استفاده شود - مقدسی و همکاران،. - 1385 با توجه به اهمیت و حساسیت داده کاوی در پزشکی و همچنین نیاز مبرم این صعنت به حرکت از پزشکی سنتی به سمت پزشکی مبتنی بر شواهد لذا در این پژوهش، کاربرد داده کاوی در عرصه ی سلامت مورد بررسی قرار گرفته و نتایج بدست آمده روی مجموعه بیماران را نشان می دهیم که در میان روش های طبقه بندی، درخت تصمیم کدامیک نتیجه ی بهتری را بدست می آورد و کدام الگوریتم 4دقت بالاتری نسبت به بقیه ی روش های طبقه بندی دارد و از اهداف پژوهش میشود به موارد زیر اشاره کرد:
1. طراحی سیستم های هوشمند برای تشخیص زودهنگام بیماری و در نتیجه کاهش اثرات منفی ناشی از عدم تشخیص بموقع بیماری
2. حذف بی نظمی داده ها در نتیجه کاهش خطاهای انسانی و در نتیجه کاهش هزینه مالی و جانی و در نهایت طبقه بندی بیماری
3. امکان تشخیص بیماری در مواردی که به دلیل افزایش پارامتر های مورد بررسی، تشخیص آزمایشگاهی پیچیده و مشکل است.وآنچه در این مقاله مد نظر است، تشخیص بیماری دیابت است. به اینصورت که مشخصات و داده های مورد نظر هر بیمار وارد سیستم می شود و سیستم بصورت خودکار تشخیص می دهد که فرد مورد نظر دارای بیماری دیابت است یا خیر.در جدول شماره یک به طور اجمالی تاریخچه استفاده از تکنیک های داده کاوی در تشخیص بیماری دیابت آورده شده و مورد بررسی قرار گرفته شده است.