بخشی از مقاله
چکیده
این مقاله بر موضوع دادهکاوی وجود سل نهفته در معتادین به مواد مخدر متمرکز است. که بر اساس مطالعه مقطعی توصیفی میباشد.در تحقیق حاضر، جمعآوری دادهها با استفاده از روش مصاحبه با افراد کلیدی انجام شده است. که پس از ارائه خلاصهای از جنس آماری دادهها، به زمینههای استفاده روشهای خوشه بندی با استفاده از شبیهسازی توسط نرمافزارهای کلمنتاین، به فرآیند دادهکاوی در این تحقیق پرداخته شده است.
در این مقاله استفاده از روشی که بتواند با در نظر گرفتن همه ویژگی ها ، گونه های مشابه را استخراج کرده و انتخاب بهترین ضریب - k تعداد خوشه ها - برای رسیدن به بهترین خوشه بندی و یافتن الگوی مناسب تشخیص بیماری سل ، مرجع هدف بود. در این تحقیق جهت تابع فاصله و معیار تراکم خوشه بندی ، برای تعیین تعداد خوشه ها از تابع DEB و تابع فاصله اقلیدسی استفاده شده است. که نتایج حاصل کیفیت خوشه بندی با بالاترین ضریب دقت و الگوی مناسب تشخیص بیماری سل را شامل شد.
-1 مقدمه
جمعیت مورد مطالعه این پژوهش از معتادان به مواد مخدر مراجعهکننده به مرکز ترک اعتیاد امید و بیمارستانهای مطهری و پیمانیه جهرم انتخاب شدند. نمونهگیری به صورت متوالی و مبتنی بر هدف صورت گرفت به طوری که هر بیمار معتاد که به مراکز نامبرده شده مراجعه کرده و اعتیاد به مواد مخدر داشت است و تمایل به شرکت در مطالعه را نیز داشتند وارد مطالعه شدند. ، جمعآوری دادهها با استفاده از روش مصاحبه با افراد کلیدی انجام شده است.
در واقع میتوان با مصاحبه علاوه بر یافتن فرصتها، افراد کلیدی را با مفهوم دادهکاوی آشنا ساخت و یک ارتباط دو طرفه بین گروه دادهکاوی و افراد درگیر برقرار ساخت. این مقاله2 هدف را دنبال میکند ، یک تشخیص بیماری و یافتن الگوی مناسب داده کاوی و دیگری پیشنهاد انتخاب بهترین ضریب k - ارزیابی کیفیت خوشه بندی - می باشد. سل در معتادان به خصوص معتادان تزریقی از شیوع بالایی برخوردار است.
اهمیت پیش بینی بیماری سل از این لحاظ است که به گزارش گروه پزشکی خبرگزاری آنا، دکتر پیام طبرسی با توجه به 23 مهر روز ملی مبارزه با سل به تاریخچه این بیماری پرداخت و گفت: بیماری سل یکی از قدیمیترین بیماریهای بشری است که شواهد آن در اجساد مومیایی هزاران سال پیش مشاهده شده و اولین بار میکروب این بیماری توسط رابرت کخ - Robert - Koch کشف شده است.وی گفت: این بیماری عفونی منشا میکروبی داشته و درگیری آن بصورت ریوی است اما اعضای خارج ریه مانند لنفوم، پلور، مغز، استخوان، کلیه و غیره را نیز درگیر میکند. و همچنین سالانه حدود 11 هزار نفر در ایران به »سل« مبتلا میشوند .
در علم پزشکی کشف و تشخیص به موقع بیماری ها می تواند از ابتلا به بسیاری از بیماری های مهلک جلوگیری نموده و باعث نجات زندگی مردم گردد. با پیشرفت فناوری اطلاعات و توسعه تکنولوژی و استفاده از فناوری های روز و تجهیزات مدرن پزشکی ، متخصصین قادرند تا به جمع آوری اطلاعات دقیق تری در موردبیماران گردند که تحلیل آنان به دلیل حجم بالای اطلاعات و متعدد بودن موارد ، مشکل می باشد و نیاز به فناوری جدیدتری می باشد که تکنولوژی های داده کاوی به کمک الگوریتم قدرتمند خود به این مهم دست یافته است .
هدف از روش های پیشگویی داده کاوی در پزشکی بالینی ساخت یک مدل پیشگویانه است که به پزشکان کمک میکند تا روشهای پیشگیری ، تشخیص و برنامه های درمانی خود را بهبود بخشند . - Bellazzi ,2008 - داده کاوی عبارتست از اقتباس یا استخراج دانش از مجموعه ای بسیار حجیم از داده ها ، به بیان دیگر ، داده کاوی فرآیندی است که با استفاده از تکنیک های هوشمند ، دانش را از مجموعه ای از داده ها استخراج میکند که تحلیل های ساده آماری قادر به انجام آن نیستند .
داده کاوی از الگوریتم های بسیار پیچیده ریاضی جهت تقسیم بندی داده ها و پیشگویی رویداد ها استفاده می کند - - Shahrabi , 2008 بیشتر افرادی که علم داده کاوی را مورد استفاده قرار می دهند افراد متخصصی در یک زمینه خاص علمی - پزشک ، رادیولوژیست ، مدیر فروش و ... - بوده است که نه تنها به داده خاص خود دسترسی دارند بلکه به جمع آوری آن نیز اقدام می ورزند . هدف این افراد این است که نه تنها ترجیح می دهند داده های خود را بهتر بشناسند بلکه مایلند دانش جدیدی را در رابطه با زمینه فعالیت خود کشف نمایند . مقصود صاحبان داده ، حل مسائل و مشکلات با استفاده از راههای جدید و در صورت امکان بهتر می باشد. - Shahrabi , 2009 -
بکارگیری روشهای داده کاوی در دانش پزشکی در کشور ایران سابقه دارد درحالی که توانائی های این روش می تواند در بدست آوردن الگوهای مفید کارساز باشد - - Kajabadi,2011 خوشه بندی یکی از مهمترین ابزار کشف اطلاعات است که در کشف های تصادفی به کار گرفته می شود. این تکنیک به شناسایی مناطق پراکنده و متراکم در فضای داده ها ، کشف الگوی توزیع و نیز روابطی که بین ویژگی های داده ها وجود دارند ، کمک می کند. روشهای خوشه بندی به واسطه قابلیت درک از جهات گوناگونی حائز اهمیت است . فهم قلمرو ، درک قابلیت های کلاس بندی ، توجیه تصمیم و بالاخره وجود قوانین نمادینی که می تواند از روی خوشه ها استخراج شده و سپس در یک تصمیم گیری مبتنی بر قوانین به کار گرفته شوند.
- N. Ye,2003 - - Pragnyaban,2012 - نرم افزار کلمنتاین مشتمل از ابزارها برای طبقه بندی داده ها ، رگرسیون ، خوشه بندی و قوانین انجمنی است. مطالعات پیش بینی با استفاده از داده کاوی و با رویکرد پیش بینی در علوم پزشکی وجود دارند. به عنوان مثال ، دلن و همکاران از شبکه های عصبی مصنوعی ، درخت تصمیم و خوشه بندی برای توسعه مدل های پیش بینی سرطان پستان با تجزیه و تحلیل پایگاه های بزرگ گردآوری شده بود ، بهره جستند. نتایج تحقیقات آنان نشان داد که الگوریتم درخت تصمیم و خوشه بندی برای استخراج دانش از داده های موجود مقدم بر سایر روش ها بود و نتایج بدست آمده ، نزدیک به واقعیت بود.
- Delen,2010 - طلوعی و همکاران در جهت پیش بینی سرطان پستان از درخت تصمیم ، ماشین بردار بهره گرفت و نتایج حاصله نشان داد که روش داده کاوی مثل ماشین برادار با دقت ./975 بهترین داده پیش بینی کننده پایگاه داده ای پزشکی است . نسرین اسدی و همکاران در مقاله ای تحت عنوان"به کارگیری داده کاوی جهت تعیین عوامل موثر درابتلا به انواع سرطان و تعیین روش درمانی بهینه در پایگاه داده سرطان بیمارستان نمازی - Asadi, 2010 - سعی برآن داشتند تا با بررسی انواع سرطان از طریق تکنیکها و روشهای داده کاوی به کشف وابستگی هایی جهت تعیین عوامل موثر برسرطان پرداخته و سپس با بررسی انواع درمان از طریق الگوریتم ها ی داده کاوی ، بهترین نوع درمان برای هریک ازانواع سرطان راپیشنهاد دهند×؟
به این منظور از الگوریتم k-meansبرای خوشه بندی عوامل موثر بر بیماری نظیر جنسیت ،سن ،سابقه یبیماری در اقوام ،مصرف سیگار یا الکل استفاده گردید . نویسندگان مقاله - غضنفری ، - 1388 از تابع DEB و بر اساس فاصله اقلیدسی جهت خوشهبندی استفاده گردیده بودند . در الگوریتم k-means ابتدا k عضو - که k تعداد خوشه هاست - به صورت تصادفی از میان N عضو به عنوان مراکز خوشهها انتخاب میشود سپس N - K عضو باقی مانده به نزدیکترین خوشه تخصیص مییابند . بعد از تخصیص همه اعضا مراکز خوشه مجددا محاسبه میشود و اعضا با توجه به مراکز جدید به خوشهها تخصیص مییابند و این کار تا زمانی که مراکز خوشهها ثابت بماند ، ادامه مییابد.
لین و همکاران - Lin WT , 2011 - طی مطالعه ای دربیمارانی که درپایگاه داده بخش اورژانس یک بیمارستان تایوان به ثبت رسیده است سعی بر این داشتند تا به کشف بهترین تصمیمات جهت درمان پرداخته و بدین ترتیب از بسیاری از هزینه ها ی ناشی از اقدامات نادرست نظیر جراحی بپرهیزند×؟جهت انجام اینکار از روش خوشه بندی جهت دسته بندی مشخصه ها وعلائم بیماری وتصمیمات اتخاذ شده توسط پرستار و پزشک پرداختند.

