بخشی از مقاله

چکیده

در دنیای امروزه استفاده از تجهیزات و دانش به روز کمک کرده است که بسیاری از مشکلات که از اشتباهات انسانی به وجود آمده است حل و یا رفع شود، اما یکی از فوائد حل این مشکلات در زمینه پزشکی است که بسیار کمک شایانی به رفع موانع تشخیص درست در بیماران کرده است، زیرا با این که تشخیص به موقع بیماری از هزینههای بیمار میکاهد اما این تشخیص باید درست نیز باشد.

در پژوهش پیشرو سعی میشود که تمرکز اصلی بر روی استفاده از تکنولوژی و دادههای موجود و افراد متخصص باشد. تا کنون سیستمهای مختلفی برای تشخیص و پیشبینی دیابت پشینهاد شدهاند ، ولی در روش پیشنهادی از ترکیب این دو روش برای افزایش دقت و کارایی استفاده میشود. همانطور که گفته شد تشخیص به موقع دیابت و درمان آن میتواند ریسک مرگ و میر ناشی از آن و همچنین هزینههای درمانی را کاهش دهد، در این پژوهش سعی میشود با استفاده از ترکیب روشها یک روش برای تشخیص و پیشبینی این بیماری ارائه شود.

هدف از این پژوهش بکارگیری تکنیکهای دادهکاوی در تشخیص افتراقی بیماری دیابت میباشد. دادههای پژوهش از سایت معتبر UCI استخراج شده است و جامعه آماری آن حدود 800 نفر متشکل از افراد مبتلا به بیماری دیابت و هم افراد سالم میباشد. روش تجزیه و تحلیل به این صورت است که با استفاده از الگوریتم SOM و الگوریتم K-NN به صورت سلسله مراتبی سعی بر تشخیص دیابت و تشخیص افتراقی بین انواع دیابت انجام میپذیرد . درصدهای به دست آمده در این پژوهش برای تشخیص افتراقی بین انواع دیابت 76 درصد ، برای تشخیص صحیح بیماری دیابت 93 درصد و مدل ترکیبی برای تشخیص افتراقی دیابت 80 درصد می باشد.

.1  مقدمه

امروزه استفاده از پایگاه های داده در حوزه سلامت که حاوی میزان وسیعی از داده های بالینی است گسترش پیدا کرده است و این امر باعث به وجود آمدن تکنیکهای جدیدی در حوزه سلامت شده است، ثبت داده های مربوط به علائم بیماران مبتلا به بیماری های گوناگون و روش های کمکی برای تشخیص بیماری ها بسیار گسترش پیدا کرده است و حجم دادهها متناسب با پیشرفتهای تکنولوژی افزایش پیدا کرده است، حجم زیاد این داده ها باعث میشود که درک همه جانبه این اطلاعات و عوامل دخیل توسط یک فرد کار دشواری باشد و نیاز به سیستمهای کمکی احساس شود. به همین دلیل است که نیاز به یک سیستم مکانیزه برای کشف الگو های موجود و پیش بینی احساس می شود.

داده کاوی در راستای مدیریت داده ها و استفاده از پایگاه داده و ادغام آن با روش های سنتی استفاده می شود . همچنین استفاده از داده کاوی و تجزیه و تحلیل خروجیهای آن، یکی از زمینه های موثر در پیشرفت تصمیم گیری می باشد. استفاده از تکنیک های داده کاوی در شاخه علم پزشکی باعث شده است که در تشخیص بیماری ها کمک بسیاری به پزشکان بنماید.

داده کاوی فرآیندی است که در آن داده ها از جنبه های مختلف مورد تجزیه و تحلیل قرار می گیرند تا بدین وسیله بتوان الگو های مفید، تازه و قابل استناد در پایگاه داده را بیابیم و از آنها در قالب اطلاعات مفید، برای بالا بردن بازده استفاده کنیم. در داده کاوی از تحلیل و اکتشاف داده ها استفاده می شود که در آن بر کشف اطلاعات نهفته و ناشناخته از درون انبوهی از داده ها تاکید می شود. داده کاوی که به عنوان کشف دانش نیز شناخته می شود شامل مراحل پالایش داده ، یکپارچه سازی داده ، تبدیل داده، ارزیابی الگو و نمایش دانش می باشد.

.2 کارهای مرتبط

انصاری و همکارانش - - 1393 در مقاله ای به بررسی روش های توسعه یافته ماشین بردارپشتیبان جهت بهبود دقت تشخیص بیماری دیابت نوع دو پرداختند، با توجه به حجم زیاد داده های پزشکی، یکی از پرکاربردترین روش ها جهت تشخیص الگو در میان اطلاعات پنهان، استفاده از تکنیک های داده کاوی است. عسگری - 1393 - در پژوهشی به بررسی طراحی یک سیستم مبتنی بر کلونی مورچه ها برای تشخیص بیماری دیابت پرداخت. دیابت یکی از بیماری های رایج در جوامع امروزی است که دارای عوارض خطرناکی می باشد.

رمضان خانی و همکارانش - - 2014 در پژوهشی به بررسی استفاده از درخت تصمیم برای شناسای جمعیت کم خطر ابتلا به دیابت نوع 2 پرداختند. هدف از این مطالعه، ایجاد یک مدل پیش بینی با استفاده از روش داده کاوی برای شناسایی افراد کم خطر به ابتلا دیابت نوع دو با استفاده از پایگاه داده مطالعه قند لیپید تهران. مگ و همکارانش - - 2013 در پژوهشی به بررسی و مقایسه سه مدل داده کاوی برای پیش بینی دیابت پرداختند. هدف از این پژوهش مقایسه روش رگرسیون، شبکه عصبی و درخت تصمیم برای پیش بینی دیابت یا پیش دیابت با استفاده از عوامل مشترک خطر می باشد.

محمدی و ندیمی - 1394 - در مقاله ای به بررسی و مروری بر روشهای مبتنی بر درخت تصمیم جهت پیش بینی بیماری دیابت پرداختند. شه و لیپسکومپ - - 2015 در مقاله ای به بررسی عوامل بالینی دیابت با استفاده داده کاوی پرداختند. پرون و همکارانش - - 2016 در مقاله ای به بررسی و تجزیه تحلیل عملکرد تکنیک های طبقه بندی در پیش بینی دیابت پرداختند.

.3 روش ارائه شده

به طور کلی در روش پیشنهادی دو فاز اجرایی وجود دارد اولین فاز شامل پیش پردازش دادهها میباشد به دلیل این که داده ها ناهمگون میباشد در ابتدا با استفاده از روشهای معمول دادهها را در بازههای همگن قرار میدهیم، فاز دوم این پژوهش پیاده سازی الگوریتمها و استخراج خروجی میباشد. در روش پیشنهادی اول فاز پیشپردازش دادهها شامل مرتب کردن دادههای بیماران و سپس جدا سازی اطلاعات بیماران مبتلا به دیابت و افراد سالم از هم میباشد. اما در روش دوم فقط باید دادهها را در یک بازه همگن قرار داد .

فاز دوم در روش پیشنهادی اول، استفاده از الگوریتم K-NN و SOM به صورت جداگانه در تشخیص بیماری میباشد و این فاز در روش پیشنهادی دوم استفاده از این دو الگوریتم به صورت سلسله مراتبی برای تشخیص بیماری دیابت میباشد. در روش پیشنهادی دوم جدا سازی افراد مبتلا به دیابت از افراد سالم به عهده الگوریتم SOM میباشد و تشخیص افتراقی بر عهده الگوریتم K-NN میباشد.

در فاز اول این پژوهش ابتدا بر اساس تست قند خون انجام شده از بیماران، افرادی که تست خون آنها از حد استاندارد بیشتر است جدا سازی شده ادامه کار بر روی دادههای افراد مبتلا به بیماری دیابت انجام میشود. در فاز دوم این بررسی، بر اساس تقسیمبندیهای گفته شده در تشخیص افتراقی فرد مبتلا به دیابت، مشخص میشود که دیابت او نوع اول است یا نوع دوم. بعد از روش بالا که به صورت موازی عملکرده از روش سلسله مراتبی استفاده میکنیم به این صورت که در ابتدا با استفاده از روش SOM به شناخت بیماران دیابتی میپردازیم و سپس با استفاده از الگوریتم K-NN به تشخیص نوع دیابت آنها میپردازیم با توجه به مطالعات انجام شده انتظار میرود که با استفاده از الگوریتم SOM بتوان راحتتر بیماران مبتلا به دیابت را از افراد سالم تشخیص داد.

زیرا با استفاده از ویژگیهای مهم در بیماری دیابت میتوان با استفاده از ویژگی الگوریتم SOM راحتتر به شناسایی بیماران مبتلا به دیابت پرداخت مراحل انجام این روش به صورت سلسله مراتبی می باشد. بعد از این که دادههای خود را به الگوریتم SOM دادیم خروجیهای به دست آمده را به یک فرد خبره نمایش میدهیم تا از صحت نتایج استخراج شده اطمینان حاصل کنیم. در دو طرح پیشنهادی در مرحله K-NN یک قانون طراحی میشود که بتوان با استفاده از آن به تشخیص افتراقی بین انواع دیابت کمک کرد همانطور که در جدول آمده است احتمالات برای وجود انواع بیماریها متفاوت است و با توجه به دادههای محدود شده ، از قوانین زیر برای نوشتن یک چارچوب استفاده شده است.

.4 نتایج

در این فصل به ارائه مدل هایK-NN و SOM پرداخته شد. در ابتدا با استفاده از مدلK-NN سعی بر پیش بینی و تشخیص افتراقی بین انواع دیابت کردیم. سپس این الگوریتم را با دادههای دیگری تست کردیم که نتایج آن را در این فصل ملاحظه کردیم. در مرحله بعد یک شبکه SOM طراحی شد تا با استفاده از آن بتوان افراد مبتلا به دیابت را تشخیص داد و سپس با استفاده از قوانین تعیین شده در مرحله بعد با استفاده از K-NN بین انواع دیابت تشخیص درستی دهیم و برای صحت از نتیجهگیری از فرد خبرهای کمک گرفته میشود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید