بخشی از مقاله

خلاصه

بیماری دیابت با افزایش مقدار قند خون یا کاهش هورمون انسولین در بدن ایجاد میشود. این بیماری در صورتیکه دیر تشخیص داده شود اثرات زیانباری بر روی سلامت افراد خواهد گذاشت. امروزه برای تشخیص بیماری دیابت آزمایشات مختلفی انجام میشود که این بیماری را تشخیص می دهد. تشخیص بیماری دیابت با استفاده از اطلاعات موجود در مراکز درمانی و به کمک ابزارهای دادهکاوی یک شیوه موثر و کاربردی در تشخیص بیماری دیابت در نظر گرفته میشود و قادر است در زمان اندک و دقت مناسب بیماری دیابت را تشخیص دهد. شبکه عصبی مصنوعی یکی از ابزارهای مهم دادهکاوی در تشخیص بیماری دیابت محسوب میشود که کمینه کردن خطای طبقهبندی در آن باعث افزایش دقت تشخیص بیماری دیابت میشود.

در این پژوهش به کمک الگوریتم فرا ابتکاری بهینهسازی امواج آب یک روش برای تشخیص بیماری دیابت به کمک شبکه عصبی مصنوعی ارایه شده است. یافتههای ما نشان میدهد الگوریتم بهینهسازی امواج آب با دقت بیشتری نسبت به ابزارهای دادهکاوی بیماری دیابت را تشخیص میدهد. دقت، حساسیت و تشخیص متوسط روش پیشنهادی به ترتیب برابر %91,54، %92,36 و %89,21 میباشد.

کلمات کلیدی: بیماری دیابت، الگوریتم بهینهسازی امواج آب، الگوریتمهای فرا ابتکاری، شبکه عصبی مصنوعی، دادهکاوی

مقدمه

دادهها و اطلاعاتی که افراد مراجعه کننده در اختیار کلینیکهای درمانی قرار میدهند میتواند به عنوان یک منبع مناسب برای پژوهش در حوزه تشخیص بیماری بکار گرفته شود. بیماری دیابتیکی از بیماریهای فراگیری است که دارای پیش زمینههای مانند تعداد دفعات بارداری، سن، جنسیت، فشار خون، قند دوساعته1 و موارد دیگر است که میتوان از این ویژگیها در تشخیص بیماری بهره گرفت. تجزیه و تحلیل این دادهها به علت عدم سازماندهی دادهها و وجود الگوهای پنهان2 اینگونه اطلاعات بدون ابزارهای تخصصی تا حدودی غیرممکن به نظر میرسد.

دادهکاوی را میتوان یک روش کشف اطلاعات مفید از دادههای سازماندهی نشده و فاقد اطلاعات آشکار تعریف نمود. بررسی دادههای بکار رفته در پرونده بیماران دیابتی در قالب مجموعهدادههای استاندارد این امکان را به پژوهشگران میدهد که کار خود را با هم مقایسه نمایند.

تشخیص بیماری دیابت که وابستگی پیچیدهای بین ویژگیهای ورودی و خروجی آن وجود دارد با آزمایشات پزشکی که در چند نوبت صورت میپذیرد امکان پذیر است اما این روشها به علت صرف زمان، هزینه و حتی ترس از آزمایشات مختلف بالینی کمتر مورد استقبال عموم قرار میگیرد و زمانی بیماری تشخیص داده میشود که متاسفانه علائم خطرناک آن مانند آسیب بینایی، کلیه و قطع عضو بروز مینماید. توسعه سیستم های نرمافزاری که بتواند با حداقل آزمایش خون و با دقت بالا و البته هزینه و زمان اندک تخمینی از میزان دیابت یا قند خون افراد ارایه دهد یک ایده مناسب و جالب خواهد بود.

بیماری دیابت دارای یکسری ویژگی ورودی و یک ویژگی خروجی است که توسط ویژگیهای ورودی مقدار ویژگی خروجی - سالم بیمار - تشخیص داده میشود. در این پژوهش قصد داریم از الگوریتم بهینهسازی امواج آب به عنوان یک الگوریتم تکاملی کاملاً جدید جهت تشخیص دقیقتر بیماری دیابت استفاده نمایم به عبارت بهتر سیستم پیشنهادی برای افزایش دقت و موثرتر نمودن پیشبینی و طبقه بندی افراد به دو دسته سالم و بیمار از مفاهیم الگوریتم تکاملی امواج آب استفاده مینماید.

با توجه به اینکه الگوریتمهای تکاملی به تنهایی قادر به کشف الگو و دانش پنهان موجود در دادههای مختلف نظیر بیماری دیابت نمیباشند نیاز است که با یکی از تکنیکهای دادهکاوی ترکیب شوند تا قادر به تشخیص بیماری دیابت شوند. هدف از بکارگیری الگوریتم بهینهسازی امواج آب در کنار شبکه عصبی مصنوعی ایجاد یک سیستم نرمافزاری دقیقتر جهت تشخیص بیماری دیابت است که میتواند به عنوان یک سیستم نرم افزاری برای تشخیص بیماری بکار گرفته شود.

در این پژوهش قصد داریم یک شبکه عصبی را انتخاب نمایم ودادههای مجموعه داده بیماری دیابت رابه عنوان داده آموزشی در اختیار این شبکه عصبی قرار دهیم تاشبکه عصبی درمراحل یادگیری یک نمودارپیشبینی به کمک دادههای آموزشی و الگوریتم بهینهسازی امواج آب ایجاد نماید. نمودار پیشبینی بیماری دیابت که به کمک شبکه عصبی مصنوعی ایجاد شده به علت اینکه فضای ویژگیهای مسئله - مانند مقداروزن، سن، جنسیت و غیره - چند بعدی میباشد به شکل یک ابرصفحه درفضای چند بعدی مدلسازی میشود.

همانگونه که می-دانیم این ابرصفحه باید به گونه هایی طراحی شودکه بهترین تقریب ازنقاط پراکنده - اطلاعات بیماران - را ارایه دهد یا به عبارتی حداقل فاصله از نقاط آموزشی راداشته باشد. این رویکرد نشان میدهدکه حل این مسئله یک مسئله ازنوع بهینه-سازی است که نیاز است وزنهای شبکه عصبی به گونهای بهینه انتخاب شوند تا میزان خطای پیشبینی ابر صفحه کمینه شود. حل این مسئله بهینه سازی یک مسئله سخت و دشوار به شمار میرود که روشهای کلاسیک ریاضی نظیر گرادیان یا سیمپلکس قادر به حل آن نمیباشند.

در این پژوهش قصد داریم از الگوریتم بهینهسازی امواج آب برای حل این مسئله استفاده نمایم تا خطای پیشبینی و طبقهبندی بیماران به دو دسته سالم و بیمار کمینه شود. در واقع این پژوهش تلاشی برای ایجاد یک سیستم نرمافزاری جهت تشخیص بیماری دیابت بااستفاده از ترکیب شبکه عصبی مصنوعی و الگوریتم بهینهسازی امواج آب میباشد. ادامه مقاله به این صورت میباشد که در بخش دوم سابقه پژوهش و در بخش سوم به مفاهیم پایه شامل الگوریتمهای فراابتکاری، الگوریتم بهینه سازی امواج آب، داده های پزشکی و مروری بر داده کاوی اشاره شده است.

در بخش چهارم چارچوب کلی روش پیشنهادی، تابع هدف، کدینگ جمعیت و الگوریتم روش پیشنهادی تشخیص دیابت ارایه شده است. در بخش پنجم به ارزیابی و نتایج شبیهسازی روش پیشنهادی میپردازد. در بخش ششم نتیجهگیری مقاله و کارهای آتی را خواهیم داشت.

سابقه پژوهش

جهت تشخیص بیماری دیابت در افراد از دو الگوریتم و قوانین انجمنی استفاده نمودند. آنها با استفاده از این دو الگوریتم جهت کشف قوانین، یک مجموعه قوانین و روابط در مجموعه داده4 دیابت - PIDD - کشف و برای تخمین بیماری دیابت ارایه نمودند. در روش پیشنهادی آنها در مجموع 25 قانون جهت تشخیص بیماری دیابت و براساس ویژگیهای مجموعه داده PIDD ارایه شده است. به عنوان مثال در قانون چهارم، به این نکته اشاره شده که در صورتیکه فشار دیاستول5 شخص 50 باشد این شخص بیمار دیابتی نیست.

یک سیستم یادگیری عمیق - شدید - 7 را جهت تشخیص بیماری دیابت مورد استفاده قرار دادند. نتایج پژوهش آنها نشان میدهد که اگر تعداد گرههای لایههای پنهان صفر در نظر گرفته شود، میزان دقت تشخیص بیماری دیابت افزایش مییابد و با افزایش تعداد گرههای لایههای پنهان، دقت تشخیص بیماری دیابت در دادههای آموزشی و آزمون کاهش مییابد. آنها جهت ارزیابی روش پیشنهادی در تشخیص بیماری دیابت، روش خود را که مبتنی بر یادگیری عمیق است را با شبکه عصبی مصنوعی چندلایه بازخورد به عقب8 مقایسه نمودند.

نتایج پژوهش آنها نشان میدهد که دقت تشخیص بیماری دیابت در دو مجموعه داده آموزشی و آزمون در شبکه عصبی مبتنی بر یادگیری عمیق از شبکه عصبی چند لایه بیشتر میباشد. از طرفی دقت روش یادگیری عمیق در مجموعه داده آموزشی و آزمون به ترتیب 1,12 و 2,14 برابر شبکه عصبی مصنوعی چند لایه است. علاوه بر دقت بیشتر شبکه عصبی عمیق نسبت به شبکه عصبی چند لایه در تشخیص بیماری دیابت، زمان تشخیص شبکه عصبی عمیق نسبت به شبکه عصبی مصنوعی نیز کمتر است. آنها نشان دادند که سرعت روش یادگیری شدید در مجموعه داده آموزشی و آزمون به ترتیب 3,102 و 5,136 برابر شبکه عصبی مصنوعی چند لایه است.

جهت تشخیص بیماری دیابت، سه نوع شبکه عصبی رگرسیون10، چندلایه و شعاعی را با استفاده از مجموعه داده PIDD بکار گرفتند. نتایج پژوهش آنها نشان میدهد که شبکه عصبی مصنوعی شعاعی دارای بدترین دقت در بین مجموعه داده آزمون است. نتایج کلی تحقیق نشان میدهد که شبکه عصبی GRNN در مجموعه آزمون خود دارای دقت بیشتر و در حدود 82,21 درصد میباشد. نتایج کلی نشان میدهد که شبکه عصبی مبتنی بر رگرسیون یک ساختار مناسب جهت تشخیص رویدادهای پزشکی است.

جهت تشخیص بیماری دیابت، تاثیر فاز پیش پردازش از نوع نرمال سازی بر روی 5 روش دادهکاوی و با استفاده از مجموعه داده PIDD را بررسی نمودند. نتایج مربوط به دقت تشخیص بیماری دیابت، بدون پیش پردازش دادهها و با پیش پردازش دادها در 5 روش شبکه بیزی، شبکه عصبی چند لایه، جدول تصمیم گیری درخت تصمیم گیری و چارت ساده نشان میدهد که اعمال فاز پیش پردازش در 5 تکنیک بالا باعث میشود دقت دستهبندی درست افزایش و به همان نسبت دقت دستهبندی غلط کاهش یابد.

جهت تشخیص بیماری دیابت از چهار تکنیک دادهکاوی شامل درخت تصمیمگیری 13، نزدیکترین همسایه14، ماشین بردار پشتیبان15 و جنگل تصادفی16 استفاده نمودند. نتایج پژوهش آنها نشان میدهد که تشخیص بیماری دیابت به کمک درخت تصمیمگیری دارای بیشترین دقت نسبت به تکنیکهای مشابه است و این دقت در حدود 73 .82 درصد میباشد. از جمله نتایج آنها افزایش دقت روش تشخیصی به کمک اعمال فازهای پیش پردازش و رفع دادههای نویزی در مجموعه داده PIDD است.    

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید