بخشی از مقاله

خلاصه

لزوم استفاده از الگوریتمهای یادگیر در پیشبینی و تشخیص بیماری به نحوی که صحت و اعتبار عملکرد آن قابل تضمین باشد، مطالعات و تحقیقات جدید را به سوی دستیابی به راهکارهای بهینه در هر دو زمینه پزشکی و دانش کامپیوتر رهنمون کرده است. در این راستا بیوانفورماتیک علمی است که توانسته این همکاری را بین محققان این دو رشته به نحو احسن فراهم آورد. برای خوشهبندی دادههای بیماری هپاتیت بایستی به دادههای بیماری هپاتیت دسترسی داشت. بر روی دادهها ابتدا با استفاده از شاخص مرکزی میانگین عمل پاکسازی دادهها صورت گرفته است سپس بعداز نرمالسازی به کمک الگوریتم تحلیل تفکیکی فیشر تعداد 6 ویژگی از بین 19 ویژگی انتخاب و مدل پیشنهادی معرفی شده است، که ترکیبی از خوشهبند K-Means و الگوریتم بهینهسازی علفهای هرز میباشد و با اعمال آن بر روی پایگاهداده مذکور و مقایسه نتایج خوشهبندی آن با الگوریتمهای بهینهسازی هوشمند دیگر نظیر الگوریتم بهینهسازی ازدحام ذرات، الگوریتم بهینهسازی کلونی مورچگان، الگوریتمهای K-Medoids و K-Means میتوان دریافت که ترکیب خوشهبند K-Means و الگوریتم بهینهسازی علفهای هرز نه تنها دقت خوشهبندی را بالا میبرد بلکه قدرت تعمیمدهی مدل را نیز افزایش میدهد. نتایج استفاده از خوشهبند K-Means و الگوریتم بهینهسازی علفهای هرز حاکی از دقت %100 در طبقهبندی دادههای آزمایشی و %98,9 در طبقهبندی دادههای آموزشی است.

کلمات کلیدی: خوشهبندی، هپاتیت، الگوریتم بهینهسازی علفهای هرز، الگوریتم K-Means ، الگوریتم K-Medoids، الگوریتم تحلیل ترکیبی فیشر.

.1 مقدمه

هپاتیت به معنی التهاب در پارانشیم کبد است و به دلایل مختلفی میتواند ایجاد شود که بعضی آنها قابل سرایت هستند و برخی دیگر مسری نیستند. از عواملی که ایجاد هپاتیت میکنند میتوان به افراط در مصرف الکل، اثر برخی داروها، آلودگی به باکتری و همچنین ویروس اشاره نمود. هپاتیت ویروسی منجر به عفونت کبدی میگردد.[1] عامل بیماری هپاتیت ویرال - ویروسی - یک ویروس است و در ابتدا میتواند مثل یک سرماخوردگی بروز نماید، ولی بیماری مزمن هپاتیت "&" بر عکس سرماخوردگی معمولی به دلیل از کارافتادن کبد و مشکل بودن درمان میتواند حیات بیمار را تهدیدکند. بیشتر مبتلایان به هپاتیت از نوع & و % علائمی ندارند. برخی از این بیماران علائم سرشتی عفونت ویروسی را نشان میدهند از قبیل خستگی، دل درد، درد عضلانی و تهوع و بی اشتهایی، ولی در موارد پیشرفته علائم نارسایی کبدی بروز میکند که شامل تورم شکم، اندامها، یرقان و خونریزیهای گوارشی و... است.

در ایران بالغ بر %3 افراد آلوده به این ویروس میباشند. حدود 75 الی 80 درصد از افرادی که تازه به این ویروس مبتلا شدهاند، دچار پیشرفت و مزمنشدن این بیماری شده و از بین آنها نیز 6 الی 70 درصد به بیماریهای مزمن کبدی دچار میشوند. از بین افراد حدود 5 الی 20 درصد به سیروز کبدی مبتلا شده و 1 الی 5 درصد آنان بر اثر بیماری سیروز کبدی و یا سرطان کبد میمیرند. هپاتیت ویروسی یکی از عوامل مهم مرگ زودرس انسان است و براساس تخمین سازمان بهداشت جهانی بیش از یک میلیون مورد مرگ در اثر هپاتیت اتفاق میافتد.[2] ساختار این مقاله به این صورت است که در بخش دوم مروری بر پیشینه تحقیقات انجامشده، خواهیم داشت و در بخش سوم الگوریتم تکاملی علفهای هرز بیان میشوند. در بخش چهارم خوشهبندی و در بخش پنجم مدل پیشنهادی و ارزیابی نتایج استفاده از الگوریتمهای تکاملی در جهت حل مسئله ارائه میشود و در نهایت در بخش آخر نتیجهگیری انجام میشود.

.2 مروری بر پیشینه تحقیق

جاگاناتان و همکاران در سال 2013 یک روش آنتروپی آستانه فازی مبتنی بر انتخاب ویژگی بر روی پایگاهداده بیماری هپاتیت ارائه دادند. انتخاب ویژگی یک عمل بسیار رایج و مهم در طبقهبندی پایگاهداده است. انتخاب ویژگی هزینه محاسبات را بهوسیله حذف ویژگیهای غیرمهم کاهش میدهد. همچنین فرآیند تشخیص را جامع و دقیق مینماید. این مقاله معیارهای ویژگیهای مرتبط را مبتنی بر آنتروپی فازی نشان میدهد . آزمایش با یک طبقهبند شبکه عصبی پایهای-شعاعی روی پایگاهداده بیماری هپاتیت انجام میشود. سه استراتژی انتخاب ویژگی برای بدستآوردن زیرویژگیهای مرتبط معرفی میشوند. دقت طبقهبندی نشان میدهد روش پیشنهادی قادر است با ویژگیهای کمتر از ویژگیهای پایگاهداده اصلی نتایج مطلوبی تولید نماید.[3]

لودویگ و همکاران در سال 2014 یک روش جدید با نام eigen value decay برای آموزش شبکه عصبی ارائه کردند. این مقاله الگوریتم آموزش جدید برای شبکههای عصبی پرسپترون چندلایه مبتنی بر محاسبات تکاملی ارائه میدهد. هدف الگوریتم آموزش شبکه عصبی است بهطوریکه دچار بهخاطرسپاری نشود. در این مقاله، اینکار بهعنوان یک روش جدید بر روی شبکههای عصبی معرفیشده و eigen value decay نام دارد که هدف آن بهبود حاشیه طبقهبندی است. معرفی این الگوریتم منجربه توسعه یک روش آموزشی جدید مبتنی بر مؤلفههای یکسان مانند ماشین بردار پشتیبان است. تأثیر روش پیشنهادی بر روی هفت پایگاهداده الگو که شامل پایگاهداده هپاتیت نیز می-شود، ارزیابی شده است.[4] هین سو یون و همکاران در سال 2013 الگوریتم یادگیری مبتنی بر شبکه عصبی برای انتخاب ویژگی و طبقهبندی ارائه دادند.

تکنیکهای انتخاب ویژگی و طبقهبندی بدون درنظرگرفتن محاوره بین دو روال بررسی میشوند که منجر به کاهش کارایی میشود. در این مقاله یک روش شبکه عصبی جدید که الگوریتم یادگیری مبتنی بر شبکه عصبی ALBNN نامیده میشود تا دقت طبقهبندی را بهوسیله روالهای انتخاب ویژگی و طبقهبندی بهبود بخشد. در کل دانش مبتنی بر شبکه عصبی مصنوعی بر روی دانش قبلی دامنه تجربه عمل میکند و نقاط شروع بهتری را برای تابع هدف فراهم میکند و منجربه بهترشدن دقت طبقهبندی میشود. اگرچه دانش قبلی سخت شناسایی میشود در عوض استفاده از منابع پسزمینه ناشناخته روش پیشنهادی دانش قبلی را بهبود میدهد. روش پیشنهادی به-صورت ریاضی خواص الگوریتمهای یادگیری دیگر مانند PCA، LARS، C4.5 و SVM را محاسبه میکند. روش پیشنهادی ویژگی مرتبط جدید تولید میکند و خطا را کاهش و دقت طبقهبندی را افزایش میدهد.[5]

پلات و همکاران در سال 2007، روشی مبتنی بر آنالیز اجزای اصلی و سیستم شناسایی ایمنی مصنوعی برای تشخیص بیماری هپاتیت معرفی کردند. دقت طبقهبندی این سیستم بر روی مجموعه دادهای UCI دقت %94,12 را نشان داده است.[6] مونیرول کبیر و همکاران در سال 2010 یک روش انتخاب ویژگی جدید Wrapper با شبکه عصبی برای تشخیص بیماری هپاتیت ارائه دادند. در این مقاله یک الگوریتم انتخاب ویژگی جدید مبتنی بر Wrapper با استفاده از شبکه عصبی ارائه میدهند. انتخاب ویژگی بهصورت مؤثر انجام میشود.[7] کالیسر و همکاران در سال 2011، یک سیستم هوشمند تشخیص بیماری هپاتیت را معرفی کردهاند که یک روش ترکیبی با نام PCA-LSSVM است.

سپس از ماشین بردار پشتیبان جهت طبقهبندی استفاده کرده است. دقت الگوریتم پیشنهادی با استفاده از پارامترهای مختلف بهدست آمده و به دقت %96,12 رسیده است.[8] چن و همکاران در سال 2011، یک روش ترکیبی جدید مبتنی بر آنالیز تفکیک فیشر و ماشین بردار پشتیبان برای تشخیص بیماری هپاتیت معرفی کردهاند. در این تحقیق از آنالیز تحلیل فیشر برای انتخاب ویژگی و از ماشین بردار پشتیبان برای طبقهبندی استفاده شده است و دقت %96,77 را گزارش نمودهاند.[9] سردار باسکیل و همکاران در سال 2011 به تشخیص بیماری هپاتیت با استفاده از شبکه عصبی پرسپترون چندلایه با الگوریتم آموزشی لونبرگ مارکوارت پرداختند. نتایج این مطالعه با روشهای دیگر مقایسه شده است. نتایج حاکی از دقت %91,87 با اعتبارسنجی 10برابر است.[10]

.3 الگوریتم بهینهسازی علفهای هرز

الگوریتم بهینهسازی علفهای هرز یک الگوریتم بهینهسازی عددی الهام گرفتهشده از رشد علفه هرز است. این الگوریتم در سال 2006 توسط محرابیان و لوکاس در قالب مقالهای پیشنهاد شد. علفهای هرز گیاهانی هستند که رشد هجوم آورنده و شدید آنها تهدید مهمی برای گیاهان زراعی محسوب میشود.علفهای هرز بسیار پایدار و تطابقپذیر در مقابل تغییرات محیط میباشند، بنابراین با الهام گرفتن و شبیهسازی خصوصیات آنها میتوان به یک الگوریتم بهینهسازی قوی رسید.[11]مقداردهی اولیه جمعیت: توزیع یک جمعیت اولیه در فضای dبُعدی بهصورت تصادفی یک راهحل اولیه است. تولیدمثل: هر یک از اعضای جمعیت علفها مجاز است بسته به توان و شرایط خود تولید مثل کند. هر علف میتوان بهطور خطی حداقل و یا حداکثر تعدادی دانه تولید کند. بهعبارت دیگر، دانههای یک علف بسته به شرایط آن بهطور خطی مورد تولید حداکثر و حداقل قرار میگیرند.

رابطه - 1 - این موضوع را نشان میدهد.[12] تصادفی نبودن و سازگاری در الگوریتم در این بخش ارائه شده است. بهطور تصادفی با توزیع نرمال و با میانگین صفر، توزیع دانههای تولیدشده در فضای جستجو dبُعدی شکل میگیرد، اما واریانس متفاوت است. این به این معنی است که دانههای تولیدشده بهطور تصادفی نزدیک والد خود هستند. با اینحال، انحراف معیار - - ، تابع تصادفی خواهد بود و از مقدار اولیه قبلی تعریفشدهاش کاهش مییابد و در هر مرحله - نسل - LQLWLDO به ارزش نهایی ILQDO تبدیل میشود. در شبیهسازی، تغییر غیرخطی نشان داده میشود که در رابطه - 1 - بیان شده است.که itermax بیشترین مقدار تکرار و σiter انحراف معیار در هر مرحله و n شاخص مدولاسیون غیرخطی است این تغییر تضمین میکند که احتمال از بین رفتن دانه در یک منطقه دور غیرخطی کاهش مییابد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید