بخشی از مقاله
پيش بيني بيماري آلزايمربا استفاده از الگوريتمهاي داده کاوي
چکيده
هرروزه حجم وسيعي از اطلاعات در مراکز پزشکي توليد ميشوند، لذا ضروري به نظر ميرسد که اطلاعات جمع آوري شده با استفاده از منابع در دسترس ذخيره ، پردازش و تحليل شود. هدف اصلي در اين مقاله ، استخراج ويژگي هاي ژن افراد و طبقه بندي آن ها جهت تشخيص بيماري آلزايمر ميباشد. ژن افراد به دو دسته سالم و بيمار طبقه بندي ميشوند. در اين روش پيشنهادي مجموع ١٩ ويژگي توسط ماتريس اغتشاش از مجموعه داده ها استخراج شده و آزمايش ها براي يک مجموعه داده ژن ٣١٥ تايي از افراد مختلف در زمينه آلزايمر، تست و اجرا شده است .
همچنين داده هاي بومي از داده هاي مطالعاتي مرکز تحقيقات ژنتيک دانشگاه علوم بهزيستي و توان بخشي دريافت شده است . بالاترين دقت حاصله از اين روش ها، با استفاده از روش SVM حدود ٩٣ درصد مي باشد. از نتايج اين تحقيق ميتوان در مراکز پزشکي به منظور پيش بيني احتمال ابتلاي افراد به آلزايمر و پيشگيري بهنگام استفاده نمود.
کلمات کل دي ي
داده کاوي، آلزايمر، طبقه بندي ، RBF،SVM ،PRUNE ، شبکه ي عصبي
١- مقدمه
بيماري عصبي آلزايمر، بيماري است که بر بافت مغز تاثير ميگذارد به تدريج باعث مرگ سلول هاي عصبي در مناطق خاصي از مغز ميشود.
در اين بيماري ابتدا توانايي هاي شناختي به تدريج کاهش مي يابد،که مشکلي برگشت ناپذير است و بيشتر بخش هاي مربوط به حافظه را درگير ميکند. متاسفانه از زمان شروع اين بيماري تا هنگام بروز نشانه در فرد، فاصله زماني زيادي وجود دارد؛ بنابراين پزشک زماني از بيماري اطلاع پيدا ميکند که در مراحل پيشرفته قرار دارد. بدين دليل پيش بيني و تشخيص زودهنگام اين بيماري در بهبود عملکرد فرد موثر خواهد بود[١].
يکي از عوامل مهمي که معمولاً در ايجاد بيماري آلزايمر دخيل و موثر شناخته شده اند، عامل ژنتيک ميباشد. اگر فردي در خانواده مبتلا به اين بيماري باشد، احتمال ابتلاي فردي ديگر در خانواده وجود دارد. از آن جاکه رشد مغزي ، تا حدودي به ژنتيک فرد بستگي دارد و اين بيماري مربوط به کوچک تر شدن حجم مغز به مرور زمان ميشود،به نظر عامل ژنتيک در پيش بيني اين بيماري دقيق تر از عوامل ديگر عمل ميکند[٢].
آلزايمر ششمين علت مرگ در جهان است . هر چه علم پزشکي بيشتر پيشرفت ميکند، بيشتر اين مسأله مطرح مي شود که يک زمينه ژنتيکي از يک بيماري، احتمال وقوع آن را در ساير اعضاي خانواده بيشتر ميکند، بيماري آلزايمر بيش از اينکه يک بيماري با دلايل محيطي باشد، يک بيماري ژنتيکي است .
با توجه به اهميت عوامل ژنتيکي در بروز بيماري آلزايمر، در اين پژوهش به تحليل مجموعه داده ژن هايي که منجر به بيماري آلزايمر ميشود و انتخاب روش درمان و دارويي مناسب را راحت تر ميکند، با استفاده از الگوريتم هاي داده کاوي ميپردازيم . استفاده از الگوريتم ها و تکنيک هاي داده کاوي ميتوان الگوها و نتايجي را براي محققين فراهم کند، که عوامل ابتلا به بيماريهاي مختلف را نشان دهد و براساس آن نتايج ، پزشکان و دست اندرکاران علوم پزشکي در پيش گيري آن بيماريها اقدام کنند.
امروزه در حوزه پزشکي، جمع آوري داده ها درمورد بيماري هاي مختلف از اهميت زيادي برخوردار است . حجم داده هاي جمع آوري شده ، بسيار بالاست و براي اين که بتوان از بين اين حجم انبوه داده ها، الگوها و نتايج موردنظر را بدست آورد، بايد از تکنيک هاي داده کاوي استفاده کرد. مراکز پزشکي با مقاصد گوناگوني به جمع آوري اين داده ها مي- پردازند. تحقيق روي اين داده ها و به دست آوردن نتايج و الگوهاي مفيد
در رابطه با بيماريها، يکي از اهداف استفاده از اين داده ها است . حجم زياد اين داده ها و سردرگمي حاصل از آن ، مشکلي است که مانع رسيدن به نتايج قابل توجه ميشود. بنابراين از داده کاوي، براي غلبه بر اين مشکل و به دست آوردن روابط مفيد بين عوامل خطرزا در بيماري ها استفاده مي شود[٣]. داده کاوي، به معناي استخراج اطلاعات نهفته ، بازشناخت روابط و الگوهاي پنهان و به طورکلي کشف دانش سودمند از داده با حجم بالا است . استخراج قواعد طبقه بندي، نوعي داده کاوي است که در آن دانشي به شکل چندين قانون ساده و فهم پذير ازداده کشف شده و در آينده براي تصميم گيري و پيش گويي به کار برده مي- شود، از مهم ترين زمينه هاي کاربردي، استخراج قواعد طبقه بندي درحيطه پزشکي ميباشد[٤].
بدين منظور، در اين پژوهش به کمک داده هاي برگرفته از ژن هاي افراد گوناگون ، با بهره گيري از الگوريتم ها و نرم افزارهاي داده کاوي ميزان دقت و مهم تر بودن تعيين ژن ها، نسبت به روش هاي ديگر درپيش بيني اين بيماري و اين که آلزايمر پيش از اين که يک بيماري با دلايل محيطي باشد يک بيماري ژنتيکي است را نشان خواهيم داد.
مسأله اصلي در اين پژوهش ، تشخيص درست و زودهنگام آلزايمر براي درمان با کمک الگوريتم هاي داده کاوي مي باشد.
٢- کاربرد داده کاوي در بيماري آلزايمر
داده کاوي در زمينه هاي مختلفي پزشکي جهت تشخيص اوليه بکار گرفته شده است . با توجه به اهميت تشخيص بهنگام بيماري جهت معالجه و درمان فوري بيمار، داده کاوي بيش از پيش مورد توجه پزشکان و متخصصان قرار گرفته است .
مطالعات جالب توجه و کاربردهاي موفقي در زمينه استخراج ويژگي ها جهت تشخيص آلزايمر ارائه شده است که از ميان آنهاميتوان به استفاده از تصاوير MRI، تصاوير PET اسکن ، مايع مغزي
١
نخاعي،EEG، مادون قرمز، شبکه عصبي،ML،KNN ،SVM ، VBM،MLP ، الگوريتم ژنتيک و ... اشاره نمود.
ارتيز و همکارانش [٥] ابزار تشخيص CAD با استفاده از تصاوير MRI را با توزيع بافت GM و WM در مغز تقسيم و با استفاده از الگوريتم
LVQ مدلسازي مي کنند. لوپز و همکارانش [٦] با کمک تصاوير تابعي مغز همانندspect و pet و سيستم CAD به ارزيابي اين تصاوير براي تشخيص آلزايمر مي پردازند و روشي مبتني بر PCA و تکنيک LDA FDR براي انتخاب تصوير پيشنهاد، سپس تصوير نهايي را با طبقه و
بندي NN و SVM تحليل مي کنند. گريب و همکارانش [٧] با کمک اندازه گيري مايع نخاعي مغز و پروتئين را با تبديل فوريه و با کمک مادون قرمز مقايسه مي کنند. پلنت و همکارانش [٨] داده کاوي را در ترکيب سه طبقه مختلف SVM ،VFI ، بيزين براي استخراج شاخص کمي تطبيق الگو براي پيش بيني تبديل MCI به AD گسترش ميدهيم .
١ماشين بردار پشتيبان
لوپس و همکارانش [٩] با بررسي EEG با کمک ANN يک روش
کمکي براي تشخيص AD ارائه مي کنند. چاوز و همکارانش [١٠] از هيستوگرام تصاوير spect و pet براي پوشش ROI با طبقه بندي برمبناي دو گروه CTRLو AD عمل مي کنند. لي و همکارانش [١١]رويکردي جديد براي شناسايي آلزايمر با بکارگيري رويکرد ترکيبي Rough-Fuzzy بنام ARFIS پيشنهاد مي شود.
جوش و همکارانش يک مدل جديد براي طبقه بندي AD وPD با کمک ANN و ML(يادگيري ماشين ) ارائه مي کنند. ژانگ و همکارانش [١٢] ترکيبي از VBM با SVM را بعنوان يک ابزار اتوماتيک براي تشخيص زودهنگام AD معرفي کردند.
با مدنظر قرار دادن روش هاي فوق و نتايج حاصل از آن ها درمي يابيم که عوامل ژنتيکي، ديابت ، سن و مصرف سيگار مهم ترين عوامل خطر
AD اند. ولي در هيچ کدام از اين مقالات به بررسي پيش بيني بيماري آلزايمر با استفاده از ژن افراد پرداخت نشده است ، باتوجه به تاثير اين عامل در بروز اين بيماري بر آن شديم که در اين پژوهش به بررسي ميزان تاثير ژنتيک افراد در بروز بيماري آلزايمر بپردازيم .
پژوهش حاضر به ارائه يک مدل هيبريدي در داده کاوي ميپردازد. در اين مدل به ترکيب و استفاده و مقايسه همزمان از الگوريتم انتخاب ويژگيها، شبکه هاي عصبي MLP،RBFN و Prune و SVM پرداخته ميشود.
٣- روش پيشنهادي
ساختار کلي روش پيشنهادي اين پژوهش در شکل (١) نشان داده است .
در اين تحقيق در ابتدا به آماده سازي و پيش پردازش داده هاي بيماران آلزايمر پرداخته ميشود. اين مجموعه داده داراي ويژگي هاي جمعيت شناختي و ژنتيکي بيماران است ، روش اين تحقيق بر مبناي فرايند داده کاوي است . از تکنيک هاي داده کاوي، براي پيش بيني بيماران آلزايمر و تعيين ويژگيهاي موثر بر اين بيماري استفاده ميشود.