بخشی از مقاله
چکیده :
مقدار داده تولید شده در انفورماتیک بهداشت، به صورت بسیار وسیع رشد کرده است؛ صرع3 یکی از مهمترین بیماریهای دستگاه عصبی است که حدود %1 از مردم جهان به آن مبتلا هستند. امکان پیشبینی وقوع حملات صرعی از روی سیگنالهای الکتروانسفالوگراف4 برای بیماران صرعی، فرصتهای درمانی جدیدی را فراهم میکند. در این مقاله با این دیدگاه که سه روش پرکاربرد داده کاوی در تشخیص بیماری صرع از جمله درخت تصمیم، شبکه عصبی مصنوعی و ماشین بردار پشتیبان مورد بررسی قرار گرفته است.
.1 مقدمه
داده کاوی - که گاهی اوقات اکتشاف اطلاعات یا دانش نامیده می شود - که از چشم اندازهای مختلف به بررسی وتحلیل داده ها می پردازد و نتایج آنها را در قالب اطلاعات مفید یا الگو ارائه می کند. اطلاعات و دانش به دست آمده را می توان برای کاربرد های مختلف از جمله تجزیه و تحلیل، تشخیص تقلب و در بسیاری از صنابع از جمله پزشکی، آموزش، بازار کسب و کار و بسیاری از صنایع دیگر مورد استفاده قرار داد. [1] در اینجا نیاز به یک سیستم مکانیزه برای داده های آتی کاملا احساسمیشود. دانش همه ی این سیستم مکانیزه کمک های شایانی در پزشکی به ویژه در زمینه ی تشخیص بیماری های گوناگون کرده است.
سیگنال های حیاتی، اطلاعات بیوالکتریک مفیدی را در مورد عملکرد ناحیه تحت ثبت برای بررسی های کلینیکی در اختیار محققین قرار می دهند. از جمله این سیگنال ها می توان به سیگنال مغزی یا الکتروانسفالوگرام - EEG - اشاره نمود که یکی از پرکاربردترین سیگنال ها در زمینه تحقیقاتی و عصب شناختی می باشد. سیگنال EEG که ناشی از فعالیت الکتریکی نرون ها و سلول های عصبی است، تحت سیستم های مختلف ثبت سیگنال، با قرار گیری الکترود هایی در نقاط مشخص از جمجمه و بر روی پوست سر، ثبت شده و جهت کاربردهای دیگر با در نظر گرفتن فرکانس نمونه برداری مناسب ذخیره می شوند.
سیگنال های EEG جنبه های مختلفی از عملکرد مغز انسان را نمایش می دهند. از جمله این موارد می توان به موضوع تشنج 5مغزی و همچنین بیماران مبتلا به بیماری صرع اشاره نمود
تشخیص و درمان مناسب صرع یک مسئله اصلی بهداشت عمومی است. بیماران مبتلا به این بیماری غالب دارای خصوصیات فیزیکی مختلف می باشند، که این بیماری ناشی از نتیجه تخلیه همزمان و بیش از حد از یک گروه از سلول های عصبی در قشر مخ است.
در دهه های اخیر تلاش های زیادی با هدف ایجاد ارتباطات عصبی و عملکرد شناختی مغز، به صورت نظری و تجربی صورت گرفته است. این تلاش ها منجر به تولید حجم انبوهی از داده ها در ساختار تصاویر مغز و توابع و روش های کارآمد آن شده است. لذا استخراج این اطلاعات با استفاده از سیگنالEEG که از مسائل مهم در پردازش سیگنال پزشکی است، بکار می رود .
از جمله اولین تحقیقات در زمینه تشنج در سال 1990 با معرفی الگوریتمی برای آشکارسازی وقوع تشنج ارائه شده است. این الگوریتم فعالیت های ریتمیک هماهنگ را از میان سیگنال های EEG به عنوان علائمی از وقوع تشنج جستجو می کند. این مدل فعالیت دنباله دار مغزی را در محدوده فرکانسی بین 3 تا 30 هرتز با چگالی توان بیشینه و همچنین دامنه کمتر از سه برابر بزرگترین پنجره زمینه را جستجو می کند و با در نظر گرفتن مدت زمان حضور یک ریتم در حدود 4 ثانیه اعلام تشنج می نماید.
در کل این الگوریتم %50 از تشنج های انجام شده را با خطایی حدود %5 تشخیص داد. از این موارد می توان به آشکار ساز معرفی شده در [5] اشاره نمود که با در نظر گرفتن بخش هایی مشخص در پنجره های طیف فرکانسی و با استفاده از شبکه های عصبی به منظور طبقه بندی ویژگی های استخراجی، در نهایت توانست به صحتی از تشخیص در حدود %76 دست یابد. با در نظر گرفتن این موضوع که این آشکارسازی به طور خاص برای هر بیمار طراحی شده و دارای تعمیم پذیری کمی نیز بود، ولی در عمل با خطای %34 همراه شده بود
اخیرا در مورد بیماری صرع مطالعات زیادی صورت گرفته است، که مدل ساز تشخیص ان با روش های داده کاوی می باشد. و به نتایج خوبی هم در این زمینه دست پیداکرده اند. فرایند تشخیص مدل، بر اساس یک سری از الگوریتم ها مانند دسته بندی ویژگی های بیمار و یا تعداد خود بیمار که داده های اولیه بر اساس آنها بدست می آیند.
.2 بیماری صرع چیست؟
بیماریصَرع به مجموعهای از اختلال های عصبی مغز گفته می شود و یکی از شایع ترین بیماری های عصبی در جهان است. تشخیص و درمان مناسب صرع، یک مسئله اصلی بهداشت عمومی است. با توجه به گزارش سازمان بهداشت جهان بیش از 50 میلیون نفر از سراسر جهان وجود دارد که از نوعی صرع رنج می برند، نزدیک به 80 درصد از آنها در مناطق در حال توسعه هستند. علت آن را نقص در فعالیت الکتریکی سلولهای مغزی به دلیل افزایش تحریک پذیری سلولهای عصبی می دانند. ترشح بیش از حد سلول های مغز و تکرار تشنج منجر به یک بیماری ناگهانی می گردد. علت می تواند ذاتا اکتسابی باشد.
با این حال، موارد صرع نسبت بسیار کوچک، کمتر از 3/1، نشان می دهد که انتقال ژنتیکی است، که از اختلال معمول نورولوژیکی مغز بروز می کند و در عروق مغزی قابل پیشرفت است. یک آشفتگی ناگهانی و گذرا در عملکرد مغز است، که از فعالیت همزمان نورونها در یک شبکه وسیع نورونی حاصل می شود و این اختلات همزمان با یک حمله شروع می شود. این حمله ها یا خفیف هستند یا شدید و طولانی، که با لرزش اندام بیمار همراه است که این حملات به طور مکرر روی میدهد علائم بالینی متعدد معمولا همراه تشنج و بیهوشی می باشد و هیچ دلیل ثابت و مشخصی هم ندارد. اما در برخی افراد دلایلی از قبیل آسیب مغزی، سرطان مغز، و سوء مصرف دارو و الکل، وغیره از دلایل ایجاد آن است.
طبق آمار، اکثریت بیماران صرع در زیر سن 19 سالگی اتفاق می افتد، که حدود 80 درصد را تشکیل می دهند. و بعد از آن درصد کمی هم زیر سن 10 سالگی می باشد . علائم این بیماری عبارتند از هذیان، کشش بدن، تریسموس، کف در دهان، و غیره می باشد.
صرع درمان قطعی ندارد اما با تجویز دارو مانند داروهای ضد تشنج می توان آن را کنترل کرد. اما در برخی موارد بیماران نسبت به دارو ها مقاوم اند. . علیرغم اینکه بیش از 40 سال از فعالیت و بررسی در زمینه پاتوفیزیولوژی صرع میگذرد، هنوز آشکار سازی و پیشگویی آن در حال بررسی است ولی نشان داده شده است که آشکار سازی تخلیه های نورونی صرعی - امواج تیز - در سیگنال الکترآنسفالوگرام گامی مهم در تشخیص، درمان و حتی پیش بینی اختلال عصبی است. و تنها با اندازه گیری مشخصه های امواج مغزی عینی نوار مغزی می توان تشخیص داد که بیمار در چه مرحله ای از صرع است و اینکه آیا اصلا به بیماری صرع مبتلا است یا خیر. و بنا برای پزشک با تحلیل پارامترهای فیزیولوژیکی از الکتروانسفالوگرام یا همان نوار مغزی - EEG - است.
.3 الکتروانسفالوگرام
الکتروانسفالوگرام - EEG - سیگنال اندازه گیری متوسطی از جریان الکتریکی در مغز انسان است. این سیگنال مسئول جریان اطلاعات از طریق سلول های عصبی در مغز که کنترل و نظارت بر نیم تنه پر است، می باشد
قرار دادن الکترودها و اندازه الکترودها، حداکثر تعداد الکترود، همه و همه خیلی در تشخیص تاثیر بسزایی دارد. دامنه فرکانس را می توان در چهار باند فرکانس پایه در سیگنال هایEEG، یعنی دلتا، تتا، آلفا، بتا و فعالیت های متمایز مغز را نشان می دهند. محدوده فرکانس تتا متناسب با امواج در محدوده 8-4 هرتز، که به عنوان پاتولوژیک در نظر گرفته می شود. اگر امواج متقارن به نظر برسد، در فرد سالم این امواج در مرکز زمانی دیده می شود . و فرکانس آلفا نیز متناسب با امواج در محدوده 13-18 هرتز، در حالت بیداری در بخش پس سری مغز به نظر می رسد. فعالیت مشخصه EEG، در مواقع استدلال منطقی و احساس خشم و اضطراب اندازه گیری می شود. و برای تشخیص بیماری هایی مانند:
اختلالات تشنجی - مانند صرع - ،ضربه به سر، آنسفالیت - التهاب مغز - ، به تومور مغزی، انسفالوپاتی - یک بیماری است که باعث اختلال در عملکرد مغز می شود - ، مشکلات حافظه، اختلالات خواب، سکته مغزی، زوال عقل هم بکار میرود. EEG ممکن است برای تعیین سطح فعالیت مغز انجام می شود. یک نمونه از استفاده EEG برای نظارت در طول عمل جراحی مغز در شکل 1 نمایش داده شده است.
شکل.1 الگوهای غیر معمول از یک نوار مغزی دریک بیمار بیهوش
همچنین میتوان گفت الکتروانسفالوگرام - EEG - یک وسیله مهم شناسایی و تحلیل فعالیت های صرع در انسان است. [10] الکتروانسفالوگرافی - EEG - به طور گسترده مورد استفاده پزشکی قرار می گیرد. از لحاظ تکنیکی به طور کلی یک EEG شامل کانال هایی است که بر فعالیت های سلول های عصبی در یک منطقه از مغز را نظارت می کند، و هرکانال نشان دهنده یک الکترود بر روی پوست سر بیمار است.
با این حال، یک روش خودکار برای تجزیه و تحلیلEEG می تواند یک گزینه جذاب برای تجزیه و تحلیل بصری سیگنال هایEEG باشد. بنابراین، برخی از تکنیک های داده کاوی درعلم کامپیوتر قادر به انجام این کار در عین حال با دقت و سرعت بالا هستند.
.4 داده کاوی در پزشکی
داده کاوی پزشکی دارای پتانسیل زیادی برای کاوش درمیان الگوهای پنهان دامنه مجموعه داده های پزشکی می باشد. که این الگوها را برای تشخیص بالینی استفاده می کنند. امروزه یکی از چالش های عمده در حوزه پزشکی فراوانی داده و چگونگی برخورد با انواع این داده های بزرگ است چگونگی بهره برداری از این داده ها،که این رشته تولید می کند. [12] پس از انجام مراحل کشف دانش در پایگاه داده ها - KDD - روند مشخصی به کشف دانش از داده های پزشکی به دست آمده از سوابق سلامت الکترونیکی بیمار - EHR - است.
دیدگاه های ارائه شده بر اساس تجربه جمع آوری به عنوان بخشی از پروژه ی کشف دانش در داده های پزشکی است که تعدادی از مشکلات و پیامدهای که توسط پایگاه داده های بزرگ بالینی مقادیر زیادی از اطلاعات در مورد بیماران و شرایط پزشکی را در خود انباشته است. روابط و الگوهای در این داده ها می تواند دانش پزشکی جدیدی رافراهم کند. تکنیک های داده کاوی - که به عنوان کشف دانش در پایگاه شناخته می شود - جستجو را برای روابط در یک پایگاه داده بزرگ بالینی مورد استفاده قرار می دهند.
استخراج در یک پایگاه داده های بالینی عمل انبار داده ها، پرس و جو داده ها و تمیز کردن، و تجزیه و تحلیل داده ها صورت می گیرد. با این حال، داده های بزرگ اولیه پزشکی به طور گسترده ای توزیع شده، ناهمگن، و این داده ها نیاز دارد تا به یک شکل سازمان یافته جمع آوری می شود. این داده های جمع آوری شده پس از یکپارچه شدن داده کاوی در سیستم فناوری اطلاعات، یک الگو را برای یک کاربر فراهم می کند. تکنیک های کشف دانش در پایگاه داده با استفاده از داده کاوی تکنیک های که در استفاده در تحقیقات پزشکی به خصوص در پیش بینی بیماری صرع است که با انواع نوار مغزی از بیماران این کار انجام می شود.
کشف دانش در پایگاه داده ها - KDD - ، اغلب به نام معدن، - انبار داده - هم شناخته می شود هدف کشف اطلاعات مفید از مجموعه این داده های بزرگ است. توابع و روش ها و الگوریتم های مختلف به منظور کشف الگوهای داده استفاده خواهد شد. داده کاوی و تمرکز بر کشف دانش برنامه های کاربردی دارد و اهمیت آن در تصمیم گیری می باشد. داده کاوی، همچنین به عنوان کشف دانش شناخته شده در پایگاه داده است که اشاره به استخراج و یا "کاووش" دانش از مقادیر زیادی از داده می باشد. که در تکنیک های داده کاوی استفاده می شود و برای حجم زیادی از داده های و کشف الگوها و روابط در تصمیم گیری مفید است. در شکل 2 توالی مراحل استخراج دانش از داده ها نشان داده شده است.