بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

استخراج پتانسیل برانگیخته بینایی با استفاده از ترکیب تبدیل موجک گسسته و ICA مقید در P300 Speller

 

چکیده در این مقاله، کارآیی ترکیب تبدیل موجک گسسته (DWT با دو روش ICA مقيد خودکار و غیرخودکار جهت تشخیص حرف از مجموعه دادگان مسابقه بررسی می شود. بدین منظور، ابتدا توسط معیار فاصله فيشر، سه کانال با بیشترین تمایزپذیری را انتخاب کرده و سیگنال الگوی پتانسیل برانگیخته بینایی هر کدام را بعنوان سیگنالهای مرجع انتخاب می کنیم. سپس با در نظر گرفتن این سه کانال و کانالهای اطراف آنها با بیشترین تمایز پذیری، یک مجموعه کانال ۱۲ تایی را در نظر میگیریم، با اعمال الگوریتم Fast ICA و در نظر گرفتن سیگنال الگوی سه کانال اصلی، سیگنالهای این سه کانال با دو روش بازسازی شدند. نتایج نشان داد که روش ICA مقيد خودکار در مقایسه با ICA استاندارد (غیر خودکار، در جداسازی شکل موجهای زمانی بازسازی شده هدف و غیرهدف توانایی بیشتری دارد و در انتخاب مؤلفه های مستقل بصورت خودکار عمل می کند. در آخرین مرحله، ضرایب تاثيرگذار DWT سیگنالهای بازسازی شده بعنوان بردار ویژگی انتخاب می شوند. با استفاده از طبقه بندی کننده پرسپترون چند لایه MLP در ۵ آزمون به دقت ۶۳٫۳۳% و در ۱۵ آزمون به 91% می رسیم. این نتیجه بالاتر از جایگاه دوم مسابقات  است. اهمیت این کار در آنست که در این پژوهش از ۱۲ کانال استفاده می کنیم در حالیکه نفر اول مسابقه از تمامی ۶۴ کانال استفاده کرده است.

 

کلید واژه - آناليز مقید مولفه های مستقل، تبدیل موجک گسسته، معیار فاصله فيشر، واسط مغز-کامپیوتر، MLP

 

ا- مقدمه

هدف نهایی فناوری BCI، امکان ایجاد ارتباط و تقابل در بیمارانی است که از ناتوانی های جدی حرکتی رنج می برند. یکی از معروفترین انواع موجود BCI روش  P300 Speller Paradigm مربوط به گروه Wadsworth است که داده های آن در چارچوب )  تهیه شده و از طریق سایت اینترنتی  در اختیار محققین قرار گرفته است [۱] در این آزمایش شخص روبروی یک ماتریس ۶۶ کاراکتری می نشیند و سطر و ستونهای این ماتریس بصورت تصادفی روشن و خاموش می شوند. هنگام روشن شدن هر یک از سطر و ستون مترادف با حرف مورد نظر شخص، پتانسیل P300 در سیگنال EEG ثبت شده بوجود می آید. دامنه (P300  بخشی از پتانسیل برانگیخته بینایی (Visual Evoked Potential) است. این پتانسیل، در حدود ۳۰۰ میلی ثانیه پس از تحریک رخ می دهد و در اشخاص سالم و بیمار از پایداری بیشتری در مقایسه با سایر اجزاء VEP برخوردار است [۲]

نوسانات زیاد و مداوم پتانسیلهای الکتریکی سیگنال EEG منعکس کننده تغییرات کورتکس مغزی داخل جمجمه هستند. دامنه پتانسیلهای ناشی از تحریک دیداری و شنیداری کم بوده و در نویز ناشی از فعاليت دائمی مغز مدفون شده اند. از طرفی اغتشاشاتی نظیر تداخل حرکتی و پلک زدن بر روی داده خام EEG تأثیر گذاشته و می توانند استفاده از داده های ثبت شده را در کاربردهای BCI بی فایده سازند. روش آناليز مؤلفه های مستقل (ICA) روشی است ،

که توانایی استخراج اطلاعات مناسب مدفون شده در سیگنالهای نویزی را دارد و تجزیه سیگنال های ثبت شده به مؤلفه های مستقل پایه (ICs) را میسر می سازد [۳]. از روش ICA به دو منظور در سیستم P300 Speller استفاده می شود:

۱- کاهش نویز سیگنال EEG جهت افزایش نسبت سیگنال به نویز VEP

۲- طبقه بندی و جداسازی سیگنالهای EEG به دو گروه هدف (شامل VEP) و سیگنال غیرهدف (بدون VEP. در این مقاله از ICA بعنوان یک ابزار پیش پردازشی جهت کاهش نویز و بازسازی سیگنالهای VEP سه کانال با بیشترین تمایزپذیری استفاده می کنیم.

در- ۳ مرور کاملی بر روشهای ICA بکار رفته در سیستمهای BCI مختلف صورت گرفته است و عملکرد این روشها در سیستم BCI مبتنی بر ریتم میو (Mu rhythm) بررسی شده است.

در -۴ -سه روش ICA Fast ICA همراه با سیگنال الگوی انتخابی و  ICA مقید مکانی را به مجموعه دادگان IIb مسابقه  اعمال نموده و با بهینه سازی آنها توانستند در ۱۵ بار متوسط گیری و با اطلاعات ۱۹ کانال به دقت  96.8%دست یابند. آنها فقط مؤلفه مستقل مربوط به کانال Cz را بعنوان الگوی)(P300در نظر گرفتند زیرا اطلاعات پیشین نشان می داد که مؤلفة (P300 (در نواحی کانالهای C4 Cz C3 Fz و Pz دیده می شود و بطور طبیعی در Cz بیشترین مقدار را دارد. در حالیکه تضمینی وجود ندارد که کانال Cz بهترین نتیجه را برای هر دو شخص A و B بدهد. در ضمن می توان تعداد کانال مرجع و سیگنال الگوی انتخابی را افزایش داد.

یکی از اشکالات روشهای ICA این است که این الگوریتم ها به کانالهای ثبت زیادی نیاز دارند و اگر تنها یک یا چند کانال در دسترس باشند و حجم اطلاعات ورودی کم باشد، ICA به سهولت قابل پیاده سازی نیست. بنابراین، در )۵( روشی پیشنهاد شده که در حالت ICA یک کاناله یا دو کاناله با ایجاد تأخیر و پیش پردازشهای خاص، حجم داده های اولیه را افزایش می دهد. ولی کارآیی این روش بعلت کم بودن بیش از حد کانالها بر روی مجموعه دادگان ما پایین است. در (۶) ابتدا توسط PCA داده های ثبت ۶۴ کانال EEG را کاهش بعد داده و سپس با استفاده از روش ICA مقید، سیگنالهای هدف و غیرهدف مجموعه دادگان P300 Speller مسابقه BCI2003 را جدا کردند. این گروه توانست با ۱۵ بار متوسط گیری به دقت ۱۰۰٪برسد. اگر این الگوریتم به مجموعه داده BCI2005 اعمال شود، بعلت نویزی بودن این دادگان دقت خروجی کاهش می یابد. از طرفی از هر ۶۴ کانال برای پردازش استفاده شده است که حجم محاسبات زیاد است. در) ۷(و (۸) از ICA مقيد بعنوان عملیات پیش پردازشی و استخراج ویژگی استفاده شده است ولی در آن فقط به دقت تشخیص P300 در مجموعه داده BCT2005 اشاره شده و دقت تشخیص حرف معلوم نیست و نمی توان آنرا با کار دیگران مقایسه کرد.

هدف از این مقاله بررسی و تحلیل موارد زیر است:

۱- بررسی کارابی ICA مقید در پاکسازی و بازسازی سیگنال الگوی VEP کانال انتخابی در مقایسه با ICA استاندارد.

 ۲- استفاده از سه سیگنال مرجع کانالهای موثر بجای کانال Cz

3- مقایسه عملکرد روش ترکیبی ICA و تبدیل موجک گسسته در مقایسه با تبدیل موجک تنها در بخش استخراج ویژگی. بدین منظور سیگنالهای مربوط به کانالهای موثر از طریق معیار فاصله فيشر، ICA مقید و در نظر گرفتن سیگنالهای مرجع مربوطه بازسازی و حذف نویز می شوند. بعلت توانایی تبدیل موجک در آنالیز سیگنالهای گذرا و غیر ایستان نظیر EEG و VEP از ضرایب تبدیل موجک گسسته با موجک مادر 4db بعنوان بردار ویژگی استفاده می کنیم (۷).

در ادامه مقاله، ابتدا مجموعه دادگان مورد استفاده در بخش ۲ معرفی می شود و در بخش ۲ مباحث نظری مربوط به معیار تمایز پذیری فاصله فیشر و ICA مقید با سیگنال مرجع بیان می شود. در بخش ۴ به پیاده سازیهای انجام شده و نتایج بدست آمده اشاره شده و بحث پایانی و نتیجه گیری هم در بخش ۵ آمده است.

 

۲- مجموعه دادگان

در این مقاله از مجموعه داده IIb مسابقه BCI2005که با روش تحریک Speller Paradigrm از طریق ۶۴ الكترود EEG ثبتگردیده، استفاده می کنیم. این مجموعه داده، آخرین و جدیدترین دادگان برای رقابت در زمینه P300 Speller است. در این آزمایش بطور جداگانه از دو فرد A و B خواسته می شود بر روی یک ماتریس ۶*۶ کاراکتری تمرکز کنند و منتظر روشن و خاموش شدن سطر و ستون معادل حرف بالای صفحه نمایش شوند (شکل ۱). برای نمایش یک حرف در حالت تک آزمون، هر کدام از بطرها و ستونها بصورت

 

تصادفی در مدت ۱۷۵ میلی ثانیه یکبار چشمک می زنند و ۱۲ تحریک بینایی ایجاد می شود. این عمل برای هر حرف ۱۵ مرتبه تکرار می شود (۱۵ آزمون). در هنگام روشن شدن سطر و ستون مترادف با حرف بالای صفحه نمایش، پتانسیل برانگیخته بینایی در سیگنال ثبت شده EEG تولید شده ولی در مورد ۱۰ سطر و ستون دیگر VEP بوجود نمی آید. این دادگان شامل ۸۵ کاراکتر برچسب دار آموزشی و ۱۰۰ کاراکتر بدون برچسب آزمون در ۱۵ آزمون برای اشخاص A و B است.

 

۳- مباحث نظری و روش پیشنهادی

۱ - ۲ - معيار تمایز پذیری فاصله فیشر استفاده از تمام کانالها برای استخراج مولفه های مسقل راهکار مناسبی نیست، زیرا تمامی کانالها از درجه اهمیت یکسانی نسبت به هم برخوردار نیستند و همچنین کانالهایی که در موقعیت مکانی نزدیک به هم قرار دارند سیگنال های مشابهی را ثبت می کنند. بنابراین، کانالی موثرتر است که تمایزپذیری بیشتری بین دو کلاس ایجاد کند. یک معیار مناسب جهت بررسی این موضوع معیار فیشر است که توسط رابطه زیر بدست می آید

 

که در آن  بترتيب ماتریس پراکندگی بین کلاسی و ماتریس پراکندگی درون کلاسی هستند و W، بردار وزنی فیشر است. هر چه مقدار F بزرگتر باشد تمایز پذیری در کلاس بیشتر می شود. برای یافتن مقدار بیشینه نسبت به متغیر W، لازم است که  شود. با اعمال این شرط نتیجه زیر حاصل میشود

که F یک ماتریس قطری بیان کننده مقادیر ویژه ماتریس  است و بعنوان معیار فيشر تعریف می شود. هر چه فاصله فیشر بزرگتر باشد جداپذیری در کلاس بیشتر است

۲ - ۳ - روش ICA مقيد با سیگنال مرجع

در آنالیز مولفه های مستقل n  متغير تصادفی مشاهده شده  داریم که ترکیبی از n منبع تصادفی  هستند و توسط ماتریس A و طبق رابطة زیر با هم ترکیب می شوند

مسأله اصلی در ICA تخمین همزمان ماتریس ترکیب کنندة A و بردار منابع مستقل و با توزیع غیر گوسی است که از روی بردار مشاهده X و در نظر گرفتن فرضهایی در مورد ویژگیهای آماری توزیع منابع بدست می آید. بعبارتی، هدف یافتن ماتریس مناسب وزن W است طوریکه، تبديل خطی مشاهدات  با معیاری که مشخص می شود بهینه باشد. غیر گوسی بودن تابع توزیع در ICA بیار مهم است و تخمین مجهولات بدون آن امکان ندارد. یک روش برای سنجش غیر گوی بودن، استفاده از معیار کور تسیس با کامیونت مرتبه ۴ است که به صورت زیر تعریف می شود

این مقدار میتواند مثبت و یا منفی باشد.

یک بار دیگر، نگاتروپی (negentropy) است که بر اساس آنتروپی تفاضلی تعریف می شود. آنتروپی H برای یک متغیر تصادفی گ ته میزان اطلاعاتی است که مشاهده متغیر در اختیار ما قرار میدهد و عبارت است از

متغیر گوسی، بیشترین آنتروپی را در میان تمام متغیرهای تصادفی با واریانس یکان دارد. بار گانتروپی شکلی از آنتروپی است که برای متغیر گوسی صفر بوده و از رابطه (۶) محاسبه می شود

البته در عمل بدلیل پیچیدگی محاسباتی و نیاز به تخمین تابع چگالی احتمال، از تقریب آن استفاده می شود. روش معمول تقریب نگاترو پی استفاده از مصانهای مرتبه بالا است. الگوریتم سریع آنالیز مؤلفه های مستقل Fast ICA بر اساس تخمینی از نگانتروپی طبق رابطه (۷) بدست می آید

که  ها مقادیر ثابت مثبت،v متغیر گوسی با میانگین صفر و واریانس واحد و  تابعی غیر از یک تابع درجه ۲ است. در ICA

 

تک واحدی می توان به یک مؤلفه با بیشترین نگانتروپی در میان همه منابع مستقل همگرا شد ولی، تضمینی وجود ندارد که این مؤلفه همان سیگنال موردنظر باشد. در ضمن با توجه به تصادفی بودن مقداردهی اولیه، امکان دارد الگوریتم به کمترین مقدار ممکن همگرا نشود. ساختار روش ICA تک واحدی در شکل نمایش داده شده است که در آن  خروجی تخمینی است و  سیگنال مرجعی است که از روی اطلاعات اولیه منبع مورد نظر ساخته میشود. در این مقاله  یگال الگوی VEP هر کانال است میزان شباهت  خروجی و  توسط معیار شباهت پر اندازه گیری می شود و بعنوان فید یادگیری ICA برای پیدا کردن بردار وزن  (یک سطر از ماتریس ترکیب کننده W) در نظر گرفته می شود. بنابراین می توان گفت سیگنال خروجی با سیگنال تغمبنی منبع موردنظر برابر است [۱۰]

در آناليز مقید مؤلفه های مستقل (CICA) یک تابع کنتراست در (۷) تعریف می شود و هدف اصلی کمینه کردن مشروط این تابع است. منظور از بهینه سازی مشروط تابع کنتراست این است که با داشتن اطلاعات اولیه ای در مورد منابع اصلی، شروط اضافه ای به الگوریتم بهینه سازی اضافه شود، نتیجه حامل الگوریتم جدیدی خواهد بود که می بایست این دو شرط را برآورده کند: امخروجی تخمین زده شده، یکی از مؤلفه های ترکیب شده در سیگنال ورودی باشد. ۲- مؤلفه استخراج شده نزدیکترین مورد به یگال مرجع باشد. با روش ضرایب لاگرانژ و فرایند یادگیری نیوتن می توان این مساله بهینه سازی را حل کرد.

۳ - ۳ - الگوریتم پیشنهادی

شکل و ساختار روش پیشنهادی ما را برای بازسازی سیگنالهای به کانال با بیشترین تمایز پذیری نشان می دهد. در این ساختار از ضرایب موجک گسسته برای محاسبه تمایز پذیری کاتالها بر اساس معیار فيشر استفاده شده است. به کانالی که بیشترین مقدار فاصله فيمر را دارا باشند بعنوان کانالهای مرجع انتخاب شده و از روی این به کانال و با در نظر گرفتن دو شرط همایگی و تمایزیذیری بالا. ۱۲ کانال مناسب انتخاب می شوند. با تجزیه بیگنالهای آموزشی این کانالها، ۱۲ مولفه مستقل بدست می آید. جهت بازسازی سیگنالهای هر یک از سه کانال مرجع، ۴ مولفه از ۱۲ مولفه حاصل را انتخاب و بقیه را حذف می کنیم. نحوه انتخاب ۴ مولفه مهمتر به دو صورت دستی و خودکار می تواند انجام شود. در روش انتخاب دستی، ۴ مولفه ای که بیشترین شباهت را به سیگنال الگوی کانال مورد نظر دارند انتخاب می شوند. در روش خودکار به ازای تمام حالتهای ممکن  یعنی  سیگنال دوباره بازسازی شده و سیگنال بازسازی شده با بیشترین شباهت با سیگنال الگوی VEP کانال مرجع موردنظر. انتخاب می گردد. ماتریس جداپذیری W حاصل بهترین بازسازی را انجام خواهد داد. حال با محاسبه ماتریس  برای هر کدام از به کانال مرجع، می توان سیگنالهای مرجع معادل باهر کانال را برای داده های آزمایشی بازسازی کرده و از آنها جهت استخراج ویژگی استفاده کرد

۴- پیاده سازی و بیان نتایج

 در این قسمت ابتدا به نتایج حاصل از انتخاب کانالهای با حداکثر تمایز پذیری توسط معیار فاصله فیشر اشاره کرده و سپس توانایی روش ICA معمولی و ICA مقید خودکار در بازسازی بیگنالهای هدف و غیر هدف مقایسه می کنیم. در پایان، نتایج حاصل از الگوریتم پیشنهادی ارائه می شود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید