بخشی از مقاله
چکیده: EEG از سیگنال های حیاتی با دامنه بسیار کوچک، دارای رفتاری پیچیده و شبه نویزی است. رفتار EEG می تواند با تحریکات خارجی تغییر کند که باعث ایجاد پتانسیل های برانگیخته در آن می گردد. این پتانسیل ها از مولفه هایی تشکیل شده که یکی از آن مولفه ها P300 می باشد و تحت شرایط خاصی ایجاد می گردد. در این مطالعه با استفاده از دیتاهای رقابت BCI2003 ،P300 ایجاد شده در آن را استخراج می نماییم. برای این منظور ابتدا به کمک فیلترینگ و روش های پیش پردازش، پارامترهایی را که کمک می کند بهتر بتوانیم P300 را استخراج کنیم، به کار می گیریم.
روش های استخراج ویژگی که ترکیبی از آنالیز مولفه های مستقل و تبدیل ویولت گسسته است سبب کاهش بعد دیتا می شود. پس از آن ماشین بردار پشتیبان، به طبقه بندی ضرایب به دست آمده می پردازد. با استخراج P300 حروف مورد نظر به کمک جدول oddball تعیین می گردند که نتایج این روش، دقت، سرعت و تفکیک پذیری بالاتری نسبت به سایر روش هایی که تا کنون مورد مطالعه قرار گرفته، ارائه می دهد. نتایج این کار با دقت %87حاصل شده است.
- 1 مقدمه
سیگنالهای الکتریکی تولید شده توسط فعالیت مغزی،الکتروانسفالرگرام1 یا همان EEG ، نخستین بار در سال 1924 توسط هانس برگر از مغز انسان گرفته شد.[ 1] محققان بر این باورند که توسط EEG و سایر روش های اندازه گیری فعالیت های مغزی، می توان از مغز به عنوان ابزاری برای انتقال پیام ها و ارتباطات با دنیای بیرون استفاده کرد. [2] در سالهای اخیر گزارشات بسیار زیادی درباره امکان ارتباط انسان با کامپیوتر از طریق سیگنال های مغزی ارائه شده است. [3] این کانال ارتباطی را تحت عنوان رابط مغز- کامپیوتر - BCI - 2 می شناسیم.
پس از ثبت سیگنال EEG توسط الکترودها، این سیگنال وارد BCI می شود. شکل - 1 - بلوک دیاگرام کلی یک BCI را نشان می دهد. در این مرحله ابتدا یک سری ویژگی سیگنال از آن استخراج می شود تا بتوان بر مبنای آن ها دسته بندی را انجام داد. البته به دلیل پایین بودن نسبت سیگنال به نویز - SNR - سیگنال های EEG، غالبا قبل از پردازش اصلی یک مرحله دیگر به عنوان پیش پردازش بر روی آن صورت می گیرد که می توان نویزهای ناخواسته را تا حد امکان حذف نمود.
شکل 1 بلوک دیاگرام کلی یک BCI
تحقیقات آونون و کیرن در زمینه BCI نقطه عطفی در این موضوع به حساب می آید.[ 4] این دو، پس از ثبت سیگنال EEG مغز در حین انجام پنج فعالیت ذهنی، توان باندهای مختلف فرکانسی را به عنوان ویژگی به یک تفکیک کننده بیز1 دادند تا توسط آن بتوانند این فعالیت ها را از یکدیگر تشخیص دهند . در ادامه گروه دکتر آندرسن، کار آونون و کیرن را ادامه داد.[5] این گروه نیز در اغلب کارهای خود از همان پنج فعالیت ذهنی قبلی استفاده کردند که البته برای استخراج ویژگی عموما ضرایب مدل AR را به کار گرفتند و طبقه بندی کننده شبکه عصبی را مورد استفاده قرار دادند.
پس از آن فارول و دونچین روش جدیدی برای ثبت سیگنال EEG ارائه کردند. آن ها در آزمایشات خود از اشخاص می خواستند که در مقابل صفحه ای ماتریس شکل نشسته و بر روی یکی از حروف و یا خانه های آن صفحه متمرکز شوند. سپس آن صفحه به صورت تصادفی و با سرعت مشخصی روشن و خاموش می شد. این جدول که از آن پس در ثبت EEG بسیار مورد توجه قرار گرفت، به نام جدول oddball شهرت یافت. از فرد مورد آزمایش خواسته می شد که بدون هیچ حرکتی و فقط به صورت ذهنی تعداد دفعات روشن شدن آن خانه خاص را شمرده و پس از ثبت EEG آن را اعلام کند. این روش موسوم به P300، ابداعی در BCI بود. [6]
ولپا و همکارانش در مرکز ودس ورث2 نیویورک هم از گروههای فعال در زمینه BCI هستند.[7] اساس کار آن ها بر این مبناست که افراد را می توان به گونه ای آموزش داد که بتوانند برخی از ویژگیهای EEG خود را کنترل کنند. در کارهای آنها هم از ویژگی های زمانی و هم فرکانسی استفاده شده است، اما عمده نتایج گزارش شده آن ها با استفاده از ویژگی های فرکانسی باند - 8-12Hz - و باند - 13-28Hz - بوده است. به گفته ولپا این ویژگیها به دو دلیل انتخاب شده اند.
اول ارتباط آنها با اعمال حرکتی و دوم قابلیت افراد در تغییر دامنه توان این باند ها. در این مطالعه از داده های مسابقات BCI Competition استفاده شده است. عنوان رقابت در دو تا از این مسابقات هجی کننده P300 بوده است . - BCI2003-IIb, BCI2005-II - از زمان برگزاری این مسابقات تاکنون بسیاری از افراد که قصد کار کردن روی مساله آشکارسازی P300 را داشتند، از این داده ها استفاده کرده اند.از جمله برندگان این مسابقه گروه کیپر و همکاران می باشند که با استفاده از طبقه بندی کننده ماشین بردار پشتیبان، پیش پردازش واستفاده از تعداد محدودی کانال به دقت %84 دست یافته اند.[8]
پس از آن نیز گروههای بسیاری بر روی دقت آشکار سازی P300 کار کرده اند، اما هیچ یک توجهی به قدرت تفکیک در این آشکارسازی نداشته اند. در این مقاله سعی شده تا علاوه بر ارتقا یافتن دقت و سرعت در آشکارسازی P300، به کمک یک روش پردازش ترکیبی، قدرت تفکیک الگوریتم را نیز بالا ببریم. هدف ما در این مقاله استخراج حروف با استفاده از جدول oddball و به کارگیری ترکیبی روش های آنالیز مولفه های مستقل و تبدیل موجک برای استخراج ویژگی مولفه P300 از سیگنال EEG می باشد.
-2 آنالیز مولفه های مستقل
آنالیز مولفه های مستقل - ICA - 3 یک روش گسترش یافته آنالیز مولفه های اصلی است و برای جداسازی کور منابع مستقل که به طور خطی ترکیب شده اند، به کار می رود. ICA ابزار موثری برای جداسازی انواع آرتیفکت ها از سیگنال EEG می باشد و می تواند دسته وسیعی از آنها شامل حرکات چشم، پلک زدن، EMG، ECG و اغتشاشات خارجی را به خوبی از سیگنال های مغزی جدا کند[9] در ادامه این مطالعه، از روش تبدیل موجک گسسته بر روی کانال های تفکیک شده در روش ICA، استفاده می شود که باعث می شود اولا بعد بردار ویژگی کاهش یابد و پردازش سریعتر انجام شود و ثانیا احتمال وجود P300 با تفکیک بالاتری انجام پذیرد.
در بسیاری مواقع با داده های چند بعدی روبرو هستیم. - مثلا در اینجا با سیگنال های مغزی مربوط به کانال های مختلفی روبرو هستیم که در مغز با یکدیگر ترکیب شده اند و وقتی که ما نمونه برداری را از مغز انجام می دهیم در واقع هر کانال بصورت ترکیبی از چند سیگنال خواهد بود - . در اینگونه موارد با استفاده از روش های استخراج ویژگی و بازنمایی اطلاعات می توان نمایش جدیدی از اطلاعات بدست آورد که گویای خواص مطلوب و مورد نظر باشد.
مسئله تعیین ماتریس ثابت W است بطوریکه تبدیل خطی متغیرهای مشاهده شده دارای یک خاصیت مناسب باشد. روش های مختلفی برای تعیین چنین تبدیل خطی ارائه شده است، شامل آنالیز مولفه های اصلی، آنالیز فاکتور و آنالیز مولفه های مستقل [10] که در اینجا از آنالیز مولفه های مستقل جهت حل تبدیل خطی فوق استفاده شده است. چنانچه از نام این آنالیز بر می آید، هدف اصلی از این تبدیل پیدا کردن یک باز نمایی است به طوریکه مولفه های si از یکدیگر مستقل و غیر گوسی باشند. مقدار غیر گوسی بودن یک سیگنال را می توان به چند طریق اندازه گیری کرد.
یکی از روش های کلاسیک، درجه چهارم آمار cumulant یا kurtosis است: مقدار کورتیزیس برای سیگنالی با توزیع گوسی صفر بوده و برای توزیع های ساب- گوسی، منفی و برای سوپر- گوسی، مثبت می باشد. در عمل به دلیل حساسیت کورتیزیس به نویز، برای اندازه گیری میزان غیر گوسی بودن سیگنال از معیار نگانتروپی استفاده می شود. معیار آنتروپی که در نظریه اطلاعات، مفهومی اساسی بوده و کاربردهای فراوان دارد برای متغیر تصادفی y به صورت رابطه زیر تعریف می شود.
تا کنون روش های اندازه گیری میزان غیر گوسی یک متغیر تصادفی، توسط تابع عملگر ذکر شد . حال برای ماکزیمم کردن تابع تمایز و یافتن جهات مستقل نیاز به یک الگوریتم داریم. یکی از الگوریتم هایی که به این منظور بکار گرفته می شود الگوریتم fixed-point ICA است که در ادامه به توضیح نحوه عملکرد آن می پردازیم. الگوریتم Fixed-point ICA در ابتدا به توضیح الگوریتم FastICA یک نورونه می پردازیم. الگوریتم یادگیری fixed -point ICA وزن های - W - این نرون را طوری تعیین می کندکه تصویر WTx مقدار غیر گوسی را ماکزیمم کند. اطلاعات ورودی بر روی آن جهت یک مولفه مستقل را نتیجه دهد. به طور خلاصه الگوریتم fixed -point ICA برای یافتن یک مولفه مستقل شامل مراحل زیر می باشد.
-1حذف مقادیر متوسط از اطلاعات ورودی.
-2سفید سازی اطلاعات ورودی.
-3انتخاب بردار وزن w بصورت تصادفی. -4تصحیح مقدار بردار وزن w مطابق رابطه زیر تابع g در رابطه فوق می تواند یکی از توابع ذکر شده در معادله - 8 - باشد.
-5 نرمالیزه کردن مقدار
-6 برگشت به مرحله 4 در صورت عدم همگرایی. الگوریتم یک نورونه فقط یکی از مولفه های مستقل را نتیجه می دهد. حال برای تخمین تمام مولفه های مستقل لازم است که الگوریتم fastICA یک نرونه به ازای نرون های مختلف با ضرایب w1….Zn اجرا شود. به منظور جلوگیری از همگرایی الگوریتم به یک مولفه باید مقادیر P;… را بعد از هر تکرار نسبت به هم ناهمبسته کنیم. برای ناهمبسته کردن w ها نیز می توان از روش Gram-Schmidt استفاده کرد. برای این منظور هنگامیکه مولفه p+1 را با استفاده از الگوریتم fixed ICA یک نرونه تخمین می زنیم، کافی است بعد از تکرار مقدار تصویر بردار M 1'… , p ، را از wp+1 کم کنیم و سپس مقدار wp+1 نرمالیزه شود. به این ترتیب از همگرایی الگوریتم مولفه های قبل جلوگیری می شود.
-3 تبدیل موجک تبدیل موجک1 روشی ساده و مفید برای انتقال، فشرده سازی و آنالیز بسیاری از تصاویر و سیگنال ها است. بر خلاف تبدیل فوریه که توابع اساسی آن سینوسی هستند، توابع اصلی تبدیل موجک، موج های کوچکی از فرکانس متغیر با طول محدود به نام موجک می باشند. تبدیل موجک را می توان به دو بخش عمده تفکیک نمود: تبدیل موجک پیوسته در زمان - CWT - 2 و تبدیل موجک گسسته در زمان3 . - DWT - بنا به عللی که در ادامه ذکر خواهد شد، در این مطالعه از تبدیل موجک گسسته در زمان استفاده می گردد CWT یک مشکل اساسی دارد:این تبدیل شدیداَ سیگنال را دچار افزونگی می کند.
CWT باعث افزایش تعداد نمونه ها 4 در شکل موج سیگنال اصلی می شود. این افزونگی در کاربردهای تحلیلی خیلی مشکل ساز نیست اما اگر بخواهیم سیگنال اصلی را بازیابی کنیم با مشکل مواجه می شویم. در کاربردهایی که نیاز به تبدیلات دو طرفه5 داریم بهتر است از روشی استفاده کنیم که حداقل تعداد ضرایب را نیاز داشته باشد. DWT این شرایط را فراهم می کند زیرا تغییرات در تبدیل و مقیاس را به توانی از دو محدود می کند. گاهی اوقات ممکن است DWT نیز نیاز به افزونگی داشته باشد تا بتوان یک تبدیل دو طرفه داشت. برای حل این مشکل باید موجک را از خانواده ای انتخاب کنیم که اساس آن متعامد6 باشد.