بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

آشکارسازي جهت حرکت چشم از روي سيگنال EOG بوسيله شبکه هاي عصبي مصنوعي
چکيده : استفاده از سيگنال هاي حياتي به عنوان يک ابزار واسط ارتباطي بين انسان و کامپيوتر اخيرا مورد توجه قرار گرفته است يکي از اين سيگنالها، سيگنال الکترواکلوگرام (EOG) است ، که ناشي از پتانسيل چشمي مي باشد. در اين مطالعه از شبکه هاي عصبي مصنوعي براي تشخيص جهت حرکت چشم از روي سيگنال EOG استفاده شده است . شبکه هاي عصبي به دليل قابليت يادگيري ديناميک هاي غيرخطي و تقريب فراگيرشان، قادر به تشخيص و طبقه بندي سيگنال هاي بيولوژيکي داراي ديناميک غيرخطي ، از جمله سيگنال EOG مي باشند. در اين مطالعه از دو شبکه کاملا متفاوت MLP و ART براي آشکارسازي حرکات متوالي و تصادفي چشم استفاده شده است . نتايج نشان مي دهد که شبکه MLP قادر است حرکات متوالي چشم را با دقت بالاي% ٩٠ تشخيص دهد، اما در مورد حرکات اتفاقي صحت تشخيص اين شبکه بسيار پايين است . در بخش تشخيص حرکات تصادفي چشم ، بهترين نتيجه با استفاده از شبکه ART2A-E بدست مي آيد که به کمک آن، صحت تشخيص بالاي % ٧٠ است .
واژه هاي کليدي: EOG، آشکارسازي حرکات چشم ، شبکه پرسپترون چند لايه (MLP)، تئوري تشديد وفقي (ART)

١- مقدمه
امروزه تشخيص ميزان و جهت حرکت کره چشم ، زمينه تحقيقاتي وسيعي را در حوزه ارتباط انسان با کامپيوتر تشکيل مي دهد[١]. روش هاي مختلفي تا کنون براي ثبت حرکات چشم ارائه شده است [٨]. يکي از مناسب ترين و مقرون به صرفه ترين روش هاي تشخيص جهت حرکت کره چشم ، استفاده از پردازش سيگنال الکترواکلوگرام (EOG)١ مي باشد[٨]، که در اين مطالعه نيز به همين دليل مدنظر قرار گرفته است .
در سال ١٩٢٠ براي اولين بار مشخص شد که مي توان با قرار دادن الکترود هاي سطحي در منطقه اطراف چشم ، يک پتانسيل الکتريکي را ثبت نمود[٢]. در ابتدا، اعتقاد بر اين بود که فعاليت الکتريکي القا شده که توسط حرکات چشم ايجاد مي شود، وابسته به پتانسيل عمل ماهيچه هاي چشم است ؛ امروزه، اين مساله پذيرفته شده است که پتانسيل الکتريکي القا شده وابسته به يک اختلاف پتانسيل دائمي مي باشد، که بين ١٠ تا ٣٠ ميلي ولت قابل تغيير است . به اين پتانسيل که بين قرنيه و شبکيه چشم برقرار است و رابطه اي تقريبا خطي با حرکات چشم دارد، CRP٢ مي گويند[٢]. عمل ثبت اين پتانسيل الکترواکلوگرافي و سيگنال ناشي از ثبت اين پتانسيل الکترواکلوگرام (EOG)٣ ناميده مي شود.
همانگونه که بيان شد، استفاده از الکترواکلوگرافي يکي از مناسب ترين و مقرون به صرفه ترين روش هاي ثبت حرکات چشم مي باشد. در سال ١٩٩٥ براي اولين بار يک رابط کامپيوتري بر مبناي EOG براي ارتباط بين انسان و کامپيوتر طراحي گرديد (١٩٩٥,Kaufman)[٩]. در سال ١٩٩٨ نيز يک موشواره چشمي چهار جهته براي کمک به افراد داراي بيماري سلولهاي حرکتي مغز و طناب نخاعي ارائه شد(١٩٩٨,Tomita) [٩].
پتانسيل قرنيه اي – شبکيه اي باعث ايجاد يک ميدان الکتريکي در بافت احاطه کننده چشم مي شود و چرخش چشم ، منجر به يک چرخش متناظر در بردار ميدان مي شود. به هر حال، اين فقط يک تخمين از سيستم بيولوژيکي واقعي است ، چون بافت اطراف چشم داراي ساختاري نامنظم است . شايان ذکر است که رابطه بين حرکات چشم و سيگنال EOG را فقط مي توان در محدوده حرکتي 30o درجه خطي فرض نمود. شکل ١ اندازه گيري جابجايي هاي افقي چشم را نشان مي دهد، که بوسيله قرار دادن يک جفت الکترود در دو طرف چشم بدست آمده است .

شکل ١: سيگنالEOG توليد شده توسط چرخش افقي چشم
پردازش و طبقه بندي سيگنال EOG همانگونه که به آن ارائه شد، يکي از پرکاربردترين روش ها در زمينه آشکارسازي جهت حرکات چشم است . به همين دليل لزوم استفاده از يک طبقه بندي کننده مناسب در اين مورد واضح و مشخص است . قابليت يادگيري ديناميک هاي غيرخطي و تقريب فراگير، از شاخصه هاي مهم شبکه هاي عصبي مي باشد و اين مساله باعث مي شود که اين شبکه ها تبديل به ابزار مناسبي در تشخيص و طبقه بندي سيگنال هاي بيولوژيکي ، از جمله سيگنالEOG شوند. در يک دسته بندي کلي مي توان اين شبکه ها را در دو نوع شبکه هاي استاتيک و ديناميک تقسيم بندي نمود. شبکه هاي استاتيک که از آن جمله مي توان به پرسپترون چندلايه اشاره کرد، شبکه هايي با گره هاي بدون حافظه هستند. گره هاي اين شبکه ها بدون ديناميک خطي مي باشد. شبکه هاي عصبي ديناميک دسته مهمي از شبکه هاي عصبي محسوب مي شوند، که داراي اهميت بيشتري نسبت به شبکه هاي استاتيک مي باشند. اين شبکه ها از آن جهت حائز اهميت هستند که بيشتر سيستم هاي حقيقي که ما به دنبال مدل کردن آنها هستيم ، سيستم هاي ديناميکي غير خطي هستند.
در اين مقاله يک روش تشخيص جهت حرکت چشم از روي سيگنال EOG با استفاده از شبکه هاي عصبي مصنوعي ارائه شده است . چهار نوع حرکت مختلف چشم در اين تحقيق مدنظر مي باشد که مي توان آنها را به دو دسته حرکات متوالي و تصادفي تقسيم نمود. در اين مطالعه ابتدا از يک شبکه عصبي پرسپترون چند لايه (MLP) براي طبقه بندي چهار نوع حرکت بيان شده استفاده شده است . قابل توجه است که نوعي ديناميک خارجي ابداعي نيز براي بهبود عملکرد اين شبکه در اين مطالعه به کار گرفته شده است . در بخش دوم، از تئوري تشديد وفقي (شبکه ART) استفاده شده است . دو نسخه مختلف از شبکه ART به نام هاي A٢-ART و ARTA-E٢ در اين مقاله به کار گرفته شده اند. ارزيابي نتايج نشان مي دهد که شبکه MLP در تشخيص حرکات متوالي ، و شبکه ART در تشخيص جهت حرکات تصادفي چشم نتيجه بهتري را از خود نشان مي دهند. هدف از آشکارسازي جهت حرکات چشم که در اين مقاله مدنظر مي باشد، استفاده از اين حرکات در ارتباطات متقابل بين انسان و کامپيوتر است .
2 - روش
در اين مطالعه از دو شبکه MLP و ART براي آشکارسازي حرکات متوالي و تصادفي چشم استفاده شده است و در پايان عملکرد اين دو شبکه با يکديگر مقايسه شده است . براي اينکه داده هاي مورد نياز آموزش و آزمايش طبقه بندي کننده (شبکه هاي عصبي ) بدست آيند، آزمايش هاي مختلفي صورت گرفته که در زير به آنها اشاره شده است :
١-٢- نحوه ثبت داده :
طول زماني هر يک آزمايش هاي انجام شده در اين مطالعه ٢١ ثانيه بوده و با استفاده از سيستم Powerlab موجود در آزمايشگاه تخصصي دانشگاه آزاد اسلامي واحد مشهد اخذ شده اند. براي اخذ سيگنال EOG از پنج الکترود استفاده شده است . چهار الکترود در قسمت هاي بالا، پائين ، چپ و راست چشم ، و الکترود پنجم بعنوان مرجع در وسط پيشاني قرارداده شده است . در شکل زير نحوه نصب اين الکترودها مشاهده مي شود.

شکل ٢: نحوه نصب الکترودها براي ثبت سيگنال EOG
در اين ثبت ، شخص به صورت طبيعي و بدون هيچ گونه عايق بندي از لحاظ صوت و نور، جلوي کامپيوتر مي نشيند و يک هدف متحرک را که هر ٢.٥ ثانيه ( يا به طور دقيق هر ٢.٥٤ ثانيه ) يکبار بر روي صفحه کامپيوتر حرکت مي کند را با چشم تعقيب مي نمايد. همزمان سيگنال EOG شخص با استفاده از سيستم معرفي شده تقويت ، و پس از نمونه برداري با نرخ ٢٥٦ هرتز به کامپيوتر ارسال مي شود. با توجه به اينکه زمان کل هر آزمايش حدود ٣٥.٥ ثانيه بوده و هدف متحرک بر روي صفحه کامپيوتر هر ٢.٥ ثانيه ( يا به طور دقيق هر ٢.٥٤ ثانيه ) يکبار حرکت مي کند، لذا در طول ثبت ، چشم فرد مورد آزمايش ، ١٤ حرکت انجام مي دهد. از اين ١٤ حرکت ، سيگنال EOG مربوط به اولين و آخرين حرکت ، معتبر نيستند و کنارگذاشته مي شوند. از اينرو در طول هر آزمايش ، چشم مورد آزمايش ، ١٢ حرکت صحيح انجام مي دهد. از هر آزمون ويژگي هاي سيگنال EOG ناشي از حرکت دوم تا دوازدهم (١١ حرکت ) استخراج شده و مورد استفاده قرار مي گيرند.
در اين مطالعه بررسي چهار نوع هدف متحرک در نظر گرفته شده است ،که عبارتند از:
١- حرکات متوالي مابين دو هدف در صفحه نمايش
٢- حرکات متوالي مابين چهار هدف در صفحه نمايش
٣- حرکات اتفاقي مابين چهار هدف در صفحه نمايش
٤- حرکات اتفاقي مابين شش هدف در صفحه نمايش
در شکل زير اين چهار نوع هدف متحرک، نشان داده شده است .

شکل ٣ : حرکات چشم درنظر گرفته شده براي ثبت : الف ) حرکات متوالي مابين دو هدف؛ ب) حرکات متوالي مابين چهار هدف؛ ج) حرکت اتفاقي مابين چهار هدف؛ د) حرکت اتفاقي مابين شش هدف در اهداف نوع الف ، گوشه چپ و راست صفحه نمايش کامپيوتر به ترتيب و به صورت متوالي روشن مي شود و فرد بايد در هر لحظه به قسمتي از صفحه که روشن شده است نگاه کند. نوع دوم هدف متحرک، شامل چهار حرکت چپ ، راست ، بالا و پايين است و هدف تشخيص اين چهار حرکت مي باشد. براي اين منظور، چهار گوشه صفحه کامپيوتر در نظر گرفته شده است . در هر لحظه ، فقط يک گوشه روشن مي باشد.
روشن شدن گوشه ها بترتيب انجام شده است . (گوشه بالا- چپ ، بالا- راست ، پايين – راست و پايين – چپ ). شخص اين روشن و خاموش شدن را دنبال مي کند و همزمان سيگنال EOG از وي ثبت مي شود.
در اهداف نوع (ج) و (د) به ترتيب چهار هدف و شش هدف مدنظر قرار گرفته اند، که به صورت اتفاقي روشن مي شوند و سوژه بايستي در هر لحظه اين تغييرات را روي صفحه نمايش دنبال کند.
با توجه به اينکه تعداد کل آزمون ها در هر يک از انواع اهداف، ١٠ تا مي باشد و تعداد حرکات چشم مورد بررسي در هر آزمون ١١ تا، لذا تعداد کل حرکات چپ و راست چشم که مورد استفاده قرار مي گيرند، ١١٠ حرکت است . از هر آزمون ١٠ الگو استخراج مي شود. لذا تعداد کل الگوهاي ورودي شبکه ، ١٠٠ الگو خواهد بود که از ٦٠ الگو براي آموزش شبکه و از ٤٠ الگو ديگر براي ارزيابي کارايي شبکه در تشخيص حرکات چشم استفاده شده است .
٢-٢-پيش پردازش
در شکل هاي ٤ (الف و ب) سيگنال EOG ثبت شده ناشي از حرکات متوالي مابين گوشه هاي چپ و راست صفحه تصوير و سيگنال ناشي از حرکات متوالي مابين چهار گوشه چپ ، راست ، بالا و پايين نشان داده شده است . توجه شود که عمليات پيش پردازش روي اين سيگنالها به منظور حذف نويزهاي فرکانس بالا بوسيله فيلتر پائين گذر با فرکانس قطع ٣٠ هرتز انجام شده است . پس از اين مرحله ، حذف سطح DC و همچنين حذف آرتيقکت مربوط به پلک هاي غير ارادي نيز از اين سيگنال صورت مي گيرد.
حذف پلک ها از سيگنال EOG با استفاده از اعمال روش حد آستانه بدين شکل صورت مي گيرد که بر روي کانال عمودي، دامنه پلک ها بسيار بزرگتر از ميزان تغيير دامنه سيگنال EOG ناشي از حرکات ارادي چشم است . لذا از يک مقدار آستانه مي توان براي شناسايي و حذف پلک ها (برداشتن آن از سيگنال EOG) استفاده نمود.

شکل ٤- الف : سيگنال ناشي از حرکات متوالي مابين دو هدف، پس از حذف نويزهاي فرکانس بالا



شکل ٤- ب: سيگنال ناشي از حرکات متوالي مابين چهار هدف پس از حذف نويزهاي فرکانس بالا
ملاحظه مي شود که در هنگام حرکت چپ – راست ابتدا يک پتانسيل مثبت ، سپس يک پتانسيل منفي در کانال هاي افقي ظاهر مي شود. اما در هنگام حرکت راست - چپ ، ابتدا يک پتانسيل منفي ، سپس يک پتانسيل مثبت ظاهر مي شود. در حرکت هاي افقي ، ميزان تغييرات پتانسيل در کانال افقي بيشتر از ميزان تغييرات در کانال عمودي است .
در حرکت عمودي عکس حالت فوق رخ مي دهد و شاهد پيک هاي قوي در کانال عمودي خواهيم بود.
٣-٢-استخراج ويژگي
در اين مطالعه براي استخراج ويژگي از سيگنال، از الگوهاي زير استفاده شده است :
١. حداقل
٢. حداکثر
٣. ميانگين (Mean)
٤. پراش (Variance)
٥. تيزي (Sharpness)
٦. مقادير منفرد (Singular Values)
در حقيقت اين ويژگي ها، ورودي هاي طبقه بندي کننده (شبکه عصبي ) را تشکيل مي دهند.
براي بهره گيري از الگوهاي تجزيه به مقادير منفرد، سيگنال به يک سري بردارهاي عمود بر هم تجزيه مي شود که مقادير منفرد، مقادير ويژه اين بردارها مي باشند. مقادير منفرد به دليل متعامد بودن بردارها باعث حذف زوائد اطلاعاتي مي شوند و به همين دليل اطلاعات مهم سيگنال را در خود دارند. يکي از بهترين جواب هاي ممکن را مي توان با استفاده از اين الگو بدست آورد.

٤-٢- شبکه MLP
بدون شک پرسپترونها يکي از پرکاربردترين و قابل فهم ترين انواع شبکه هاي عصبي مي باشند. مدل عمومي شبکه هاي پرسپترون، شبکه جلو رونده با روال تعليم انتشار به عقب است . شبکه هاي جلو رونده شبکه هايي هستند که وروديهاي لايه اول نرونهاي آن به لايه هاي بعدي متصل بوده و در هر سطح اين مسئله صادق مي باشد، تا به لايه خروجي برسد. روال انتشار به عقب نيز بدين معني است که پس از مشخص شدن خروجي شبکه ، ابتدا وزنهاي لايه آخر تصحيح شده و بعد به ترتيب اوزان لايه هاي قبلي تصحيح مي شوند. شبکه هاي پرسپترون از يک لايه ورودي، تعدادي لايه پنهان و يک لايه خروجي تشکيل شده است . در شکل زير يک نمونه شبکه عصبي پرسپترون با دو لايه مخفي مشاهده مي شود.

شکل ٥ : نمونه اي از شبکه پرسپترون با دو لايه پنهان
شبکه عصبي پس انتشار خطا با دو لايه مخفي ( ١٥ نرون در لايه مخفي اول و ١٠ نرون در لايه مخفي دوم) در اين مطالعه به کار گرفته شده است . همچنين از تابع غيرخطي به فرم هيپربوليک در لايه هاي مخفي و لايه خروجي استفاده شده است . وروديهاي شبکه ، الگوهاي استخراج شده از سيگنال EOG ناشي از حرکات چشم مي باشند. نرخ يادگيري برابر ٠.٠١ انتخاب شده است . تعداد خروجي هاي شبکه نيز با توجه به تعداد اهداف مدنظر کاربر، ٢ يا ٤ يا ٦ است .

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید