بخشی از مقاله

سيستم خبره شناسايي احساس از روي تصوير ويديويي چهره
چکيده
در اين مقاله ، سيستم خبره اي براي شناسايي احساس از روي تصوير ويديويي حالات چهره ارائه مي شود. ورودي اين سيستم فريمهاي متوالي نماي تمام رخ چهره است . فرض مي شودکه سر حرکت محسوسي ندارد و روشنايي فريمها يکنواخت است . اين سيستم ، اعضاي صورت را در فريمهاي متوالي دنبال کرده و تغييرات آنها را در قالب واحدهاي حرکت چهره مي شناسد و اين تغييرات را به شکل مجموعه اي از احساسهاي اوليه تفسير مي کند. در اين سيستم براي هر واحد حرکت و احساس ، شدت ظهور تعريف مي شودکه براي تميز برخي حرکات ، حذف حرکات ضعيف و ادغام حرکات مشابه استفاده مي شود. از آنجاييکه اين سيستم ممکن است بيش از يک احساس را از تغيير حالات نتيجه بگيرد، تمهيداتي براي درجه بندي شدت ظهور و رفع تناقضهاي ممکن انديشيده شده است سيستم خبره به فرايند ادراک انسان نزديک است ، استفاده از آن انعطاف زيادي به مديريت دانش سيستم داده است . نتايج شناسايي روي ۱۰۵ رشته تصوير ويديويي با ۸۰ درصد شناسايي درست احساس همراه بوده است .
واژگان کليدي : شناسايي احساس ، سيستم خبره ، حالات چهره ، رديابي ، تصوير ويديويي


۱. مقدمه
چهره ، مهمترين ابزار ارتباط غير کلامي است . از اين نظر متخصصان کامپيوتر همواره سعي کرده اند بنحوي از اين طريق نيز ارتباط انسان و ماشين را برقرار کنند. با انجام چنين کاري ، ضمن تسهيل ارتباط انسان و ماشين بويژه براي افراد ناتوان جسمي ، افقهاي جديدي براي کاربرد کامپيوتر نيز گشوده مي شود. اتوماسيون فرايند آموزش ، گرافيک کامپيوتري ، بينايي روباتها، تشخيص و معالجه بيماريهاي رواني از اين جمله اند. يکي از اصول اوليه ماشيني کردن يک فرايند، بيان کمٌي نحوه انجام آن است . گرچه روانشناسان مطالعات زيادي روي نحوه ادراک انسان از حالات چهر اشخاص انجام داده اند، تحقيقات کمي در زمينه بيان کمٌي حرکات چهره انجام شده است . در اين ميان کار اکمن ١ و فريزن ٢ براي تعريف سيستم کدگذاري حرکات چهره بسيارمشهور و مورد توجه است [۱]. آنها با تقسيم هر حرکت پيچيده به يکسري حرکات اوليه ، مجموعه واحد حرکتها را تعريف کرده اند. در اين مجموعه ، هر واحد حرکت مستقل و غير قابل تقسيم است . سيستم ارائه شده ، با رديابي اتوماتيک اعضاي چهره ، تغييرات آنها را کشف کرده و در قالب کدهاي FACS ١ دسته بندي و به احساسهايي با شدت ظهور معين تفسير مي کند. اين سيستم ضمن کشف چند احساس همزمان ، تناقض هاي احتمالي پيش آمده را نيز حذف مي کند.
هدف از بکارگيري سيستم خبره در اين پژوهش ، استفاده از مدلي مناسب براي بيان نحوه ادراک انسان از حالات چهره است . همچنين استقلال کنترل از دانش در سيستم خبره ، انعطاف زيادي به آن ميدهد. بعلاوه مي توان با ساختار قوانيني مشابه قوانين استفاده شده براي شناسايي ، موتور استنتاج را کنترل کرده و فرايند آموزش و پالايش دانش را بصورت اتوماتيک انجام داد.
ساختار بقيه مقاله چنين است : در بخش ۲ نگاهي کلي به آنگاه دو نمونه از پيش زمينه موضوع خواهيم داشت .
کارهايي را که از سيستم خبره براي شناسايي استفاده کرده اند، بررسي مي کنيم . در بخش ۳ سيستم پيشنهادي توضيح داده مي شود. بخش ۴ نتايج حاصل از آزمايشهاي انجام شده و بخش ۵ جمع بندي و نتيجه گيري را در بر دارد.
۲. بررسي پيشينه
شناسايي حالات چهره ، از ديرباز مورد توجه روانشناسان بوده است . داروين در سال ۱۸۷۸ يکسان بودن نحوه بروز احساس در چهره افراد مختلف را بررسي کرد. حدود ۱ قرن بعد، در سال ، ۱۹۷۸ اکمن ، مطالعه مشابهي روي افراد بدوي در گينه نو انجام داد[۱]. او در ادامه کارهايش FACS را تدوين کرد و طي تحقيقات ديگري ، الگوهايي براي نحوه تغيير چهره هنگام بروز احساس تهيه کرد[۱] . در FACS ، هر واحد حرکت به تغييري در صورت اطلاق مي شود که اولا بتنهايي قابل اجرا باشد و ثانيا قابل تقسيم نباشد. مثلا حرکت "باز کردن دهان همراه با بالا انداختن ابروها" گرچه يکباره انجام مي گيرد، به دو حرکت " بالا انداختن ابرو" و "باز کردن دهان " تقسيم مي شود که مستقل از هم مي توانند انجام گيرند. اين سيستم مبناي اغلب کارهاي شناسايي اتوماتيک يا نيمه اتوماتيک حالات چهره و احساس بوده است . نسخه ۱ FACS ۴۲ واحد حرکت را تعريف کرده که تعدادي از اين مجموعه را در جدول ۱ مي بينيد.
جدول ۱ – واحدهاي حرکت چهره در FACS

شِيرِر٢ در سال ۱۹۸۸ طي تحقيقاتي دريافت هنگام بروز احساس ، تغيير حالت چهر نابينايان مادرزادي ، مشابه افراد بيناي عادي است [۲]. شناسايي اتوماتيک حالات چهره از سال ۱۹۹۵ به بعد مورد توجه بوده و اغلب کارهاي انجام شده مربوط به سالهاي ۹۵ تا ۹۸ است . تحقيقاتي که در اوايل اين دوره انجام شده اند، سعي در اثبات يا نفي عقايد روانشناسان مبني بر مشابه بودن شکل بروز احساس داشته اند. مرور مناسبي بر اين تحقيقات را مي توان در [۳] و [۴]
يافت . در اينجا به دليل ارتباط نزديکتر با موضوع اين مقاله دو نمونه از کارهايي را که با استفاده از سيستمهاي خبره به شناسايي حالات پرداخته اند، بررسي مي کنيم .
۲-۱. سيستم پانتيک ١ (تصاوير ثابت )
پانتيـک [۵] ابتـدا بـا اسـتفاده از نماهـاي تمـام رخ و نـيم رخ ، محل اعضاي صورت را تشخيص داده و سپس با مقايسه آنهـا بـا حالـت عـادي شـخص ، تغييـرات ايجـاد شـده را در قالـب کدهاي FACS شناسايي مـي کنـد. مـثلا، احسـاس تنفـر در نتيجه ظهور واحدهاي حرکت ( ۱۰ و ۱۷و ۲۶ )يـا(۹ و ۱۷و ۲۶ ) گزارش مي شود(جـدول ۱ ) . ايـن سيسـتم واحـدهاي حرکـت را داراي سـهم مسـاوي در توليـد احسـاس فـرض مــي کنــد. مــثلا، اگــر در تصــوير چهــره اي ، کــدهاي ۹و ۲۶شناسايي شوند، آنگاه شـدت ظهـور"تنفـر" در ايـن نمونـه براساس ترکيب اول برابر ۱.۳ يا ۳۳% و بر اساس ترکيب دوم برابر ۲.۳ يا ۶۶ % است . اين سيستم درنهايت نتيجه بزرگتر را بعنوان ميـزان ظهـور احسـاس تنفـر گـزارش مـي کنـد. بـدين ترتيب ، خروجي سيستم تعـدادي احسـاس اسـت کـه واحـد هــاي حرکــت شناســايي شــده در توليــد آنهــا نقــش دارنــد.
پانتيــک دربــاره رفــع تناقضــهاي احتمــالي بــين احساســهاي شناخته شده ، توضيحي نداده است .
۲-۲ سيستم بلک ٢ و ياکوب ٣ (تصاوير ويديويي )
بلــک و يــاکوب [۶] بــراي شناســايي احســاس از تصــاوير ويـديويي ، حرکــت چهـره را در نــواحي مختلـف بصــورت محلي مدل مي کنند. مثلا با استفاده از مدل نواري شکلي کـه تنها مي تواند انحنـاي عمـودي داشـته باشـد، حرکـت لبهـا را مدل مي کنند. براي شناسايي احساس ، از يک آرايه مدلهاي تغيير براي نمايش تغييرات چهره استفاده مـي کننـد. هرگونـه حرکت و تغيير حالات چهـره يـا سـر در هـر فـريم در قالـب پارامترهاي مدل ظاهر مـي شـود. پـس از اسـتخراج تغييـرات پارامترها در هر فريم ، بر اساس حـدودي کـه از چنـد نمونـه آزمايشي تهيه شده ، تغييرات ناچيز و قابل اغماض حذف مـي شوند. تغييرات باقيمانده در قالب تغييرات سطح ميـاني شـامل شـروع ، ادامـه يـا خاتمـه يـک احسـاس شـناخته مـي شـوند.
شناسايي احساس بر اساس ترتيب خاص ايـن تغييـرات انجـام مي گيرد. مثلا براي شناسايي احساس "شـادي " بايـد "شـروع خنده " ، "ادامه " و "پايان خنده "در فريمهاي متـوالي صـعودي ، شناسـايي شـوند. بـراي تشـخيص هـر کـدام از ايـن مراحـل ، حرکـات تشـکيل دهنـده آن مرحلــه بايـد همپوشـاني قابــل ملاحظه اي داشته باشند. خروجي ايـن سيسـتم تنهـا يکـي از احساسهاي پايه بوده ودقت شناسايي درست آن ۷۰ % است .
۳. سيستم پيشنهادي
سيستم پيشنهادي در اين مقاله ، روشي مشـابه کـار پانتيـک [۵]
را بـراي شناســايي احســاس از روي تصـوير ويــديويي بکــار مي گيرد. در اين سيستم ، ابتدا تغييـرات صـورت در فريمهـاي متوالي استخراج شده و سپس اين تغييرات در مرحلـه اول بـه واحدهاي حرکـت و در مرحلـه بعـد بـه احسـاس تفسـير مـي شوند.
۳-۱. استخراج تغييرات صورت
فرض مي کنيم :
۱. روشنايي فريمها يکنواخت است
۲. سر حرکت انتقالي يا چرخشي ندارد
۳. تغيير مکان نقطه در دو فريم متوالي اندک است
۴. تغيير مکان نقاط دريک ناحيـه کوچـک ، گروهـي است
فرض کنيد Pi نقطه اي در فريم i و 1+Pi نظير ايـن نقطـه در فريم 1+i باشد(شکل ۱). آنگاه براي يافتن 1+Pi ، روشـنايي آن را با تمام نقاط پنجره جستجو مقايسه کـرده و شـبيه تـرين نقطـه را انتخــاب مــي کنــيم . ايــن الگــوريتم هــر مجموعــه دلخواهي از نقاط يک فريم را در فريمهاي بعـدي دنبـال مـي کند. براي استخراج تغييرات صورت ، ابتدا موقعيت هر عضو ( ابروها، چشمها، بيني ، لبها) در فريم اول بصورت دستي و بـا استفاده از ماوس تعيين مـي شـود و سـپس بـا اسـتفاده از ايـن الگوريتم ، نقاط مربـوط بـه هـر عضـو رديـابي و تغييـرات آن عضو استخراج مي شود. روش تعيين ايـن تغييـرات بـراي هـر عضو متفاوت است . مثلا براي ابرو، فاصله گوشه هاي ابـرو از گوشه هاي نظير چشم و براي لب ، طول وعرض آنها محاسـبه مي شود. نمونه اي از رديابي لب را در شکل ۱ مي توان ديد.

۳-۲. مدلهايي براي اعضاي چهره
از آنجا که ممکن اس
ت نقطه اي از اعضـاي چهـره بـه اشـتباه رديابي شود و همچنين بررسي تغييرات يک عضـو در قالـب يک مدل هندسي شناخته شده آسانتر و قابل فهمتـر اسـت ، از مدلهاي سهمي براي نمـايش ابروهـا، حاشـيه بـالايي و پـايين چشمها و لبهاي بالا و پايين استفاده شده است .
۳-۳. شناسايي واحدهاي حرکت
بــراي اســتخراج واحــدهاي حرکــت از ســه دســته ويژگــي استفاده شده است . دسته اول (شکل ۲-الـف ) ويژگيهـايي از جنس طول هستند. دسـته دوم (شـکل ۲-ب ) ويژگيهـايي از جنس فراواني و بيانگر تعداد نقاط لبه در بخشهاي خاصـي از صورت هستند و دسته آخر(شکل ۲-ج ) ويژگيهايي از جـنس روشنايي هستند.
بــراي اســتخراج فراوانــي نقــاط ، بــا اســتفاده از الگــوريتم کَني ١[۷] لبه هاي نواحي شکل ۲-ب را پيدا مي کنيم . سـپس لبه هاي افقي ، عمودي يا مورب را با استفاده از فيلترهاي ۳*۳ جدا مي کنيم [۸]. چينهاي نامنظم چانه و ناحيه بـين دو چشـم را مستقيما از لبه ها استنتاج مي کنيم . جدولهاي ۲و۳و۴ اين مشخصات را تعريف مي کنند.

الف ) مشخصات طولي [۴]

ب ) نواحي حاوي مشخصات فراواني

ج )نواحي حاوي مشخصات روشنايي
شکل ۳- مشخصات مختلف استفاده شده
بـر اسـاس ويژگيهـاي ذکـر شـده در جـدول هـاي ۲ ، ۳و۴ و همچنــين توضــيحات FACS ، واحــدهاي حرکــت را مــي شناسيم . مثلا واحد ۱ در نتيجه بزرگتر شدن ويژگيهـاي f٧ و f٨ رخ مي دهد. در جدول ۵ فهرست تعدادي از واحدهاي بررسي شده در اين مقاله و ارتبـاط آنهـا بـا ايـن ويژگيهـاي تعريف شده آمده است .

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید