بخشی از مقاله
چکیده
در این مقاله، سیستم خبره ای برای شناسایی احساس از روی تصویر ویدیویی حالات چهره ارائه می شود. ورودی این سیستم فریمهای متوالی نمای تمام رخ چهره است. فرض می شودکه سر حرکت محسوسی ندارد و روشنایی فریمها یکنواخت است. این سیستم، اعضای صورت را در فریمهای متوالی دنبال کرده و تغییرات آنها را در قالب واحدهای حرکت چهره می شناسد و این تغییرات را به شکل مجموعه ای از احساسهای اولیه تفسیر می کند. در این سیستم برای هر واحد حرکت و احساس، شدت ظهور تعریف می شودکه برای تمیز برخی حرکات ، حذف حرکات ضعیف و ادغام حرکات مشابه استفاده می شود. از آنجاییکه این سیستم ممکن است بیش از یک احساس را از تغییر حالات نتیجه بگیرد، تمهیداتی برای درجه بندی شدت ظهور و رفع تناقضهای ممکن اندیشیده شده است سیستم خبره به فرایند ادراک انسان نزدیک است، استفاده از آن انعطاف زیادی به مدیریت دانش سیستم داده است. نتایج شناسایی روی ۵۰۱ رشته تصویر ویدیویی با ۰۸ درصد شناسایی درست احساس همراه بوده است.
واﮊگان کلیدی: شناسایی احساس، سیستم خبره، حالات چهره، ردیابی، تصویر ویدیویی
۱. مقدمه
چهره، مهمترین ابزار ارتباط غیر کلامی است. از این نظر متخصصان کامپیوتر همواره سعی کرده اند بنحوی از این طریق نیز ارتباط انسان و ماشین را برقرار کنند. با انجام چنین کاری، ضمن تسهیل ارتباط انسان و ماشین بویژه برای افراد ناتوان جسمی، افقهای جدیدی برای کاربرد کامپیوتر نیز گشوده می شود. اتوماسیون فرایند آموزش، گرافیک کامپیوتری، بینایی روباتها، تشخیص و معالجه بیماریهای
روانی از این جمله اند. یکی از اصول اولیه ماشینی کردن یک فرایند، بیان کمّی نحوه انجام آن است. گرچه روانشناسان مطالعات زیادی روی نحوه ادراک انسان از حالات چهر اشخاص انجام داده اند، تحقیقات کمی در زمینه بیان کمّی حرکات چهره انجام شده است. در این میان کار اکمن١ و فریزن٢ برای تعریف سیستم کدگذاری
1 Paul Ekman 2 Friesen
حرکات چهره بسیارمشهور و مورد توجه است]۱.[ آنها با تقسیم هر حرکت پیچیده به یکسری حرکات اولیه، مجموعه واحد حرکتها را تعریف کردهاند. در این مجموعه، هر واحد حرکت مستقل و غیر قابل تقسیم است. سیستم ارائه شده، با ردیابی اتوماتیک اعضای چهره، تغییرات آنها را کشف کرده و در قالب کدهای FACS ١ دسته بندی و به احساسهایی با شدت ظهور معین تفسیر می کند. این سیستم ضمن کشف چند احساس همزمان، تناقض های احتمالی پیش آمده را نیز حذف می کند.
هدف از بکارگیری سیستم خبره در این پژوهش، استفاده از مدلی مناسب برای بیان نحوه ادراک انسان از حالات چهره است. همچنین استقلال کنترل از دانش در سیستم خبره، انعطاف زیادی به آن میدهد. بعلاوه می توان با ساختار قوانینی مشابه قوانین استفاده شده برای شناسایی، موتور استنتاج را کنترل کرده و فرایند آموزش و پالایش دانش را بصورت اتوماتیک انجام داد.
ساختار بقیه مقاله چنین است: در بخش ۲ نگاهی کلی به پیش زمینه موضوع خواهیم داشت. آنگاه دو نمونه از کارهایی را که از سیستم خبره برای شناسایی استفاده کردهاند، بررسی می کنیم. در بخش ۳ سیستم پیشنهادی توضیح داده می شود. بخش ۴ نتایج حاصل از آزمایشهای انجام شده و بخش۵ جمع بندی و نتیجه گیری را در بر دارد.
۲. بررسی پیشینه
شناسایی حالات چهره، از دیرباز مورد توجه روانشناسان بوده است. داروین در سال ۸۷۸۱ یکسان بودن نحوه بروز احساس در چهره افراد مختلف را بررسی کرد. حدود ۱ قرن بعد، در سال ، ۸۷۹۱ اکمن، مطالعه مشابهی روی افراد بدوی در گینه نو انجام داد]۱.[ او در ادامه کارهایش FACS را تدوین کرد و طی تحقیقات دیگری، الگوهایی برای نحوه تغییر چهره هنگام بروز احساس تهیه کرد]۱. [ در FACS ،
هر واحد حرکت به تغییری در صورت اطلاق می شود که
اولا بتنهایی قابل اجرا باشد و ثانیا قابل تقسیم نباشد. مثلا حرکت "باز کردن دهان همراه با بالا انداختن ابروها" گرچه یکباره انجام می گیرد، به دو حرکت " بالا انداختن ابرو" و "باز کردن دهان" تقسیم می شود که مستقل از هم می توانند انجام گیرند. این سیستم مبنای اغلب کارهای شناسایی اتوماتیک یا نیمه اتوماتیک حالات چهره و احساس بوده است. نسخه ۱ FACS ۲۴ واحد حرکت را تعریف کرده که تعدادی از این مجموعه را در جدول ۱ می بینید.
جدول ۱ – واحدهای حرکت چهره در FACS
کد توصیف
۱ انتهای درونی ابرو بالا رفته است.
۲ انتهای خارجی ابرو بالا رفته است.
۴ ابرو پایین تر آمده است.
۵ پلک بالایی، بالاتر رفته است.
۶ گونه بالاتر رفته است.
۷ پلک، تنگتر شده است.
۹ بینی، چروک شده است.
۰۱ لب بالا، بالاتر رفته است.
۱۱ بینی فشرده تر شده است.
۲۱ طول لب بزرگتر شده است.
۶۱ لب پایین منقبض شده است.
۷۱ چانه بالا آمده است.
۸۱ لبها جمع و گرد شده اند.
۰۲ طول دهان بزرگتر شده است.
۳۲ لبها بهم فشرده شده اند.
۴۲ گوشه لبها بالاتر رفته است.
۵۲ لبها از هم جدا شده اند.
۶۲ فک پایینتر آمده است.
۷۲ دهان کاملا باز شده است.
۸۲ لبها مکیده شده اند.
۱۴ پلک بالا کمی افتاده است.
۲۴ پلک بالا افتاده است.
۳۴ چشم کاملا بسته است.
۴۴ چشم ظاهرا بسته است.
شیِرِر٢ در سال ۸۸۹۱ طی تحقیقاتی دریافت هنگام بروز احساس ، تغییر حالت چهر نابینایان مادرزادی، مشابه افراد
2 Scherer 1 Facial Action Coding System
بینای عادی است ]۲.[ شناسایی اتوماتیک حالات چهره از سال ۵۹۹۱ به بعد مورد توجه بوده و اغلب کارهای انجام شده مربوط به سالهای ۵۹ تا ۸۹ است. تحقیقاتی که در اوایل این دوره انجام شده اند، سعی در اثبات یا نفی عقاید روانشناسان مبنی بر مشابه بودن شکل بروز احساس داشته اند. مرور مناسبی بر این تحقیقات را می توان در ]۳[ و ]۴[
یافت. در اینجا به دلیل ارتباط نزدیکتر با موضوع این مقاله دو نمونه از کارهایی را که با استفاده از سیستمهای خبره به شناسایی حالات پرداخته اند، بررسی می کنیم.
۲-۱. سیستم پانتیک١ (تصاویر ثابت )
پانتیـک ]۵[ ابتـدا بـا اســتفاده از نماهـای تمـام رخ و نــیم رخ، محل اعضای صورت را تشخیص داده و سپس با مقایسه آنهـا بــا حالــت عــادی شــخص، تغییــرات ایجــاد شــده را در قالــب کدهای FACS شناسایی مـی کنـد. مـثلا، احسـاس تنفـر در نتیجه ظهور واحدهای حرکت ( ۰۱ و ۷۱و ۶۲ )یـا(۹ و ۷۱و ۶۲ ) گزارش می شود(جـدول ۱ ) . ایـن سیسـتم واحـدهای
حرکــت را دارای ســهم مســاوی در تولیــد احســاس فــرض
مــیکنــد. مــثلا، اگــر در تصــویر چهــره ای ، کــدهای ۹و ۶۲شناسایی شوند، آنگاه شـدت ظهـور"تنفـر" در ایـن نمونـه براساس ترکیب اول برابر ۳/۱ یا ۳۳% و بر اساس ترکیب دوم برابر ۳/۲ یا ۶۶ % است. این سیستم درنهایت نتیجه بزرگتر را بعنوان میـزان ظهـور احسـاس تنفـر گـزارش مـی کنـد. بـدین ترتیب، خروجی سیستم تعـدادی احسـاس اسـت کـه واحـد هــای حرکــت شناســایی شــده در تولیــد آنهــا نقــش دارنــد.
پانتیــک دربــاره رفــع تناقضــهای احتمــالی بــین احساســهای شناخته شده، توضیحی نداده است.
۲-۲ سیستم بلک٢ و یاکوب٣ (تصاویر ویدیویی)
بلــک و یــاکوب]۶[ بــرای شناســایی احســاس از تصــاویر ویــدیویی، حرکــت چهــره را در نــواحی مختلــف بصــورت محلی مدل می کنند. مثلا با استفاده از مدل نواری شکلی کـه
1 Maja Pantic 2 Black 3 Yaccoub
تنها می تواند انحنـای عمـودی داشـته باشـد، حرکـت لبهـا را مدل می کنند. برای شناسایی احساس، از یک آرایه مدلهای تغییر برای نمایش تغییرات چهره استفاده مـی کننـد. هرگونـه حرکت و تغییر حالات چهـره یـا سـر در هـر فـریم در قالـب پارامترهای مدل ظاهر مـی شـود. پـس از اسـتخراج تغییـرات پارامترها در هر فریم، بر اساس حـدودی کـه از چنـد نمونـه آزمایشی تهیه شده، تغییرات ناچیز و قابل اغماض حذف مـی شوند. تغییرات باقیمانده در قالب تغییرات سطح میـانی شـامل شــروع، ادامــه یــا خاتمــه یــک احســاس شــناخته مــی شــوند.
شناسایی احساس بر اساس ترتیب خاص ایـن تغییـرات انجـام می گیرد. مثلا برای شناسایی احساس "شـادی" بایـد "شـروع خنده" ، "ادامه" و "پایان خنده"در فریمهای متـوالی صـعودی، شناســایی شــوند. بــرای تشــخیص هــر کــدام از ایــن مراحــل، حرکــات تشــکیل دهنــده آن مرحلــه بایــد همپوشــانی قابــل ملاحظه ای داشته باشند. خروجی ایـن سیسـتم تنهـا یکـی از احساسهای پایه بوده ودقت شناسایی درست آن ۰۷ % است.
۳. سیستم پیشنهادی
سیستم پیشنهادی در این مقاله، روشی مشـابه کـار پانتیـک]۵[
را بــرای شناســایی احســاس از روی تصــویر ویــدیویی بکــار میگیرد. در این سیستم، ابتدا تغییـرات صـورت در فریمهـای متوالی استخراج شده و سپس این تغییرات در مرحلـه اول بـه واحدهای حرکـت و در مرحلـه بعـد بـه احسـاس تفسـیر مـی شوند.