بخشی از مقاله
چکیده
طی چند سال گذشته، علاقه در فهم و تشخیص حالات عاطفی و ذهنی شناختی، به ویژه در تجزیه و تحلیل حالات صورت به عنوان کانال اصلی ارتباط غیر کلامی درنظر گرفته می شود، تجزیه و تحلیل حالات صورت در برنامه هاي مختلف به منظور تسهیل تعامل کامپیوتر و انسان استفاده می شود. علاوه بر این، تجزیه و تحلیل خودکار حالت صورت می تواند به عنوان یک ابزار در مطالعه برخی بیماري ها مانند افسردگی و مواردي مانند تشخیص خوابالودگی راننده و غیره مورد استفاده ق رارگیرد .
تشخیص خودکار و تجزیه و تحلیل واحدهاي حرکتی 1صورت یکی از بلوك هاي سازنده اصلی در تجزیه و تحلیل اتوماتیک حالات چهره است. این شامل تشخیص واحدهاي حرکتی زمانی که در صورت رخ می دهد و برآورد شدتشان، که به نوبه خود اجازه می دهد به تجزیه و تحلیل وقوع آنها بپردازیم. روش هاي مورد استفاده شامل الگوریتم ویولاجونز براي تشخیص چهره، مدل فیلد عصبی محلی محدود شده براي تشخیص نقاط ویژگی چهره و تشخیص واحدهاي حرکتی و در نهایت از کلاسه بند ماشین بردارپشتیبان براي تشخیص حالات چهره استفاده شده است. دقت روش پیشنهادي برابر با %90,38 می باشد.
کلمات کلیدي: واحدهاي حرکتی، فیلد عصبی محلی محدود شده، ویولا جونز، ماشین برار پشتیبان، مدل توزیع نقطه اي، نقاط ویژگی چهره
مقدمه
یکی از مهمترین راه هاي ارتباطی انسان از طریق چهره و حالات آن است. حالات چهره در انتقال منظور و ارتقاء کیفیت ارتباطات انسانی نقشی اساسی بازي می کند. در دنیاي صنعتی امروز تشخیص خودکار احساسات چهره در طیف وسیعی از زمینه ها از قبیل مطالعات روان شناسی و حقوقی، انیمیشن سازي، روباتیک، لب خوانی، درك تصاویر و ویدئو کنفرانس ها، مخابرات و ارتباطات تلفنی، تشخیص موارد مشکوك در محافظت هاي امنیتی و ضد تروریستی، شناسایی افراد و هم چنین تقابل انسان و ماشین کاربرد دارد.
دانشمندان از سی سال گذشته تا کنون فعالیت هاي زیادي در این زمینه انجام داده اند و موفقیت هاي چشمگیري در رشد و توسعه این سیستم ها به دست آورده اند، به طوري که چه در زمینه ي تشخیص حالات شش گانه در تصاویر ویدئویی و زنده و چه در زمینه ي بررسی تصاویر استاتیک و ضبط شده به سیستم هایی با بازده ي بالا رسیده اند. ما نیز در این زمینه به دنبال طراحی روشی به صورت زمان واقعی و مدلی با قابلیت تعمیم پذیري و بازدهی بیشتر می باشیم.
گام اول تشخیص و جداسازي صورت می باشد که در این مقاله از الگوریتم ویولا جونز استفاده شده است مرحله ي بعد پیدا کردن نقاط ویژگی - لندمارك ها - با روش هاي CLM و CLNF بیان گردیده که با استفاده از لندماك ها می توانیم واحدهاي حرکتی را مطابق با سیستم کدگذاري FACS مشخص کنیم. در مرحله ي بعد ردیابی چهره و نقاط ان بیان شده سپس استخراج حالت خنثی براي تشخیص بهتر و دقیق تر حالات و واحد هاي حرکتی و در نهایت اموزش اشکارسازهاي حالات چهره اورده شده است.
اشکارسازي چهره
نخستین گام در سیستم تشخیص حالات چهره، شناسایی چهرهمی باشد. یکی از روش هاي بسیار کارآمد براي تشخیص چهره و نواحی چهره - اعم از چشم ها، دهان و بینی - روش مرسوم ویولا جونز می باشد. ویولا در مقاله خود ایده استفاده از تکنیک بوستینگ را ارائه می کند چنانکه در آن با کمک انتگرال تصویر سرعت پروسه تشخیص را تا زمان واقعی افزایش می دهند. بطور مختصر بوستینگ یک متالگوریتم در تکنیک یادگیري بانظارت از شاخه یادگیري ماشینی است که سبب بهبود تعیین پارامترهاي ﻣﻮﺛﺮ یک مساله می شود.
معروف ترین الگوریتم بوستیگ ادابوست است که می توان گفت یک دسته بند است که بر اساس تعداد زیادي یادگیرنده ضعیف کار می کند این یادگیرنده ها بخودي خود نمی توانند عاملی براي دسته بندي مطلوب یک پدیده شوند اما ترکیب همه آنها سبب می شود یک دسته بند قوي ایجاد شود. در موضوع تشخیص چهره، یادگیرنده ها اجزاي کوچکی از تصویر هستند - مثلا یک ماسک 3*3 که پیکسل هاي وسط سیاه و پیکسل هاي اطراف سفید هستند - این ماسک ها با عنوان ویژگی هاي هار 4 شناخته می شوند.
هر کدام از این یادگیرنده ها قرار است در خصوص تصویر نهایی ما مبنی بر اینکه یک بخشی از یک تصویر خاصی ناحیه دلخواه ما - چهره - است یا نه اظهار نظر کنند.بطور خلاصه آنکه معمولا این ماسک ها با روشی سریع - انتگرال تصویر - بر روي تصویر کانوال می شوند سپس بررسی آماري تعداد مطابقت ها به ما یک میانگین و واریانس می دهد که همین دو مقدار براي ارزیابی نواحی کفایت می کند پس به ازاي هر یادگیرنده ضعیف پارامترهایی خواهیم داشت که بعدا در پروسه تست استفاده شده و چهره بودن یا نبودن یک نمونه تست بر اساس آنها تعیین می شود. چنانچه بالاتر گفتیم اگر تمام یادگیرنده هاي ضعیف بر اساس همان پارامترها، نمونه تست را ریجکت نکردند یعنی آن ناحیه چهره است.
روش تشخیص لندمارك5 ها
ما از دو نوع ویژگی استفاده می کنیم: ظاهري و هندسی. به منظور استخراج وﯾﮋﮔﯽ ها براي دست یابی به چهره ي ترازشدهبه ردیابی لندمارك هاي خاص - نقاط ویژگی - در چهره تکیه می کنیم براي استخراج لندمارك ها و واحدهاي حرکتی از روش هاي CLM و CLNF استفاده کردیم. در حقیقت یک نمونه جدید از CLM می باشد که با مسائل مربوط به تشخیص ویژگی در صحنه هاي پیچیده سروکار دارد. سه بخش اصلی در یک CLM وجود دارد: یک مدل توزیع نقطهPDM6، متخصص پچ - اشکارساز محلی - ، و روش اتصالات. مدل هاي PDM محل نقاط ویژگی هاي صورت در تصویر با استفاده از شکل غیر ریجید و پارامترهاي تغییر گلوبال ریجید مشخص می شود.
ظاهر پچ یا وصله هاي محلی در اطراف لندمارك موردظرن با استفاده از متخصص پچ مدل شده است . در حقیقت CLMیک روش تطبیق مدل کارآمد و قوي که از مدل مشترك شکل و ظاهر بافت براي تولید مجموعه اي از آشکارسازهاي الگوي محلی یا منطقه اي استفاده می کند ارائه می شود. مدل به یک تصویر دیده نشده در شیوه اي تکرار شونده با تولید الگوها7 با استفاده از مدل مشترك و برآورد پارامترهاي رایج، مرتبط کردن الگوها با تصویر مورد نظر براي تولید تصاویر پاسخ و بهینه سازي پارامترهاي شکل به طوري که مجموع پاسخ ها را به حداکثر برساند فیت می شود.
CLM از یک مدل آماري از مجموعه آموزش براي تولید الگو استفاده می کند. روش جستجو نیز به الگوریتم مدل شکل فعال وابسته است، این رویکرد با بهره گیري از تمام سطوح پاسخ، تعادل بهتري را بین شکل و پاسخ ویژگی8 امکان پذیر می کند. با توجه به مدل مشترك و یک تصویر دیده نشده با یک مجموعه از نقاط ویژگی اولیه، مدل مشترك را می توان به تصویر با استفاده از ﺗﺨﻤﯿﻦ شکل، بافت و پارامترهاي مشترك متصل کرد.
الگوریتم جستجوي CLM ترکیبی از روش هاي شرح داده شده به شرح زیر است 1 ورود کردن یک مجموعه اولیه از نقاط ویژگی 2 تکرار دو مرحله ي زیر:الف اتصال مدل مشترك به ﻣﺠﻤﻮﻋﻪ فعلی از نقاط ویژگی براي تولید مجموعه اي از الگوها ب- استفاده از روش جستجو شکل محدود شبدهراي پیش بینی مجموعه اي جدید از نقاط ویژگی.این مراحل تا همگرایی نتیجه ادامه پیدا می کند. الگوریتم جستجو CLM نمونه از مقداردهی تغییر شکل و تکرار اتصالات تا رسیدن به همگرایی مدل CLNF ما داراي یک متخصص پچ9 فیلد عصبی محلی جدید LNF 10 است، که بصورت غیرخطی، روابط فضایی بین مقادیر پیکسل و احتمال تراز لندمارك ها را اموزش می بیند و به ما این اجازه را می دهد اطلاعات پیچیده تري بگیریم .
همچنین از یک تکنولوژي جدید اتصالات، میانگین شیفت لندمارك هاي منظم شده غیر یکنواخت که براي در نظر گرفتن اعتبار پچ بکار برده می شود استفاده می کند. متخصص پچ احتمال یک لندمارك که در محل یک پیکسل خاص تراز شده باشد را ارزیابی می کنند. پا تعدادي از روش هاي مختلف که به عنوان کارشناسان پچ ارائه شده اند وجود دارد: مدل هاي مختلف SVR12 و رگرسورهاي لجستیک، یا حتی روش هاي ساده تطبیق الگو. محبوب ترین متخصص تا کنون رگرسوربردار پشتیبان خطی است در ترکیب با یک رگرسور لجستیکی بر روي تصاویر با استفاده از کانولوشن استفاده می شوند.
LNF همچنین شامل یک لایه شبکه عصبی است که می تواند پیچیدگی روابط غیر خطی بین مقادیر پیکسل ها و پاسخ خروجی را بدست اورد. براي انتخاب و اتصال بهترین نقشه پاسخ به لندمارك اصلی صورت از بین نقشه هاي پاسخ یافته شده به واسطه ي متخصص هاي پچ از یک روش محلی و متکی بر تخمین پارامتر اولیه استفاده می کنیم - اغلب از یک آشکارساز چهره می باشد - . اگر یک تخمین اولیه P0 داشته باشیم، هدف پیدا کردن یک پارامتر به روز رسانی براي یافتن یک راه حل نزدیک می باشد.