بخشی از مقاله

چکیده - شناسایی چهره با وجود کاربردهای گسترده و تحقیقات فراوان هنوز دارای مسائل حلنشده متعددی است. یکی از چالشهای مهم برای دستیابی به یک سیستم شناسایی چهره کاربردی، تغییرات شدید ظاهر چهره به ازای حالتهای هیجانی گوناگون است. برای غلبه بر این مشکل الگوریتمهای گوناگونی پیشنهاد شدهاند که در اکثر آنها از ویژگیهای هندسی برای جبران تأثیرات حالت هیجانی استفاده میشود. از طرف دیگر، اخیرا الگوریتمی بر مبنای نمایش تنک پیشنهاد شده است که مستقیما از خود تصویر چهره برای شناسایی استفاده میکند و در عین حال نسبت به انسداد و تخریب مقداری از پیکسلهای تصویر مقاوم است.

بنابراین، این الگوریتم تا حدودی نسبت به تغییرات مربوط به حالت چهره نیز مقاوم است. با این وجود، برخی از حالتهای هیجانی تأثیر زیادی بر ظاهر چهره دارند و عدم جبران آنها میتواند منجر به کاهش دقت شود. در این مطالعه، برای بهبود دقت سیستم شناسایی چهره مبتنی بر بیان تنک، دیکشنری مورد استفاده با اضافه کردن چند بردار مربوط به حالتهای هیجانی مورد نظر تکمیل میشود. با استفاده از این دیکشنری کامل شده دقت شناسایی چهره بر روی دادگان CK+ با 6 حالت هیجانی مختلف از %95,67 به %98,92 افزایش مییابد.

-1 مقدمه

با وجود آنکه تحقیقات برای شناسایی افراد با استفاده از تصاویر چهره از سالها پیش شروع شده است، به دلیل وجود مشکلات مختلفی مانند تغییرات زاویه چهره، نورپردازی، آرایش، سن و حالتهای هیجانی، هنوز این تحقیقات ادامه دارد. در این مقاله موضوع تأثیر حالتهای هیجانی بر روی ظاهر چهره و نحوه مقابله با این تأثیرات برای دستیابی به یک الگوریتم شناسایی چهره مقاوم به حالتهای هیجانی مورد مطالعه قرار میگیرد.

ظاهر چهره تحت تأثیر حالتهای هیجانی مختلف میتواند تغییرات شدیدی داشته باشد - شکل . - 1 بیشتر الگوریتمهای پیشنهاد شده برای مقاوم کردن سیستم شناسایی چهره نسبت به حالتهای هیجانی از ویژگیهای هندسی استفاده میکنند تا تأثیر حالتهای هیجانی را در تصویر چهره به حداقل برسانند. در [1] از چندین ویژگی هندسی سطح پائین که از تصاویر سهبعدی استخراج میشوند و طبقهبنده کننده مبتنی بر بیان تنک [2] استفاده شده است. در [4,3] نیز از مدل ظاهر فعال - AAM - به منظور جبران تأثیرات حالت هیجانی استفاده شده است.

مهمترین ایراد در الگوریتمهایی که از ویژگیهای هندسی استفاده میکنند نیاز آنها به تعیین دقیق مکان تعداد زیادی نقطه مشخصه بر روی تصویر چهره است. علاوه بر اینکه تعیین دقیق مکان این نقاط معمولا کار سادهای نیست، مقدار کمی خطا در مکانیابی آنها میتواند منجر به خطای زیادی در گام شناسایی چهره شود. در نقطه مقابل، الگوریتمهایی پیشنهاد شدهاند تا با استفاده از تصاویر بریده چهره و بدون احتیاج به نقاط مشخصه فراوان، عمل شناسایی چهره را با دقت مناسبی برای تصاویر دارای حالت هیجانی انجام میدهند.

در برخی از مطالعات مانند [5] ابتدا حالت هیجانی طبقهبندی میشود و سپس یک طبقهبند آموزش دیده برای آن حالت هیجانی به منظور شناسایی چهره استفاده میشود. در این روشها، خطای طبقهبندی حالت هیجانی به طور مستقیم بر دقت سیستم شناسایی چهره تأثیرگذار است. در [2] طبقهبندی کنندهای مبتنی بر نمایش تنک - SRC - پیشنهاد شده است که نسبت به انسداد و تخریب پیکسلها بسیار مقاوم است.

بنابراین، این الگوریتم نسبت به تغییرات حالت چهره نیز تا حدی مقاوم است. با این وجود، تأثیر برخی از حالتهای هیجانی بر روی ظاهر چهره آنقدر زیاد است که با وجود مقاوم بودن الگوریتم SRC باز هم خطا اتفاق میافتد. به همین دلیل، اگر تأثیرات حالتهای هیجانی بر روی ظاهر چهره مقدار کمی نیز جبران شود، دقت شناسایی چهره میتواند افزایش چشمگیری داشته باشد.

علاوه بر این، در برخی دیگر از مقالات از دیکشنریهایی استفاده شده است تا عمل شناسایی حالت چهره را با استفاده از نمایش تنک انجام دهند .[7,6] هدف از این مقاله کامل کردن دیکشنری مورد استفاده در الگوریتم SRC برای شناسایی همزمان هویت و حالت چهره است به گونهای که تأثیر حالتهای هیجانی بر روی ظاهر چهره توسط چند بردار ویژگی مستقل از تصویر شخص مورد نظر بیان شود. برای این کار، فرض سادهای در نظر گرفته میشود که تصویر یک شخص با یک حالت هیجانی خاص از ترکیب خطی تصویر خنثی - بدون هیچ حالت هیجانی - شخص مورد نظر و یک تصویر متناظر با آن حالت هیجانی قابل سنتز است.

بنابراین، 6 بردار ویژگی متناظر با 6 حالت هیجانی مورد نظر به دیکشنری اصلی که از بردارهای ویژگی تصاویر خنثای افراد تشکیل شده بود اضافه میشود. حال اگر بردار ویژگی یک شخص با یک حالت هیجانی بر روی این دیکشنری جدید بسط داده شود، تغییرات مربوط به حالت هیجانی تا حد خوبی به وسیله بردارهای تعبیه شده برای سنتز حالتهای هیجانی بیان میشود و قسمت دیگر از بردار ویژگی که مربوط به خود شخص مورد نظر است در بخش اول دیکشنری بیان خواهد شد.

جزئیات بیشتر الگوریتم پیشنهادی در بخشهای بعد بررسی میشود. در ادامه و در بخش 2 اصول مربوط به طبقهبندی کننده مبتنی بر نمایش تنک مورد بحث قرار میگیرد. روش پیشنهادی برای تکمیل دیکشنری مورد استفاده در این طبقهبند در بخش 3 ارائه میشود. بخش 4 مربوط به نتایج پیادهسازی است. در نهایت، بخش 5 این مقاله را جمعبندی و کارهای پیش رو را معرفی میکند.

-2 طبقهبندی کننده مبتنی بر نمایش تنک

در این بخش ابتدا ایده مطرحشده در [2] به منظور استفاده  از بیان تنک برای شناسایی اشیاء معرفی میشود. سپس، راههای مقابله با نویز و انسداد مطرح میشوند. نکته قابل ذکر آن است که اگر در کاربرد مورد نظر تعداد کلاسها زیاد باشد، جواب ایدهآل تنکتر است - درصد اعضای مخالف صفر کوچکتر است - ، و مسئله - 7 - سادهتر و دقیقتر قابل محاسبه است. در کاربرد شناسایی چهره تعداد کلاسها برابر با تعداد افراد موجود در پایگاه داده هستند که این تعداد معمولا بزرگ است و به همین دلیل، استفاده از این روش در کاربرد شناسایی چهره کارآیی بالایی را از خود نشان داده است.

گام آخر برای شناسایی، انتخاب کلاس مناسب با توجه به بردار پاسخ x 0 است. در حالت ایدهآل، در x 0 تنها نمونههای مربوط به کلاس صحیح مخالف صفر هستند اما در حالت واقعی ممکن است برخی از ضرایب مربوط به کلاسهای دیگر نیز مخالف صفر باشند. به همین دلیل، در [2] روش زیر پیشنهاد شده است. برای محاسبه خطای هر کلاس، ضرایب کلاسهای دیگر برابر با صفر قرار داده میشود و فاصله بردار ساخته شده با این ضرایب از بردار ورودی محاسبه میشود.

در صورتیکه بخشی از پیکسلهای تصویر چهره به دلایل مختلفی مانند عینک، ریش و ... با حالت معمول تفاوت داشته باشد، ممکن است برخی از اعضای بردار ویژگی مورد نظر نیز دچار تخریب شده باشند. در این حالت، بسط تنک بردار ورودی بر حسب بردارهای آموزشی پاسخ درستی را ارائه نمیکند. به عبارت دیگر، با وجود آنکه قسمت عمدهای از بردار ورودی بر حسب بردارهای آموزشی کلاس مورد نظر قابل بیان است، اما قسمتی که دچار تخریب شده است بر حسب این بردارها قابل بیان نخواهد بود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید