بخشی از مقاله
چکیده
این مقاله یک سیستم کامل تشخیص و شناسایی چهره را با استفاده از ترکیب چند الگوریتم یادگیری ماشین معرفی میکند. بدین منظور ابتدا با استفاده از الگوریتم شناسایی چهره ارائه شده توسط ویولا و جونز مکان چهره در تصویر شناسایی میشود، پس از استخراج چهرهها در تصویر، یک مرحله متعادل سازی هیستگرام محلی بر روی آن اعمال میشود تا تاثیر تفاوت در شدت روشنایی در تصاویر متفاوت کاهش یابد، سپس الگوریتم آنالیز اجزای اصلی بر روی آن اعمال میشود تا ویژگیهای اصلی چهره از تصویر استخراج شود. پس از این مرحله ضرایب آنالیز اجزای اصلی با استفاده از الگوریتم آنالیز تمایزات خطی به فضای جدید نگاشت مییابد. این کار باعث بهبود تفکیک پذیری کلاسها از یکدیگر میشود. در نهایت با استفاده از شبکه عصبی که قبلا با استفاده از همین تبدیل بر روی بانک چهره آموزش دیده است، کلاس مربوط به چهره تشخیص داده شده مشخص میشود.
واژههای کلیدی :الگوریتم ویولا-جونز، تشخیص چهره، الگوریتم آنالیز اجزای اصلی، الگوریتم آنالیز تفکیک کننده خطی، شبکه عصبی
-1 مقدمه
یکی از بهترین روشهای شناسایی بیومتریک، شناسایی چهره است که اخیرا بسیار مورد توجه قرار گرفته است. منظور از شناسایی چهره سیستمی است که قادر به تشخیص مکان چهره در تصویر و شناسایی چهره تشخیص داده شده با استفاده از بانک چهره متشکل از چند چهره برای هر فرد است. تغییرات حاصل از تغییر مکان صورت در تصویر،اندازه صورت، حالت صورت، تغییر سن و. . جزو مشکلات این زمینه محسوب می شوند. شناسایی چهره بطور کلی به دو دسته کلی تشخیص مکان چهره1 و تطبیق یا شناسایی2 قابل تقسیم است. بیشتر تحقیقات گذشته به طور جداگانه به در یکی از این دو دسته به تحقیق میپرداختند یا در یکی موفقیت مناسب و در زمینه دیگرضعفهای زیادی از خود نشان میدادند در این مطالعه تلاش شد تا الگوریتم هایی که در هر زمینه موفق بودند را با یکدیگر ترکیب کرده تا یک ساختار کامل حاصل گردد.
مساله شناسایی چهره در تصاویر دو بعدی در تحقیقات زیادی مورد مطالعه قرار گرفت. الگوریتم معرفی شده توسط ویولا و جونز - 2001Viola & Jones, - 3 یک موفقیت بزرگ بود. ویولا و همکاران در - Viola, Jones, & Snow, 2005 - ویژگی ها را برای مقایسه نواحی یکسان در فریم های متفاوت از تصویر ویدئویی اصلاح کردند. لینهارت و مایدت - - 2002Lienhart & Maydt,یک مجموعه جدید از ویژگی های شبه هار دوران یافته را معرفی کردند. لوی و همکاران - - 2004Levi & Weiss, از هیستگرام های جهت لبه محلی4 به عنوان منابع اطلاعاتی جهت استخراج ویژگی استفاده کردند. - - 2005Dalal & Triggs, لی و همکاران - Li et al., 2002 - یک روش یادگیری جدید را برای آموزش کلاس بندی کننده تقویت5 شده که حداقل نرخ خطا را بدست آورد ، ارائه کردند. میتا6 و همکاران - - 2005 Mita, Kaneko, & Hori,ویژگی های شبه هار مشترک را پیشنهاد دادند.
یک بررسی کامل بر روی روشهای شناسایی چهره با کمک تصاویر دو بعدی توسط ژاوو و دیگران - Zhao, Chellappa, Phillips, & Rosenfeld, 2003 - انجام شد. معروفترین روش شناسایی چهره دو بعدی روش چهره ویژه7 است که توسط ترک و پنتلند پیشنهاد شده است - - Turk & Pentland, 1991 که از روش آنالیز المانهای اصلی استفاده میکند روش چهره فیشر8، که از تحلیل جدا سازهای خطی استفاده میکند - Li - 2002et al., روش بیز، ماشین بردار پشتیبان9 و روشهای شبکه عصبی سایر روشهایی هستند که از تمام چهرهبرای شناسایی استفاده میکنند.
- ; Ojala, 2007; Huang, Ai, Li, & Lao, 1994Grabisch & Nicolas, - 2002Pietikinen, & Menp,ساختار کلی مقاله به این صورت است که در بخش اول نحوه عملکرد الگوریتم ویولا-جونز به طور مختصر تشریح میشود. در بخش دوم به طور خلاصه شناسایی چهره با استفاده از الگوریتم آنالیز اجزای اصلی مطرح میشود و سپس در بخش سوم آنالیز تمایزات خطی بررسی شده و در بخش چهارم روش ترکیبی آنالیز اجزای اصلی و آنالیز تمایزات خطی مطرح میشود. در بخش پنجم معرفی کوتاهی از شبکه عصبی مصنوعی پرسپترون چند لایه10ارائه میشود و در بخش ششم به معرفی ساختار پیشنهادی و نحوه آموزش آن پرداخته میشود. بخش هفتم به شبیهسازی نتایج پرداخته و در انتها نتیجه گیری قرار دارد.
-1-1تعیین مکان چهره در تصویر
در این مطالعه از الگوریتم ویولا-جونز در متلب برای تشخیص چهره استفاده شده است. این الگوریتم شامل سه بخش عمده است - - 2001Viola & Jones, که عبارتند از:ااستخراج تصویر تجمعی از تصویر اصلی: به منظور محاسبهی سریع ویژگیها در مقیاسهای متفاوت، تصویر تجمعی از روی تصاویر تولید میشود که تنها یک بار نیاز به محاسبه دارد. پس از آن ویژگیهای شبه هار هر کدام در هر مقیاس یا مکان در یک زمان ثابت میتواند محاسبه شود.
1. بکار گیری کلاس بندی کننده های ساده: بخش دوم شامل کلاس بندی کننده های ساده و موثر است که تعداد کمی از آنها با استفاده از الگوریتم تقویت تطبیقی از میان یک کتابخانه بزرگ از ویژگیهای بالقوه انتخاب شدهاند. در هر زیر پنجره تعداد کل ویژگیهای شبه هار بسیار زیاد است که بسیار بیشتر از تعداد پیکسلهای موجود در زیر پنجره است. برای دستیابی به کلاسبندی سریع، فرآیند یادگیری باید تعداد بسیار زیادی از این ویژگیها را حذف و روی بخش کوچک حیاتی تمرکز کند. ویژگیها با استفاده از الگوریتم یادگیری تقویت تطبیقی11 بدست میآید.
2. ترکیب متوالی کلاس بندی کننده های پیچیده تر در ساختار کسکود: سومین بخش از فرآیند تشخیص مکان چهره متدی برای ترکیب متوالی کلاس بندی کننده های پیچیده تر در ساختار کسکود است که سرعت آشکارساز را با تمرکز بر روی مناطق با احتمال بیشتر وجود چهره در تصویر، افزایش دهد. فرآیندهای پیچیدهتر در مراحل بعدی تنها در این نواحی صورت میگیرد. نحوه اندازه گذاری برای میزان انجام این فرآیند، نرخ
منفی کاذب12 در فرآیند توجه به نواحی است. تمامی چهرههای نمونه باید توسط فیلترهای توجهی نشانه گذاری شده باشند. این نحوه آموزش کلاس بندی کننده ها یک نوع آموزش تحت نظارت است. یک اپراتور توجهی چهرهیاب بعد از آموزش میتواند 50 درصد از تصویر را فیلتر کند - از نواحی مستعد خارج کند - در حالی که 99 درصد از چهرهها حفظ میشوند. این فیلترها بسیار کارآمد میباشد و میتواند با 20 فرآیند ساده در هر محل/مقیاس ارزیابی را انجام دهد. زیر پنجره هایی که در مرحله ابتدایی حذف میشوند - از محلهای