بخشی از مقاله

چکیده

امروزه با توجه به پیشرفت روز افزون سیستمهای نظارتی، شناسایی و گسترش الگوریتمهای کارآمد در این حوزه حائز اهمیت است. در این راستا تشخیص چهرهی انسان به دلیل کاربرد گستردهای که در موارد متعددی نظیر تشخیص هویت، کنترل دسترسی، سیستمهای امنیتی و غیره دارد، به یکی از موضوعات مهم تحقیق در زمینه شناسایی الگو و بینایی ماشین تبدیل شده است.

فرآیند استخراج ویژگی یکی از بخشهای مهم در سیستم هوشمند محسوب میشود، برای شناسایی چهره این ویژگیها باید نسبت به تغییرات حالت چهره، تغییرات شدت روشنایی، تغییر مقیاس و دوران سر مقاوم باشد. در این مقاله از ویژگیهای محلی برای شناسایی چهره استفاده میشود. ابتدا ویژگی الگوهای دودویی گرادیان از تصاویر چهره استخراج میشوند. سپس از الگوریتم آنالیز خطی متمایز کننده برای کاهش ابعاد بردار ویژگی استخراج شده استفاده میشود.

در مرحله بعد عملیات بهینهسازی و یافتن بهترین ویژگیها برای دستهبندی توسط الگوریتم کلونی زنبور عسل انجام میشود. دستهبند مورد استفاده در این پایاننامه ماشین بردار پشتیبان میباشد. در این مقاله از پایگاهدادهی ORL استفاده شده است. دقت به دست آمده برای روش پیشنهادی 100 درصد میباشد.

مقدمه

شناسایی چهره هم اکنون یکی از زمینه های تحقیقاتی است که بسیاری از محققین را به خود جذب نموده است. ایده و راه برد اصلی در این زمینه، کاربردهای امنیتی و تعاملات انسان با کامپیوتر است. شناسایی با استفاده از چهره یک روش بصری و غیر دخالت کننده ، برای شناسایی افراد است که برای استفاده از آن نیازی به همکاری فرد مورد نظر نمیباشد و به همین دلیل به عنوان یکی از سه مشخصه بیومتریکی فرد برای استفاده در گذرنامه الکترونیکی انتخاب شده است.

بازشناسی هویت افراد با استفاده از تصاویر چهره در مقایسه با سایر مولفه های بیومتریکی دارای مزیت دخالت کنندگی پایین است که آن را در کاربردهای امنیتی متمایز میکند. به همین دلیل تحقیقات زیادی بر روی انواع روش های شناسایی چهره انجام گرفته است. در بسیاری از کاربردهای روش های شناسایی چهره از اطلاعات شدت روشنایی چهره استفاده میشود.

برخی از چالش های موجود برای شناسایی هویت از روی تصاویر چهره شامل، تغییرات شدت روشنایی، تغییر حالت چهره، دوران سر نسبت به دوربین و تغییر سن میباشد. در این مقاله روشی جدید برای شناسایی هویت از روی تصاویر چهره ارائه شده است. در ابتدا ویژگی محلی الگوهای دودویی گرادیان از تصاویر چهره استخراج میشوند. سپس ابعاد ویژگیهای استخراج شده توسط رویکرد تجزیه خطی متمایز کننده کاهش داده میشود.

در مرحله بعد از الگوریتم کلونی زنبور عسل مصنوعی برای انتخاب ویژگیهای بهینه استفاده میشود. دسته بند مورد استفاده برای آموزش و تست ویژگیهای انتخاب شده برای شناسایی هویت، ماشین بردار پشتیبان میباشد. در ادامه بخشهای مختلف الگوریتم پیشنهادی مورد بررسی قرار میگیرد. در بخش دوم مروری بر تحقیقات گذشته انجام میشود و در بخش سوم روش پیشنهادی توضیح داده خواهد شد. در بخش چهارم نیز آزمایشات و نتیجهگیری مورد بحث قرار میگیرد.

مروری بر تحقیقات گذشته

در مرجع - Nagi et al, 2008 - جهت کاهش دادههای چهره از فشرده سازی تبدیل کسینوسی گسسته دو بعدی استفاده میشود. تبدیل کسینوسی ویژگیها را از تصاویر چهره بر اساس رنگ پوست استخراج میکند. سپس بردارهای ویژگی توسط محاسبهی ضرایب تبدیل کسینوسی محاسبه میشوند. پس از استخراج ویژگیها از یک شبکهی عصبی پیشرو برای آموزش بردارهای ویژگی جهت شناسایی چهره استفاده میشود. رویکرد شناسایی چهره در شبکهی پیشرو توسط دسته بندی مقادیر شدت روشنایی پیکسل های خاکستری در گروه های مختلف انجام میشود.

در سیستم های شناسایی چهره به دلیل تعداد محدود تصاویر چهره عدم قطعیت زیادی وجود دارد. در مرجع - Xu et al, 2014 - هدف این است با ترکیب نمونههای آموزشی مجازی عدم قطعیت کاهش یابد. سپس نمونههای آموزشی مفیدی که شباهت بالایی با دادههای آزمایشی دارند از میان مجموعه دادههای اصلی و دادههای ترکیبی تولید شده انتخاب میشوند. در این تئوری برای تعداد نمونههای آموزشی مفید یک باند بالا تعریف شده است. معیار مورد استفاده برای دسته بندی و شناسایی تصاویر چهره نرم میباشد.

در مرجع - Zou & Yuen, 2012 - شناسایی چهره در تصاویری که رزولوشن بسیار پایین - 16*16 - میباشد مورد بررسی قرار میگیرد. هر چند روش هایی جهت افزایش رزولوشن تصاویر وجود دارد، اما این الگوریتم ها روی تصاویر چهره که دارای رزولوشن بسیار پایینی هستند به خوبی عمل نمیکند. برای حل این مشکل در مرجع - Zou & Yuen, 2012 - از ارتباط بین فضای تصاویر با رزولوشن بالا و فضای تصاویر با رزولوشن بسیار پایین جهت بازیابی تصاویری با کیفیت استفاده میشود.

در این مرجع دو چالش مورد بررسی قرار میگیرد، ابتدا این که تصویر بازیابی شده در فضای جدید باید مربوط به چهره باشد و دیگر اینکه این تصویر چهره باید مرتبط با یک شخص خاص باشد. برای این منظور در ابتدا گرادیان دادهها محاسبه میشود، سپس دادهها خوشه بنده میشوند و ارتباط بین دادههای با رزولوشن بالا و دادههای دارای رزولوشن بسیار ضعیف توسط یک تابع نگاشت خطی به دست می آید. در فرآیند آموزش توسط دادههای دارای رزولوشن بالا و دادههای با رزولوشن بسیار ضعیف، هدف رسیدن به حداقل خطای بازیابی برای دادههای ورودی جدید میباشد.

در مرجع - Yang et al, 2011 - روشی به نام کدگذاری اسپارس برای شناسایی چهره معرفی شد. ابتدا مقادیر ویژه و بردارهای ویژه مربوط به پایگاه داده ی تصاویر چهره از روی ماتریس کواریانس آنها محاسبه میشود. این قسمت همان مفهوم PCA1 را نشان می دهد اما در کد گذاری اسپارس که به منظور بازسازی مورد استفاده قرار میگیرد برخلاف PCA هیچ گونه کاهش بعد انجام نمیشود و از تمامی مولفه های اصلی استفاده میشود.

این روش تحت عنوان یادگیری کاملٍ نیز شناخته میشود. پس از استخراج مولفه های اصلی تصاویر، خوشه بندی انجام میشود و دادهها در دسته های مختلف قرار میگیرند. که این خوشهها شامل تصاویر مختلف افراد میباشد که تعیین کننده ی هویت آنها است. هنگامی که تصویری برای تست وارد میشود، هدف بازسازی این تصویر از روی پایگاه داده ی ذخیره شده میباشد. در این فرآیند خوشه ای که بیشترین سهم را در بازسازی تصویر تست داشته باشد، به عنوان کاندید نماینده تصویر انتخاب خواهد شد.

در مرجع - Bagherian & Rahmat, 2008 - از ویژگیهای مرتبط با عصب صورت مانند فاصلهی بین دو چشم، ابعاد بینی، رنگ صورت، شدت روشنایی تصویر و ویژگیهای آماری تصویر استفاده میشود. پس از استخراج ویژگی برای کاهش ابعاد از الگوریتم PCA استفاده میشود. نحوه ی عملکرد الگوریتم PCA در این حالت نگاشت فضای ویژگی با ابعاد بالا به فضایی با ابعاد کمتر میباشد.

در این حالت ویژگیهایی که از اهمیت کمتری برخودار می باشند یا ویژگیهایی که با هم تداخل دارند حذف خواهند شد. پس از تشکیل معیار مقایسه از روی تصاویر پایگاه داده، این ویژگیهای نگاشت شده به سیستم هوشمند شبکه عصبی، آموزش داده میشود. سپس در فاز تست پس از استخراج ویژگی و کاهش ابعاد از این سیستم می توان برای تشخیص هویت استفاده کرد.

در مرجع - Fan & Verma, 2009 - از رویکرد انتخاب ویژگیهای مربوط به عصب چهره و روشی ترکیبی برای بهبود دقت دسته بندی سیستم شناسایی چهره استفاده میشود. سیستم ترکیبی مورد استفاده از شبکه عصبی و الگوریتم ژنتیک جهت انتخاب و دستهبندی ویژگیها استفاده میکند. در این سیستم ناحیه های مربوط به عصب چهره به یک ناحیه مجزا اشاره دارد که یک ارگان محلی مانند چشم چپ، بینی و ناحیه دهان را شامل میشود. این ناحیه ها خصوصیات متمایز از یک چهره را در بر میگیرند.

در ناحیه های مربوط به عصب چهره برخی ویژگیها ممکن است از اهمیت بیشتری برخودار باشند، لذا ناحیه های با ارزش کمتر حذف میشوند که منجر به افزایش دقت دسته بندی خواهد شد. پس از پالایش ناحیه های مربوط به عصب چهره از الگوریتم تحلیل مولفه های اصلی جهت کاهش ابعاد فضای ویژگی استفاده میشود. در مرحله ی بعد از الگوریتم ترکیبی شبکه عصبی و ژنتیک جهت انتخاب و دسته بندی ویژگیها استفاده میشود.

برای آشکارسازی چهره در مرجع - Sung & Poggio, 1995 - از شبکه های عصبی چند ﻻیه پرسپترون استفاده شده است. محبوبیت استفاده از شبکه های عصبی به دلیل ساختار غیر خطی آنها است. ساختار شبکه عصبی مورد استفاده در دقت تشخیص چهره بسیار تعیین کننده خواهد بود.

در مقاله - Fathi et al, 2016 - جهت شناسایی چهره از توصیفگرهای ویژگی محلی مقاوم در برابر دوران و تغییر مقیاس استفاده میشود . این ویژگیها از دو بخش تشکیل شده است. بخش اول از ممآنهای زرنیک که روی خروجی فیلتر گابور اعمال میشود به دست می آید و بخش دیگر ویژگیهای محلی هیستوگرام گرادیان جهتدار میباشد. در مرحله ی اول فیلتر گابور روی تصویر اعمال میشود که 9 تصویر با مقیاس های مختلف تشکیل میشود سپس از ممآنهای زرنیک جهت استخراج ویژگیهای جهانی استفاده میشود.

برای محاسبهی هیستوگرام گرادیان جهتدار هر تصویر به 9 سلول تقسیم میشود که 50 درصد با هم همپوشانی دارند. سپس ویژگیهای محلی در 9 جهت برای هر یک از 9 سلول محاسبه میشود. که با در نظر گرفتن ویژگیهای به دست آمده از ممآنهای زرنیک در مجموع 90 ویژگی برای هر تصویر استخراج میشود. این ویژگیها برای تصاویر آموزشی و تست استخراج میشود و در مرحله ی آزمایش از روش نزدیک ترین همسایه جهت شناسایی چهره استفاده میشود.

ماشین بردار پشتیبانٌ یک روش یادگیری میباشد که به خاطر قدرت تعمیم پذیری برای شناسایی الگو مورد استفاده قرار میگیرد . - Vapnik, 2013 - این سیستم نمونه ای از یادگیری با ناظر است که هدف آن یافتن بهترین ابر صفحه ی جداکننده ی کﻻس ها از یکدیگر است. این ابر صفحه، ابر صفحه ی جدا کننده ی بهینهٌ نامیده میشود که خطای دسته بندی را برای نمونههای آموزشی و نمونههای تست به حداقل می رساند. در مرجع - Phillips, 1998 - مسئله شناسایی چهره با استفاده از مدلسازی عدم شباهت و آموزش آن به یک ماشین بردار پشتیبان انجام میشود. در این مرجع عدم شباهت به دو صورت مدلسازی میشود:

-1 مدلسازی عدم شباهت بین تصاویر مربوط به ویژگیهای صورت برای یک شخص مانند حالت های شاد، غمگین، عصبانی و غیره

-2 مدلسازی عدم شباهت بین تصاویر چهره از اشخاص مختلف الگوهای باینری محلیٍ یکی از توصیفگرهای غیر پارامتری است که ساختار محلی تصویر را توصیف میکند.

در سالهای اخیر بسیاری از محققان در حوزه های بینایی ماشین و پردازش تصویر از این توصیفگر استفاده کرده و کارایی آن را در کاربردهای مختلف به اثبات رسانیده اند . - Huang et al, 2011 - عملکرد این توصیفگر به این صورت است که با مقایسه هر پیکسل با پیکسل های همسایه آن ساختار محلی تصویر را به صورت کارآمد بازنمایی میکند.

در مرجع - Chadha et al, 2011 - از تبدیل تبدیل کسینوسی گسسته َ برای استخراج ویژگی به منظور شناسایی چهره استفاده شده است. تبدیل کسینوسی گسسته یک نوع تبدیل فرکانس است که می تواند سیگنال تصاویر را از دامنه مکانی به دامنه فرکانس تبدیل کند.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید