بخشی از مقاله

چکیده

در سالهای اخیر شناسایی چهره به دلیل کاربردهای فراوان، در تحقیقات بینایی ماشین مورد توجه قرار گرفته است. به دلیل تغییراتی مانند حالت چهره، شدت روشنایی محیط، نویز و زاویه دید، شناسایی چهره با دقت بالا هنوز هم به عنوان یک مسئله چالش برانگیز مطرح است. از آنجایی که فرآیند استخراج ویژگی یکی از بخش های مهم بوده و تاثیر بسزایی در دسته بندی دارد، در این مقاله روشی جدید برای استخراج ویژگیهای چهره جهت شناسایی هویت ارائه شده است.

در ابتدا توسط رویکرد مدلسازی پیکربندی محلی که نسخه بهبود یافته از الگوهای دودویی محلی میباشد، ویژگیهای ساختاری از تصاویر چهره استخراج میشوند، سپس با استفاده از شبکه عصبی مصنوعی این ویژگیها جهت شناسایی چهره دستهبندی میشوند. در این مقاله از پایگاه داده ORL استفاده شد و دقت حاصل جهت دستهبندی تصاویر 91/66 درصد به دست آمد. نتایج آزمایشات برتری روش ارائه شده را نسبت الگوریتمهای مشابه در شناسایی چهره نشان میدهد.

مقدمه

در سالهای گذشته پیشرفت های سریع در زمینه تعامل انسان با رایانه و سامانه های هوشمند، موجب افزایش علاقه پژوهش گران بینایی ماشین به مباحث شناسایی هویت شده است.ویژگی های فیزیکی و رفتاری افراد همچون، چهره، صدا، عنبیه، و اثر انگشت به طور گسترده در شناسایی شخص مورد استفاده قرار می گیرند. در میان این مشخصات، استفاده از چهره، با وجود این که دقتی به اندازه ی روش های دیگر شناسایی همچون اثر انگشت ندارد، ولی به علت ماهیت غیر دخالت کنندگی آن و نیاز به همکاری کمتر افراد در اجرای پردازش شناسایی، بیشتر از روش های موجود دیگر مورد توجه قرار گرفته است.

در طول دو دههی گذسته روش های مختلفی در زمینه ی شناسایی چهره ارائه شده است، ولی با وجود پیشرفت های قابل توجه هنوز یک سامانه کامل که دارای دقت، سرعت بالا و مستقل از تغییراتی همچون روشنایی، حالات چهره، سن، چرخش سر و پوشش قسمتی از چهره وجود ندارد. یکی از بزرگترین چالش ها برای شناسایی چهره یک شخص، یافتن ویژگی های منحصر به فرد است، به شکلی که نسبت به تصاویر مختلف از یک شخص مقاوم باشد و قدرت تمایز از سایز اشخاص را داشته باشد. روش های متعددی برای این منظور ارائه شده اند که می توان آن ها را به صورت کلی به دو دسته زیر تقسیم کرد

·    روش های مبتنی بر تصویر، یا کلی نگر

·    روش های مبتنی بر ویژگی

روشهای کلی نگر به دنبال یافتن یک توصیف کلی از چهره هستند. از جمله شناخته شده ترین این روش های میتوان به page10 - Turk & Pentland, 1991 - PCA، - Lu, Plataniotis, & Venetsanopoulos, 2003 - LDA، اشاره کرد. استفاده مستقیم از مقادیر پیکسل ها، تعداد ویژگی های بسیار زیادی تولید می کند. روش هایی مانند PCA و LDA سعی می کنند با وجود کاهش تعداد ویژگی ها، اطلاعات مفید تصویر را حفظ کنند. این روش ها معمولا نسبت به تغییرات ژست، اندازه و روشنایی حساس هستند.

روش های مبتنی بر ویژگی سعی در شناسایی ویژگی های ساختاری چهره مانند چشم ها، دهان، بینی و رابطه ی بین آنها دارند. در این روش ها معمولا از تکنیک های شناسایی آماری الگو برای مقایسه ی چهره ها استفاده می شود. یکی از معایب عمده ی روش های مبتنی بر ویژگی، دشواری شناسایی و استخراج خودکار ویژگی های اصلی چهره است.

کارهای انجام شده

در مرجع - Nagi, Ahmed, & Nagi, 2008 - جهت کاهش داده های چهره از فشرده سازی تبدیل کسینوسی گسسته دو بعدی استفاده می شود. تبدیل کسینوسی ویژگی ها را از تصاویر چهره بر اساس رنگ پوست استخراج می کند. سپس بردارهای ویژگی توسط محاسبه ی ضرایب تبدیل کسینوسی محاسبه می شوند. پس از استخراج ویژگی ها از یک شبکه ی عصبی پیشرو برای آموزش بردارهای ویژگی جهت شناسایی چهره استفاده می شود. رویکرد شناسایی چهره در شبکهی پیشرو توسط دسته بندی مقادیر شدت روشنایی پیکسل های خاکستری در گروه های مختلف انجام می شود.

در سیستم های شناسایی چهره به دلیل تعداد محدود تصاویر چهره عدم قطعیت زیادی وجود دارد. در مرجع - Xu et al., 2014 - هدف این است با ترکیب نمونه های آموزشی مجازی عدم قطعیت کاهش یابد. سپس نمونه های آموزشی مفیدی که شباهت بالایی با داده های آزمایشی دارند از میان مجموعه داده های اصلی و داده های ترکیبی تولید شده انتخاب میشوند. در این تئوری برای تعداد نمونه های آموزشی مفید یک باند بالا تعریف شده است. معیار مورد استفاده برای دستهبندی و شناسایی تصاویر چهره نرم   می باشد.

در مرجع - Zou & Yuen , 2012 - شناسایی چهره در تصاویری که رزولوشن بسیار پایین - 16*16 - می باشد مورد بررسی قرار می گیرد. هر چند روش هایی جهت افزایش رزولوشن تصاویر وجود دارد، اما این الگوریتم ها روی تصاویر چهره که دارای رزولوشن بسیار پایینی هستند به خوبی عمل نمی کند. برای حل این مشکل در مرجع - Zou & Yuen, - 2012 از ارتباط بین فضای تصاویر با رزولوشن بالا و فضای تصاویر با رزولوشن بسیار پایین جهت بازیابی تصاویری با کیفیت استفاده میشود.

در این مرجع دو چالش مورد بررسی قرار می گیرد، ابتدا این که تصویر بازیابی شده در فضای جدید باید مربوط به چهره باشد و دیگر اینکه این تصویر چهره باید مرتبط با یک شخص خاص باشد. برای این منظور در ابتدا گرادیان داده ها محاسبه می شود، سپس داده ها خوشه بنده می شوند و ارتباط بین داده های با رزولوشن بالا و داده های دارای رزولوشن بسیار ضعیف توسط یک تابع نگاشت خطی به دست می آید. در فرآیند آموزش توسط داده های دارای رزولوشن بالا و داده های با رزولوشن بسیار ضعیف، هدف رسیدن به حداقل خطای بازیابی برای داده های ورودی جدید می باشد.

در مرجع - Yang, Zhang, Yang, & Zhang, 2011 - روشی به نام کدگذاری اسپارس برای شناسایی چهره معرفی شد. ابتدا مقادیر ویژه و بردارهای ویژه مربوط به پایگاه داده ی تصاویر چهره از روی ماتریس کواریانس آنها محاسبه می شود. این قسمت همان مفهوم PCA را نشان می دهد اما در کد گذاری اسپارس که به منظور بازسازی مورد استفاده قرار می گیرد برخلاف PCA هیچ گونه کاهش بعد انجام نمی شود و از تمامی مولفه های اصلی استفاده می شود.

این روش تحت عنوان یادگیری over complete نیز شناخته می شود. پس از استخراج مولفه های اصلی تصاویر، خوشه بندی انجام می شود و داده ها در دسته های مختلف قرار می گیرند. که این خوشه ها شامل تصاویر مختلف افراد می باشد که تعیین کننده ی هویت آنها است. هنگامی که تصویری برای تست وارد می شود، هدف بازسازی این تصویر از روی پایگاه داده ی ذخیره شده می باشد. در این فرآیند خوشه ای که بیشترین سهم را در بازسازی تصویر تست داشته باشد، به عنوان کاندید نماینده تصویر انتخاب خواهد شد.

در مرجع - Bagherian & Rahmat, 2008 - از ویژگی های مرتبط با عصب صورت مانند فاصله ی بین دو چشم، ابعاد بینی، رنگ صورت، شدت روشنایی تصویر و ویژگی های آماری تصویر استفاده می شود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید