بخشی از مقاله

چکیده

هر گاه به چهره کسی می نگریم بدون هیچگونه زحمتی یک شاهکار خلقت رخ می دهد .کاری که یک نوزاد قادر به انجام آن است اما از توانایی پیچیده ترین کامپیوترهای امروزی بسیار فراتر است .این شاهکار چیزی نیست جز شناسایی چهره. اگر بدانیم که برخی پژوهشگران معتقدند که ارائه یک تئوری کامل شناسایی نه تنها ساده نیست بلکهاصولاً امکان پذیر نیست .

در قرن 21 شاید اهمیت این شاهکار را بیشتر احساس کنیم.در این مقاله روشی جدید برای آشکارسازی چهره با استفاده از روش تحلیل مولفه های مستقل ارائه شده است. در روش ارائه شده چون بسیاری از قسمت های تصویر توسط الگوریتمی ساده حذف می شوند، علاوه بر افزایش دقت در آشکارسازی چهره، باعث افزایش سرعت پردازش خواهد شد.

مقدمه

استفاده از الگوهای بیومتریک بالاخص اثر انگشت و تصویر چهره از دیرباز مطرح بوده است ولی امروزه با پیشرفت تکنولوژی و افزونی جمعیتی که هر روز بیشتر و بیشتر نیازمند احراز هویت خویش هستند، استفاده از تشخیص و یا تصدیق هویت اتوماتیک گزینه ای است که مورد توجه بسیاری از ارگان ها ودولت قرار گرفته است

دردنیای امروز، استفاده از اسکنرهای دست و یا اثر انگشت و همچنین دوربین های مخصوص عکسبرداری از چهره و یا عنبیه چشم مواردی هستند که در بیشتر ارگان های حساس کشورهای صاحب تکنولوژی، در ایستگاه های تصدیق و تشخیص هویت به چشم می خورند. زمانی که صورت کاربر در فاصله حدود 2 متر در حوزه دستگاه تشخیص چهره قرار گرفت، سیستم شروع به شناسایی صورت کرده و پس از گرفتن عکس، آنرا با اطلاعات موجود مورد مقایسه قرار می دهد و سپس عکس مورد نظر را با عکس موجود در پایگاه داده تطبیق میدهد .[ 2 ]این تصمیم گیری در کمتر از 5 ثانیه انجام میشود. اگرچه اولین مطالعات جدی در زمینه چهره و شناسایی آن به قرن نوزدهم میلادی و کارهای داروین1 و گالتون2 باز می گردد اما بشر تا دهه شصت میلادی صبر نمود تا شاهد تولید اولین ماشین خودکار شناسایی چهره توسط بلدسو3 باشد.

تحلیل مؤلفه های مستقل

در این مقاله به مفاهیم پایه در پردازش تصویر پرداخته می شود و به مرور کلیه روش های بررسی شده می پردازد.سپس روشی جدید برای آشکارسازی چهره با استفاده از روش تحلیل مؤلفه های مستقل ارائه شده است و به ارائه جزئیات پیاده سازی تکنیک پیشنهادی و تجزیه و تحلیل نتایج حاصل از شبیه سازی پرداخته شده و در نهایت به بیان نوآوری های تحقیق حاضر و ارائه برخی پیشنهادات جهت تحقیقات آتی مرتبط در این زمینه اختصاص یافته است.

در ابتدا پس از انتخاب تصویر مورد نظر بانک فیلتر بر روی آن اعمال می شود و در این حالت استخراج ویژگی ها یعنی یافتن فاصله بین دو چشم و لب تا بینی انجام می شود. سپس با استفاده از شبکه عصبی ویژگی های استخراج شده را آموزش می دهیم و نهایتا چهره را از غیر چهره تشخیص می دهد .سیستم با تجزیه تحلیل این موارد و شناسایی آن ها در صورت مطلوب بودن شرایط این فرآیند را به بهترین نحو انجام داده است.

الگوریتم ارائه شده روی پایگاه دادهی FDDB تست شد و نتایج آن با الگوریتم استاندارد تحلیل مؤلفه های مستقل روی همین پایگاه داده بررسی گردید. تعدادی از تصاویر این پایگاه داده انتخاب شد و برای مشخص کردن خاص بودن روش ارائه شده در سرعت عمل اجرای الگوریتم، نسبت به الگوریتم استاندارد تحلیل عناصر اصلی و تحلیل تفکیک خطی مورد مقایسه قرار گرفت.

به منظور تعریف دقیق تحلیل مؤلفه های مستقل ، ما می توانیم از یک مدل متغیرهای پنهان استفاده کنیم. ما n متغیر تصادفی را مشاهده می کنیم   که به عنوان ترکیب های خطی n متغیر تصادفی مدلسازی می شوند  :

در اینجا i , j = 1'…'n و   چند ضریب واقعی می باشند. با توجه به تعریف،   از لحاظ آماری به طور متقابل مستقل میباشند. این در واقع مدل تحلیل مؤلفه مستقل مبنا و اصلی می باشد. مدل تحلیل مؤلفه مستقل یک مدل از زایشی است و بدین گونه می باشد که چگونگی مشاهده داده ها توسط فرآیند ترکیب مؤلفه های ایجاد می شوند 

مؤلفه های مستقلدر حقیقت متغیرهای پنهان می باشد که بدین معنی است که آنها نمی توانند بطور مستقیم مشاهده شوند. علاوه بر این ضریب های ترکیبی   فرض می شوند ، ناشناخته هستند.تمام متغیرهایی که مشاهده می کنیم متغیرهای تصادفی   تخمین می زنیم و ارزیابی می کنیم.این کار باید تا جای ممکن تحت فرضیه های کلی انجام شود.

ما شاخص زمان t را حذف کرده ایم و این بدین صورت که در این مدل تحلیل مؤلفه مستقل اصلی ، ما فرض می کنیم که هر ترکیب و همچنین هر مؤلفه ی مستقل   یک متغیر تصادفی است به جای اینکه یک سیگنال زمانی مناسب یا سری زمانی باشد.

مقدار های مشاهده شده   نمونه ای از این متغیر تصادفی می باشد.علاوه بر این ما تمام تأخیرات زمانی که شاید در ترکیب اتفاق بیافتند را نادیده می گیریم، به همین دلیل است که این مدل اصلی اغلب مدل ترکیب همزمان نامیده می شود

تحلیل مؤلفه مستقل با روشی به نام تفکیک منبع کور4 یا تفکیک سیگنال کور ارتباط نزدیکی دارد.در اینجا ما یک منبع به عنوان یک سیگنال اصلی و مبنا داریم . " کور" به این معنی است که ما اطلاعات بسیار کمی از ماتریس ترکیبی داریم و بسیار کم آن را می شناسیم و فرضیه های بسیار ضعیفی در مورد سیگنال های منبع ایجاد و ارائه می کنیم

تحلیل مؤلفه مستقل روشی است که شاید به طور وسیع برای اجرای تفکیک منبع کور استفاده شود.

بردار تصادفی را با X علامت گذاری و مشخص می کنیم که عناصر و اجزای آن ترکیبات   می باشند و
همچنین بردار تصادفی با عناصر و اجزا   را به وسیله S علامت گذاری و مشخص می کینم و ماتریس با عناصر و اجزا   را به وسیله A علامت گذاری میکینم.تمام بردار ها به عنوان بردارهای ستونی درک و شناخته می شوند از این رو  و در طرف دیگر X یک بردار ردیفی است.با استفاده از این نمادگذاری ماتریس بردار ، مدل ترکیبی به صورت زیر نوشته می شود:    

در بسیاری از کاربردها ، فرض این موضوع واقع گرایانه تر است که مقداری نویز در اندازه گیری ها وجود دارند که به معنی افزودن یک عبارت نویز در مدل می باشد.به منظور ساده سازی تمام عبارات نویز را در مدل اصلی حذف می کنیم زیرا تخمین و ارزیابی مدل بدون نویز به خودی خود دشوار است و به نظر می رسد برای بسیاری از کاربردها کافی باشد.علاوه بر این در بسیاری از موارد تعداد ترکیبات مشاهده شده نمی توانند یکسان باشند و ترکیب می تواند غیر خطی باشد

به منظور تضمین این موضوع که مدل مبنا و اساسی تحلیل مؤلفه های مستقل در حال حاضر ارائه شده و می تواند تخمین زده و ارزیای شود باید محدودیت ها و فرضیه های مشخصی ارائه کنیم.

- 1 مؤلفه های مستقل از لحاظ آماری مستقل فرض می شوند. این اصلی است که تحلیل مؤلفه مستقل بر اساس آن می باشد. به طور شگفت انگیزی چیزی بیش از این فرضیه برای تصدیق این موضوع لازم نیست که مدل می تواند ارزیابی و تخمین زده شود . به همین دلیل است که تحلیل مؤلفه مستقل چنین روش قدرتمندی با کاربردهای بسیار در بخش های مختلف ، زیاد می باشد.

اساساً متغیر های تصادفی در صورتی مستقل گفته می شوند که اطلاعات مربوط به مقدار   هیچ

اطلاعاتی در مورد ارزش برای i j را ارائه نمی کنند. بطور تکنیکی می تواند توسط تراکم های احتمال تعریف شود.تابع چگالی یا تراکم احتمال مشترک را با نشان دهیم و فایل نهایی   را توسط   نشان دهیم و علامتگذاری کنیم.

ما می توانیم به طور شهودی بیان کنیم که توزیع های گاوسی بسیار ساده هستند.کامیولن ها مرتبه بالاتر برای توزیع های گاوسی صفر می باشند، اما چنین اطلاعاتی برای تخمین و ارزیابی مرتبه بالاتری از مدل تحلیل مؤلفه مستقل ضروری و لازم می باشند.

از این رو تحلیل مؤلفه مستقل در صورتی غیر ممکن است که متغیر های مشاهده شده دارای توزیع های گاوسی می باشند.توجه داشته باشید که در مدل پایه و اصلی می دانیم که توزیع های گاوسی تحلیل مؤلفه های مستقل شبیه هم هستند، اگر آنها شناخته شده باشند مسئله به طور قابل توجهی ساده خواهد شد که در آن صورت فرضیه ی "غیر گاوسی" توسط بعضی از فرضیه ها ی مربوط به ساختار زمانی سیگنال ها جایگزین شده است.

به منظور ساده سازی ، فرض می کنیم که ماتریس مرکب ناشناخته درجه دوم است.به عبارتی دیگر تعداد مؤلفه های مستقل برابر با تعداد ترکیبات مشاهده شده می باشد. این فرضیه گاهی اوقات میتواند نادیده گرفته شود و در اینجا اینکار را انجام می دهیم زیرا در واقع تخمین و ارزیابی را ساده می سازد، سپس بعد از تخمین و ارزیابی ماتریس A میتوانیم عکس آن را محاسبه کنیم و مؤلفه های مستقل را به راحتی توسط معادله ی زیر به دست آوریم:

این فرضیه در اینجا نیز بیان شده است که ماتریس مرکب معکوس پذیر است. اگر این مورد اصلی نیست ، ترکیب های اضافی وجود دارند که می توانند حذف شوندو در آن مورد ماتریس درجه دوم نخواهد بود، سپس ما دوباره موردی را پیدا می کنیم که تعداد ترکیبات برابر با تعداد مدار مجتمع ها نیست.

از این رو تحت سه فرضیه قبلی - یا حداقل دوتا از فرضیه های اول - مدل تحلیل مؤلفه مستقل قابل شناسایی است که بدین معنی است که ماتریس مرکب و مدار مجتمع ها می توانند برای بعضی از معلول ها - یا نا معلوم ها - ناچیز تخمین زده شوند.

در مدل تحلیل مؤلفه مستقل در معادله - 5 - مشاهده این موضوع آسان است که نامعلوم ها و ابهامات زیر لزوماً برقرار هستند:

1 -  نمی توان واریانس های مؤلفه های مستقل را تعیین و مشخص کنیم.

دلیل اصلی این است که S و A هر دو ناشناخته و نا معلوم هستند، هر مضرب اسکالر در یکی از منابع   همیشه می تواند از طریق تقسیم ستون مربوطه   از A بر عددی یکسان ، مثلا   حذف شود:

در نتیجه می توان دامنه های مؤلفه های مستقل را تثبیت کنیم.به دلیل اینکه آن ها متغیر های تصادفی هستند، شیوه ی انجام این کار فرض این موضوع است که هر کدام دارای واریانس واحد یا یک می باشد :

سپس ماتریس A در روش های حل تحلیل مؤلفه مستقل به منظور در نظر گرفتن این محدودیت استفاده می شود. توجه داشته باشید که هنوز این ابهام و نامعلومی خوشبختانه در اکثر کاربرد ها ناچیز است

- 2 نمی توان مرتبه و بزرگی مؤلفه های مستقل را تعیین و مشخص نمود.

دلیل اصلی این است که با نامشخص بودن A و S ، میتوان مرتبه و بزرگی موجود در فرمول - 6 - تغییر دهیم و همه ی مؤلفه های مستقل را مرتبه اول بنامیم.رسماً یک ماتریس جایگشت P و عکس آن می توانند در مدل جاگذاری شوند تا  X = A به دست بیاید.عناصر در واقع متغییرهای مستقل اصلی اما در مرتبه ای دیگر می باشند. ماتریس  A تنها یک ماتریس ترکیبی ناشناخته می باشد که باید توسط الگوریتم های تحلیل مؤلفه مستقل حل شود.

بدون از دست دادن اصل کلی، می توانیم فرض کنیم که متغیرهای ترکیبی و مؤلفه های مستقل دارای میانگین صفر می باشند.این فرضیه در واقع نظریه و الگوریتم را تاحدی زیادی ساده می کند .[12 ] اگر فرضیه میانگین صفر درست نیست می توانیم پردازش هایی برای صدق آن انجام دهیم. این کار از طریق متمرکز سازی متغیر ها قابل مشاهده است. یعنی تفریق میانگین ممکن و امکان پذیر می باشد.این بدین معنی است که قبل از اجرای تحلیل مؤلفه مستقل ترکیبات اصلی مانند X توسط فرمول زیر پیش پردازش می شوند:

از طرف دیگر ، ماتریس ترکیبی بعد از این پیش پردازش یکسان باقی می ماند بنابراین ما می توانیم همیشه این کار را بدون تأثییرگذاری بر تخمین و ارزیابی ماتریس ترکیب انجام دهیم. بعد از تخمین ماتریس ترکیبی و مؤلفه های مستقل برای داده های میانگین صفر، میانگین تفریق شده می تواند به راحتی از طریق افزودن به مؤلفه های مستقل میانگین صفر بازسازی شود. به منظور توصیف تحلیل مؤلفه مستقل در عبارات آماری ، دو مؤلفه ی مستقل با توزیع های یکنواخت زیر را در نظر بگیرید:

دامنه ی مقدار ها برای این توزیع یکنواخت طوری انتخاب شدند که میانگین صفر و واریانس برابر یک شوند، چگالی مشترک و بر روی یک ماتریس مربع یکنواخت می باشد.

این حالت از این تعریف پیروی می کند که چگالی مشترک دو متغیر مستقل تنها حاصل و نتیجه ی چگالی های حاشیه ای آنها می باشد. حال دو مؤلفه ی مستقل را باهم ترکیب می کنیم و ماتریس ترکیبی زیر را بدست می آوریم:

با مشخص شدن بعضی از متغیرهای تصادفی ، تبدیل خطی آن ها به متغیرهای غیر همبسته آسان و راحت می باشد.از این رو تلاش برای تخمین مؤلفه های مستقل توسط چنین روشی، معمولاً سفید سازی یا گرد کردن نامیده می شود و اغلب توسط تجزیه و تحلیل مؤلفه ی اصلی اجرا و پیاده سازی می شود، وسوسه انگیز است

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید