بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

شناسایی چهره به روش فازی - عصبی
خلاصه
برای حل بسیاری از مسائل پیچیده نظیر شناسایی چهره، در دنیای امروز به سیستمهای هوشمندی نیاز است که بتوانند ترکیبی از دانش، تکنیکها و روشها را از منابع مختلف به کار گیرند. از جمله این سیستمهای هوشمند میتوان از شبکههای عصبی، منطق فازی و الگوریتم ژنتیک نام برد. تاکنون از شبکههای عصبی به صورت گسترده در پروژههای شناسایی چهره استفاده شده است، اما از آنجا که در شبکههای عصبی آموزش شبکه امری زمان بر است و از سوی دیگر نسبت به سایر روشها در شناسایی چهره دارای عملکرد ضعیفتری میباشد. به همین دلیل این مقاله ترکیب روشهای شبکههای عصبی و منطق فازی ( استنتاج تطبیقی فازی – عصبی(ANFIS، را بر روی مسائل شناسایی چهره مورد بررسی قرار داده است؛ که نتایج آزمایشها نشان میدهد که روش پیشنهادی بسته به نوع الگوریتم انتخابی در آموزش شبکه عصبی و توابع فازی نتایجی مطلوبتر از شبکههای عصبی و و حتی نزدیکترین همسایگی((KNN و در برخی موارد نتایجی بسیار بدتر از شبکههای عصبی در تشخیص صحیح تصاویر از خود نشان میدهد.
کلمات کلیدی: شناسایی چهره، شبکههای عصبی، منطق فازی، سیستمهای فازی-عصبی

.1 مقدمه
در چند سال اخیر با پیدایش و توسعه هوش محاسباتیٌ که در واقع استخراج هوش، دانـش و الگـوریتم محاسـبههای عـددی و ارائـه روزآمـد دادههـای عـددی است، علاقه بسیاری در میان پژوهشگران ایجاد نموده است. به گونهای که هوش محاسباتی در علوم مختلف وارد شده و کاربردهای متعددی دارد. مؤلفـههای اصلی هوش محاسباتی شامل شبکههای عصبی مصنوعیٍ، منطق فازی َ و الگوریتم ژنتیکُ است. برای حل بسـیاری از مسـائل پیچیـده در دنیـای امـروز ماننـد شناسایی چهره که اغلب غیر دقیق و شامل عدم قطعیت میباشند، به سیستمهای هوشمندی نیاز است که بتوانند ترکیبی از دانش، تکنیکها و روشهـا را از منابع مختلف به کار گیرند. از چنین سیستمهای هوشمندی انتظار میرود که در حل مسأله مورد نظر مانند انسان مهارت داشته باشند، بتوانند اسـتدلال کننـد و خود را با تغییرات محیطی تطبیق دهند و قدرت یادگیری برای بهبود عملکرد خود را داشته باشند و همچنین بتواننـد چگـونگی تصـمیمگیری و عملکـرد خود را شرح دهند. از طرفی با توسعه تکنولوژی و افزایش روزافزون جمعیت نیاز به امنیت در محیطهای ویژه روز به روز افزایش خواهد یافت.
شناسایی چهره هم اکنون یکی از زمینههای تحقیقاتی است که بسیاری از محققین را به خود جذب نموده است. در سـالهای اخیـر شناسـایی چهـره مورد توجه زیادی در زمینههای تحقیقاتی مرتبط با بیومتریک، شناسایی الگو و بینایی ماشین قرار گرفته است.[1,2] در کاربردهـای تجـاری و امنیتـی نیـز روشهای شناسایی چهره مورد استفاده قرار می گیرد. این کاربردها شامل کنترل امنیتی افـراد ، کنتـرل دسترسـی، شناسـایی افـراد مجـرم (مـثلا بـرای کنتـرل گذرنامه)، بازسازی چهره و مدارهای واسط بین انسان و رایانه هستند. علاوه بر شناسایی با کمک چهره روشهای شناسایی دیگـری نیـز وجـود دارد کـه از آن جمله میتوان به شناسایی از طریق اثرانگشت، دست، صدا، چشم، گوش و امضا اشاره کرد. برای روشهای شناسایی مختلف نیاز به روشهای برداشت اطلاعات متفاوتی است که می توان آنها را بر حسب عواملی از جمله میزان همکاری شخص، دقت، هزینه، راحتی اندازهگیری دستهبندی کرد. شناسایی با کمک تصاویرچهره بدلیل نیاز به همکاری کمی از طرف دیگران داشته و ماهیت غیر دخالت کنندهای دارد مـورد توجـه شـرکتهای امنیتـی قـرار گرفتـه است. از طرفی انعطاف پذیری چهره و ساختار پیچیده سهبعدی آن باعث میشود تا تصویر چهره توسط عوامل مختلفی از قبیل شدت روشناییِ زاویـه سـرّ حالت چهرهْ (خنده، ترس و تعجب)، گذشت زمانَ، پوشیدگیُ و حتی حالت و مدل مو تغییر پیدا کند و در نتیجه طراحی یـک سیسـتم شناسـایی چهـره را بـا مشکل مواجه کند.


.2 پیشینه تحقیق
اگرچه اولین مطالعههای جدی در زمینه چهره و شناسایی آن به قرن نوزدهم میلادی و کارهای داروین و گالتون باز میگردد، اما بشر تا دهه شصت میلادی صبر نمود تا شاهد تولید اولین ماشین خودکار شناسایی چهره توسط بلدسو باشد. بلدسو سیستمی را اختراع نمود که قادر بود با اندازه گیری روابط فیزیکی حاکم بر چهره هر شخص عمل شناسایی را انجام دهد. وی با استفاده از تکنولوژی آن زمان و تابلویی با ابعاد تقریبی 30 × 30 2 که از یک میلیون نقطه مجزا تشکیل شده بود، به طور دستی مکان نقاط مهم چهره مانند چشمها، بینی و حتی رستنگاه موها را از روی عکسها استخراج ذخیره نمود. سپس با مقایسه فواصل بردارهای ویژگی که به این ترتیب حاصل شده بود سیستم شناسایی خود را تکمیل نمود.
روشهای تشخیص و شناسایی اجسام را در ادبیات بینایی به دو گروه -1 مدلگرا، -2 ظاهرگرا تقسیمبندی میکنند. اگرچه ارائه تعریفی جامع و روشن از روشهای تشخیص و شناسایی اجسام بحث مفصلی را میطلبد اما به زبانی ساده روشهای مدلگرا سعی در توصیف اجسام به صورت سهبعدی دارند. به این منظورمعمولاً یک جسم را با استفاده از ارتباطهای سهبعدی و حجمهای ساده هندسی(مکعبها، مخروطها، کرهها) و روابط فیزیکی بین آنها توصیف میکنند.
· روشهای ظاهرگرا از شکل ظاهری اجسام برای توصیف آنها استفاده میکنند. ورودی سیستمهای ظاهرگرا تصاویر و توصیفهای
دوبعدی اجسام است.
هم اکنون گرایش قالب در میان جامعه بینایی ماشین استفاده از روشهای ظاهرگرا برای حل مسائل شناسایی است. شناسـایی چهـره نیـز از ایـن گرایش مستثنی نیست و حجم مطالعات و پژوهشهای انجام شده در توسعه روشهای ظاهرگرا بسیار بیشتر از روشهای مدلگرا است.[3]
بر حسب ذات ورودی یک سیستم شناسایی چهره، سیستم شناسایی را میتوان سیستمهای دوبعدی و سهبعدی نیز دستهبندی کرد. هرچنـد یـک بررسی ساده و اجمالی نشان میدهد که در بسیاری از روشها، مسأله شناسایی چهره به صورت تشخیص جسم سهبعدی (چهـره) از روی تصـاویر دو بعـدی معرفی شده است؛ اما با رشد فنآوری و ظهور اسکنرهای سهبعدی چهره، بالطبع توجه بیشتر به سمت پردازش اطلاعات سهبعدی چهره جلب شده است.
یک بررسی کامل بر روی روشهای شناسایی با کمک تصاویر دو بعدی توسط Zhao و دیگران [4] انجام شده است. معروفترین روش دستهی اول Eigenface است که توسط Turk & Pentland پیشنهاد شده است که از روش آنالیز المانهای اصلی استفاده میکند.[5] در سال 1991میلادی روش Fisherface توسط Kriegman & Belhumeur پیشنهاد شده است که از تحلیل جداسازهای خطی در شناسایی چهره استفاده میکند[6]، روش بیز ، SVM10 و روشهای شبکهی عصبی سایر روشهایی هستند که از تمام چهره برای شناسایی استفاده میکنند. از روشهای دسته دوم (مدل مبنا) میتوان به روش Elastic Bunch Graph [7] و[8] Active Appearance mode اشاره کرد. از روشهای دسته سوم روشی است که از ترکیب eigenface، eigennose و eigeneye استفاده میکند. نمای کلی روشهای شناسایی چهره در شکل 1آمده است.

یک سیستم شناسایی چهره در سادهترین حالت از دو جزء تشکیل شده است که در ادامه هریک شرح داده میشوند.
. استخراج ویژگی
طبقه بندی

استخراج ویژگی
استخراج ویژگی که تحت عنوان انتخاب زیرمجموعه یا انتخاب متغیر نیز شناخته میشود فرآیندی است که معمولأ در یادگیری ماشین برای حل مسائل بـا ابعاد بالا بکار گرفته میشود. این فرآیند زیر مجموعههایی از ویژگیهای ممتاز و موثر را انتخاب کرده و ویژگیهای اضافی و بـیربط را جهـت سـادگی نمایش دادهها و افزایش دقت طبقهبندی آنها حذف میکند. در این مقاله در بخـش اسـتخراج ویژگـی از روش Fisherface اسـتفاده شـده اسـت، کـه در بخش بعدی به شرح آن پرداخته شده است.

.1-3 الگوریتم LDA
در این الگوریتم هدف این است که فضای بهتری برای بیان دادهها با در نظر گرفتن دادههای متناسب با هر کلاس بهدست آورده شـود. بنـابراین بایـد بـه تعـداد افراد موجود در پایگاه داده کلاس وجود داشته باشد. در زیر به مراحل اجرای این الگوریتم پرداخته میشود:

تعداد ویژگیهایی که برای هر بار مشاهده باید اندازهگیری شود ابعاد داده نامیده میشود. بسترهای دادهایی که دارای ابعاد بالایی هستند علیرغم فرصتهای زیادی که به وجود میآورند چالشهای محاسباتی زیادی ایجاد میکنند. یکی از مشکلات مجموعه دادههای با ابعاد بالا مانند چهره، این است که اکثر مواقع تمام ویژگیهای دادهها برای یافتن دانشی که در دادهها نهفته است مهم و حیاتی نیستند. به همین علت بحث کـاهش ابعـاد دادههـا در اکثـر زمینهها هنوز یک بحث قابل توجه است. به همین منظور در این روش ابتدا دادهها را به یک فضای متعامد نرمال p بعدی منتقل میکنند. باید دقـت داشـت کـه در این انتقال دادههای اصلی حفظ میشوند و میتوان از روی دادههای منتقل شده که دارای ابعاد و بار محاسباتی کمتـری اسـت کـار را ادامـه داد؛ معمـولا در این قسمت کاهش بعد از الگوریتم Eigenface که به PCA معروف است، استفاده میشود.[5] در روش Fisher دادههـا از یـک فضـای N بعـدی کـه N تعداد پیکسلها است به یک فضای C-1 بعدی که C تعداد کلاسها است، منتقل میشوند. هدف روش پیشنهادی Fisher این است که تابعی را کـه بیـانگـر تفاوت بین میانگینها است و توسط پراکندگی درون کلاسی نرمال شده است را ماکزیمم کند.[6] در ادامه روش انجام کار آورده شده است:
1- محاسبه ی میانه ها: ابتدا تصویر میانه در هر کلاس و سپس تصویر میانه بین تمامی کلاسها به دست آورده میشود.
2-انتقال دادهها به مبدأ: در این قسمت تصاویر هر کلاس به مبدأ منتقل میشوند. برای این کار تصاویر هر کلاس را از تصویر میانه آن کلاس کم میشود
.3- انتقال میانهها به مبدأ: برای این منظور متوسط تمامی کلاسها از متوسط کل کلاسها کم میشود.
-4تشکیل ماتریس دادهها: در این قسمت تمام داده به صورت پشت سر هم قرار داده میشود و سپس کل دادهها در یک ماتریس قرار میگیرد.
5-محاسبهی ماتریس متعامد نرمال: برای این کار میتوان از روش تجزیه مثلثـی – متعامـد QR یـا از بـردار و مقـادیر ویـژهی مـاتریس کوواریـانس دادههـا استفاده کرد. ماتریس متعامد نرمال U نامیده میشود.
6- انتقال به فضای جدید: در این قسمت تصاویر و میانههای آنها به فضای متعامد جدید منتقل میشود. همانطور که در رابطه 1 نشان داده شده اسـت، ایـن کار به کمک ضرب نقطهای ماتریس دادهها در ترانهادهی ماتریس متعامد نرمال انجام میشود.

1-محاسبه ماتریس پراکندگی درون کلاسی: برای محاسبه آن مجموع ماتریسهای کوواریانس تصاویر منتقل شدهی هر کلاس را بدسـت مـیآوریـم و بـه عنوان ماتریس پراکندگی درون کلاسی قرار میدهیم. سپس مجموع این ماتریس های پراکندگی را به عنوان ماتریس پراکندگی درون کلاسـی در نظـر گرفته میشود:

محاسبه ماتریس پراکندگی بین کلاسی: این ماتریس نشاندهندهی پراکندگی بین کلاس ها است و از مجموع وزندار کوواریانس ماتریس میانههای هـر کلاس بهدست میآید. تعداد تصاویر هر کلاس وزن آن کلاس هستند.

محاسبه ی مقادیر و بردارهای ویژه: حال باید مقادیر و بردارهای ویژهی ماتریس های پراکندگی بین و درون کلاسی را محاسبه کرد.

.11 انتخاب C-1 مقدار ویژه: برای این کار ابتدا بردارهای ویژه را بر اساس مقادیر ویژه بصورت صعودی به نزولی مرتب کرده و سپس C-1 بـردار ویـژه ی معادل با بزرگترین مقادیر ویژه را بر میداریم که این بردارها تشکیل محورهای پایه ی Fisher را میدهند.

.11 انتقال تصاویر : حال تصاویر منتقل شده به محورهای نرمال عمود بر هم را به فضای جدید منتقل میکنیم. باید دقت داشت که با ماتریس بدست آمـده در قسمت 11 نمیتوان داده های اصلی را منتقل کرد چون ماتریس بدست آمده برای انتقال داده ها ی منتقل شده ایجاد شده است و نه داده های اصلی.

زمانی که به وسیله روش LDA ویژگی های مربوط به یک تصویر استخراج شد، باید مشخص شود که این تصویر متعلق به چـه فـردی مـی باشـد بـه همین منظور باید از یکی از روشهای طبقهبندی که در بخش بعدی به آن پرداخته میشود استفاده کرد.

.4 بخش طبقه بندی

هدف طبقهبندی دادهها، سازماندهی و تخصیص دادهها به کلاسهای مجزا میباشد. در این فرآیند بر اساس دادههای توزیع شده، مدل اولیهای ایجاد میگـردد. سپس این مدل برای طبقهبندی دادههای جدید مورد استفاده قرار میگیرد، به این ترتیب با بهکارگیری مدل به دست آمده، تعلق دادههای جدید به کلاس معـین قابل پیشگویی میباشد. طبقهبندی در مورد مقادیر گسسته و پیشگویی آنها به کار میرود. از جمله طبقه بندی کننده های مرسوم در شناسایی چهره میتوان بـه روش نزدیکترین همسایگی، روش ماشین بردار پشتیبان و شبکههای عصبی اشاره کرد. که از این بین روشها، روش نزدیکترین همسایگی بیشـترین کـاربرد را دارا است. در این مقاله سعی میشود که قابلیت طبقهبندی با شبکه های عصبی را تا حدی بالا برد. کـه بـرای ایـن منظـور از سیسـتم اسـتنتاج تطبیقـی فـازی-عصبی((ANFIS استفاده میشود.

.1-4 استنتاج تطبیقی فازی عصبی

هرکدام از جنبههای هوش مصنوعی در پارهای از بخشها دارای نقطـه قـوت و در مقابـل در پـارهای مسـائل دارای نقطـه ضـعف میباشـند. بـه طـور مثـال، شبکههای عصبیشدیداً به تعداد دادههای آموزشی حساس است و در صورت وجود دادههای ناقص یا دادههـای دارای پراکنـدگی زیـاد از توانـایی آنهـا برای یافتن رابطه بین ورودی و خروجی کاسته خواهد شد.[9] همچنین در سیستمهای فازی وقتی که از یک سری داده بـا تعـداد زیـاد و یکنـواختی بـالا استفاده میشود، از کارایی آن کاسته میشود. در واقع در نقطه مقابل سیستمهای عصبی، منطق فازی بیشتر در مورد دسته دادههایی بـهکار مـیرود کـه در آنها، حالتی از ابهام و یا نقص وجود داشته باشد؛ زیرا این سیستمها با استفاده از قوانین اگر و آنگاه بهراحتی می توانند شـرایط حـاکم بـر دسـته دادههـا را مدلسازی نمایند و قوانین منظمی را از یک سری داده ناقص و مبهم استخراج کند. ولی مشکلی که به صورت عمده درگیرکاربرد سیستمهای فازی است، مسئله توابع عضویت میباشد. بنابراین، ترکیب و استفاده همزمان از تواناییهای موجود در شبکه عصبی و منطق فازی میتواند نویدگر نگرشی جدید برای برخورداری از مزیتهای آنها و رفع نقاط ضعف موجود باشد. به این منظور، پروفسور جنگ در سال 1993 میلادی مدل ANFIS را ارائه کرد که قابلیت ترکیب تواناییهای دو روش مذکور را داشتANFIS .[10] قابلیت خوبی در آموزش، ساخت و طبقهبندی دارد و هم چنین دارای این مزیت است کـه اجازه استخراج قوانین فازی را از اطلاعات عددی یا دانش متخصص میدهد و به طور تطبیقی یک قاعده میسازد. علاوه بر این، میتوانـد تبـدیل پیچیـده هوش بشری به سیستمهای فازی را تنظیم کند. ساختار این الگوریتم در شکل 2 نشان داده شده است:[11]

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید