بخشی از مقاله
تشخيص چهره با استفاده از شبکه عصبي
چکيده
دراين مقاله سعي شده است که با بهره گيري از مزاياي سيستم هاي ترکيبـي آنـرا در تـشخيص چهـره کـه يکـي از مهمترين بيومتريک هاي مطرح مي باشد و درسالهاي اخير توجه ويژه اي به آن شده است ، استفاده گردد. سيستم پيشنهاد شده يک سيستم ترکيبي با معماري موازي و در سطح گمان است که از امتيازات تطبيقي سه الگوريتم استخراج کننـده ويژگي مطرح در تشخيص چهره يعني PCA ،LDA و گابور براي ترکيب استفاده مي نمايد. براي ترکيب امتيازات از يک شبکه عصبي از نوع Feed Forward Back Propagation استفاده شده است .نتايج نشان م ي دهـد کـه اسـتفاده از سيستم ترکيبي در کاهش تا ير عوامل خارجي نظير روشنايي و تغييرات ناشي از حالت وژسـت بـرروي الگـوريتم هـاي مختلف موثر بوده ونتايج را بهبود مي بخشد.
واژگان کليدي
تشخيص چهره ، ترکيب دسته بندي ، سطح گمان ، شبکه عصبي ، گابور،PCA،LDA
١- مقدمه
بيومتريک نمونه اي از فناوري هاي نوظهور در عرصه دنياي ارتباطات و اطلاعات است که به عبارتي مي توان گفت ، کليد ورود به دنياي اطلاعات و کنترل ارتباطات مي باشد. در گزارش ژانويه سال ۲۰۰۰ دانشگاه MIT از بيومتريک به عنوان يکي از ۱۰ فناوري جديد، که دنيا را تغيير خواهد داد، نام برده شده است .
اجراي پروژه هاي عظيم امنيت بيومتريکي در جهان نمايان گر اهميت اين فناوري در ارتباطات آينده بين المللي مي باشد.
بطوريکه هرروز شاهد آن هستيم که بر گستره روشها و کاربردهاي اين فناوري افزوده مي شود و اخبار تازه اي دراين زمينه منتشر مي گردد.
اين مقاله با عنوان ترکيب دسته بندي کننده ها در سطح گمان براي تشخيص چهره ، سعي در معرفي مختصر روشهاي تشخيص هويت با استفاده از بيومت يک چهره و استفاده از ترکيب دسته بندي کننده ها در شناسايي چهره دارد.
بيومتريک بعنوان يکي از ابزارهاي تشخيص و شناسايي هويت فردي همواره مورد توجه بوده است . از آنجايي که تشخيص هويت بصورت يکي از الزامات دنياي امروز مطرح است و در
بسياري از زمينه ها خودنمايي مي کند به همين نسبت بيومتريک نيز بعنوان ابزار تشخيص مورد توجه خاص مي باشد.
سيستمي که در اين مقاله براي تشخيص چهره پيشنهاد شده است يک سيستم ترکيبي با معماري موازي و در سطح گمان مي باشد.اين سيستم ، متشکل از سه زير سيستم منفرد تشخيص چهره است که نتايج حاصل ازآنها، بصورت امتيازات تطبيقي ، توسط يک شبکه عصبي از نوع Feed Forward Back Propagation با يکديگر ترکيب شده و يک نتيجه نهايي حاصل مي گردد.شکل (۱) طرح شماتيک سيستم پيشنهادي را نشان مي دهد.
شکل (۱) طرح شماتيک سيستم ترکيبي پيشنهاد شده براي حل مسئله تشخيص چهره
در اين سيستم ، هر يک از الگوريتم هاي PCA،LDA و Gabor جهت استخراج ويژگي ها از فضاي داده آموزشي و تصوير آزمايشي (تصويري که تشخيص هويت آن مورد نظر مي - باشد) مورد استفاده قرار مي يرند سپس فاصله بين ويژگي هاي هر کلاس از تصاوير چهره آموزشي و تصوير مورد آزمايش ، محاسبه مي گردد. الگوريتم هاي متفاوتي مي تواند جهت محاسبه اين فاصله مورد استفاده قرار گيرد که در اين مقاله ، محاسبه فاصله اقليدسي براي الگوريتمهاي PCA و LDA و محاسبه نوعي تابع تشابه که در ادامه مطرح مي گردد، براي الگوريتم گابور پيشنهاد شده است . امتيازات حاصل از عمل تطابق بعد از رماليزاسيون توسط يک شبکه عصبي به تشخيص نهايي مي - انجامد.
۲- روش تجزيه به مولفه هاي اصلي
سيستم تشخيص چهره مبتني بر تصاوير ويژه ،را مي توان به دو بخش اساسي ايجاد تصاوير ويژه پايه و تشخيص ويا شناسايي يک چهره جديد تقسيم نمود
۲-۱ چهره ويژه
تکنيک چهره ويژه هنوز هم ي ک راه حـل سـاده و قدرتمنـد براي حل مسئله پيچيده تشخيص چهره مي باشد. درحقيقت ، اين روش بهترين راه حسي براي طبقه بندي يـک چهـره مـي باشـد.
همانطوريکه نشان خواهيم داد، تکنيـک هـاي قـديمي تـر بـرروي ويژگي هاي بخصوصي از چهره متمرکز شده است [١].
تکنيک چهـره وي ژه از اطلاعـات بيـشتري در طبقـه بنـدي چهره ها بر اساس الگوي چهره عمـومي اسـتفاده مـي کنـد. ايـن الگوها شامل خصيصه هاي بخصوص چهره است که بـه آنهـا نيـز محدود نمي شود. روش چهره ويژه با استفاده از اطلاعات بيـشتر، بطور طبيعي از کارايي بالاتري نـسبت بـه روش هـاي تـشخيص مبتني بر خصيصه برخوردار است .
چهره ويژه ، اساسا چيزي بيش از بردارهـاي پايـه بـراي يـک چهره واقعي نمي باشد. اين مطلب مي تواند بطور مستق م يکي از
مفاهيم اساسي مهندسي الکترونيک به نام آناليز فوريه را تـداعي نمايد. آناليز فوريـه نـشان مـي دهـد کـه جمـع جمـلات وزن دار سينوسي در فرکانسهاي متفاوت ، مي تواند يک سـيگنال را بطـور کامل بازسازي نمايد. بهمين ترتيب ، يک جمع از چهره هاي ويژه مي تواند بطور يکپارچه يک چهره خـاص را بازسـازي نمايـد [١]. فهميدن اينکه چهره هاي ويژه چه هستند معمـاي ايـن تکنيـک است .
۲-۲ آناليز تفکيک خطي فيشر
در روش PCA بيشترين دقـت بـر ي ارائـه مجموعـه اي از داده در يک فضاي کوچکتر جستجو مي گردد. دراين روش داده ها درجهت بيشترين اختلاف ( واريانس ) برروي يک خط تصوير مي - گردند [٣][٢][١] . اما ممکن است اين جهت براي طبقه بنـدي دسته ها مفيـد نباشـد. شـکل (۲) مجموعـ اي از داد هـا کـه در دوکلاس قرار گرفته اند نشان داده شده است . مـشاهده مـي شـود بيشترين اختلاف در ر دسته در راسـتاي عمـود مـي باشـد امـا نتيجه تصوير داده ها در اين راستا باعث تفکيک دسـته هـا نمي - گردد.
شکل (۲) درروش PCA تصوير درجهت بيشترين واريانس منجر به تفکيک دسته ها نمي گردد.
در تفکيک کننـده خطـي فيـشر(FLD) داده هـا درجهتـي برروي يک خط تصوير مي گردد کـه منجـر بـه تفکيـک تـصاوير دسته ها برروي خط شود. ايده اصلي در ايـن روش يـافتن خطـي است که نمونه هاي متعلق به دسته هاي مختلف بخوبي از يکديگر جدا شوند [٣] [٢] .
شکل (۳) مقايسه نت يج حاصل از انتخاب خط تفکيک کننده
۲-۳ آناليزموجک گابور در تشخيص چهره
استفاده از ويژگي هاي محلي ، يک روش تکامل يافته در مسئله تشخيص چهره است [٥][٤]. يکي از انگيزه هاي اصلي در استفاده از روشهاي مبتني بر ويژگي ، ارائه تصاوير چهره بصورت خيلي فشرده است . از اينرو احتياجات به حافظه را کاهش مي دهد. اين حقيقت بخصوص زمانيکه از بانک اطلاعاتي چهره بزرگي استفاده مي گردد اهميت زيادي مي يابد. روش هاي مبتني بر ويژگي بر پايه يافتن نقاط ثابتي (ويا مناطق محلي ) بر روي چهره و ارائه اطلاعات متناظر با اين نقاط با يک روش مؤثر است اما انتخاب مناسب مکان هاي ويژگي و مقادير متناظر با آن براي کارايي سيستم تشخيص بشدت بحراني وبا اهميت است . طبيعت جستجوگر براي يافتن پاسخ ، پژوهشگران را به بررسي رفتار سيستم بينايي انسان سوق داده است .
مطالعات فيزيولوژيکي ، سلولهاي ساده اي را در قشر بينايي انسان يافته است که با فرکانس فضايي ونيز موقعيت قرارگيري بصورت قابل انتخاب وفق يافته است . پيشنهاد شده است که پاسخ يک سلول ساده مي تواند با فيلترهاي دوبعدي گابور تقريب زده شود [٦].
در طول سالهاي اخير، يافته ها نشان مي دهد که استفاده از فيلترهاي گابور بعنوان يک سيستم تشخيص چهره نهايي مي - تواند بسيار موفقيت آميز باشد [٨][٧][٤]. يکي از موفق ترين روش هاي تشخيص چهره ، مبتني بر تطبيق گراف ضرايبي است که از پاسخ هاي فيلتر گابور بدست آمده است [٩] [٨] . اما چنين الگوريتم هاي تطبيق گراف اشکالاتي که ناشي از پيچيدگي انطباق آنها، موقعيت يابي دستي در آموزش گراف ها وبطور کلي زمان بالا، مي شوند را تحميل مي نمايند. در اين روشها از يک ساختار عمومي چهره براي توليد گرافها استفاده مي گردد. يک روش جديد مبتني برگابور قادر است تا چنين اشکالاتي را برطرف نمايد.
توابع دو بعدي گابور لبه اشکال همچنين گودي ها و برآمدگي هاي تصوير را تقويت مي نمايد. افزايش تمايز چشم ها، دهان ، بيني که بعنوان نقاط مهم و اساسي چهره مطرح هستند، از تأثيرات اين توابع است . علاوه بر اين خصوصياتي مانند خالها، گوديهاي صورت ، اثر زخمها و مواردي از اين نوع برجسته مي - شوند. از اينرو با استفاده از چ ين نقاط برجسته اي بعنوان موقعيت هاي حاوي ويژگي ، براي هر تصوير مبتني برصورت يک نقشه ويژگي حاصل مي گردد و هر چهره مي تواند با استفاده از خصوصيات مربوط به خود، بدون محدوديت هاي اوليه ارائه گردد. داشتن نقشه ويژگي تخصيص داده شده براي هر چهره ، اين روشها را قادر مي سازد تا اطلاعات کلي چهره را بعد از تقويت خصوصيات محلي حفظ نمايد.
در اين مقاله يک روش جديد براساس انتخاب نقاط ماکزيمم (نقاط تقويت شده )، از پاسخ هاي موجک گابور بعنوان نقاط حاوي ويژگي بجاي استفاده از نقاط گرافهاي از پيش تعريف شده در تطبيق گراف کشسان که قابليت هاي نمايشي موجک گابور را کاهش مي دهد [٨]، يشنهاد شده است . بردارهاي ويژگي با نمونه گيري از ضرايب تبديل موجک گابور در نقاط حاوي ويژگي بدست مي آيند.
۳- ترکيب در سطح گمان
ترکيب در سطح گمان ، در واقـع ترکيـب امتيـازات تطبيقـي جداگانه اي است که از هريک از دسته بندي کننده ها بدست آمده اســت . در ايــن روش در هرســطح مجموعــه اي از حــسگرها و استخراج کننده هاي ويژگـي ، بـصورت مـستقل از هـم اطلاعـات مربوط به ويژگي هاي فردي را بصورت يک بردار ويژگي به طبقـه دسته بندي کننده ها ارائه مي دهد. هردسته بندي کننده متناسب با الگوريتم خود، و مقايسه بردار ويژگـي بدسـت آمـده بـا بـردار ويژگي قالبها، نتيجه اي را بصورت يک امتياز تطبيقي ارائه مـي - کند که اين امتيازات ، جهت تصميم گيـري بـا يکـديگر ترکيـب مي گردند و درنهايت يک خروجي از طبقه تصميم سازي حاصـل مي گردد. شکلهاي (۴) و (۵) بلـوک ديـاگرام ترکيـب در سـطح گمان را نشان مي دهد.
شکل (۴) دياگرام سيستم ترکيبي در سطح گمان
شکل (۵) سيستم ترکيبي در سطح گمان
۴- شبکه عصبي
همانطوريکه در معرفي سيستم تـشخيص چهـره پيـشنهادي بيان گرديد( شکل (۱) ).نتايج حاصل از الگوريتمهـاي اسـتخراج ويژگـي PCA ،LDA و Gabor هـر کـدام بـصورت جداگانـه آموزش ديده و ويژگيهاي مربوط به چهره هـاي شـناخته شـده را استخراج مي نمايند. در مرحله بعد اين اطلاعات براي مقايـسه بـا ويژگيهاي بدست امده از يک چهره ناشناس مـورد اسـتفاده قـرار مـي گيرنـد. در روش هـاي PCA و LDA مقايـسه ويژگيهـاي بدست آمده از چهره هاي ناشناخته با هريک از چهره هاي شناخته شده در بانک اطلاعات تصويري آموزشي بصورت فاصله اقليدسي بين تصوير چهره تصوير ناشناخته بـرروي خـط تفکيـک کننـده PCA يا LDA (ويژگيهاي چهره ناشـناس ) و تـصوير تـک تـک چهره هاي بانک داده آموزشي برروي اين خط انجام مي گيرد و در روش گابور مقايسه با بدست آوردن مقادير تابع تشابه متنـاظر بـا هر تصويرآموزشي انجام مي پذيرد. ايـن نتـايج در يـک سيـستم منفرد مستقيما براي تشخيص نهايي مورد استفاده قرار مي گيـرد اما دراين جـا ايـن نتـايج دسـته بنـدي کننـده هـا بعـد از انجـام نرماليزاسيون براي ترکيب به يک شـبکه عـصبي از نـوع Feed Forward Back Propagation منتقل مي گردد.
شبکه عصبي پيشنهادي متشکل از سه لايه ورودي ، مياني و خروجي مي باشد(شکل (۶)).لايه ورودي داراي سه نرون مي باشد که مقادير متناظر با هريک از کلاسه بندي کننده هاي Gabor PCA,LDA , را دريافت مي نمايد. لايه خروجي بـا ي ک نـرون ، يک نتيجه نهـايي بـين ٠ و ١ را برمـي گردانـد. مقـدار بيـشينه خروجي بيانگر نزديکترين تصوير از مجموعه آموزش بـه تـصوير ي ناشناخته مي باشد.
شکل (۶) شبکه عصبي از نوع Feed Forward Back Propagation
۵- نتايج
تاکنون ديديم ترکيب دسته بندي کننده ها يکي از روشهاي جديد در افزايش کارايي و دقت سيستم هاي منفرد است . در سيستم ترکيبي پيشنهادي الگوريتم هاي متفاوت از يک بيومتريک ، يعني چهره براي تشخيص مورد استفاده قرار گرفت و نتايج حاصل از آنها در سطح گمان و بصورت ترکيب امتيازات با يکديگر ترکيب گرديد. و در فاز آموزش ، نسبت به فضاي چهره آموزشي ، آگاهي پيدا نمود. در اين قسمت بررسي خواهيم کرد که پاسخ سيستم در مسئله تشخيص چهره و حالت آن ، چگونه عمل مي کند. بنابراين سيستم ترکيبي را در تشخيص هاي متفاوت مورد آزمايش قرار مي دهيم و نتايج حاصل بيانگر آن خواهد بود که کارايي و دقت سيستم افزايش يافته است يا خير.
۵-۱ طرح فضاي آزمون تشخيص چهره
براي دستيابي به نتايج مورد نظر فضاي آزمايش مي بايست مشخص و معين گردد. تا پاسخ سيستم در حالت هاي مختلف مورد بررسي قرار گيرد و مشخص گردد که حساسيت سيستم نسبت به تغييرات مختلف چهره که محدوده وسيعي را در بر مي گيرد چگونه است . در کنار نتايج سيستم ترکيبي ، نتايج هر يک از سيستم هاي منفرد نيز مطرح خواهد شد تا ديد بهتري نسبت به کارايي سيستم ترکيبي حاصل گردد.
بطور کلي فضاي آزمون به پنج حالت مختلف تقسيم بندي شده است که در هر حالت تعدادي نمونه آزمايشي انتخاب
گرديده است . پنج حالت مورد نظر عبارتند از:
۱- استفاده از تصاوير مجموعه چهره آموزشي
۲- تصاوير چهره با حالتهاي مختلف چهره
۳- تصاوير چهره با عينک
۴- تصاوير چهره که قسمتي از آن پوشيده شده است .
۵- تصاوير چهره نويزي
۵-۱-۱ استفاده از تصاوير مجموعه چهره آموزشي
دراين بخش ساده ترين آزمون در مسئله تشخيص مورد نظر است . بدين ترتيب که تصاوير چهره اي که به سيستم آموزش داده شده است بعنوان چهره ناشناس به سيستم معرفي مي گردد. جدول (۱) نتايج حاصل ازاين آزمايش را نشان مي دهد.
جدول (۱) نتايج سيستم تشخيص دراستفاده از تصاوير
مجموعه چهره آموزشي
نتايج نشان مي دهند که هم الگوريتم هاي منفرد و هم سيستم ترکيبي تمامي آزمايشات اين قسمت را با موفقيت به انجام رساندند.
۵-۱-۲ تصاوير چهره با حالتهاي مختلف چهره
همانطور که قبلا نيز بيان گرديد يکي از چالشهاي سيستم تشخيص چهره گستردگي تغييرات چهره است که تفاوتهاي زيادي را در يک کلاس ايجاد مي کند. در اين قسمت از آزمايش تصاوير چهره با حالتهاي مختلف احساسي نظير شادي ، تعجب ، غمگين و خواب و ... جهت تشخيص به سيستم اعمال مي - گردد.(شکل (۲))