بخشی از مقاله
چکیده
یکـی از ابـزارهای هـوش مصنوعی شبکه های عصبی مصنوعی است که امروزه مورد توجه بسیاری از محققان و دانش پـژوهان می باشد. بدلیل قابلیت های فراوان این ابزار در کاربردهای مختلف، مدل های گوناگونی برای آن طرح شده است که یکـی از ایـن مـدلها، شبکههای پرسپترون چند لایه پیشرو است که با الگوریتم پس انتشار خطا آموزش داده میشوند. در ایـن مقالـه هـدف، اسـتفاده از ایـن شـبکه هـا جهـت تشـخیص جنسیت افراد از روی چهره می باشد. نتایج بدست آمده در آزمایشـات انجـام گرفته موید آن است که بین ٨٥% الی ٩٥% تشخیص چهره های ناآزموده با موفقیت انجام گرفته که نشان دهـنده توانایـی مناسب شبکه های پرسپترون چند لایه ای در حل مساله تشخیص جنسیت و مسائلی از این قبیل میباشد.
در ایـن روش از روشهـای پـردازش چهره بعنوان پیش پردازش تصاویر استفاده شده است. همچنین با مقایسه این روش با سایر روشها نظیر استفاده از حافظه خود القاﺀ وآنالیز مولفههای اصلی چهره به کارایی این روش میتوان پی برد.
کلـید واﮊگـان: شـبکه هـای عصـبی پرسپترون چند لایه پیشرو، پردازش تصویر، پس انتشار خطا، آنالیز مولفه های اصلی،
حافظه خود القاﺀ.
١- مقدمه
روش الگوریتمیک در پردازش اطلاعات که به محاسبه برنامه ریزی شده مشهور است، جهت حل مسائلی که رویه ای مناسب جهـت حـل آن اسـتنتاج مـی شـود، مناسب می باشد. در مسائلی که نتوان رویهای مشخص ارائه داد و یا آنکه اطلاعات ما از دانـش مسـئله آنقـدر کـم باشد که راه حل دقیق مسئله ممکن نباشد، استفاده از روش الگوریتمیک مناسب نبوده و باید از روش هـای غیر الگوریتمیک بهره جست. یکی از این روش ها استفاده از شبکه های عصبی مصنوعی است که در آن به دانش قواعـد حـاکم بـر مسـئله نـیاز نیست، و در حل مسائلی نظیر پردازش چهره و تشخیص آن که الگوریتم مشخصی برای آن وجود ندارد، میپردازد.
بدلیل عدم شناخت کافی، تشخیص مشخصه های چهره توسط ماشین به سادگی قابل انجام نیست. تشخیص جنسیت اشـخاص از روی چهـره با استفاده از ANN مشکل فوق را نداشته و استخراج ویژگیهای مطلوب به عهده شبکه میباشد. در بخـش هـای بعـدی کارهـای انجـام شـده در حـوزه تشـخیص چهـره را بـیان نموده و سپس آزمایشات انجام شده به روش شـبکه های پرسپترون چند لایه با الگوریتم پس انتشار را روی تصاویر جمع آوری شده بیان نموده، در پایان به تشریح
نتایج مربوطه می پردازیم.
٢- روش غیر الگوریتمیک (روش مبتنی بر استفاده از شبکه عصبی)
بـر خـلاف روش الگوریتمـیک، کـه در آن غالـباﹰ از مشخصـات هندسی چهره استفاده می شود، روش مبتنی بر شبکه های عصـبی مسـتقیماﹰ بـرروی چهـره و اطلاعـات آن عمـل مـی کـند (شدت نور پیکسل های تصویر دو بعدی). لذا در این روش اطلاعـات هندسـی تصـویر بطـور ضـمنی ذخـیره مـی شـود، بعـلاوه آنکه بافت و جزئیات تصویر نیز حفظ می گردد. یکی از مشـکلات این روش حساس بودن به تغییرات شرایط روشنایی محیط، جهت یابی سر و اندازه تصاویر مختلف افراد می باشد.
لذا در این مقاله برای جلوگیری از بروز این مشکل یک مرحله پیش پردازش برروی تصاویر (شامل نرمال سازی،تغییر اندازه، ودوران و ...) ضـروری اسـت، ایـن عمـل می تواند به روشی نسبتاﹰ مشخص مشابه الگوریتم های پیدا کردن خودکار موقعیت صورت در تصویر و مقیاس بندی ا نجام گیرد . [1,2,3]
٣- دستهبندی روش های مبتنی بر شبکه عصبی جهت پردازش چهره
دو گـروه عمـده از شبکه های عصبی جهت شبیه سازی یادگیری تصاویر چهره مورد استفاده قرار گرفته است که گروه اول، شـبکه هـای خودالقـاﺀ خطی می باشندکه به عنوان آنالیزگر مولفه های اصلی١ شناخته شده اند. این شبکه ها برای کاربردهای مختلف از قبیل بازشناسی و دسته بندی تصاویر براساس جنسیت مورد استفاده قرار گرفته اند و در گروه دوم شبکههای خود القـای سـه لایـه غـیر خطـی مـی باشـند که باالگوریتم پس انتشار خطا٢ آموزش دیدهاند، و به عنوان شبکههای فشرده ساز شناخته شده اند. این شبکه ها طوری آموزش می بینند که ورودی خود را پس از عبور از یک کانال باریک در خروجی مجدداﹰ بازسـازی مـی نمایـند. از لایـه های میانی این شبکه بعنوان یک فشرده ساز استفاده می شود. خروجی لایه میانی به عنوان ورودیهای یک شبکه دیگر مورد استفاده قرار میگیرند که شبکه ثانویه عمل بازشناسی و دستهبندی را به عهده دارد.[4,5,6]
٣-١- شبکه های پس انتشار خطا و فشرده سازی تصویر
برخلاف شبکه های خطی خود القا که در آن واحدهای ورودی مستقیماﹰ به واحدهای خروجی متصل هستند، شبکههای پس انتشار دارای واحدهای مخفی غیر خطی بین لایه ورودی و لایه خروجی میباشند.
الگوریتم پس انتشار در ابتدا توسط Werbos پیشنهاد شد و سپس مستقلاﹰ توسط محققان دیگری مانند Parker ، Rumelhart و Hinton معرفی گردید. این الگوریتم به راحتی توسط معادلات ماتریسی قابل توصیف میباشد.
٣-١-١- توصیف الگوریتم
نشانه های مورد استفاده به قرار زیر میباشند:
K امیـن تصویر با I مشخصه توسط برداری I*1 به نام Xk نشان داده میشود. پاسخ واحدهای پردازشی مخفی به K
امیـن تصـویر بـه وسـیله برداری L*1 به نام hk نمایش داده می شود که L نمایش دهنده تعداد واحدهای پردازشی مخفی مـیباشـد. پاسـخ واحدهای خروجی به نام K امین تصویر توسط برداری J*1 به نام Ok نمایش داده میشود که J نمایش دهـنده تعـداد واحدهای خروجی می باشد