بخشی از مقاله
خلاصه
شناسایی چهره یکی از مسائل کاربردی در تجهیزات صنعتی و همچنین در تجهیزات امنیتی می باشد. با اینکه تجهیزات صنعتی هنوز وابسته به انسان است و ربات ها نتوانسته اند جای آن را بگیرند با این حال در این دستگاه ها می توان از بینایی مجازی در کنترل بعضی از فرایندها که امکان به کارگیری ربات وجود ندارد استفاده کرد. در تجهیزات امنیتی مانند تشخیص افراد از روی چهره، عنبیه و ژست های صورت که دقیقا می تواند مختص به یک شخص باشد، نیز این موضوع مطرح است.
امروزه پردازش تصویر بهترین ابزار برای استخراج ویژگی ها و تحلیل موقعیت و در نهایت تصمیم گیری صحیح در این زمینه می باشد.در این مقاله تشخیص چهره با استفاده از شبکههای کانولوشنال با ویژگیهای ویولت انجام شده است. نتایج شبیهسازی کارآمدی روش پیشنهادی در سه آزمایش متفاوت نشان و اعتبارسنجی میکند.
.1 مقدمه
رد پای پردازش تصویر در بسیاری از علوم و صنایع مشاهده میشود و بعضی از این کاربردها آنچنان به پردازش تصویر وابستهاند که بدون آن از اجرای اهداف خود باز میمانند. کاربرد پردازش تصویر در هر زمینهای، بسیار گسترده میباشد، پردازش تصویر به روشهایی که به کمک آنها میتوان معنی و محتوای تصاویر را درک کرد، میپردازد.
هوش مصنوعی، دانش ساختن ماشینها یا برنامههای هوشمند است. همانگونه که از تعریف فوق که توسط یکی از بنیانگذاران هوش مصنوعی ارائه شده است برمیآید، ساختن ماشینهای هوشمند مستلزم داشتن برنامههایی هوشمند میباشد. با اینکه مدت زمان زیادی از اولین پروژههای مربوط به پردازش تصویر نمیگذرد، پیشرفت زیادی در این زمینه حاصل شده است. بهطوری که ترقی سطح برنامهنویسی در هر دوره با دوره قبل کاملا مشهود است. در این پژوهش سعی داریم روشی نوین برای تشخیص و تعیین محل چهره در تصاویر و با استفاده از شبکههای عصبی ارائه داده که میتواند مبنای تصمیمگیری دقیقی برای نرمافزارها یا سختافزارها باشد.
از سوی دیگر، چهره نقش اساسی را در شناسایی افراد و نمایش احساسات آنها در سطح جامعه دارد. توانایی انسان در تشخیص چهرهها قابل توجه است. ما میتوانیم هزاران چهرهی یاد داده شده در طول عمرمان را تشخیص داده و در یک نگاه چهرههای آشنا را حتی پس از سالها جدایی، شناسایی کنیم. این مهارت در مقابل تغییرات در شرایط دیداری مانند حالت چهره، سن و همچنین تغییراتی در عینک، ریش یا سبک مدل موها ایستادگی میکند. تشخیص چهره یک موضوع مهم در کاربردهایی همچون سیستمهای امنیت، کنترل کارت اعتباری و شناسایی مجرمان شده است. بهطور مثال، قابلیت مدل کردن یک چهرهی خاص و تمیز دادن آن از تعداد فراوان از مدلهای چهرهی ذخیره شده، شناسایی مجرمان را بهصورت گستردهای بهبود خواهد بخشید.
در سالهای اخیر روشهای مختلفی برای استخراج ویژگیهای مهم وموثر جهت شناسایی چهره، مورد بررسی قرار گرفته است، این روشها به سه دسته کلی تقسیمبندی میشوند:
· ویژگیهای ظاهری
ویژگیهای ظاهری شامل مختصات اجزاء چهره، مانند چشمها، بینی، حلقهها، بافتها ونواحی مختلف چهره میباشد که همان خصوصیات ظاهری چهره هستند. در استخراج این خصوصیات از تصویر محدودیتهای فراوانی وجود دارد. در ادامه با این مهم بیشتر آشنا خواهیم شد.
· ویژگیهای جبری
هر تصویر میتواند بصورت یک ماتریس تلقی شده و سپس عملیات جبری و تبدیلات ریاضی مختلف بر روی آن اعمال گردد. ویژگیهای جبری، حاصل این فرایند بود و عموما نشانگر خواص ذاتی یک تصویر میباشد. ازعملیات مهم بر روی ماتریس تصویر، تحلیل مولفههای اساسی - تبدیل - PCA میباشد. این تبدیل یکی از روشهای مهم برای استخراج ویژگیهای جبری از تصویر چهره میباشد، که بر مبنای بردارهای ویژه ماتریس کواریانس بنا نهاده شده است.
بردارهای ویژه ماتریس، بیان کننده توزیع جبری ماتریس وثابتهای هندسی بوده و میتواند برای استخراج ویژگی از تصویر بکاربرده شود. از دیگر روشهای جبری، روش تجزیه مقادیر منفرد SVD میباشد. میتوان نشان داد که تجزیه مقادیر منفرد ماتریس یکی از روشهای موثر برای استخراج ویژگی ازماتریس تصویر است. تجزیه مقادیر منفرد در فشردهسازی و پردازش سیگنال نیز مورد استفاده قرار میگیرد. روش تجزیه مقادیر منفرد و تحلیل مولفههای اساسی در ادامه مورد بررسی قرار گرفتهاند
· ویژگیهای آماری نقاط تصویر
با توجه به دو بعدی بودن تصاویر و در نظر گرفتن نقاط تصویر به صورت دادههای آماری، میتوان از مشخصات آماری نقاط، برای توصیف تصویر استفاده کرد. در این روش معمولا از خصوصیاتی استفاده میشود که دارای توانائی کافی برای توصیف تصویر بوده وضمن غنای اطلاعاتی، از پایداری خوبی نیز برخوردار باشد. یکی از روشهای آماری مهم استفاده از روش خود بستگی موضعی با درجه بالا میباشد. ویژگیهای استخراج شده از تصویر بصورت بردار در نظر گرفته میشود. اگر بردارهای استخراج شده از تصاویر دارای ابعاد زیادی باشند، باید کاهش بعد داده شوند تا جداپذیری و طبقهبندی کلاسها بهتر گردد.
روش کاهش بعد و جداپذیرتر کردن کلاسها نیز در ادامه ارائه شده است. تعداد افراد قابل بازشناخت را روش مورد استفاده در استخراج ویژگی از تصویر و دقت لازم برای بازشناخت تعیین میکند و هر قدر روش استخراج ویژگی از چهره کاراتر باشد، میتوان تعداد بیشتری از افراد را مورد شناسایی قرار داد. اما عموما در تمام روشهای موجود، باز شناخت برای تعداد محدودی از افراد انجام میگیرد.
تصاویر چهره دارای ابعاد 128*128 نقطه بوده و هر نقطه توسط یک بابت بیان میگردد. به عبارتی تصاویر دارای 256 سطح روشنایی میباشند. فاصله دوربین تا چهره تصویربرداری شده تقریبا ثابت در نظر گرفته شده است و اختلاف در فاصله تصویر برداری از افراد، حداکثر 40 سانتیمتر میباشد. البته برای تصاویر گرفته شده از یک شخص، این تقریب به 20 سانتیمتر محدود میشود. در مورد شدت نور تصاویر و تغییرات نور در تصویربرداری، چون تصاویر در روزهای مختلفی گرفته شده، نور تمامی تصاویر دقیقا یکسان نیست. اما برای تصاویر گرفته شده از یک نفر، به دلیل اینکه تصاویر در یک محیط ثابت ودر فاصله زمانی کم گرفته شده است، تغییرات نور کم بوده ومیتوان از آن صرف نظر کرد - در گرفتن تصاویر از نور فلاش استفاده شده است - .
دسته تصاویر مربوط به یک نفر، شامل تصویر چهره در حالت تمام رخ، چرخش چهره به اطراف، چشمهای بسته، لبخند و حالتهای مختلف چهره میباشد. درتهیه بانک تصویر سعی شده از انواع چهره و افراد مختلف استفاده شود. پس از تهیه بانک تصویر، از تصاویر اشخاص موجود در بانک تصویر، ویژگیها استخراج شده وکاهش بعد داده میشوند. واضح است که ویژگیهای استخراج شده و کاهش بعد یافته، در بانک دیگری، که بانک ویژگیهای استخراج شده نامیده میشود، ذخیره میگردد.
هدف پروژه شناسایی یک چهره است. بنابراین در مرحله اول این شناسایی که پروژه فعلی بر اساس آن تعریف گشته است، از مرحله تفکیک که چهره را از میان اجزاء دیگر موجود درتصویر منفک مینماید صرف نظر میگردد. این موقعیت مشابه با وضعیتی است که فردی به یک در بسته نزدیک میشود و قرار است قبل از رسیدن به در مورد شناسایی قرار گیرد. دوربین از چهره وی تصویر برداری کرده تا بازشناخت را بهوسیله سیستم انجام دهد، سپس دستورات بعدی مثلا باز شدن در ورودی انجام شود، دراین حالت تصاویر پشت سر فرد میتواند سفید در نظر گرفته شود.
این محدودیت در تعریف بازشناخت باعث میگردد که در تصویر برداری از چهره محدودیتهایی اعمال گردد. از جمله این محدودیتها ثابت بودن زمینه تمام تصاویر میباشد، لذا پس از تصویر برداری زمینه تصویر سفید و اطلاعات اضافی از قبیل شانهها و گردن تا حد ممکن حذف میگردد. واضح است هر قدر اطلاعات اضافی وناخواسته در تصویر چهره کمتر باشد، ویژگی استخراجی دارای پایداری بیشتری میباشد
· مدل سیستم بازشناخت:
برای بازشناخت یک تصویر ورودی، ابتدا از تصویر بردار ویژگی استخراج میشود - باید ویژگی استخراج شده با روش استخراج ویژگی از تصاویر موجود در بانک ویژگی مطابقت داشته باشد - . سپس بردارهای استخراجی کاهش بعد داده می-شود. در کاهش بعد جداپذیری کلاسها و طبقهبندی آنها بهتر میگردد. سپس ویژگی دسته موجود در بانک ویژگی مشخص میشود.
حال یکی از دستههای موجود در بانک ویژگی انتخاب شده، باید مشخص کرد که آیا تصویر ورودی متعلق به همین کلاس است - شخصی که ویژگیهای موجود در بانک متعلق به آن شخص است - یا اینکه تصویر ورودی اصلا در بانک تصاویر نبوده وکاملا جدید است. لذا یک سطح آستانه برای فاصله و متناسب با ضریب اطمینان لازم برای بازشناخت تصویر جدید بکار برده شده و به این صورت عمل میگردد که اگر فاصله بردار ویژگی استخراج شده از تصویر جدید تا نزدیکترین بردار ویژگی موجود در بانک، در حد قابل قبولی بود، تصویر جدید متعلق به آن کلاس تشخیص داده میشود و در غیر اینصورت تصویر جدید قابل شناسایی - باز شناخت - نمیباشد.
اگر برای ویژگی مربوط به فردی که تصویر ورودی متعلق به وی است[6-7]، در بانک باشد و باز شناخت انجام نشود. به این معنی است که ویژگیهای استخراجی از تصویر جدید، با ویژگی استخراجی از تصاویر آموزشی متفاوت است. با تغیر تصویر چهره یک شخص ویژگیهای استخراجی تغییر میکند، اما اگر روش استخراجی به گونهای باشد که تغییرات در تصویر فرد، تاثیر زیادی بر بردار ویژگی مربوط به وی نداشته باشد. ویژگی استخراجی موثرتر و پایدارتر بوده و میتوان حالتهای متفاوتتری از چهره را مورد باز شناخت قرار داد.
ساختار این مقاله نیز بدین ترتیب است که در بخش دوم مقاله شبکه عصبی کانولوشنال میپردازد. در بخش سوم معرفی و مدل پیشنهادی، در بخش چهارم شبکه عصبی، ارائه و نتایج شبیهسازیها و نتیجهگیری نیز در بخشهای 5و 6 بیان شده است.