بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

تشخیص چهره انسان براساس مدل رنگ پوست و تصویر باینری با استفاده از فضای رنگ RGB و HSV

چکیده
تشخیص چهرهی انسان پایهی تمام سیستمهای پردازش چهره میباشد. در این مقاله یک روش جدید و سریع برای تشخیص چهرهی انسان پیشنهاد شـده است که میتواند به سرعت مکان چهره ی انسان را در تصویر ورودی مشخص میکند. روش پیشنهادی شامل سه قسمت عمـده مـیباشـد. در قسـمت اول، منـاطق پوست با استفاده از فضای رنگ RGB و HSV مشخص میشود. قسمت دوم با استفاده از عملیات مورفولوژیکی محلهای چهرهها(سرها) را در تصویر شناسـایی مـی-کند؛ و در قسمت سوم با یک روش ابتکاری چهرهها را در تصویر ورودی مشخص میشوند. این روش پیشنهادی بـر روی تصـاویر مختلفـی آزمـایش شـده اسـت و از عملکرد و سرعت مناسبی برخوردار میباشد.


-1 مقدمه
متن چهره، یک ویژگی منحصربفرد از انسان است. حتی دوقلوها تفاوتهای اندکی در چهره دارند. از این رو چهره میتواند به عنوان یکی از معیارهای مهم و مناسب تعیین هویت و شناسایی افراد استفاده شود. امروزه مبحث شناسایی چهره کاربرد فراوانی درعرصه های مختلف دارد از جمله میتوان به امنیت عمومی، شناسایی هویت، حراست از مکانهای مهم و حساس،کنترل دستیابی،پایش ویدئویی و اشاره نمود بعلاوه، سیستمهای شناسایی چهره درزمینههای جدیدی مانند رابطهی انسان کامپیوتر((HCI، سرویسهای اینترنتی مثل خریداینترنتی و مستعد استفاده بیشتری هستند. در سالهای اخیر محققان، تحقیقات گستردهای بر روشهای تشخیص چهره انجام داده-اند.[22][19] دو مسئلهی مهمی که در کاربردهای تشخیص چهره اهمبت دارند سرعت و دقت در تشخیص است. در طول دههی گذشته، تلاشهای مؤثری برای بهبود عملکرد سرعت ودقت شناسایی صورت گرفته است.[13][1] معذالک، سرعت تشخیص هنوز یک مسئلهی جدی است و یک مانع برای گسترش کاربردهای همزمان تشخیص چهره میباشد. از مواردی که باعث ایجاد خطا در فرآیند تشخیص میشوند میتوان به شدت روشنایی، زاویهی سر، حالت سر، پوشیدگی صورت(توسط سبیل، ریش، عینک و ...)،چرخش سر و غیره اشاره کرد.[8]

لووری1 تشخیص چهره را با استفاده از شبکه عصبی انجام داد.[9] ویلا 2 و جونز 3 طبقه بندی کنندهی daBoost را براساس ساختاری آبشاری پیشنهاد کردند.[15] کیم 4 از توزیع گوسی برای بهبود عملکرد الگوریتم AdaBoost توسط اصلاح مدل باینری طبقه بندی کنندهی ضعیف به مدل گوسی برای بهینهسازی ساختار سیستم استفاده کرد.[3] با توجه به موارد ذکر شده، انواع الگوریتمهای بهبود یافته پیشنهاد شدند.[18][6]

در تمام الگوریتمهای بیان شده از روشهای آماری به طور فراوان استفاده میشود. از این رو، این روشها دارای محاسبات سنگینی هستند که باعث کاهش سرعت سیستمها میشوند.

روشهای خطی PCA و LDA به طور گستردهای برای بازشناسی چهره به کار میروند.[4][21][24]روش Fisherface از روشهای تمایزی است. این روش به دنبال یک سری ویژگیها از چهره باشد که به بهترین نحو کلاسهای چهره را از یکدیگر جدا نماید.[10][25][5] معذالک، این روشها خطی هستند و تمام ویژگیهایی غیر خطی را در نظر نمیگیرند. لذا، تشخیص چهره با دقت کمتری انجام میشود و یک سری از اطلاعات مهم از دست میرود. به همین علت در چند سال اخیر محققان به سراغ روشهایی میروند که بتوانند تشخیص چهره را با دقت بیشتری انجام دهند. یکی از روشهای که مورد توجه محققان قرار گرفته است روش رنگ پوست است که یک روش سریع میباشد و به حالت چهره حساس نیست ولی در عین حال که دارای سرعت بالایی است یک مشکل اساسی دارد و آن در هنگام تشخیص است که علاوه بر مناطق پوست و مناطق غیر پوست نیز تشخیص داده میشود.[7][23][2]


در این مقاله یک روش ساده برای تشخیص چهره معرفی شده است که مشکل بیان شده برای مدل رنگ پوست(تشخیص مناطق غیر پوست)را بر طرف میکند..به طور کلی این مطالعه را میتوان به سه قسمت تقسیمبندی کرد: قسمت اول این مقاله به بررسی یافتن مناطق پوست از فضاهای رنگ RGBوHSV و توصیف این فضاها میپردازد. قسمت دوم آن به بررسی عملیات مورفولوزیکی بر روی تصویر بدست آمده از مرحله قبل میپردازد. در قسمت نهایی تشخیص چهره انجام میگیرد.
نمودار 1 روند کلی این مقاله را نشان میدهد.


-2 مدل کردن رنگ پوست
رنگ پوست یکی از ویژگیهای مهم چهرههای انسان است. توزیع رنگ پوست در یک منطقه کوچک از فضای رنگ Chormatic خلاصه شده است. پردازش رنگ سریعتر از پردازش ویژگیهای دیگر صورت انسان صورت میگیرد.[7][2] استفاده از تشخیص پوست باعث کاهش محاسبات پیچیده میشود. هدف از قسمت بندی رنگ پوست حذف مناطق غیرپوست از تصویر ورودی است. البته رنگ پوست افراد با نژادهای مختلف متفاوت است و اختلاف براساس درخشندگی رنگ آنها بیان میشود. از آنجا که دقت تشخیص رنگ پوست بر روی نتیجه تشخیص چهره مؤثر است، انتخاب فضای رنگ مناسب بسیار مهم است.

2-1 فضای رنگ RGB
به دلیل سادگی استفاده و درک و نیز پشتیبانی سختافزاری، فضای رنگ RGB به طور گسترده مورد استفاده قرار میگیرد، اما در مسائل تکنیکی مربوط به سیستمهای پردازش تصویر دارای کاستیهایی است، برای مثال بین سه مؤلفه آن همبستگی وجود دارد و در صورت تغییر فاکتور روشنایی تصویر، هر سه مؤلفه RGB تغییر میکنند. لذا، این فضا اغلب در سیستمهای بازیابی تصویر مورد استفاده قرارنمی-گیرد. همچنین در استفادههای تجاری، این مسأله باعث عدم بهینگی در فشردهسازی اطلاعات رنگی میشود. مشکل دیگر این فضا عدم یکنواختی ادراکی آن است. راه حل رفع همبستگی این است که فضای RGB نرمالسازی شود. در این فضای رنگ جدید که به فضای رنگ متقابل موسوم است، اطلاعات روشنایی از سایر مؤلفهها جدا میکند. بنابراین این فضا در سیستمهای بازیابی تصویر قابل استفاده است .[9][17] در شکل1 مکعب رنگ RGB نشان داده شده است.

شکل -1 فضای رنگ RGB

از این رو نمیتوان از فضای رنگ RGB به تنهایی برای تشخیص چهره استفاده کرد.

2-2 فضای رنگ HSV
فضای HSV دارای خاصیت یکنواختی ادراکی است، به همین دلیل ازآن در سیستمهای بازیابی تصویر به طور معمول استفاده می-شود.[19] ابعاد تشکیل دهنده ی این فضای رنگ را براساس رده5 یا طول موج، H ، درجهی اشباع رنگ6 ، ،و درجهی روشنایی 7 آن، V ، تعریف میکنند. فضای مذکور یک فضای مخروطی است،که درآن :
(1 طول موج رنگ برابر زاویهی رنگ در برش دایره مخروط میباشد و در فاصله 0,2  تعریف میشود، به صورتی که قرمز در زاویه صفر درجه، سبز در زاویه و آبی در زاویه قرار گرفته که در انتها دوباره به قرمز در زاویه2 باز میگردد.
2) درجه روشنایی رنگ معادل محور مرکزی مخروط است.
(3 درجهی اشباع رنگ برابر فاصلهی نقطه روی دایره تا محور مرکزی است به گونهای در نزدیکی محور، میزان غلظت کمتر است و رنگ مزبور به دستهی رنگهای خاکستری میپیوندد.
H مؤلفه اصلی مورد استفاده در سیستمهای بازیابی است چرا که نسبت به تغییرات جهت تصویربرداری از شیئ یا منظره پایدارتراست. امابا این حال، نسبت به تغییرات روشنایی به شدت حساس میباشد.
شکل 2 فضای رنگی HSV را نشان میدهد. هر برش دایرهای از0 تا 360 درجه علامتگذاری میشود که هر درجه معرف یک طول موج مشخص رنگ است در شکل 2 بالاترین برش از این دایره، نام تجاری معادل رنگها و مقادیر زاویه و معادل RGB هر یک ازآنها آمده است.[9]

شکل -2 فضای رنگی HSV


اگرچه فضای رنگ RGB برای نمایشگرها ایده آل است، ولی برای انسانها غیرطبیعی است. برای مثال تشخیص چگونگی روشنتر کردن یک رنگ در فضای رنگ RGB کاری بسیار مشکل است. برای انسان-ها بسیار راحتتر است تا از ویژگیهای رنگ((Hue، درجه اشباع شدن((Saturation و درجه روشنایی((Value برای توصیف یک رنگ استفاده کند.[4]

برتری این فضای رنگ نسبت به فضای رنگ RGB در عدم ارتباط عناصر سازنده رنگ، به میزان درخشندگی آن میباشد. مساله قابل توجه در مورد این فضا این است که، درکنار مزایای استفاده از آن، مشکل عمدهای وجود دارد و آن محاسبات دشوار در این فضا است. یکی از راههای کاهش این محاسبات تبدیل مقادیر از این فضا به RGB و بالعکس است.

بنایراین با ترکیب فضای رنگی RGB و HSV میتوان به نتایج قابل قبولی دست یافت.

2-3 تبدیل فضای رنگ RGB به HSV
معمولاً تصویر ورودی با فرمت RGB میباشد بنابراین باید ابتدا تصویر به فضای رنگ HSV تبدیل کرد.
اگر فرض کنیم که r, g,b 0,1 به صورتی که به ترتیب معرف محورهای قرمز، سبز و آبی فضای RGB باشد، و h، s و v معرف مؤلفههای فضایHSV باشد ، آنگاه برای تبدیل از RGB به HSV از روابط زیر استفاده میشود.[12]

و از آنجا که r+g+b=1 میتوان رنگ آبی را نیز بدست آورد.

-3 بدست آوردن مناطق پوست در تصویر
بعد از تبدیل تصویر ورودی به فضای رنگ HSV ، نوبت به آن می-رسد که مناطق پوست را شناسایی کنیم. مناطق پوست را میتوان از روی معادلات 8 تا 11 پیدا کرد..[12]

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید