بخشی از مقاله

چکیده

در سال های اخیر، شناسایی حالت های چهره بر اساس توصیف گرهای محلی در برابر تغییرات حالت، نوع چهره، شباهت بین حالت های مختلف و اثرات نور محیط، عملکرد مقاوم تری را نشان داده انددر. حال حاضر، روش های استفاده شده برای شناسایی حالت اساساً برپایه ی    تطبیق الگو، شبکه عصبی، مدل احتمال، ماشین بردار پشتیبان و ... هستند. در این مقاله برای شناسایی دقیق حالت چهره، یک روش ترکیبی به منظور استخراج ویژگی های محلی چهره ارائه می شود. ابتدا از ویژگی های پیش پردازش تصویر به منظور حذف نواحی اضافی تصویر، بهبود نور تصویر، کنتراست، سایز تصویرو ... استفاده می شود.

سپس با بکارگیری از توصیف گرهای محلی الگوی باینری محلی و آنالیز فراکتال مبتنی بر بافت به منظور استخراج موثر اطلاعات جزئی بافت چهره استفاده می شود. این توصیف گرهای محلی، ویژگی های بافت محلی از ناحیه ی دهان و چشم ها که بیشترین تاثیر را در شناسایی حالت چهره دارند را استخراج می کنند. پس از آن از ماشین بردار پشتیبان برای شناسایی و دسته بندی حالت های مختلف چهره استفاده می شود.

کارایی تکنیک معرفی شده با استفاده از پایگاه داده ی    تصاویر صورت JAFFE اندازه گیری و محاسبه می شود که در میان آن ها تصاویری وجود دارد که چندین حالت ترکیبی را به طور همزمان نشان می دهند که ناچاریم سیستمی طراحی نماییم که قوی ترین حالت را از میان حالت های دیگر تشخیص دهد. این سیستم ها می توانند به صورت قابل قبولی حالت های مختلف را دسته بندی کنند و نرخ شناسایی قابل توجهی ارائه دهند. این روش به میزان 92,7 درصد نرخ شناسایی دارد.

-1 مقدمه

شناسایی حالات چهره به دلیل تغییرات در حالات مختلف چهره انسان یکی از پیچیده ترین و بحث برانگیز ترین مسائل بینایی ماشین تلقی می شود. زیرا این فرآیند، تحت تاثیر تغییرات روشنایی محیط، چرخش سر، تغییر فاصله ی چهره ی شخص تا دوربین و نوع چهره است. علاوه براین شباهت بین حالات مختلف باعث تشخیص اشتباه حالات چهره می شود. برای مثال چون در هر دو حالت شادی و تعجب دهان شخص باز است، امکان دارد این دو حالت به اشتباه به جای یکدیگر تشخیص داده شوند.

یکی از جذابیت های تشخیص چهره و حالت آن عامل طبیعی حالت چهره است که اطلاعات بیشتری نسبت به سخن گفتن و تن صدا می دهد. سیستم هایی که با حالت چهره کار می کنند می توانند کارایی سیستم هایی که با صدای شخص کنترل می شوند را بهبود دهند. هدف این مقاله، طراحی یک سیستم شناسایی حالت چهره مقاوم توسط ترکیب تکنیک های مختلف بینایی ماشین و شناسایی الگو است. برای طراحی یک سیستم شناسایی حالت چهره می توانیم مزایای منابع موجود را بگیریم و از الگوریتم های موجود به عنوان بلوک های ساختاری سیستم بهره ببریم. بنابراین تعیین ترکیب بهینه ی الگوریتم ها قسمت اصلی کار است.

تجزیه و تحلیل حالات صورت از موضوعات تحقیقاتی فعال برای دانشمندان رفتاری از زمان کار داروین در سال [1] 1872 بوده است. پس از آن پیشرفت های زیادی برای ساخت سیستم های کامپیوتری انجام شد که به ما در فهم و استفاده از این شکل طبیعی ارتباط انسان کمک می کند .[4-2] اکمان1 و فرایزن[5] 2 نیز مدلی مشهور برای توصیف حالات چهره و سیستم کدینگ به نام سیستم کدینگ واحد های حرکتی صورت پیشنهاد کردند. در حال حاضر،روش های استفاده شده برای شناسایی حالت اساساً بر طبق تطبیق الگو3، شبکه عصبی4، مدل احتمال 5، ماشین بردار پشتیبان 6 - SVM - و غیره هستند.

[6] SVM یک نوع روش یادگیری ماشین است که بر پایه ی نظریه ی یادگیری آماری بنا شده است. براساس قاعده کلی کمینه سازی ساختار وپنیک[7] 7، SVM یک دادوستد در پیچیدگی عملکرد و پیچیدگی نمونه می سازد، توانایی عمومی را بهبود بخشیده و عملکرد طبقه بندی بسیار خوبی دارد. لیتل ورت8 و و همکاران [8] یک طبقه بندی کننده با ترکیب فیلترگابور و SVM برای شناسایی حالت چهره طراحی کردند.

توصیف گرهای بافت محلی نسبت به تغییرات روشنایی و موقعیت توجه زیادی را برای تجزیه و تحلیل تصاویر مربوط به چهره به خود جلب کرده اند و کاربردهای زیادی در زمینه استخراج ویژگی های صورت و تشخیص حالت چهره دارند. استخراج ویژگی های حالات چهره می تواند بر اساس اطلاعات هندسی و یا با استفاده از اطلاعات بافت چهره مانند الگوی باینری محلی - LBP - و یا روش هایی دیگر همچون فرکتال مبتنی بر بافت - SFTA - 9 انجام شود.

استفاده از ویژگی های الگوی باینری محلی10 برای تشخیص حالت چهره در تصاویر ایستا، توسط فنگ11 و همکاران در مقاله [9] بررسی شده است. در این روش اطلاعات بافت محلی، اطلاعات بافت کلی و اطلاعات شکل صورت به طور خودکار برای تشکیل ویژگی های صورت تشخیص داده می شوند. عموما از عملگر LBP برای تشخیص چهره استفاده می شود، به این صورت که ابتدا تصویر صورت به چند ناحیه تقسیم می شود، سپس عملگر LBP روی این نواحی اعمال شده و ویژگی دهان استخراج شده از این نواحی به یک بردار ویژگی اعمال می شوند.

این بردار برای توصیف چهره به کار می رود. این ایده موفقیت رو به رشدی داشته است و توسط گروه های تحقیقاتی زیادی بررسی شده و موفقیت هایی برای استفاده در شناسایی چهره و شناسایی حالت چهره داشته است. از آن جایی که تصویر گرفته شده فاکتورهای بسیاری از جمله کنتراست، میزان روشنایی، نواحی اضافی، سایز تصویر و غیره دارد که بر دقت، قوت و کارایی آنی سیستم شناسایی تاثیرگذار است، پیش پردازش تصویر از اهمیت بسیاری برخوردار می شود.

بنابراین باید قبل از شناسایی حالت و استخراج ویژگی ها به پیش پردازش تصویر گرفته شده پرداخت. از این رو، در این مقاله پس از مکان یابی صورت، ناحیه ی موثر صورت را جدا نموده، سپس از روش های پیش پردازش استانداردسازی هندسی12، استانداردسازی روشنایی13 و تساوی هیستوگرام14 برای کاهش اثر روشنایی بر سیستم شناسایی چهره استفاده شد.  همچنین به منظور حذف نواحی اضافی چهره، یک روش قطعه بندی بر ناحیه ی چهره بکار گرفته شد تا بتوان نواحی اضافی تصویر را حذف نمود .[10] فرآیند کامل بازشناسی حالت چهره به چهار مرحله اصلی تقسیم می شود:[11]

·    تشخیص چهره در تصویر - چهره یابی -

·    پیش پردازش تصاویر

·    استخراج ویژگی های مورد نیاز از چهره ی تشخیص داده شده

·    تحلیل و طبقه بندی ویژگی های استخراج شده

مطالب این مقاله در پنج بخش ارائه می گردد. در بخش های اول و دوم به ترتیب به بررسی روش های استخراج ویژگی الگوی باینری محلی و روش تجزیه فرکتال مبتنی بر بافت که در روش پیشنهادی مقاله به منظور استخراج ویژگی های محلی چهره استفاده گردیده اند پرداخته می شود. در بخش سوم روش کلاس بندی ماشین بردار پشتیبان مطرح می شود. در قسمت بعد، جزییات روش پیشنهادی و نتایج شبیه سازی بیان شده و با یک روش مشابه مقایسه می شود، و بهترین الگوریتم ممکن که از لحاظ دقت، سرعت و مقاومت بهینه باشد، معرفی می شود. و در انتها به جمع بندی و نتیجه گیری مقاله پرداخته می شود.

-2 الگوی باینری محلی

عملگر الگوی دودویی محلی که روشی قوی برای آنالیز بافت به حساب می آید به صورت یک عملگر مربعی 3×3 مطرح شده است. روش ویژگی های محلی برخلاف روش های کلی نگر در مقابل تغییر موقعیت و روشنایی مقاوم ترند. دلیل اصلی لزوم استفاده از توصیف گر الگوی باینری محلی، تحمل آن در مقابل سطوح خاکستری یکنواخت و پایین بودن سربار محاسباتی این عملگر نسبت به توصیف گرهای محلی دیگر است.

توصیف گرهای بافت روی ناحیه ی تصویر میانگین می گیرند. این روش به این صورت است که 8 همسایگی روی عملگر را با پیکسل مرکزی مقایسه می کند. هر یک از این 8 پیکسل همسایه اگر مقدارش از مقدار پیکسل مرکزی بزرگتر یا مساوی باشد، مقدار 1 و در غیر این صورت مقدار آن ها صفر خواهد بود. در پایان، پیکسل مرکزی با جمع کردن وزندار باینری پیکسل های همسایه جایگزین می شود و پنجره 3×3 به پیکسل بعدی منتقل می شود . با گرفتن هیستوگرام از این مقادیر، توصیف کننده ای برای بافت تصویر بدست می آید. رابطه 1 تشکیل الگوی باینری در هر پیکسل می باشد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید