بخشی از مقاله
تشخیص چهره ودسته بندی اشیاء سه بعدی بااستفاده ازهیستوگرام های مبتن برتوصیفگرهای SIFT و SURF
چکیده
این مقاله به بررس روش برمبنای هیستوگرام های مبتن بـر توصـیفگر هـای عمـوم ویژگـی , SIFT و SURF وچگونگی بـه کـارگیری آن درمسئله تشخیص چهره و تشـخیص اجسـام سـه بعـدی از زوایـای مختلـف پرداختـه وروش مـورد نظربـرای تشـخیص تصـاویر چهـره مجموعـه تصاویرORL و YALE به کاررفته ونتایج ارائه می شود. همچنین مجموعه ای ازتصاویر اشیاء سه بعدی برای ارزیابی کارآیی روش مـورد نظـر در تشخیص سه بعدی اجسام , مورد ارزیابی قرار م گیرد و در نهایت برخ نتایج بدست آمده ازاین مقاله ارائه خواهد شد.
کلمات کلیدی
هیستوگرام مبتن بر توصیفگرویژگ , تشخیص چهره , تشخیص سه بعدی اجسام , SURF , SIFT
١- مقدمه
تشخیص اشیاء مختلف با استفاده از توصیفگرهای تصویر درسالهای اخیر رشد چشم یری داشته وامیدهای زیادی را در زمینه بینایی ماشین برای داشتن سیستم های قدرتمند وبا تواناییهای گسترده و متفاوت ایجاد کرده است به گونه ای که امید دانشمندان برای داشتن سیستم هایی با قابلیتهایی مشابه سیستم های بینایی بیولوژی در سالهای نه چندان دور بیشتر وبیشتر شده است.
بر اساس تحقیقات دانشمندان علوم اعصاب شواهدی وجود دارد که نشان دهنده این است که در سیستم های بینایی بیولوژی برخ لایه های نرون وجود دارند که حساس به ویژگ ها وخصوصیات محل بوده ونقش عمده ای درفرآیند تشخیص اشیاء وخصوصیات محیط دارند . درسالهای اخیر برخ ال وریتم های استخراج ویژگیهای محل پیشنهاد شده اند که با موفقیت در تشخیص ال وهای دو بعدی همچون چهره وهمینطور در شناسایی و تشخیص اشیاء سه بعدی وخصوصیات وویژگ های محیط باموفقیت به کارگرفته شده اند. ازمشهورترین توصیفگرهای محل م توان به SIFT و SURF اشاره کرد که درکاربردهای مختلف بینایی ماشین عمل رد خوبی ازخود نشان داده اند و دراین مقاله برای تشخیص چهره وتشخیص اجسام سه بعدی به کار گرفته شده اند.
١-١ تشخیص چهره
بسیاری که در این زمینه انجام شده هنوز نم توان مسئله تشخیص چهره را مسئله ای به طور کامل حل شده فرض کرد زیرا که چهره انسان تحت شرایط مختلف بسیار متغیر میباشد وموفقیت فرآیند تشخیص تا حد زیادی به نحوه توصیف ویژگ ها وخصوصیات اصل چهره وابسته است.[1]
روشهای کلاسی توصیف چهره همچون Eigenface [2] و [3] Fisherface بر اساس کاهش ابعاد داده وتوصیف کمینه ساختار اصل چهره استوارند ول به کارگیری توصیفگرهای محل م تواند کارایی پروسه تشخیص چهره را تا حد زیادی بهبود بخشد و ی از روشهایی که پیشنهاد شده توصیفگرهای محل بر اساس تبدیل [4] Gabor Wavelet در سایزها وجهت های مختلف بوده و استفاده از اطلاعات آن به جای استفاده از مقادیر شدت روشنایی در تصویر , م تواند فرآیند تشخیص چهره را نسبت به برخ تغییرات مقاوم ودقت تشخیص را بالا ببرد.[1]
ی از اولین روش هایی که براساس ویژگ های محل استوار بوده و در شناسایی چهره نتایج موفقیت آمیزی از خود نشان داده [5] Local Binary Pattern(LBP ) میباشد ول نسبت به روش SIFT و SURF که درچند سال اخیر مطرح شده ودر کاربردهای مختلف عمل رد خوبی از خود نشان داده اند , چندان قدرتمند نیست. در این مقاله این دو روش به عنوان توصیفگرهای ویژگ در برخ آزمایشات به کاررفته اند که در ادامه به معرف این دو توصیفگر خواهیم پرداخت.
١-٢ توصیفگر SIFT
در دهه اخیر محققان توجه زیادی به زمینه تشخیص چهره از خود نشان داده اند زیرا که نتایج این تحقیقات در طیف وسیع از کاربردهای مختلف به کار میرود. با وجود تحقیقات توسط David Lowe در سال ١٩٩٩ معرف شد تا بوسیله آن بتوان ویژگ هایی محل جهت توصیف ی ش خاص بدست آورد. هدف ال وریتم SIFT ساخت بانک اطلاعات از ویژگیهای شئ , که دارای خصوصیات زیادی میباشد بوده تا بتوان با استفاده از آن ش را در تصاویر متفاوت و صحنه های متفاوت تشخیص داد. ویژگیها در برابر تغییر اندازه و دوران تصویر و حت تغییر روشنایی و تغییر میدان دید دوربین ثابتند. خصوصیات زیادی م توان از تصویر استخراج کرد که این ویژگ ها آنقدر م توانند متمایز باشند که به راحت ی از آنها را به ی ویژگ موجود در بانک داده های ویژگ به درست منطبق کرد]۶.[ ال وریتم SIFT دارای چهار گام میباشد:
١- کشف اکسترمم اندازه- فضا ٢- م ان یابی نقاط کلیدی ٣- انتساب دوران ۴- توصیفگر نقاط کلیدی
در مرحله کشف اکسترمم اندازه- فضا ، مینیمم وماکزیمم نقاط بدست آمده توسط تفاضل فیلتر گاوسین, در هر نقطه نسبت به نقاط همسایه و در تمام مقیاس ها بدست آمده و این نقاط به عنوان کاندیدهای استخراج بردار ویژگ در نظر گرفته م شوند. در مرحله م ان یابی نقاط کلیدی, .نقاط لبه که به اشتباه به عنوان نقاط کاندید در نظر گرفته شده اندحذف م شوند.انتساب دوران شامل ساخت هیستوگرام بر اساس زوایای گرادیان درنقا ط همسای نقطه کاندید و انتخاب ستون متناظر با ماکزیمم مقدار هیستوگرام به عنوان زاویه مسلط واساس بردار ویژگ مربوط به نقطه کاندید و در نهایت توصیفگر نقطه کلیدی, هیستوگرام بر اساس جهات گرادیان در نقطه مورد نظرونقاط همسایه است که نسبت به تغییر در مقیاس وجهت ثابت و بدون تغییر میباشد. [6] طبق آزمایشات و بررس های انجام شده در[6]، بهترین نتایج با آرایه ۴ ×۴ از هیستوگرامهایی با ٨ موقعیت در هر ی ، بدست آمده است. بنابراین توصیفگر SIFT نهایتا با الحاق هیستوگرام های هشت تایی در همسای مورد نظر, ی بردار با ١٢٨= ٨×۴×۴ عنصر بدست م آید.
شکل ١: توصیفگر ٨ ١٢ عنصری بدست آمده از آرایه 4x4 با هیستوگرام هایی با ٨ ستون .[6]
١-٣ توصیفگر SURF
ال وریتمهای SIFT و SURF روشهایی با تفاوت اندک را برای مشخص کردن مشخصهها ب ار م گیرند. SIFT برای یافتن نقاط کاندید, هرمهای تصویری م سازد، هر لایه را طبق قانون گاوس با افزایش مقادیر سی ما فیلتر میکند و اختلافات را بدست می آورد. از سوی دیگر SURF از ماتریس هسیان برای انتخاب نقاط کاندید در نقاط و در سایزهای مختلف استفاده میکند, همانطور که در روش Hessian-Laplace به کاررفته است.[7]
در مرحله تعیین زاویه اساس بردار ویژگ , با استفاده از فیلتر های , Haar- Wavelet وبه کارگیری انتگرال تصویر برای بالا بردن سرعت عملیات فیلترینگ, زاویه مسلط بر بردار توصیفگر ویژگ به دست م آید.[7]
در نهایت با استفاده از فیلتر های , Haar-Wavelet در زیرنواح موجود درناحیه مشخص شده برای استخراج بردار ویژگی در همسایگی نقطه کاندید , مشابه روش SIFT والبته در ابعاد کمتر, توصیفگر ویژگ بر اساس زاویه زیر نواح مورد نظر, بدست می آید.[7]
١-۴ تشخیص سه بعدی اجسام
تشخیص سه بعدی اجسام ی از تواناییهای فریبنده انسان است که از زمان کودک همراه او بوده وبه سادگ واغلب به طور ناخود آگاه توسط مغزانجام م گیرد. با ی نگاه کوتاه انسان قادر است جسم خاص را که از لحاظ نورده , تغییر زاویه دید , تغییر رنگ وویژگ ها وخصوصیات مختلف تا حدود زیادی تغییر کرده بشناسد. هدف آرمان علم بینایی ماشین توانایی ساخت سیستم است که توانایی بینایی آن در حد انسان ویا حت بهتر از آن باشد. از زمان پیدایش علم بینایی ماشین , روشهای ارا ئه شده برای تشخیص اشیاء م توانند در سه رهیافت کل دسته بندی شوند:
.1 روشهای مبتن بر توصیف خصوصیات هندس ٢. روشهای مبتن بر خصوصیات ظاهری ٣. روشهای مبتن بر توصیفگرهای ویژگ
اجسام در فضای سه بعدی وقت از زوایای مختلف مورد بررس ومشاهده قرار گیرند خصوصیات و ظاهر متفاوت دارند , بنابراین جهت تشخیص جسم خاص از زوایای متفاوت نیاز به ویژگ هاوخصوصیات ظاهری وساختاری جسم مورد نظراززوایای مختلف م باشیم. بنابراین روشهای تشخیص سه بعدی اغلب بر اساس ساخت مدل های سه بعدی براساس روشهای ذکر شده دربالامیباشدول روشهای قدرتمندی که امروزه برای کاربردهای مختلف بینایی ماشین به کار م روند, اغلب سع در به کارگیری وترکیب روشهای هر سه رهیافت ,جهت بهبود عمل رد وبهره گیری ازمزایای آنها در بالابردن قدرت ودقت سیستم های بینایی ماشین میباشد.
در این مقاله روش ارائه شده بر اساس توصیفگرهای ویژگ بوده و بر روی بانک از تصاویر اشیاء سه بعدی تست ونتایج ارائه خواهد شد.
٢- روش پیشنهادی
توصیفگرهای SIFT و SURF با روش تطبیق مستقیم برای ردیابی وشناسایی ودسته بندی اجسام سه بعدی و همچنین ال وهای دو بعدی همچون چهره به کاررفته اند, ول روش که در این مقاله به آن پرداخته شده مشابه روش است که در [8] ارائه شده ودرادامه به طور مختصر به شرح روش مذکورخواهیم پرداخت . اشیاء مشابه, ال وهای ساختاری محل مشابه در ساختار خود دارند, بنابراین در صورت استفاده از شناساگر محل همچون SIFT که تا حد خوبی توصیف کننده ویژگ های جزئ ی ش خاص باشد م توان مدل های دو بعدی وسه بعدی که بازتاب دهدنده ویژگ های ساختاری ش مورد نظربوده ومعیاری جهت شناسایی و دسته بندی اشیاء مختلف باشد به دست آورد.
روش که دراین مقاله به آن پرداخته شده بدین ترتیب میباشد که ابتدا بردارهای ویژگ SIFT یا SURF از تصاویر مربوط به ش خاص بدست آمده و با استفاده از روش K-Means به تعداد مشخص کلاس دسته بندی م شوند. سپس مراکز دسته های به دست آمده از همه اشیاء مورد نظر , به عنوان بین های هیستوگرام در نظر گرفته شده و برای هر تصویرمربوط به ش خاص با دسته بندی بردارهای بدست آمده از توصیفگرهای ویژگی SIFT و , SURF میان کلاس هاس بدست آمده از تمام اشیاء , هیستوگرام که نشان دهنده توزیع بردارهای توصیفگر ویژگ , بر اساس تمام کلاس ها است بدست آمده و پس از نرمال سازی به عنوان بردارویژگ برای دسته بندی تصاویر اشیاء مورد نظر به کار میرود.
شکل ٢: نمونه ای ازهیستوگرام بدست آمده ازیک تصویر
هیستوگرام های بدست آمده توسط این روش م توانند توسط ی از روشهای مختلف کلاس بندی همچون شبکه های عصبی و SVM دسته بندی شوند به گونه ای که هیستوگرام های بدست آمده از تصاویر مختلف هر ش که در شرایط و از زوایای مختلف بدست آمده اند در ی دسته وکلاس قرار گیرند. ول روش که دراین مقاله پیشنهاد می شود این است که هیستوگرام ها یا بردارهای ویژگ مربوط به هر ش , به عنوان نقاط در فضای با ابعاد بالا درنظر گرفته شده و مرکز این نقاط بوسیله روش K-Means یا روشهای دی ر بدست آید , سپس هیستوگرام تصاویر جدید مربوط به اشیاء مختلف بدست آمده و جهت دسته بندی این تصاویر , هر هیستوگرام به عنوان نقطه ای جدید در همان فضای با ابعاد بالا درنظر گرفته شده و فاصله اقلیدس این تقطه , از مراکزمورد نظر بدست آمده در مرحله قبل بدست م آید , و نزدی ترین مرکز به عنوان کلاس ش جدید درنظر گرفته می شود . همچنین م توان از معیارهای دی ری همچون فاصله منهتن یا فاصله [8] برای مقایسه هیستوگرام های جدید با هیستوگرام های مراکز ودرنهایت دسته بندی آنها استفاده کرد.
٣- آزمایشات وارائه نتایج
٣-١ تشخیص چهره
دراین بخش روشهای مطرح شده دربخش قبل , برای مسئله تشخیص چهره وبر روی دو پای اه داده معروف از تصاویر چهره به نام ORL و YALE و با استفاده از دو توصیفگر ویژگ
SIFT و [7] SURF-128 که نسخه قوی تری از SURF است تست وآزمایش شده ونتایج به شکل نمودار ارائه خواهد شد.
٣-١-١- آزمایش بر روی بانک تصاویر چهره ORL
پای اه داده ORL شامل ٠٠۴ تصویر از ٠۴ شخص متفاوت و١٠ عکس برای هر شخص , با حالتها و برخ ویژگ های متفاوت است. دراین آزمایش ٢٠٠ عکس به طور تصادف به عنوان مجموعه آموزش در نظر گرفته شده و ٢٠٠ عکس باق مانده به عنوان مجموعه تست وارزیابی در نظر گرفته شده است.
نتایج آزمایش به کم روش های کلاس بندی همچون شبکه MLP و RBF و روش مطرح شده بر اساس فاصله اقلیدس میباشد. نمودار مربوط به شکل ۴و۵ نشان دهنده دقت تشخیص تصاویر مجموعه تست و بر حسب تعداد کلاس های به کار رفته برای هر شخص به عنوان ستون های هیستوگرام می باشد.
شکل ٣: نمونه ای از تصاویر بانک تصاویر ORL که مربوط به اشخاص مختلف میباشد.
شکل ۴: نرخ تشخیص درست تصاویر چهره از مجموعه تست, برحسب تعداد کلاسهای تش یل دهنده هیستوگرام از توصیفگر SIFT بدست آمده از تصاویر مربوط به هر شخص.
شکل ۵: نرخ تشخیص درست تصاویر چهره از مجموعه تست برحسب تعداد کلاسهای تش یل دهنده هیستوگرام از توصیفگر١٢٨-SURF بدست آمده از تصاویرمربوط به هر شخص.
٣-١-٢- آزمایش بر روی بانک تصاویر چهره YALE
جهت اثبات قدرت روش پیشنهادی, مسئله تشخیص چهره را با بانک اطلاعات YALE که مجموعه ای از۵۶ ١ تصویر از۵١ شخص متفاوت که کیفیت چندان مطلوبی نداشته وتحت شرایط وحالتها و نورده های مختلف تهیه شده است , تکرار م کنیم با این تفاوت که مجموعه آموزش شامل ٩٠ تصویر و ۶ تصویر برای هر شخص بوده و ۵٧ تصویر باق مانده به عنوان مجموعه تست برای ارزیابی روشهای مورد نظر, درنظر گرفته شده است. در این آزمایش جهت ارزیابی بهتر از روشهایی همچون فاصله منهتن و برای مقایسه هیستوگرام ها و همچنین از روشهای یادگیری ماشین قدرتمندی همچون SVM نیز برای دسته بندی هیستوگرام های بدست آمده از مجموعه تست استفاده شده که نمودارهای مربوط به شکل ٧و٨ حاک از نتایج این ارزیابی می باشند.