بخشی از مقاله
برخی از منابع:
مراجع
[1] Jun Luo, Ma, Y., Takikawa, E., Lao, S., Kawade M., Bao-Liang Lu, “Person-Specific SIFT Features forFace Recognitio,” IEEE Conference on Acoustics, Speech and Signal Processing , April 2007.
[2] M. Turk, and A. Pentland, “Eigenfaces for Recognition,” Journal Of Cognitive Neuroscience , vol3, no. 1,pp.71-86, 1991.
[3] P. N. Belhumeur, J.P. Hespanha etc, “Eigenfaces vs Fisher- faces: recognition using class specific linear projection” IEEE Trans. Pattern Analysis and Machine Intelligence, vol.20, no.7, pp.711-720, 1997.
[4] C Liu and H. Wechsler, “Gabor Feature Based Classifi-cation Using the Enhanced Fisher Linear Discriminate Model for Face Recognition,” IEEE Trans. Image Processing, vol.11, no.4, pp.467-476, 2002.
[5] T. Ojala, M. Pietikäinen, and T. Mäenpää , “Multiresolution Gray-Scale And Rotation Invariant Texture Classification With Local Binary Patterns”, IEEE Trans. Pattern Analysis and Machine Intelligence, vol.24, no.7, pp.971-987, 2002.
[6] D. Lowe.” Distinctive Image Features from Scale-Invariant
Keypoints”, IJCV,60(2):91–110, 2004.
[7] Herbert Bay, Andreas Ess, Tinne Tuytelaars, Luc Van,“Speed Up Robust Features(SURF), ” Elsevier Inc,2007.
مقدمه
تشخیص اشیاء مختلف با استفاده از توصیفگرهای تصویر درسالهای اخیر رشد چشم یری داشته وامیدهای زیادی را در زمینه بینایی ماشین برای داشتن سیستم های قدرتمند وبا تواناییهای گسترده و متفاوت ایجاد کرده است به گونه ای که امید دانشمندان برای داشتن سیستم هایی با قابلیتهایی مشابه سیستم های بینایی بیولوژی در سالهای نه چندان دور بیشتر وبیشتر شده است.
بر اساس تحقیقات دانشمندان علوم اعصاب شواهدی وجود دارد که نشان دهنده این است که در سیستم های بینایی بیولوژی برخ لایه های نرون وجود دارند که حساس به ویژگ ها وخصوصیات محل بوده ونقش عمده ای درفرآیند تشخیص اشیاء وخصوصیات محیط دارند . درسالهای اخیر برخ ال وریتم های استخراج ویژگیهای محل پیشنهاد شده اند که با موفقیت در تشخیص ال وهای دو بعدی همچون چهره وهمینطور در شناسایی و تشخیص اشیاء سه بعدی وخصوصیات وویژگ های محیط باموفقیت به کارگرفته شده اند. ازمشهورترین توصیفگرهای محل م توان به SIFT و SURF اشاره کرد که درکاربردهای مختلف بینایی ماشین عمل رد خوبی ازخود نشان داده اند و دراین مقاله برای تشخیص چهره وتشخیص اجسام سه بعدی به کار گرفته شده اند.
١-١ تشخیص چهره
بسیاری که در این زمینه انجام شده هنوز نم توان مسئله تشخیص چهره را مسئله ای به طور کامل حل شده فرض کرد زیرا که چهره انسان تحت شرایط مختلف بسیار متغیر میباشد وموفقیت فرآیند تشخیص تا حد زیادی به نحوه توصیف ویژگ ها وخصوصیات اصل چهره وابسته است.[1]
روشهای کلاسی توصیف چهره همچون Eigenface [2] و [3] Fisherface بر اساس کاهش ابعاد داده وتوصیف کمینه ساختار اصل چهره استوارند ول به کارگیری توصیفگرهای محل م تواند کارایی پروسه تشخیص چهره را تا حد زیادی بهبود بخشد و ی از روشهایی که پیشنهاد شده توصیفگرهای محل بر اساس تبدیل [4] Gabor Wavelet در سایزها وجهت های مختلف بوده و استفاده از اطلاعات آن به جای استفاده از مقادیر شدت روشنایی در تصویر , م تواند فرآیند تشخیص چهره را نسبت به برخ تغییرات مقاوم ودقت تشخیص را بالا ببرد.[1]
ی از اولین روش هایی که براساس ویژگ های محل استوار بوده و در شناسایی چهره نتایج موفقیت آمیزی از خود نشان داده [5] Local Binary Pattern(LBP ) میباشد ول نسبت به روش SIFT و SURF که درچند سال اخیر مطرح شده ودر کاربردهای مختلف عمل رد خوبی از خود نشان داده اند , چندان قدرتمند نیست. در این مقاله این دو روش به عنوان توصیفگرهای ویژگ در برخ آزمایشات به کاررفته اند که در ادامه به معرف این دو توصیفگر خواهیم پرداخت.
١-٢ توصیفگر SIFT
در دهه اخیر محققان توجه زیادی به زمینه تشخیص چهره از خود نشان داده اند زیرا که نتایج این تحقیقات در طیف وسیع از کاربردهای مختلف به کار میرود. با وجود تحقیقات توسط David Lowe در سال ١٩٩٩ معرف شد تا بوسیله آن بتوان ویژگ هایی محل جهت توصیف ی ش خاص بدست آورد. هدف ال وریتم SIFT ساخت بانک اطلاعات از ویژگیهای شئ , که دارای خصوصیات زیادی میباشد بوده تا بتوان با استفاده از آن ش را در تصاویر متفاوت و صحنه های متفاوت تشخیص داد. ویژگیها در برابر تغییر اندازه و دوران تصویر و حت تغییر روشنایی و تغییر میدان دید دوربین ثابتند. خصوصیات زیادی م توان از تصویر استخراج کرد که این ویژگ ها آنقدر م توانند متمایز باشند که به راحت ی از آنها را به ی ویژگ موجود در بانک داده های ویژگ به درست منطبق کرد]۶.[ ال وریتم SIFT دارای چهار گام میباشد:
١- کشف اکسترمم اندازه- فضا ٢- م ان یابی نقاط کلیدی ٣- انتساب دوران ۴- توصیفگر نقاط کلیدی
در مرحله کشف اکسترمم اندازه- فضا ، مینیمم وماکزیمم نقاط بدست آمده توسط تفاضل فیلتر گاوسین, در هر نقطه نسبت به نقاط همسایه و در تمام مقیاس ها بدست آمده و این نقاط به عنوان کاندیدهای استخراج بردار ویژگ در نظر گرفته م شوند. در مرحله م ان یابی نقاط کلیدی, .نقاط لبه که به اشتباه به عنوان نقاط کاندید در نظر گرفته شده اندحذف م شوند.انتساب دوران شامل ساخت هیستوگرام بر اساس زوایای گرادیان درنقا ط همسای نقطه کاندید و انتخاب ستون متناظر با ماکزیمم مقدار هیستوگرام به عنوان زاویه مسلط واساس بردار ویژگ مربوط به نقطه کاندید و در نهایت توصیفگر نقطه کلیدی, هیستوگرام بر اساس جهات گرادیان در نقطه مورد نظرونقاط همسایه است که نسبت به تغییر در مقیاس وجهت ثابت و بدون تغییر میباشد. [6] طبق آزمایشات و بررس های انجام شده در[6]، بهترین نتایج با آرایه ۴ ×۴ از هیستوگرامهایی با ٨ موقعیت در هر ی ، بدست آمده است. بنابراین توصیفگر SIFT نهایتا با الحاق هیستوگرام های هشت تایی در همسای مورد نظر, ی بردار با ١٢٨= ٨×۴×۴ عنصر بدست م آید.
شکل ١: توصیفگر ٨ ١٢ عنصری بدست آمده از آرایه 4x4 با هیستوگرام هایی با ٨ ستون .[6]
١-٣ توصیفگر SURF
ال وریتمهای SIFT و SURF روشهایی با تفاوت اندک را برای مشخص کردن مشخصهها ب ار م گیرند. SIFT برای یافتن نقاط کاندید, هرمهای تصویری م سازد، هر لایه را طبق قانون گاوس با افزایش مقادیر سی ما فیلتر میکند و اختلافات را بدست می آورد. از سوی دیگر SURF از ماتریس هسیان برای انتخاب نقاط کاندید در نقاط و در سایزهای مختلف استفاده میکند, همانطور که در روش Hessian-Laplace به کاررفته است.[7]
در مرحله تعیین زاویه اساس بردار ویژگ , با استفاده از فیلتر های , Haar- Wavelet وبه کارگیری انتگرال تصویر برای بالا بردن سرعت عملیات فیلترینگ, زاویه مسلط بر بردار توصیفگر ویژگ به دست م آید.[7]
در نهایت با استفاده از فیلتر های , Haar-Wavelet در زیرنواح موجود درناحیه مشخص شده برای استخراج بردار ویژگی در همسایگی نقطه کاندید , مشابه روش SIFT والبته در ابعاد کمتر, توصیفگر ویژگ بر اساس زاویه زیر نواح مورد نظر, بدست می آید.[7]
١-۴ تشخیص سه بعدی اجسام
تشخیص سه بعدی اجسام ی از تواناییهای فریبنده انسان است که از زمان کودک همراه او بوده وبه سادگ واغلب به طور ناخود آگاه توسط مغزانجام م گیرد. با ی نگاه کوتاه انسان قادر است جسم خاص را که از لحاظ نورده , تغییر زاویه دید , تغییر رنگ وویژگ ها وخصوصیات مختلف تا حدود زیادی تغییر کرده بشناسد. هدف آرمان علم بینایی ماشین توانایی ساخت سیستم است که توانایی بینایی آن در حد انسان ویا حت بهتر از آن باشد. از زمان پیدایش علم بینایی ماشین , روشهای ارا ئه شده برای تشخیص اشیاء م توانند در سه رهیافت کل دسته بندی شوند:
.1 روشهای مبتن بر توصیف خصوصیات هندس ٢. روشهای مبتن بر خصوصیات ظاهری ٣. روشهای مبتن بر توصیفگرهای ویژگ
اجسام در فضای سه بعدی وقت از زوایای مختلف مورد بررس ومشاهده قرار گیرند خصوصیات و ظاهر متفاوت دارند , بنابراین جهت تشخیص جسم خاص از زوایای متفاوت نیاز به ویژگ هاوخصوصیات ظاهری وساختاری جسم مورد نظراززوایای مختلف م باشیم. بنابراین روشهای تشخیص سه بعدی اغلب بر اساس ساخت مدل های سه بعدی براساس روشهای ذکر شده دربالامیباشدول روشهای قدرتمندی که امروزه برای کاربردهای مختلف بینایی ماشین به کار م روند, اغلب سع در به کارگیری وترکیب روشهای هر سه رهیافت ,جهت بهبود عمل رد وبهره گیری ازمزایای آنها در بالابردن قدرت ودقت سیستم های بینایی ماشین میباشد.
در این مقاله روش ارائه شده بر اساس توصیفگرهای ویژگ بوده و بر روی بانک از تصاویر اشیاء سه بعدی تست ونتایج ارائه خواهد شد.
٢- روش پیشنهادی
توصیفگرهای SIFT و SURF با روش تطبیق مستقیم برای ردیابی وشناسایی ودسته بندی اجسام سه بعدی و همچنین ال وهای دو بعدی همچون چهره به کاررفته اند, ول روش که در این مقاله به آن پرداخته شده مشابه روش است که در [8] ارائه شده ودرادامه به طور مختصر به شرح روش مذکورخواهیم پرداخت . اشیاء مشابه, ال وهای ساختاری محل مشابه در ساختار خود دارند, بنابراین در صورت استفاده از شناساگر محل همچون SIFT که تا حد خوبی توصیف کننده ویژگ های جزئ ی ش خاص باشد م توان مدل های دو بعدی وسه بعدی که بازتاب دهدنده ویژگ های ساختاری ش مورد نظربوده ومعیاری جهت شناسایی و دسته بندی اشیاء مختلف باشد به دست آورد.
روش که دراین مقاله به آن پرداخته شده بدین ترتیب میباشد که ابتدا بردارهای ویژگ SIFT یا SURF از تصاویر مربوط به ش خاص بدست آمده و با استفاده از روش K-Means به تعداد مشخص کلاس دسته بندی م شوند. سپس مراکز دسته های به دست آمده از همه اشیاء مورد نظر , به عنوان بین های هیستوگرام در نظر گرفته شده و برای هر تصویرمربوط به ش خاص با دسته بندی بردارهای بدست آمده از توصیفگرهای ویژگی SIFT و , SURF میان کلاس هاس بدست آمده از تمام اشیاء , هیستوگرام که نشان دهنده توزیع بردارهای توصیفگر ویژگ , بر اساس تمام کلاس ها است بدست آمده و پس از نرمال سازی به عنوان بردارویژگ برای دسته بندی تصاویر اشیاء مورد نظر به کار میرود.
شکل ٢: نمونه ای ازهیستوگرام بدست آمده ازیک تصویر
هیستوگرام های بدست آمده توسط این روش م توانند توسط ی از روشهای مختلف کلاس بندی همچون شبکه های عصبی و SVM دسته بندی شوند به گونه ای که هیستوگرام های بدست آمده از تصاویر مختلف هر ش که در شرایط و از زوایای مختلف بدست آمده اند در ی دسته وکلاس قرار گیرند. ول روش که دراین مقاله پیشنهاد می شود این است که هیستوگرام ها یا بردارهای ویژگ مربوط به هر ش , به عنوان نقاط در فضای با ابعاد بالا درنظر گرفته شده و مرکز این نقاط بوسیله روش K-Means یا روشهای دی ر بدست آید , سپس هیستوگرام تصاویر جدید مربوط به اشیاء مختلف بدست آمده و جهت دسته بندی این تصاویر , هر هیستوگرام به عنوان نقطه ای جدید در همان فضای با ابعاد بالا درنظر گرفته شده و فاصله اقلیدس این تقطه , از مراکزمورد نظر بدست آمده در مرحله قبل بدست م آید , و نزدی ترین مرکز به عنوان کلاس ش جدید درنظر گرفته می شود . همچنین م توان از معیارهای دی ری همچون فاصله منهتن یا فاصله [8] برای مقایسه هیستوگرام های جدید با هیستوگرام های مراکز ودرنهایت دسته بندی آنها استفاده کرد.