بخشی از مقاله
چکیده- توصیفگرهای ویژگی محلی عملکرد خوبی در شناسایی تصویر دارند. ازجمله توصیفگرهای محلی پایه میتوان به الگوی باینری محلی - LBP - و گابور اشاره کرد که توصیفگرهای زیادی بر مبنای آنها شکلگرفتهاند. در سیر تحول توصیفگرهای بافت، روشهای زیادی ارائهشده-اند. برای نمونه هیستوگرام گرادیان جهتدار - HOG - که با گرفتن گرادیان از تصویر، زمان محاسباتی را نسبت به گابور بسیار کاهش میدهد، همچنین با ترکیب LBP و HOG، توصیفگری قوی بنام الگوهای اندازههای لبه جهتدار - POEM - معرفیشده است که توانایی خوبی در شناسایی چهره دارد.
نسخه بهبودیافته POEM که الگوهای جهت-های غالب - PDO - نامیده میشود، رابطه بین جهتهای غالب را در یک ناحیه محلی بررسی میکند. ازآنجاییکه POEM و PDO مکملهای خوبی برای یکدیگرند، روش پیشنهادی با ترکیب بهبودیافته این دو ارائهشده است. الگوریتم POEM با جایگزین کردن الگوی باینری محلی نرم - SLBP - بهجای LBP و تقسیمبندی متفاوت تصویر برای تشکیل هیستوگرام و PDO تنها با تقسیمبندی متفاوت تصویر، بهبود دادهشدهاند، سپس با ترکیب آنها، روش پیشنهادی بانام الگوهای جهتها و اندازهها - POM - ارائهشده است. نتایج ارزیابی پایگاههای داده ORL و FERET توانایی الگوریتم پیشنهادی را در شناسایی چهره مقابل سایر روشها بهخوبی نشان میدهد.
-1 مقدمه
شناسایی چهره یکی از مهمترین روشهای بیومتریک است که امروزه در زندگی افراد جایگاه ویژهای دارد. دلایل زیادی برای افزایش علاقه به شناسایی چهره به علت کاربردهای فراوان آن وجود دارد. هندسه چهره یا به عبارتی اندازه و فاصله بین اجزای چهره مانند بینی، دهان، چشمها و غیره و همچنین بافت پوست ازجمله تفاوتها در چهره افراد است که برای شناسایی چهره موردبررسی قرار میگیرند .[1] مواردی چون افزایش سن، تغییر چهره با ریش و مو، پوشانده شدن چهره با عینک و غیره چالشهایی است که در امر شناسایی چهره همیشه وجود دارند.
شناسایی چهره را از جهت استخراج ویژگی میتوان به دودسته مبتنی بر ظاهر1 و مبتنی بر ویژگی هندسی2 - مبتنی بر مدل - تقسیمبندی کرد. روشهای مبتنی بر ظاهر ویژگیها را بهصورت سراسری3 یا محلی4، استخراج میکنند [2] که در سالهای گذشته روشهای مبتنی بر استخراج ویژگیهای محلی توسعه بیشتری پیداکرده است و دلیل آن نیز توانایی این روشها در برابر تغییرات نورپردازی و حالت چهره است.
برای استخراج ویژگیهای محلی از توصیفگرهای محلی که به توصیفگرهای بافت یا توصیفگرهای ویژگی نیز معروف هستند، استفاده میشود. انواع مختلفی از این توصیفگرها وجود دارند که ازجمله روشهای پایهای میتوان به [3] 5LBP و گابور[4] 6 اشاره کرد. سیر تحول و پیشرفت در استخراج ویژگیهای محلی، توصیفگرهای زیادی را از قبیل، الگوی جهتدار محلی 7 - LDP - [5]، الگوی سهگانه محلی [6] 8 - LTP - ، [7] 9SLBP، تبدیل ویژگی مقیاس مقاوم [8] 10 - SIFT - ، ویژگیهای مقاوم سرعتبالا [9] 11 - SURF - ، [10] 12 HOG، [11] 13POEM، [12] 14 PDO، معرفی کرده است.
LBP و گابور دو توصیفگر بافت قدرتمند و پایهای هستند که باوجود قدیمی بودن، هیچگاه اهمیت خود را از دست ندادند و روشهای زیادی مبتنی بر آنها ارائهشده است. عملگر HOG با گرفتن گرادیان از تصویر و سپس استفاده از جهتهای گرادیان علاوه بر سرعت بیشتر نسبت به گابور به نتایج خوبی در شناسایی چهره دستیافته است. با استفاده همزمان از گرادیان تصویر و LBP یا به عبارتی ترکیب HOG و LBP، عملگر POEM به وجود میآید که میتوان گفت توانایی هر دو عملگر نامبرده را دارد.
با توسعه عملگر POEM، روش PDO پیشنهاد شد که اساس کار آن بررسی رابطه بین جهتهای غالب در یک ناحیه محلی است. توصیفگرهای POEM و PDO مکملهای خوبی هستند چراکه نیمی از مسیر این الگوریتمها باهم یکسان است. در این مطالعه توصیفگری با ترکیب بهبودیافته این دو الگوریتم پیشنهادشده است. عملگر POEM با جایگزین کردن SLBP بهجای LBP و قسمتبندی متفاوت تصویر برای تشکیل هیستوگرام، بهبودیافته است. عملگر PDO نیز فقط در قسمت تقسیمبندی تصویر بهبود دادهشده است. از ترکیب این دو عملگر بهبودیافته، یک توصیفگر محلی بانام الگوهای جهتها و اندازهها 15POM پیشنهادشده است.
-2 مروری بر کارهای انجامشده
عملگر LBP بهعنوان یک توصیفگر بافت قدرتمند به همراه مدلهای متنوع دیگری از انواع الگوریتمهای بهبودیافته LBP برای تجزیهوتحلیل بافت در کاربردهای مختلف - چهرهیابی، شناسایی چهره، شناسایی حالت چهره و غیره - در [13] معرفیشده است. عملگر LBP، عملکردی ساده دارد و پیکسل مرکزی را با پیکسلهای همسایه جهت تولید یک کد باینری بهصورت چرخشی مقایسه میکند که معادل دسیمال این کد، برچسب پیکسل موردنظر است. برای مقاوم کردن تصویر در مقابل نویز در [3] توصیفگرهای LTP و SLBP که نسخههای بهبودیافته LBP هستند، معرفیشدهاند.
عملگر LTP، توسعهیافتهی LBP به کد سهگانه است [14] و توصیفگر بافت قدرتمندی است، چراکه اطلاعات بیشتری از بافت تصویر استخراج میکند و در سطوح یکنواخت در مقابل نویز قویتر است. اگر N تعداد پیکسلهای همسایه در نظر گرفته شود، هیستوگرام LTP، شامل 3N مقدار مجزاست که ابعاد هیستوگرام بسیار بالایی است.برای کاهش ابعاد هیستوگرامِ LTP در [6] تعریف دیگری از LTP ارائهشده است که در این حالت طول هیستوگرام نسبت به مدل قبلی به شکل قابلتوجهی کاهش مییابد و طول آن دو برابر طول هیستوگرام LBP میشود.
عملگر SLBP، توصیفگر بافتی است که برخلاف دیگر توصیفگرها، توانایی درک یک تغییر کوچک در تصویر ورودی که تنها موجب یک تغییر کوچک در خروجی عملگر میشود را دارد .[7] این عملگر، مقایسه پیکسل مرکزی با پیکسلهای همسایه را با استفاده از دو تابع عضویت فازی انجام میدهد که میزان فازی-سازی توسط یک پارامتر کنترل میشود که انتخاب دقیق این پارامتر دررسیدن به نتیجه مطلوب مؤثر است.
اگر N پیکسل همسایه وجود داشته باشد، طول هیستوگرام در SLBP برابر 2N مقدار مجزاست. با استفاده از این عملگر، یک پیکسل در بیش از یک نوار 16 از هیستوگرام شرکت میکند اما مجموع مشارکت یک پیکسل در تمام نوارهای هیستوگرام برابر 1 است، یعنی هر پیکسل شامل 2N مقدار است که مجموع آنها 1 میشود. یکی از ضعفهای SLBP در مقایسه با LBP پیچیدگی محاسباتی آن است.
توصیفگر گابور یک روش برای استخراج ویژگی و لبهیابی است که باوجود قدیمی بودن، اهمیت خودش را از دست نداده و امروزه نیز مقالههای زیادی وجود دارند که بخشی از کارشان استفاده از توصیفگرهای گابور است [4] و همچنین مطالعات و روشهای زیادی مبتنی بر آن ارائهشده است. اساس کار توصیفگرهای گابور، تشکیل تعدادی بانک فیلتر با استفاده از مقیاسها و جهتهای مختلف است که برای استخراج ویژگیهای بافتی، این فیلترها به تصاویر اعمال میشوند.
توصیفگر گابور علاوه بر مقاوم بودن در برابر تغییرات مقیاس و چرخش که توانایی شاخص آن است، در مقابل تغییرات نورپردازی و نویز تصویر نیز مقاوم است اما مانند دیگر توصیفگرهای بافت نقاط ضعفی هم دارد که ازجمله آنها میتوان به طول بردار ویژگی بالا و پیچیدگی محاسباتی آن اشاره کرد. عملگر HOG، یک روش برای استخراج ویژگیهای محلی در تصاویر است که میتواند در کاربردهایی مانند شناسایی چهره، تشخیص عابر پیاده و غیره مورداستفاده قرار گیرد .[10] در بینایی ماشین، گرفتن گرادیان از تصویر از اهمیت ویژهای برخوردار است که اولین مرحله از این الگوریتم نیز گرفتن گرادیان از تصویر است و در مراحل بعدی تنها از جهتهای گرادیان برای محاسبات خود استفاده میکند.
ایده اصلی درروش HOG این است که توزیع گرادیانهای محلی یا جهتهای لبه میتواند شکل را بهخوبی توصیف کند، حتی اگر اطلاعات دقیقی از گرادیان یا لبه متناظر نداشته باشیم. این عملگر درواقعجهتِ گرادیانهای تصویر را در یک همسایگی محلی نشان میدهد. تجزیهوتحلیل جهتها، موجب مقاوم بودن در مقابل تغییرات نورپردازی میشود. این الگوریتم، روشی ساده و سریع است و ازاینرو میتوان سریع هیستوگرام آن را محاسبه کرد.
عملگر POEM که نسخه بهبودیافته HOG است، بعد از گرفتن گرادیان تصویر، علاوه برجهت از اندازه گرادیان نیز در محاسبات خود استفاده میکند. این توصیفگر را میتوان بهنوعی، ترکیبی از HOG و LBP نیز بیان کرد [11] که پس از گرفتن گرادیان از تصویر، تصاویر اندازه گرادیان را بر اساس جهتهای کوانتیزه تجزیه میکندسپس، با انباشتنِ17 این تصاویر تجزیهشده، کدگذاری LBP را روی آنها انجام میدهد، سپس هیستوگرام را از هر یک از سلول-های مشخصشده استخراج میکند و درنهایت با کنار هم قرار دادن هیستوگرامهای هر سلول هیستوگرام نهایی را تشکیل میدهد. شکل 1 مراحل الگوریتم POEM را برای سه سطح کوانتیزه نشان میدهد.
نوع بهبودیافته POEM توصیفگر PDO است که اساس کار آن، استخراج جهتهای غالب است .[12] نحوه عملکرد آن همانند POEM است با این تفاوت که بعد از انباشن تصویر با توجه به بزرگترین اندازه در هر یک از تصاویر کوانتیزه، جهتهای غالب را استخراج میکند و سپس عملگر AND را در مقیاسهای مختلف به این تصویر کوانتیزه اعمال میکند و درنهایت برای تشکیل هیستوگرام نهایی، هیستوگرامها را از هر سلول به دست میآورد. شکل 2 مراحل الگوریتم PDO را برای سه سطح کوانتیزه نمایش میدهد. عملگر POEM و PDO بهنوعی مکمل یکدیگرند و از ترکیب این دو باهم نیز استفاده میشود.
-3 روش پیشنهادی
-1-3 چگونگی شکلگیری ایده
روش پیشنهادی از ترکیب بهبودیافته توصیفگرهای POEM و PDO شکلگرفته است. درواقع ترکیب و ادغام بردار ویژگیهای مختلف، مانند توصیفگرهای LBP و گابور یا LBP و SIFT موجب میشود تا مزیتهای هر یک از بردارهای ویژگی درنتیجه نهایی به دست بیاید. نوع بهبودیافته الگوریتم POEM که درروش پیشنهادی استفاده میشود، کدگذاری تصویر انباشتهشده با SLBP بهجای LBP و همچنین نوع تقسیمبندی متفاوت تصاویر SLBP است.
درواقع بهنوعی از توانایی الگوریتم SLBP اینگونه در POEM استفادهشده است. نوع بهبودیافته PDO فقط در قسمت تقسیمبندی تصویر متفاوت است. این تقسیمبندی متفاوت بهصورت سلولهای روی-هم18، الهام گرفته از [10] باکمی تفاوت انجام میگیرد که در شکل 3 نشان دادهشده است. نحوه تقسیمبندی سلولها به این صورت است که اگر در ابتدا m×n سلول داشته باشیم، در مرحله بعد سلول-هایی با همان ابعاد روی تقاطع سلولهای مرحله اول خواهیم داشت که m-1×n-1 سلول میشوند و هیستوگرام نهایی از هر یک از این سلولها به دست میآید.
-2-3 الگوریتم POM
نحوه کارکرد این الگوریتم پس از دریافت تصویر ورودیِ مناسب - آشکارسازی مناسب چهره و نرمال کردن تصویر از جهات مختلف در صورت نیاز - در گام اول گرفتن گرادیان از تصویر است. در گام دوم تصاویر اندازه گرادیان بر اساس جهتهای کوانتیزه، تجزیه می-شوند، سپساانباشتنِ این تصاویرِ تجزیهشده در گام سوم الگوریتم به دوشاخه تقسیم میشود.
در شاخه اول ابتدا اندازه هر پیکسل از تصاویر انباشتهشده بررسی میشود و جهت کوانتیزه مربوط به بزرگترین اندازه، برچسب پیکسل تصویر جهتهای غالب میشود، سپس عملگر AND در مقیاسهای مختلف روی این تصویر اعمال میشود، به این صورت که اگر جهت کوانتیزه پیکسل مرکزی با پیکسل همسایه برابر باشد یک و در غیر این صورت صفر میشود و PDO آن طبق رابطه 1 محاسبه میشود که p پیکسل موردنظر و N تعداد پیکسل-های همسایه است. درنهایت با تقسیمبندی سلولها به روش گفتهشده در - 1-3 - هیستوگرام نهایی از شاخه اول استخراج می-شود.