بخشی از مقاله
چکیده- توصیفگرهای ویژگی مبتنی بر الگوی باینری محلی - LBP - در شناسایی تصویر، عملکرد خوبی دارند. نسخههای بهبودیافته LBP، مانند الگوی باینری محلی متقارن مرکز - CS-LBP - و الگوی سهگانه محلی - LTP - نیز در شناسایی تصویر بهکاربرده میشوند که حد آستانهها برای مقابله با نویز بهصورت دستی انتخاب میشوند و انتخاب حد آستانهای مناسب کاری دشوار است. بدین منظور، عملگرهای الگوی سهگانه محلی تطبیقی - ALTP - و الگوی سهگانه محلی تطبیقی متقارن مرکز - CS-ALTP - که توصیفگرهای ویژگی محلی تطبیقی الهام گرفته از قانون وبر هستند، پیشنهادشدهاند که حد آستانهها بهصورت خودکار انتخاب میشوند و در مقابل نویز مقاومترند.
روش پیشنهادی نیز بر اساس قانون وبر، از حد آستانه گذاری خودکار و الگوریتم الگوی سهگانه محلی متقارن-عمود - OS-LTP - که نسخه بهبودیافته LTP و CS-LTP است، استفاده میکند و الگوی سهگانه محلی تطبیقی متقارن-عمود - OS-ALTP - نامگرفته استنتایجِ. ارزیابی پایگاه داده ORL نویزیشده، برتری روش پیشنهادی را با میانگین 2/33 درصد نسبت به بهترین توصیفگر تطبیقی در حالت-های مختلف نشان میدهد. همچنیننتایجِ، ارزیابی پایگاه داده FERET که شامل تصاویر بدون نویز و باکیفیت است، توانایی الگوریتم پیشنهادی را با میانگین برتری 1/12 درصد نسبت به میانگین نتایج سایر الگوریتمهای نامبرده نشان میدهد. درمجموع، روش پیشنهادی عملکرد عادی در تصاویر معمولی و دقت بالا در تصاویر نویزیشده دارد.
-1 مقدمه
شناسایی چهره، یک موضوع اساسی در بینایی ماشین و شناخت الگو و یکی از موفقترین راهحلهای بیومتریک است که اخیراً موردتوجه بسیاری از محققان و مراکز علمی قرارگرفته است .[1] منظور از شناسایی چهره، سیستمی است که قادر به شناخت تصاویر افراد مختلف، با استفاده از بانک چهره متشکل از یک یا چند تصویر برای هر فرد باشد. مواردی چون تغییر مکان چهره، حالت چهره، تغییر سن و غیره چالشهایی است که در امر شناسایی چهره همیشه وجود دارند.
الگوریتمهای استخراج ویژگی بهطور عمده به دودسته مبتنی بر ظاهر1 و مبتنی بر ویژگی هندسی 2 - مبتنی بر مدل - تقسیمبندی میشوند. روشهای مبتنی بر ظاهر بهصورت سراسری3 یا محلی4، ویژگیها را استخراج میکنند [2] که اخیراً بیشتر کارهای انجامشده به توسعه روشهای مبتنی بر ویژگیهای محلی پرداختهاند، چراکه این روشها در مقابل تغییرات محلی ازجمله نورپردازی و حالت چهره مقاومتر هستند.
توصیفگرهای ویژگی محلی با عباراتی چون توصیفگر محلی، توصیفگر ویژگی یا توصیفگر بافت خوانده میشوند که ویژگیهای محلی یا ویژگیهای بافتی تصویر را مورد ارزیابی قرار میدهند. ازجمله روشهای توصیفگر ویژگی محلی میتوان به [3] 5LBP، [4] 6LTP، موجکهای گابور [5] 7، تبدیل ویژگی مقیاس مقاوم [6] 8 - SIFT - ، ویژگیهای مقاوم سرعتبالا [7] 9 - SURF - ، هیستوگرام گرادیان جهتدار [8] 10 - HOG - ، الگوهای اندازههای لبه جهتدار [9] 11 - POEM - اشاره نمود. LBP یک توصیفگر بافت قدرتمند و LTP نیز توسعهیافته LBP است و در شناسایی چهره موفقتر و در مقابل نویز نیز مقاومتر است. عملگر [10] 12CS-LBP با کاهش طول بردار ویژگی، مشکل ابعاد در LBP را ضمن مقاوم بودن در مقابل نویز، حل کرده است.
با ترکیب CS-LBP و LTP عملگر [11] 13CS-LTP به وجود میآید که مزیت هردو روش CS-LBP و LTP را دارد. الگوریتم 14OS-LTP نیز در [12] معرفیشده است که طول بردار ویژگی آن از CS-LTP هم کمتر است درحالیکه همچنان توانایی توصیف ساختار بافت را دارد. حد آستانه در عملگرهای مقاوم در برابر نویزِ معرفیشده، بهصورت دستی انتخاب میشود. با الهام گرفتن از قانون وبر در [11]، این حد آستانهها بهصورت تطبیقی به دست میآیند. در این مقاله، الگوریتم 15OS-ALTP با حد آستانه تطبیقی، برگرفته از قانون وبر و عملگر OS-LTP پیشنهادشده است که از نسخههای تطبیقی 16ALTP و 17CS-ALTP، در مقابل نویز مقاومتر است.
در ادامه در بخش دوم انواع توصیفگرهای بافت بهصورت سیر تحول از LBP و توصیفگرهای مقاوم در برابر نویز تا رسیدن به روش پیشنهادی معرفی خواهند شد. در بخش سوم روش پیشنهادی که یک توصیفگر بافت مقاوم در برابر نویز بنام الگوی سهگانه محلی تطبیقی متقارن-عمود است معرفی خواهد شد. در بخش چهارم روش پیشنهادی اول با استفاده از پایگاههای داده ORL و FERET مورد ارزیابی قرار خواهد گرفت و در آخر به جمعبندی و نتیجه-گیری کارهای انجامشده پرداخته خواهد شد.
-2 مروری بر کارهای انجامشده
عملگر LBP اصلی بهعنوان یک توصیفگر بافت قدرتمند در [13] معرفیشده است و همچنین مدلهای زیادی از انواع الگوریتمهای بهبودیافته LBP برای تجزیهوتحلیل بافت در کاربردهای مختلف - چهرهیابی، شناسایی چهره، شناسایی حالت چهره و غیره - در [3] پیشنهادشده است. نحوه عملکرد LBP ، مقایسه پیکسل مرکزی با پیکسلهای همسایه و تولید یک کد باینری بهصورت چرخشی است که معادل دسیمال این کد، برچسب پیکسل موردنظر است.
عملگر CS-LBP، یک الگوریتم توصیفگر بافت و نسخه بهبودیافته LBP است .[10] یکی از مشکلات LBP طول بردار ویژگی آن است که این مشکل با مقایسه پیکسلهای همسایه با پیکسل مرکزی بهصورت متفاوت در CS-LBP رفع شده است. به این صورت که بهجای مقایسه هر پیکسل همسایه با پیکسل مرکزی جفت پیکسلهای متقارن با مرکز را باهم مقایسه میکند. در اینجا تعداد الگوهای باینری 2 - N/2 - حالت است که N تعداد همسایهها است. همچنین در نواحی یکنواخت تصویر، به دلیل وجود یک حد آستانه، قویتر از LBP است.
عملگر LTP، یک توصیفگر بافت قدرتمند و توسعهیافتهی LBP به کد سهگانه است [12] و اطلاعات بیشتری از بافت تصویر استخراج میکند و در سطوح یکنواخت در مقابل نویز قویتر است. هیستوگرام LTP، شامل 3N مقدار مجزاست که ابعاد هیستوگرام بسیار بالایی است.برای کاهش ابعاد هیستوگرامِ LTP در [4] تعریف دیگری از LTP نیز وجود دارد که در این حالت طول هیستوگرام نسبت به مدل قبلی کاهش قابلتوجهی مییابد که دو برابر طول هیستوگرام LBP است.
عملگر CS-LTP، توسعه CS-LBP به کد سهگانه و درواقع ترکیبی از CS-LBP و LTP است و برای رفع مشکل بالا بودن ابعاد هیستوگرامِ LTP تعریفشده است. بهمنظور کاهش ابعاد هیستوگرام، عملگر CS-LTP، فقط سطوح خاکستری متقارن با مرکز را مقایسه میکند و مشابه LTP، دو تعریف برای آن وجود دارد. ابعاد هیستوگرام در نوع اول CS-LTP، برابر با 3N /2 است .[12] در این روش اگرچه ابعاد کاهش مییابد اما همچنان توصیفگری قدرتمند در مقابل نویز است. در [11]، نوع دیگر عملگر CS-LTP تعریفشده است که در این حالت، طول هیستوگرام، نسبت به مدل قبلی کاهش مییابد، یعنی برابر 2 - N/2 - ×2 حالت مجزا میشود.
عملگر [12] OS-LTP توصیفگر بافتی است که نهتنها ابعاد هیستوگرام را نسبت به CS-LTP کاهش میدهد، بلکه در مقابل نویز، مقاوم و توانایی تمایز برای توصیف ساختار بافت را نیز دارد. برای کاهش ابعاد هیستوگرام، چهار پیکسل متقارن و عمود بر هم را در همسایگی موردنظر مقایسه میکند. درواقع پیکسلهای همسایه به - N/4 - گروه تقسیم میشوند و کد OS-LTP بهصورت جداگانه برای هر گروه محاسبه میشود و درنهایت هیستوگرامهای محاسبهشده از هر گروه در کنار یکدیگر قرار میگیرند و هیستوگرام نهایی را تشکیل میدهند. طول هیستوگرام در برابر - N/4 - ×32 است.
در [11] برای مقابله بهتر با نویز توصیفگرهای ویژگی محلی تطبیقی18 ارائهشدهاند. با توجه به اینکه حد آستانهها در CS-LBP، LTP و سایر روشهای گفتهشده، برای مقابله با نویز تعریفشدهاند اما مشکل آن است که حد آستانهها بهصورت دستی انتخاب می-شوند که در کاربردهای واقعی، عمل مناسبی نیست و ازآنجهت که اثر نویز بهطور مستقیم وابسته به پیکسل است، باید حد آستانهای مناسب بهصورت خودکار برای پیکسل موردنظر انتخاب شود.
برای رفع این مشکل از تئوری روانشناسان استفادهشده است. ارنست وبر - 19 روانشناس تجربی قرن نوزدهم - دریافت که نسبت بین افزایش و مقدار پسزمینه ثابت بود که قانون وبر نام گرفت. رابطه 1 قانون وبر را نشان میدهد که I نشاندهندهی افزایش، I نشاندهنده شدت پسزمینه اولیه و k نشاندهنده این است که نسبت سمت چپ معادله برخلاف تغییرات I ثابت باقی میماند.
بنابراین با استفاده از قانون وبر میتوان حد آستانهها را بهصورت خودکار تعیین کرد. اینگونه الگوریتمها، توصیفگرهای ویژگی محلی تطبیقی نامیده میشوند. بر اساس قانون وبر، حد آستانه در LTP بهصورت خودکار به دست میآید که ALTP نامیده میشود. همچنین بر اساس قانون وبر، حد آستانه در CS-LTP نیز بهصورت خودکار به دست میآید که CS-ALTP نامیده میشود. دو عملگر تطبیقی نامبرده نسبت به دیگر عملگرها، عملکرد بهتری بهخصوص در تصاویر نویزی شده دارند.
-3 روش پیشنهادی
-1-3 ایده اصلی
-2-3 الگوریتم OS-ALTP
حد آستانه در عملگر OS-LTP بر اساس قانون وبر بهصورت خودکار به دست میآید که درنتیجه OS-ALTP نامیده میشود و در رابطهی 2 نشان دادهشده است که k پارامتر قانون وبر و pi+ - N/2 - نشاندهنده پیکسلهای محلی است که با توجه به مقادیرشان، حد آستانههای مختلف برای یک ناحیه محلی ایجاد میکنند. یعنی به ازای N پیکسل همسایه، N/2 حد آستانه در یک ناحیه محلی تعریف میشود.
عملگر OS-LTP ، در مقابله با نویز اگر بهتر از LTP و CS-LTP نباشد، کمتر از آنها نیست. فارغ از توانایی در استخراج ویژگی این توصیفگر، سرعت بیشتر و ابعاد پایین هیستوگرام آن، سبب شد تا حالت تطبیقی به این عملگر اضافه شود یعنی با استفاده از قانون وبر، حد آستانه در آن بهصورت خودکار تنظیم شود. بنابراین، عملگر OS-LTP، به یک توصیفگر ویژگی محلی تطبیقی ارتقا پیداکرده است که OS-ALTP نام میگیرد.
تقسیمبندی تصویر برای تشکیل هیستوگرام بهصورت سلولهای رویهم20، الهام گرفته از [8] باکمی تفاوت انجام میگیرد که در شکل 1 نشان دادهشده است. نحوه تقسیمبندی سلولها به این صورت است که اگر در ابتدا m×n سلول داشته باشیم، در مرحله بعد سلولهایی با همان ابعاد روی تقاطع سلولهای مرحله اول خواهیم داشت که m-1×n-1 سلول میشوند و هیستوگرام نهایی از هریک از این سلولها به دست می-آید.
گام .2 محاسبهی OS-ALTP بر روی تصویر و کد کردن تصویر با استفاده از رابطه .3
گام .3 تقسیمبندی تصویر کد شده به m×n سلول و سپس اضافه شدن m-1×n-1 سلول با همان ابعاد روی تقاطع سلولهای قبل مانند شکل .1
گام .4 محاسبه هیستوگرام هر یک از سلولها و کنار هم قرار دادن هیستوگرامهای هر سلول و تشکیل بردار ویژگی نهایی.
گام .5 محاسبه نزدیکترین فاصله بر اساس فاصله هیستوگرام کای.21 فاصله هیستوگرام کای در رابطه 5 نشان دادهشده است که p و q بردارهای هیستوگرام برای اندازهگیری فاصله بین دو تصویر هستند.