بخشی از مقاله

چکیده

تشخیص لب یک کار مهم در پردازش تصویر و بینایی کامپیوتر است. این مقاله روش مناسبی را برای شناسایی لب با تشخیص کامل مرزهای آن را ارائه میدهد که این کار را با ترکیب تبدیل ویژگیهای affine لب بر اساس مقیاس ثابت آن - ASIFT1 - و الگوریتم ادغام نواحی آن انجام میدهد. ASIFT به طور کامل توسط ویژگیهای affine الگوریتم ثابتی محسوب میشود، بدان معنی که ویژگیها به شش پارامتر affine که عبارتند از انتقال - 2پارامتر - ، بزرگنمایی، چرخش و دو محور تشخیصِ جهت و موقعیت دوربین، ثابت شده است.

ویژگیها بسیار قابل اطمینانند و به ما نقاط کلیدی قویای را میدهند که میتوانند برای تطبیق میان تصاویر مختلفی از یک لب استفاده گردند. ما یک لب را در چندین تصویر با ابعاد مختلف برای یافتن بهترین نقاط کلیدی آموزش دادهایم. سپس، الگوریتم بسیار قویای را برای ادغام نواحی استفاده کردهایم که جهت شناسایی و تشخیص لب، با مرز کامل آن در تصاویر مبتنی بر نقاط کلیدی ASIFT و همچنین اندازهگیری شباهت نواحیِ در حال ادغام تصویر بهکار میرود. نتایج تجربی نشان میدهد که روش ارائه شده، در تشخیص لب آن هم با دقت بالا، بسیار کارآمد و قدرتمند عمل میکند.

-1   مقدمه

استخراج نقاط از یک تصویر است که میتواند بهترین تعریف از یک لب در تصویر باشد که به آن نقاط کلیدی گفته میشود و بسیار مهم و با ارزش میباشند. این نقاط در بسیاری از کاربردهای پردازش تصویر مانند تشخیص لب و شناخت شکل آن، ثبت تصویر و ردیابی لب حائز اهمیت است. با استخراج نقاط کلیدی، میتوانیم آنها را برای یافتن لب درون تصاویر دیگر استفاده نماییم. تشخیص و شناسایی لب با استفاده از نقاط کلیدی و یک الگوریتم قطعهبندی، بسیار دقیق عمل میکند. زیرا که اگر نقاط کلیدی به درستی شناسایی شده باشند، به بهترین اطلاعات از یک لب دست یافتهایم.

همانطور که قبلا اشاره شد، ASIFT به طور کامل و با توجه به پارامتر تبدیل - Morel and Yu,2009 - ، روش ثابتی محسوب میشود در حالی که روش قبلی SIFT با توجه به چهار پارامتر تخصیص که عبارتند از انتقال - 2پارامتر - ، چرخش و تغییر مقیاس - بزرگنمایی - ثابت بوده است - . - David Lowe,2004 بنابراین میتوان نتیجه گرفت که ASIFT با پوشش دو پارامتر دیگر با نامهای عرض و طول جغرافیایی زاویه مربوط به جهت گیری دوربین، روش کارآمدتر و قابل اطمینانتری است و میتواند در تغییر تصاویر بسیار قویتر عمل کند.

بسیاری از الگوریتمهای قطعهبندی و شناسایی لب با داشتن مشخصات منحصر به فرد خود ارائه شدهاند - Papageorgiou and Poggio, .2000 - , - Shivani Agarawal et al,2004 - برخی از این الگوریتمها مجذوب قطعهبندی تصویر بر اساس ادغام نواحی تصویر شدهاند - . - Peng et al,2001 - , - Liu et al,2010 یکی از آنها، الگوریتم قدرتمندی برای تشخیص لب و مرزهای آن ارائه داده است - Ning et al,2010 - اما الگوریتم خودکاری نیست و از آنجا که در این الگوریتم کاربران باید به برخی از موقعیتها و نواحی پسزمینه و لب اشاره کنند تا الگوریتم اجرا گردد، یک مشکل محسوب میشود. در این مقاله ما نتایج ASIFT و الگوریتم ادغام نواحی را با الگوریتم شناسایی لب موجود در تصویر، ترکیب کرده و آنها را با کل نقاط مرزیشان تشخیص دادیم.

الگوریتم پیشنهادی مشکل مطرح شده در الگوریتم ادغام نواحی را ندارد. بدان معنی که لازم نیست کاربر مناطقی را مشخص نماید. ما بهترین نقاط کلیدی لب را که از نتایج ASIFT به دست آمده است را بکار برده و آنها را بر روی تصویر اجرا مینماییم. با این تفاسیر این الگوریتم یک الگوریتم خودکار خواهد بود که نیازی به علامتگذاری منطقه خاصی توسط کاربر ندارد و در عوض نقاط کلیدی بهدست آمده از ASIFT را جایگزین این امر خواهد بود.

Lowe یک الگوریتم شناسایی را که مبتنی بر SIFT بود، ارائه داد - David G. Lowe, 1999 - اما شناسایی لب و الگوریتم تشخیص کل مرز لب آن هم با استفاده از ASIFT هنوز ارائه نشده بود. بنابراین، در این زمان ما الگوریتم خودکاری برای شناسایی لب با تشخیص کل مرز آن لب که با استفاده از نقاط کلیدی حاصل از الگوریتم ASIFT است را ارائه دادهایم. این نقاط کلیدی بسیار موثرند و درباره لب هدفی که میخواهیم آن را در تصویر بیابیم، بهترین اطلاعات را به ما میدهد.

-2   الگوریتم ASIFT

الگوریتم ASIFT، بهبود یافته الگوریتم SIFT است. SIFT توسط Lowe در سال 1994 ارائه شده بود که با 4پارامتر از 6پارامتر تبدیل affine ثابت شده است. asift تمام مناظر تصویر که توسط زاویه طول و عرض جغرافیایی - دو پارامتر جهتگیری دوربین - بهدست آمده را شبیه سازی میکند و سپس پارامترهای دیگر را با استفاده از الگوریتم SIFT اجرا مینماید. این مفهوم جدیدی به نام انتقال است که به تعیین میزان میان دو گونه تصویر، طراحی شده است. در ادامه، مراحل عمده الگوریتم را توصیف خواهیم کرد.

-2-1 مدل دوربین affine

اعوجاجات تصویری که از تغییرات مناظر آن به دست آمده را میتواند با تبدیلات مسطح affine مدل کند. هر طرح A از affine به صورت ذیل تعریف شده است : که ما   در نظر گرفتیم که در آن  ،   عامل تعیین کننده A،   زاویههای چرخش،  ، و   لب است که ماتریس قطری نامیده میشود و اولین مقدار مشخصه آن   و دومین مقدار آن 1 می باشد. شکل 1 تفسیر حرکت دوربین با مقدار 1 را نشان میدهد.   و   به ترتیب طول و عرض جغرافیایی محور نوری - محور اپتیکال - دوربین هستند،   مربوط به بزرگنمایی - زوم - و زاویه سوم هم   است که چرخش دوربین را پارامتربندی مینماید.

با توجه به مقدمه، هر تصویر باید توسط شبیهسازی کلیه اعوجاجات ممکن affine که ناشی از تغییرات محورهای نوری دوربین از موقعیت روبروست، تبدیل شده باشد. این اعوجاجات به دو پارامتر طول و عرض جغرافیایی بستگی دارند. چرخشها و شیبها برای تعدادی متناهی از زوایا به جهت کاهش پیچیدگی و زمان محاسبه انجام شدهاند.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید