بخشی از مقاله
چکیده -
در روند طبقه بندی نقاط مجاور بدرستی نتوانتسته ایم در جهت بهره وری اطلاعات بیشتر در مجموعه تصاویر پیش برویم. در نظر داریم تا با استفاده از روش کدینگ غیر منفی خود تنظیمی مسافت مجموعه های بین آنها را تعریف نموده تا به موجب آن روند تشخیص چهره به شکل بهتری صورت گیرد. مسافت مجموعه بین نقاط مجاور را متناسب با بردارهای چندضلعی بدست می آید و ازطرفی متناسب با نمونه مجموعه ها در حالت خود تنظیمی را در پیش خواهیم داشت. قابلیت خود تنظیمی خود محدودیتی را در بردار پایه چند ضلعی بوجود آورده است که مشابهت بسیاری با نقاط مجاور آن دارد.
مطابق با محدودیت غیر منفی شدگی بدرستی می توان اطمینان حاصل نمود که هریک از نقاط مجاور بطور تقریبی از ترکیبات خطی مثبت از نمونه مجموعه ها بدست آمده اند.هردوی این موانع را می توان در قالب مساله بهینه سازی کوژ و روش تسریعی گرادیان تقریبی با روند نمایش خطی اقلیدسی فرمول بندی ساخته تا بتوانیم آنها را به شکل نقاط تقریبی کارآمد در بین مجموعه تصاویر بیابیم. حال با استفاده از نقاط مجاور بین مجموعه داده های درخواستی و کلیه مجموعه گالری ها و نمونه های فعال آن ها را معین ساخته اند.
-1 مقدمه
مساله تشخیص چهره از مجموعه تصاویر می باشد که در آن طبقه بندی بر اساس مجموعه ای از تصاویر مورد پرس و جو به جای یک تصویر واحد صورت می گیرد. در طول طبقه بند ی، مجموعه تصاویر مورد پرس و جو - آزمایش - ، برای شناسایی نزدیکترین نمونه با استفاده از چندین معیار فاصله معین می گردد. تصاویر مختلفی از چهره یک شخص، جهت آموزش و آزمایش در نظر گرفته می شود.
این تصاویر ممکن است برگرفته از دوربین ها، البوم های مربوط به تصاویر شخصی و یا منابع آنلاین و مطابق با حالت های مختلف چهره تحت تاثیر ژست و روشنایی باشد. در یک مجموعه، روابط معنایی مشترک، در بین تصاویر چهره به اشتراک گذاشته شده است، که نشان می دهد که کلیه تصاویر متعلق به یک نفر می باشد. این تصاویر چهره خود توانسته اند تغییرات ظاهری شخص را در شرایط مختلف به شکل بهتری تکمیل کنند. در حالی که مجموعه تصاویر فرصت های بیشتری جهت تشخیص چهره در اختیارمان قرار می دهند
.تشخیص براساس تصاویر ویدیویی از جمله موارد خاص در روند طبقه بندی تصویر است که در آن روابط زمانی بین فریم های متوالی فرض می شود. در طبقه بندی مجموعه، روابط زمانی بین تصاویر یک مجموعه ممکن است وجود نداشته باشد. برای مثال تصاویر موجود در یک آلبوم تصاویر را نمی توان در قالب یک روند زمانی پیوسته در نظر گرفت. در واقع بیشتر ترکیبات بدون قید، منجر به تصاویر نا مشخص می شود که حتی خارج از فضای چهره انسان می باشد.
برای اطمینان از اینکه فاصله بین دو زیر مجموعه در نقاط مرتبط با چهره های احتمالی و ممکن نمونه های متوالی اندازه گیری شده اند، قی ود مهمی را باید در نظر گرفت. ما دو قید را جهت طبقه بندی تصاویر چهره در نظر می گیریم. یک مجموعه تصاویر شامل تصاویر نمونه و لای ه اصلی تخمین زده شده از نمونه هاست. فاصله بین مجموعه به صورت فاصله بین نزدی ک ترین نقاط از لایه اصلی آنها تحت خود تنظیمی و قیود غیر منفی تعریف می شود .
با ترکیب خطی بردارهای پایه عمود بر هم لایه اصلی، نزدیک ترین نقطه، با روش خود تنظیمی بر ضرایب مدل تحت قید قرار می گیرند. لازمه این امر آن است که نزدیک ترین نقاط، مشابه اجزای فرد - بردارهای پایه اندازه گیری شده - استفاده شده باشد. چنانچه ی ک ترکیب خطی از نمونه های مجموعه، نزدیک ترین نقاط طی روش نامنفی در ضرایب نمونه ها تحت قید قرار گرفت این مساله به عنوان بهینه سازی محدب تحت قید و الگوریتم بردار گرادیان پروکسیمال تسریع یافته برای حل موضوع بررسی شده است.
در این بین باید خاطر نشان ساخت که Cevikalp و Triggs نزدی ک ترین نقاط بین لایه های اصلی مجموعه تصاویر را بدون هیچ گونه قیدی یافتن.[2] در اینجا الگوریتم پیشنهادی ما الگوریتم بردار گرادیان پروکسیمال تسریع یافته 1 - APGP - میباشد.
با توجه به مقایسه روشهای مختلف و عملکرد الگوریتم پیشنهادی بهبود یافته و خروجی مطلوب آن که پس از تست بر روی دیتابیس[4]Honda مشاهده شد - شکل - 2، عمدتا صحت آن بالای %95 بوده است لذا می توان نتیجه گرفت که الگوریتم بهبود یافته پیشنهادی توانسته است با دقت بسیار بالای خود عملکرد کاملا مطلوبی را ارائه نماید. دربخش بعد ریاضیات کار و قیود را توضیح داده در بخش سوم به توضیح الگوریتم پیشنهادی میپردازیم و نتایج شبیه سازی را نمایش میدهیم و در بخش اخر نتیجه گیری.
تصاویر به حالت سه گانه X c x1 c , x2 c , .... ,xn c c معین می شود. در مقایسه با نمایش محکم همچون لایه محدب، لایه اصلی به گونه ای بوده است که می توان لایه را به شکل نسبی مدل سازی نمود که البته به طور ظاهری شکل مشخصی در مقایسه با ترکیبات لایه نمونه به همراه دارد. این نمایش گسسته متناسب با سایز مجموعه کوچکتر در نظر گرفته می شود.
-1-2کدینگ نامنفی با قابلیت خودتنظیمی
دو مجموعه تصاویر چهره a و b را در نظر بگیرید، می توان فاصله بین مجموعه ها را با یافتن نزدیکترین نقاط با توجه به فرمول - 3 - معین ساخت.
-2نمایش مجموعه چهره ها
در اینجا یک مجموعه تصاویر مشترک از تصاویر نمونه و مدل لایه اصلی مشتق از نمونه ها نمایش داده می شود. این نمایش مشترک قدرتمند است چون خود نمونه و اطلاعات ساختاری رادر برمی گیرد. زمانی که x1, x2 ,...,xnc X c باشد ، cth مجموعه تصاویر را نشان می دهد، که در آن xi بردار ویژگی تصویر i th می باشد. ویژگی های تصویر با توجه به مقادیر پیکسلی با بعد بالا یاهریک از ویژگی های دیگر همچون ضرایب 2PCAو یا الگوهای [6]3LBP معین می شوند. لایه اصلی یک کلاس از فرمول - 1 - بدست می آید.
این روند را می توان در قالب مساله حداقل مربع، مجددا فرمول نویسی کرد.البته این راه حل چندان کارآمدی نمی باشد زیرا جفت بدون قید از نزدیکترین نقاط از لایه اصلی به دست می دهد. در حالی که نزدیکترین نقاط در قالب ترکیبات خطی چهره های نمونه و یا لایه اصلی عمود برهم نمایش داده می شوند، فرمول - 6 - قابل بحث و بررسی است.
که در آن V و ، ضرایب بردارهای پایه و نمونه هستند. عبارت دوم برای مقابله با قیود غیر منفی بر ضرایب نمونه اضافه شده است. عبارت دوم خود بنحوی است که می تواند فاصله بین دو نمایش را به حداقل رساند. بنابراین لازم است اطمینان حاصل نمود که ترکیبات مرتبط نمونه ها، ترکیب لایه اصلی است. این نوع فرمول بندی، فرمول را با حذف قید1 ساده می کند.حال با توجه به نمایش نقاط مشابه، عبارت دوم به شکل ایده آل برابر صفر بدست می آید. اگرچه عملا،بدنه مقعر تنها ابعاد مهم PCرا مدل سازی می کند.
-2-2قیود خود تنظیمی براساس لایه اصلی
در این بین باید دانست که کلیه ترکیبات خطی بردار پایه لایه اصلی، نقاط معتبر در مجموعه را دارا نبوده اند. بواقع بیشتر ترکیبات خطی بدون قید پدیدار شده در نقاط بیانگر وجود طبقه نمی باشد. ما در اینجا در نظر داریم تا قیود خود تنظیمی را به شکل ساده به روی کارآوریم که ترکیبات خطی بردارهای پایه را وادار می کند تا نقاط مشخصی را ایجاد نمایند. به شکل دقیق تر، بردارهای پایه فردی شباهت بسیاری به ترکیبات خطی نهایی دارد. در مقایسه دو مجموعه، ما نزدیکترین نقاط بهینه را که مشابه با اجزای لایه اصلی مورد استفاده در تولید آنها هستند را می یابیم. روند خود تنظیمی خود به منزله آن است که نقاط بدرستی، بیانگر مجموعه ها می باشد. این امر طی کمینه سازی مجموع فواصل مهالانوبیس مربع بین ترکیب تولیدی و اجزای پایه فردی قابل بحث و بررسی است.
به حداقل رسانی Rv درv ، فاصله مهالانوبیسx را از میانگین طبقات در ماتریس کووارایانس معکوس به حداقل می رساند که خود از احتمالات توزیعی مجموعه نمونه ها بدست آمده است .[11-7] نقطه ای که فاصله M کوچکتری از میانگین توزیع دارد، احتمال معتبر واقع شدن آن در مقایسه با ترکیبات دلخواه از بردارهای پایه بیشترخواهد بود. فرمول بهینه تنظیم شده که به کمک آن می توان نقاط نزدیک بهینه بین مجموعه چهره ها را یافت به صورت - 9 - است.
که در آن 2 پارامتر سبک و سنگینی است که می تواند بیش از پیش اهمیت نسبی تنظیم گر ها را معین و تحت کنترل خود قرار دهد. حال فرضا1 را جهت سادگی در پیش روی داریم. در این بین باید خاطر نشان ساخت که 4 LCCو واریانس ساده شده آن و5LCCتوانسته اند از رابطه بین مولفه های پایه و بردار تقریبی استفاده کنند و به موجب آن کدینگ خطی را تنظیم نمایند. اگرچه روند خود تنظیمی ما به شکل متفاوت قابل ارزیابی است. زیرا بردار تقریبی در قالب ترکیبات خطی مولفه های اصلی یکی از متغیرهای بهینه سازی بوده، و بنابراین در مورد [12] LLC و [13] LCC بدرستی صدق نمی کند.
-3-2قیود نامنفی بودن برضرایب نمونه
با توجه به به آنچه که از قبل در این زمینه در پیش روی داشته و فراگرفته ایم می دانیم که نمونه های مجموعه خود به یک شی تعلق دارند. در حالی که ترکیب مثبت نمونه از نظر معادلات ریاضی قابل تشریح و از نظر فیزیکی پرمعنا واقع شده اند، در اینجا ضرایب نمونه آلفا را به حالت غیر منفی محدود می سازیم. ترکیبات غیر منفی تصاویر چهره و یا ویژگی های مربوط به آن بطور احتمالی در قالب یک چهره معتبر دیده می شوند.
در این بین باید خاطر نشان ساخت که قیود غیر منفی بر ضرایب نمونه وارد شده اند نه بردارهای پایه، زیرا پایه عمود بر هم طی تحلیل اجزا و بردارهای آن بدست می آید که البته بردارهای آن تناسب لازم با چهر ه های معتبر را به همراه نداشته اند. بنابراین مقادیر منفی بردارهای پایه را در قالب بردار معتبر تلقی ساخته اند که در آن چهره منفی از نظر فیزیکی معنادار واقع شده است. بنابراین منطقی به نظر نمی رسد که عامل غیر منفی بر ضرایب بردارهای پایه را تشدید نماییم. طی ترکیب ساختن این قیود، کدینگ غیرمنفی خود تنظیمی متناسب با مساله بهینه ساز ی تحت قید فرمول - - 10 می باشد.