بخشی از مقاله
چکیده
امروزه ردگیری بهعنوان مسأله طبقهبندی دودویی درنظر گرفته میشود که شیء را از پسزمینه متمایز میکند . برخی از طبقهبندهای دودویی که بدین منظور استفاده شده، توانایی اداره کردن نقاط پرت را ندارند که باعث کاهش عملکرد سیستم ردگیر شده است. طبقهبندهای تککلاسه نیز بهدلیل آنکه تنها از نمونههای کلاس هدف استفاده میکنند، موجب مشکل بیمقصد رفتن هدف ردگیری شده میشود. در این مقاله از طبقهبند تککلاسه همراه با نمونههای منفی استفاده میشود که اطلاعات صحنه در ساخت مدل هدف دخالت میکند. با توجه به نتایج و آزمایشها، مشاهده میشود که استفاده از اطلاعات زمینه بهعنوان نمونههای منفی در مقایسه با روشی که فقط از نمونههای مثبت استفاده میکند، باعث افزایش قابل ملاحظه کارایی ردگیر میشود.
-1 مقدمه
ردگیری1 مسألهای مهم درزمینه بینایی کامپیوتر است که در چند دهه اخیر بهطور گسترده موردمطالعه قرارگرفته است. درحال حاضر، روشهای ردگیری با تشخیص 2، ردگیری را بهصورت مسأله طبقهبندیِ دودویی درنظر میگیرند که در این حالت شیء از پسزمینه3 متمایز میشود. بهعبارت دیگر، نواحی هدف بهعنوان نمونههای مثبت و نواحی غیر هدف بهعنوان نمونههای منفی در نظر گرفته میشوند و طبقهبند آموزشدیده مرز تصمیمی را پیدا میکند که مثبتها و منفیها را به بهترین نحو جدا نماید. ازجمله روش های مورد استفاده برای طبقهبندی کهتوانایی خوبی برای کنترلِ داده در ابعاد بالا دارند، ماشینهای بردار پشتیبان[1] 4 و یا طبقهبندهای بهدست آمده توسط الگوریتم [2] Adaboost هستند.
همچنین روشهای یادگیری نیمه ناظر نیز برای ردگیری شیء بهعنوان یک مسأله طبقهبندی دودویی نیمه ناظر برخط5 پیشنهاد شدهاند. که در این روش ها علاوه بر استفاده از نمونههای برچسبدار، از نمونههای بدون برچسب نیز استفاده شده است تا توانایی خوبی برای اداره کردن نقاط پرت6 داشته باشد. بااین وجود، جمعآوری داده-های بدون برچسب باعث هزینه محاسبات بالا میشود [3] ازاینرو عملکرد سیستم ردگیری در پردازش بلادرنگ 7 کاهش مییابد . علاوه بر این، روشهای ردگیری نیمه ناظر مشکل داده پرت را بهطور کامل حل نمیکنند که منجر به مشکل بیمقصد رفتنهدفِ8 ردگیریشده میشود.
در روش ارائه شده در [4] برای حل این مشکلات، از طبقهبند تککلاسه9 استفاده شده است که توانایی اداره کردن نقاط پرت و همچنین کنترل داده با ابعاد بالا را دارد. بااین وجود، بهدلیل درنظر گرفتن تنها نمونههای مثبت در طبقهبند SVDD همچنان مشکل بیمقصد رفتن هدف در ردگیری مشاهده میشود. ایدهای که به ذهن میرسد استفاده از اطلاعات زمینه 10 صحنه بهعنوان نمونههای منفی است که باعث ارائه مدل بهتری از هدف میشود.
در روش ارائه شده، از طبقهبند تککلاسه همراه با نمونههای منفی11 استفاده شده است که مدل پسزمینه را در ساختن مدل پیشزمینه12 دخالت میدهد و مدل مقاومتری از هدف بهدست میآید. این روش مدلی متفاوت با طبقهبندهای دوکلاسه - مانند - SVM ارائه میدهد که توانایی اداره نقاط پرت را دارد همچنین با درنظر گرفتن نمونههای هر دو کلاس، یادگیری مقاومتری نسبت به طبقهبند تککلاسه ایجاد می شود. ادامه مقاله به شرح زیر است: بخش 2 مروری بر کارهای گذشته است. در بخش 3 روش پیشنهادی مطرح شده و در بخش 4 نتایج و آزمایشها قرار دادهشده است و درنهایت بخش 5 نتیجهگیری ارائهشده است.
-2 مروری بر کارهای گذشته
روشهای ردگیری با تشخیص خانوادهای از روشهای یادگیری با ناظر یا نیمه ناظر میباشند که ردگیری را بهصورت مسأله طبقهبندی دودویی درنظر میگیرند. در این ردگیری از ماشین بردار پشتیبان بهعنوان طبقهبند استفاده میشود که دارای عملکرد مناسبی برای ردگیری وسایل نقلیه در حال حرکت است .[1] بااینحال در این روش SVM بهصورت برخط بهروزرسانی نمیشود که منجر به کاهش کارایی در ردگیری شده است. Grabner و Bischof از الگوریتم [2] Adaboost برای اجرای برخط استفاده کردند که نمونههای مثبت و منفی را بهصورت برخط جمعآوری میکنند. بااینحال این روشها ممکن است باوجود پسزمینه پیچیده دچار مشکل بیمقصد رفتن هدف در ردگیری شوند.
Babenko و همکارانش [5] از یادگیری چندگانه نمونه13 استفاده کردند که منجر به نتایج خوبی در ردگیری شده است. Tang و همکارانش [6] برای بهرهگیری از ویژگیهای مستقل چندگانه برای آموزش طبقهبندهای برخط، از co-training استفاده کردند. این طبقهبندها بهطور مشترک دادههای بدون برچسب را طبقهبندی میکنند و دادههای برچسبدار جدید را برای بهروزرسانی یکدیگر استفاده میکنند. هر ویژگی برای آموزش SVM برخط استفاده میشود و خروجیهایشان برای گرفتن نتایج نهایی طبقهبندی ترکیب میشوند .
روشهای ردگیری با تشخیص که در بالا ذکر شد، ردگیری را بهعنوان مسأله طبقهبندی دودویی در نظر گرفتهاند. مشکل رایج آنها این است که نمیتوانند بهطور کامل نقاط پرت را اداره کنند که منجر به ردگیری نادرست میشود. همچنین یادگیری نیمهناظر نیاز به تعداد زیادی نمونه بدون برچسب برای یادگیری دارد که باعث هزینه اضافی در استخراج ویژگی و طبقهبندی میشود. برای حل این مشکلات، Keren Fu و همکارانش [4] از طبقهبند تککلاسه استفاده کردند که در این طبقهبند تنها نمونههای مثبت درنظر گرفته میشوند، که همچنان شاهد ضعف ردگیر در محیطهای پیچیده هستیم.
-3 روش پیشنهادی
همانطور که گفته شد، در مسأله ردگیری ویدئو، برای ساخت مدل هدف یک طبقهبند تککلاسه در نظر گرفتهشده است. در این روش نمونههای کلاس غیر هدف که بهسادگی قابلدسترس هستند در ساخت مدل هدف تأثیر ندارند و برگرفته از مفهوم یادگیری زمینه، اطلاعات صحنه در یادگیری مدل هدف دخالت ندارد که این امر موجب بیمقصد رفتن هدف در ردگیری میشود. در روش ارائه شده، برای ساخت مدل هدف از طبقهبند تککلاسه همراه با نمونههای منفی استفادهشده است.