بخشی از مقاله
چکیده
یک گام اساسی در تجزیه و تحلیل ویدئو کشف و ردیابی اشیاء متحرک میباشد. در این مقاله روشی جدید برای ردیابی اشیاء متحرک در دنباله های ویدئویی ارائه شده است. در ابتدا ناحیه ی هدف به صورت دستی با موس مشخص می شود، سپس ناحیه ای هم مساحت با ناحیه ی شیء در نظر گرفته می شود. به منظور دسته بندی مدل شیء و سپس زمینه از این دو ناحیه شش ویژگی استخراج میشود که عبارتاند از: رنگ هر یک از نقاط ویژگی در فضای رنگ HSV و میانگین، واریانس و دامنهی تغییرات در یک پنجرهی 3×3 پیرامون نقاط ویژگی استخراج شده. پس از استخراج ویژگی ها به منظور آموزش مدل پس زمینه و ناحیه هدف از ماشین یادگیر بیشینه استفاده می شود.
در مرحله بعد مدل دسته بندی شده به یک ماشین یادگیر بیشینه دیگر جهت آموزش به عنوان ورودی داده می شود تا فرآیند آموزش تکمیل شود. در نهایت به منظور یافتن موقعیت هدف در فریم های متوالی از رویکرد جابه جایی میانگین استفاده می شود. نتایج مقایسه ی روش پیشنهادی با دو الگوریتم ردیابی FAST و KLT روی پایگاه داده ی استاندارد Tracking Dataset حاکی از عملکرد مناسب روش پیشنهادی در ردیابی اشیاء متحرک می باشد.
مقدمه
ردیابی هدف متحرک به مفهوم تعقیب هدف متحرک در یک سری تصاویر متوالی است و یکی از مسائل دشوار در بینایی ماشین است. از کاربردهای ردیابی هدف متحرک میتوان به بازشناسی ژست بر اساس حرکت - تحلیل حرکت بازیکنان، شناسایی فرد بر اساس طرز راهرفتن و روند بهبود بیماری - ، نظارت خودکار صحنههای مشکوک - مترو، موزه و پارکینگ - ، نمایهگذاری فایلهای ویدئویی، ارتباط انسان و رایانه از طریق ردیابی حرکات چشم و تشخیص و ردیابی خودکار اهداف متحرک در سامانههای موشکی و ضدموشکی نام برد. برخی از چالشهای ردیابی هدف متحرک، پوشیدگی هدف، تغییرات شدت روشنایی، تغییر حالت ظاهر هدف، صحنهی شلوغ و پیچیده و حرکت دوربین است . - Zhang, Zhang et al. 2013 -
تاکنون روشهای مختلفی برای ردیابی اشیاء متحرک در تصاویر متوالی پیشنهاد شده است. در یک دسته-بندی الگوریتمهای ردیابی به چهار دسته ردیابی نقاط، ردیابی بر اساس هسته1، ردیابی سیاهنما2 و روشهای تفریق پسزمینه تقسیمبندی میشوند . - Yilmaz, Javed et al. 2006 - هر یک از الگوریتمهای مطرح شده در بالا محدودیت هایی دارند که با توجه به شرایط مسئله الگوریتم مناسب انتخاب میشود.
در - Hua, Wu et al. 2008Hua, Wu et al. 2006 - محققین از خوشه بندی ویژگیهای رنگ و مکان با استفاده از الگوریتم خوشهبندی میانگین3 استفاده کردهاند. در این رویکرد ابتدا ویژگیهای شیء و زمینه نزدیک به شیء خوشهبندی شده و با حذف خوشههای مشترک، شیء از زمینه اطرافش متمایز میشود. در این الگوریتم درصورتیکه شیء دیگری با ویژگیهای مشابه با هدف در اطرف آن وجود داشته باشد، مدل هدف ضعیف میشود و حتی ممکن است ردیاب شیء مورد نظر را تشخیص ندهد.
Shuo و همکارانش در مقاله - Avidan 2007 - با استفاده از آموزش ویژگیهای ناحیهی شیء و زمینه اطراف شیء به یک مجموعه از دستهبندهای ضعیف و سپس ترکیب آنها نقشهی احتمال شیء را تشکیل دادند و برای یافتن مکان جدید شیء از روی ماکزیمم نقشهی احتمال، از رویکرد جابهجایی میانگین4 استفاده کردند. آنها از شدت روشنایی شیء و پسزمینه بهعنوان ویژگی برای آموزش استفاده کردند. ضعف این روش استفاده از آستانهگیریهای متعدد است.
در مرجع - Zhang and Ding 2012 - کشف و ردیابی اشیاء متحرک با بروزرسانی مدل پسزمینه با الگوریتم فیلتر میانه انجام می شود. در هر گام پسزمینه با جایگذاری مقدار میانه همسایههای هر پیکسل به روز رسانی شده و با اعمال الگوریتم تفریق پسزمینه نواحی متحرک به دست می آید. در ادامه با الگوریتم مولفه-های متصل اشیاء متحرک کشف شده و از مرکز هر شی به عنوان فاکتور ردیابی استفاده می شود.
در مراجع - , Lim and Kim 2013Lim and Kim 2005 - ابتدا ویژگیهای مرتبط با اشیاء متحرک استخراج شده و در هر مرحله به دنبال اشیاء با این ویژگیهای مشخص میگردند. این مقاله بهصورت زیر سازماندهی شده است: در بخش دوم الگوریتم ردیابی براساس روش ماشین یادگیر بیشینه و جابه جایی میانگین شرح داده می شود. همچنین نتایج حاصل از شبیهسازی روش پیشنهادی بر روی پایگاه دادهی استاندارد Tracking Dataset5 در بخش سوم ارائه خواهد شد.
-1 روش پیشنهادی
در روش پیشنهادی در ابتدا شیء مورد نظر برای ردیابی در فریم اول به صورت دستی آشکارسازی می شود و از آن پس انتظار می رود تا زمانی که شیء در صحنه وجود دارد الگوریتم آن را ردیابی کند. در روش ارائه شده ردیابی دو بعدی اشیاء در یک دنباله ی ویدئویی رنگی مورد نظر است. یک دنباله ی ویدئویی رنگی به عنوان یک مجموعه از تصاویر رنگی تعریف می گردد که از لحاظ معنایی به هم وابسته و از نظر زمانی مجاور هم باشند. همان طور که در شکل 1 نشان داده شده است پس از انتخاب شیء مورد نظر برای ردیابی، ناحیه ای هم مساحت با شیء در اطراف آن به عنوان زمینه در نظر گرفته می شود.
سپس ویژگی های بافت و رنگ از این دو ناحیه استخراج می گردد و این ویژگی ها به عنوان ویژگی های شیء و زمینه به ماشین یادگیر بیشینه آموزش داده می شود و سپس آزمایش می شود. برای مکان یابی محل شیء نیز از مرکز ثقل پیکسل هایی که توسط ماشین یادگیر بیشینه به عنوان هدف تشخیص داده شده است همراه با رویکرد جابجایی میانگین استفاده شده است که به تفضیل در بخش های مربوطه مورد بررسی قرار خواهند گرفت. در الگوریتم پیشنهادی جابه جایی های شدید شیء در اغلب موارد قابل تحمل است و الگوریتم ارائه شده در مواقعی که نواحی شیء در دو فریم متوالی با هم همپوشانی دارد قادر به ردیابی صحیح شیء است.