بخشی از مقاله
چکیده
توانایی شناخت و ارزیابی اشیاء متحرک در محیطهای مختلف به وسیله تکنیکهای پردازش تصویر و بینایی ماشین، یکی از موضوعات به سرعت در حال تحول است که در بسیاری از برنامههای کاربردی سیستمی مانند امور نظارتی، پزشکی، سیستمهای حمل و نقل، ورزشی، رباتیک و غیره اهمیت فراوان دارد. این مقاله به بررسی فرآیند تشخیص و رهگیری عابران پیاده با استفاده از فیلتر کالمن دو بعدی با رویکرد نظارتی میپردازد.
روش پیشنهادی، استفاده از تکنیک تفریق پسزمینه با مدل گوسین ترکیبی بوده که بر اساس معیار حرکت و رنگ به تشخیص پسزمینه پرداخته و سپس از فیلتر کالمن به عنوان یک فیلتر کنترلی بازگشتی، با اندازهگیریها و محاسبات مربوطه به برآورد حالت و ردیابی عابران پیاده میپردازد. پیادهسازی و نتایج حاصل از اجرای روش پیشنهادی نشان میدهد که این روش از سرعت و دقت بالا و بار محاسباتی کم و نتایج موثرتری نسبت به روشهای مشابه موجود برخوردار است. به علاوه در سیستمهای نظارت مونیتورینگ که امنیت و دقت بالایی میطلبند، از اهمیت خاصی برخوردار است.
مقدمه
پردازش تصاویر ویدیویی، یکی از شاخههای مهم پردازش تصویر در برنامههای کاربردی به ویژه در زمینه تعاملات انسان- ماشین میباشد. تشخیص و تعقیب و تحلیل و ردیابی اشیا متحرک موجود در صحنههای ویدئویی، از جذابترین زمینههای تحقیقاتی رشدیافته در سالهای اخیر است که شامل بخشهای مختلفی مانند تشخیص حرکت، حذف اشیا متحرک غیرلازم - مانند برگ درختان، سایهها و غیره - ، تعقیب مسیر حرکتی و یا ردیابی شیء متحرک، روش ترکیب دادههای دوربینها در فضاهای مختلف و وسیع میباشد.
معمولا همه سیستمهای تشخیص یا نظارت خودکار، مکانیزمهای تشخیص اشیا مورد نظر در میدان دید خود را به ردیابی و فعالیتهای اشیا در نواحی مشابه تصویر محدود میکنند و در بیشتر سیستمهای مبتنی بر بینایی، معمولا از روش تفریق پسزمینه استفاده میشود که در آن مدلی از صحنه پسزمینه ساخته میشود و برای هر پیکسل در تصویر، انحرافهایی از مقادیر ویژگیهای پیکسل از مدل یافت میشود تا پیکسل به عنوان متعلقاتی از پسزمینه یا پیشزمینه طبقه بندیگردد. تفریق پسزمینه، بخشی از فرآیند تشخیص حرکت است که برای انجام آن پسزمینه حذف میشود و فقط سایهها و نویزها باقی میمانند.
بعد از حذف پسزمینه، سایههای متحرک و نویزها، باید هر شی متحرک در صحنه را ردیابی کرده و مسیر حرکتی آن تجزیه و تحلیل شود. مثلا در مسابقات ورزشی. ردیابی اشیا در دنبالههای ویدئویی فرآیندی چندگانه، دشوار و چالش برانگیز است. زیرا عابرین پیاده دارای تنوع حالات گوناگون درصحنههای ویدیویی هستند. روشهای بسیاری برای تفریق پسزمینه وجود دارد که روشهای قدیمیتر بر اساس ویژگیهای شی مانند رنگ، شدت، لبه، بافت و غیره میباشد. این روشها ارتباط بین فریمهای همسایه را بررسی نمیکنند و به عبارت بهتر از ویژگیهای حرکت استفاده نمیشود.
روشهای جدید از ویژگیهای حرکتی استفاده می-کنند که پیچیدگی زمانی بیشتر ولی نرخ تشخیص بهتری دارند - . - Bandarupalli, 2010 الگوریتمهای ردیابی گوناگونی از جمله جریان نوری، مدل مخفی مارکوف، مینشیفت، برای حل مشکلاتی نظیر بروز انسداد و درهم و برهمیعابرین بکارگرفته شدهاند که هرکدام مزایا و معایبی دارند. از عمدهترین معایب آنها بار محاسباتی بالا و هزینه زیاد است. فیلترکالمن هنوز هم بیشترین الگوریتم معمول در ردیابی بوده، از این رو برای تشخیص و ردیابی عابرین پیاده در صحنههای نه چندان شلوغ از آن استفاده میشود - . - Bandarupalli, 2010 در اینجا بطورخلاصه برخی از روشهای بکار رفته از الگوریتمهای تفریق پسزمینه بررسی شده است.
· در مدل مبتنی بر ویژگی، تشخیص بر اساس اطلاعات مورد علاقه در تصویر، مانند ترکیب رنگ، لبهها، گوشهها و مرزها میباشد. ویژگیهای ماشین بردار پشتیبان - SVM - و موجکHaar، برای آموزش یک آشکارساز عابر پیاده اعمال شده است. روش تطبیق تصویر با استفاده از تبدیل فاصله که شامل ویژگیهای استخراج شده محلی در مکان-های مختلف تصویر مانند نقاط لبه است. یک رویکرد دو مرحلهای که ابتدا یک Codebook حاوی اطلاعاتی از ساختارهای شکل محلی بر روی شی بوده و سپس مدل شکل مجازی برای طبقهبندی و تشخیص اشیاء آموزش می-باشد. به علاوه ویژگیهای محلی استاتیکی از قبیل شدت، از اطلاعات ویژگیهای حرکت محلی برای تشخیص صورت و شخص عابر پیاده استفاده میکند.
هیستوگرام نرمال محلی گرادیانی - - HOGکه از نمودار جهت- لبه استفاده میکند و نتایج قوی و امیدوار کنندهای برای تشخیص دارد، توصیف شده است.عمدهترین ایراد این روش ها، انتخاب ویژگی است که نیازمند دقت در تهیه اطلاعات اولیه از تصویر و شی و ویژگیهای آنهاست. این الگوریتمها، محاسباتی جامع و گران را میطلبند و از بار محاسباتی بالایی برخوردارند. روش ترکیبی از گوسیها - MOG - نیز که یک روش غیرپارامتری بوده و بدون نیاز به ذخیره تعداد زیادی از فریمها در بافر، آپدیت میشود æ هزینههای حافظه را کاهش میدهد - . - Shayegh Broojeni & Moghadam Charkari, 2009
· تشخیص مبتنی بر الگو - تمپلیت - فرایند تطبیق ویژگی است که ویژگیهای قالبها یا الگوهای ردیابی در مرحله مقداردهی اولیه از فرآیند تشخیص، آموزش داده میشوند و انسداد و به دو نیم شدن از عمده مشکلات آن است . - Shayegh Broojeni & Moghadam Charkari, 2009 -
· یک روش مرسوم تشخیص مبتنی بر حرکت، تفریق پسزمینه است که در آن تصویر فعلی از یک مدل پسزمینه مرجع کم میشود و قابلیت تفکیک اشیاء غیرثابت و جدید در آن وجود دارد. روش تفاضل فریم بر اساس انتخاب معیار آستانهها عمل میکند . - Bandarupalli,2010 - این لگوریتم دارای یک نقص ذاتی است و آن وابستگی کامل داشتن به حرکت اشیاء است. به علاوه از منطق فازی با میانگین گاوسی استفاده شده و فقط %6 دقت بیشتری نسبت به روش میانگینگیری از پسزمینه را داراست. این روش سریع بوده و به حافظه کمی نیاز دارد ولی در تغییرات ناگهانی پسزمینه، قوی نیست . - Hosein Sigari,2008 - مدل فضایی مارکوف بطور وسیعی مورد استفاده قرار میگیرد و برای تشخیص حرکت، از تخمین حرکت آماری استفاده میکندو با اینکه روش تخمینی بسیار قدرتمندی است، اما بسیار وقتگیر میباشد .
· در میان سه روش اصلی موجود برای ردیابی اشیا متحرک، مدل نقطهای، در روشهای طبقهبندی قطعی و احتمالی جزو رویکردهای جبری به شمار میآید . - Bandarupalli, 2010 - الگوریتمی پیشنهاد شده که دو فریم متوالی را در نظر میگیرد که با مقداردهی اولیه توسط معیار نزدیکترین همسایه کار میکند، اما دارای بار حافظه ای بالایی است . - Shayegh Broojeni & Moghadam Charkari, 2009 -
· رایجترین و ابتداییترین روش ردیابی هسته یا - kernel - ، تطبیق الگو است که از روشنایی تصویر و ویژگی-گرادیانی تصویر استفاده شده که محدودیت عمده آن، هزینه محاسباتی بالاست - Shayegh Broojeni & . - Moghadam Charkari, 2009
· الگوریتم Mean Shift از هیستوگرام رنگ برای تعریف ناحیه هدف استفاده میکند از ضریب Bhattacharya æ سایر اطلاعات تیوری شباهت برای اندازهگیری شباهت بین منطقه الگو و منطقه هدف فعلی استفاده می- کند - . - Yang, 2005; Shayegh Broojeni & Moghadam Charkari, 2009 روشهای غیر قطعی و غیر احتمالاتی دیگری نیز وجود دارد که نتایج قابل قبولی ندارند.
روش تحقیق
روش پیشنهادی از دو قسمت تشکیل میشود که ابتدا تشخیص پسزمینه با مدل گوسین ترکیبی و سپس ردیابی با فیلتر کالمن انجام میگیرد.