بخشی از مقاله
*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***
رديابي اجسام متحرک در تصاوير ويدوئي به کمک مدل کردن پس زمينه
چکيده – مدل کردن پس زمينه و پيش زمينه ، نقش مهمي در امر آشکارسازي ورديابي اجسام بازي مي کند. اين مقاله روشي موثر در مدل کردن پس زمينه به منظور آشکارسازي اجسام پيش زمينه براي هر دو محيط ايستا و پويا ارائه مي کند. در روش پيشنهادي تبديل موجک از تصاوير ورودي گرفته مي شود و نتيجه حاصل از آن با نمونه هاي پس زمينه که قبلا ذخيره شده اند، مقايسه مي شوند. مدل پس زمينه ارائه شده قابليت سازگاري با سناريوهاي پيچيده اي از صحنه پس زمينه همچون محيط هاي غير ايستا، اجسام پس زمينه جابجا شده يا اضافه شده ، تغييرات شدت روشنايي و مواردي از اين قبيل را دارا مي باشد. در نهايت رديابي اجسام در تصاوير به کمک مدل ارائه شده صورت پذيرفته است . نتيجه آزمايشات بر روي تصاوير ويدئويي مختلف کارايي روش پيشنهادي را تاييد مي کند.
کليد واژه - تبديل موجک گسسته ، تفاضل پس زمينه ، رديابي هدف ، مدل کردن پس زمينه
١-مقدمه
هر سيستم بينايي کـه مـرتبط بـا دنبـال کـردن ، تفسـير و تشخيص اشياي متحرک در تصوير است ، نيازمند به آشکارسازي مطمئن و بخش بندي نواحي متنـاظر شـي متحـرک مـي باشـد.
آشکارسازي لکه هاي متحرک ، حجم اطلاعات مورد پـردازش در مراحل بعدي مانند دنبال کردن و تشخيص را کـاهش مـي دهـد. معمـولترين روش بـراي آشکارســازي حرکـت در يـک دنبالــه از تصاوير، تفاضل پس زمينه است که به وسيله محاسبه تفاضل قدر مطلق بين فريم ورودي و يک مدل پس زمينه فيلم ويدئويي ، بـه دست مي آيد. تغييرات هوا و شدت روشنايي ، حرکات تکراري بـه علت پارازيت و سايه باعـث مشـکل شـدن بخـش بنـدي تصـاوير متحرک مي شوند. مدل هاي مختلف پس زمينه ، کـه بـا بـه کـار بردن روش ها و مدل هاي وفقي گوناگون ، پـس زمينـه تصـوير را کنند، سبب کاهش اشتباهات در آشکارسازي مي مرتبا به روزمي گردند.
سازماندهي اين مقاله به اين صـورت اسـت کـه در بخـش ۲ ابتدا توضيحاتي مختصر راجع بـه کارهـاي انجـام شـده در مـدل کردن پس زمينه ارائه مي شود. در ادامه در مورد تبديل موجـک و نحوه استفاده از آن در مدل پيشنهادي بحـث مـي شـود و بعـد مدل پيشنهادي به تفصيل بيان مي گردد. بخش ۳ نتايج بدسـت آمده و مقايسه آن با ساير روش هـا را در خـود دارد. در بخـش ۴ رديابي افراد در تصاوير ويدئويي به کمک لکه هاي به دست امـده از قسمت قبل انجام مي پذيرد و نتايج آزمايشات بر روي تصـاوير ويدئويي ارائه مي شود. در نهايت در بخش ۵ نتيجه گيري مقالـه بيان گرديده است .
٢- مدل پس زمينه پيشنهادي
١٢--کارهاي انجام شده در مدل کردن پس زمينه :
روش تفاضل پس زمينه نواحي متحرک در يک تصـوير را بـا محاسبه تفاضل پيکسل مربوط به تصوير کنوني و پيکسل مربـوط به مدل پس زمينه ء تصوير متحرک ، تشخيص مي دهد. يک حـد آستانه نويز از پيش تعريف شده براي تشـخيص نـواحي سـاکن و متحرک استفاده مي شود -۱- . با اين وجود، اين روش نسبت بـه تغييرات ديناميکي منظره بسيار حساس است . معمولا اکثـر روش هاي به کار گرفته شده قبلي در ساختن مدل هاي پس زمينه اي وفقي روش هايي مانند متوسط گيـري مـوقتي يـا اعمـال فيلتـر ميانه بر روي يک سري از تصاوير مي باشند -۲- و -۳-. هکـيلا و سيلون -۴- استفاده از يک فيلتر بازگشـتي مرتبـه اول را پشـنهاد کردند. اين فيلتر اطلاعات ورودي جديد را بـه مـدل پـس زمينـه کنوني منتقل مي کند. علاوه بر اين بعضـي از محققـين -۵- و -۶-
به منظور افزایش اطمینان بیش از یک مدل پس زمینه پیشنهاد کردند . یک مدل برای پس زمینه طولانی مدت و دیگری پس زمينه کوتاه مدت .
گريمسن و استافر -۸-، يک مدل ترکيبي پس زمينه تطبيقي پيشنهاد کردند که هر پيکسل را به عنوان ترکيبي از K گاوسـين معرفي مي کند و از يک تخمين درون خطي به منظور بـه روز در آوردن مدل پس زمينه استفاده مي کند.
هاريتاگلو و همکارانش -۹- منظـره پـس زمينـه را بـه طـور آماري و به وسيله مقادير شدت روشـنايي مينـيمم و مـاکزيمم و حداکثر مشتقات زماني براي هر پيکسـل مـدل کردنـد کـه ايـن مشتقات در طول يک دوره آموزش ، ثبت شـده انـد. پارامترهـاي هر مدل به صورت دوره اي به روز در آورده مي شـوند. مقـاديري که به صورت آماري توصيف شده اند، شامل رنگها -۱۰- و يـا لبـه ها -۱۱- و -۱۲- هستند.
٢-٢-تبديل موجک و نحوه استفاده از آن در مدل پيشنهادي :
تبديل موجک ابزاري براي نمايش ويژگي هـاي سـيگنال مـي باشـد. دربرداشـتن همزمـان اطلاعـات فرکـانس و مکـان . زمـان مهمترين مزيت آن نسبت به تبديل فوريه محسوب مي شود.
اعمال تبديل موجک دو بعدي به يک تصوير، چهار زير تصـوير را نتيجه مي دهد. پياده سـازي تبـديل موجـک دو بعـدي بـراي تصوير به اين ترتيب است که ابتدا يک مرحله فيلترينگ و کاهش نممراونحه ل دردرجقهدت م بعخداي ص ب(رمرثولاي عمجوهدت ي )دايعگمرـا(ال فقمي ـ)ي عشماـول دموي هشمـيود.
بدين ترتيب چهار زير تصوير حاصل مـي شـود کـه بـا LL ،LH ، HLو HH نمايش داده شده است . L نشان دهنـده فيلتـر پـايين گذر و H نشان دهنده فيلتر بالا گذر مي باشد.
٢-٣-شرح مدل پيشنهادي :
در اين روش ابتدا چند فريم از پس زمينه براي آمـوزش مـدل مورد استفاده قرار مي گيرد. در فاز آموزش مدل ، ازتصاوير ورودي تبديل موجک با موجک اساسي هار مرتبه سوم گرفته مي شـود.
بدين ترتيب تصويري با ابعاد يک هشتم تصوير اصلي بدست مـي آيد ضمن اينکه عمـل فيلترينـگ هـم روي تصـوير صـورت مـي پذيرد. از تصاوير حاصـل بـه تعـداد N نمونـه ذخيـره مـي شـود.
بنابراين براي هر پيکسل در تصوير ما N نمونه ذخيره شده داريم ،
مثلا براي پيکسل m م از تصوير در زمان t داريم :
مقـدار مولفـه تقريـب (approximation) موجـک مرتبه سوم پيکسل m، در زمان t مي باشد. با توجه بـه اينکـه مـا اين عمل را براي تصاوير رنگي انجام داده ايم لذا براي فضاي رنگ مورد استفاده ما يعني RGB خـود داراي سـه مولفـه مي باشد يعني براي هر نمونه از اين حافظه يک برچسب بـاينري در نظر گرفته مي شود به طوري که نشان دهنـده ميـزان تطـابق بين مقدار نمونه ورودي و مقادير پـس زمينـه ذخيـره شـده مـي باشد. تابع زير اين عمل را انجام مي دهد:
در رابطه ۲ ،c مولفه رنگ مورد نظر را نشان مي دهـد کـه در اين مقاله شامل سه مولفه R،G و B مـي باشـد. حـد آسـتانه نويز به ترتيب مولفـه تقريـب موجـک مرتبه سوم مربوط به مولفه رنـگ c از پيکسـل m در زمـان i و t
مي باشند. تابع برچسب باينري مولفه رنگي c نمونه iم مربوط به پيکسل mم تصوير است . در مورد نحوه انتخـاب در ادامه بحث خواهد شد.
در مرحله بعد بر اساس شـمارش ميـزان تطـابق نمونـه هـا بـا پيکسل ورودي درمورد پيکسل جديد تصميم گيري مي شود :
مقدار حد آستانه اي است که نشان دهنده حداقل تعـداد توافقي است که پيکسل ورودي با نمونه هـاي ذخيـره شـده بايـد داشته باشد تـا بعنـوان پـس زمينـه در نظـر گرفتـه شـود. تـابع برچسبي باينري بـراي پيکسـل mم در زمـان t اسـت و وقتي مقدار يک پيدا کند نشان دهنده اين است که اين پيکسـل پس زمينه است و در غير اينصورت پيکسل مورد نطر متعلـق بـه پيش زمينه خواهد بود. واضح است کـه رابطـه مسـتقيمي بـا يعني تعداد نمونه هـاي ذخيـره شـده بـراي آن پيکسـل دارد. هر چه بزرگتر باشد به تبع آن هم بايـد بزرگتـر انتخاب شود و بر عکس . ما مقدار را براي کليه پيکسل ها ثابت و برابر مقدار از پيش تعيين شده اي در نظر مي گيريم ولـي ممکن است به دلايلي براي بعضي از پيکسـل هـا مقـدار کمتر از مقدار مورد انتظار باشـد. ايـن موضـوع را بـه تفصـيل در قسمت ۲-۳-۴ که درباره به روز رساني مدل صـحبت مـي شـود،
بررسی خواهیم کرد . به طریق مشابه تحت تاثیر است . مثلا اگر مقدار زیاد شود در این صورت شانس این که تعداد
زيادي از نمونه ها با پيکسل مورد آزمايش توافق پيدا کنند بيشتر مي شودف به اين ترتيب مقدار آستانه را بايد بزرگتر انتخـاب کنيم تا نتيجه درست و قابل قبولي بگيريم . يک انتخـاب مفيـد و سودمند اين است که را ضـريبي از حاصلرـضب و در نظر میگیریم ، يعنـي کـه در آن ضـريبي ثابت است .
٢-٣-١- حذف اثرنامطلوب سايه وتغييرات روشنايي :
فضاي رنگ RGB نسبت به تغييرات روشنايي حسـاس اسـت .
به عنوان مثال استفاده از فضـاي رنـگ RGB ممکـن اسـت کـه سبب شود که سايه ها در تصوير به عنوان پيش زمينـه شـناخته شوند. در بسياري از مقالات براي حل اين مشکل از فضـاي رنـگ نورماليزه استفاده کرده اند تا اثر تغييرات شدت روشـنايي را کـم کنند. مولفه هاي رنگي نورماليزه شده با معادلات زير بدست مـي آيند:
اطلاعات تصوير محـروم مي کند لذا به جاي استفاده از سه مولفـه تـرجيح مـي دهيم که از سه مولفه که در آن مولفه شـدت روشـنايي هم لحاظ شده استفاده کنيم . پـس روش خـود را بـدين صـورت اصلاح مي کنيم که به جاي تبديل موجک گـرفتن از سـه مولفـه اصلي R،G و B از تصوير، از مولفه هاي r،g و I تصـوير تبـديل موجک مي گيريم .
فرض کنيم که مقدار مولفه هاي مربوط به نمونه b م از پيکسل باشد و مقدار پيکسل مورد بررسـي در زمان t باشند. اگر پيکسل مـورد نظـر بـه خـاطر قـرار گـرفتن در سايه ، تاريکتر شود نتيجه اين مـي شـود کـه و همچنين چنانچه اين پيکسل تحت نورديدگي قرار گرفتـه باشـد داريم بنابراين تغييرات شـدت روشـنايي کلـي بــراي پيکســل را مــي تــوانيم بــه ايــن صــورت نشــان دهــيم :
پس به تبع آن معادله ۱ به صورت زير تصحيح مي شود
که در آن به صورت تجربي انتخـاب مـي شـوند و مـا مقدار آنها را تنظيم کرده ايم .
٢-٣-٢-انتخاب مقدار آستانه :
براي تعيين مقدار دو روش وجـود دارد. يکـي اينکـه کليـه پيکسل هاي يک مقدار تجربي در نظر بگيريم . اما در ايـن حالـت بدست آوردن يک مقدار مناسب براي کليه پيکسل هـا کـاري دشوار و برخي مواقع ناممکن است . روش دوم اينست کـه مقـدار مناسب را با توجه بـه انحـراف معيـار هـر پيکسـل يعنـي تخمين بزنيم . مثلا مي توان مقـدار را مضـربي از در نظـر گرفت . البته اگر توزيع مقادير پيکسل چند مـودي باشـد ممکـن است اين انتخاب دچار اشکال شود و لذا بايـد مقـدار مـاکزيممي براي در نظر گرفت . بنابراين ما براي تعيين مقدار آستانه براي هر پيکسل از هر دو روش بالا استفاده مي کنيم .
T1 مقدار ثابتي است که حداکثر مقدار آستانه را تعيين مي کند.
٢-٣-٣-به روزرساني نمونه هاي پس زمينه :
وقتي که صحنه پس زمينه تغيير مي کند، نمونـه هـاي پـس زمينه بايد به روزرساني شوند تا تغييرات صحنه پس زمينـه را در برگيرند. روش هاي مختلفي براي به روز رساني نمونـه هـاي پـس زمينـه وجود دارد-۱۳-و-۱۴-. اين روش ها داراي معايبي مي باشند. مثلا وقتي جسم پس زمينه در صحنه جابجا شود يا اينکه يـک جسـم جديد به صحنه اضافه شود، در اينحالـت ايـن اجسـام بـه عنـوان پيش زمينه شناخته مي شوند و مدل نمي توانـد خـود را بـا ايـن تغييرات صحنه سازگار کند. براي حل اين