بخشی از مقاله
چکیده
امروزه سیستمهای حمل و نقل هوشمند به منظور نظارت، کنترل و مدیریت جریان ترافیک مورد توجه زیادی قرار گرفتهاند. تشخیص خودرو بخشی پایهای در این سیستمها به شمار میرود. در این مقاله یک روش تشخیص خودرو بر اساس مدل پایه فعال پیشنهاد شده است. مدل پایه فعال قادر است با تعداد کمی داده آموزشی و بر اساس طرح لبههای آنها به یک الگوی واحد برای انواع خودرو برسد و کاندیدهای خودرو را در تصاویر آزمایشی شناسایی کند. جهت تأیید نهایی کاندیدها، ابتدا آستانهای برای حفظ کاندیدهای شبیهتر به الگوی آموزشدیده تعیین شده است. سپس تقارن الگو متناظر هر کاندید مورد بررسی قرار گرفته است.
بررسی تقارن این الگوی مبتنی بر لبه برای کاندیدهایی که نامتقارن به نظر میرسند، مجدداً پس از چرخش کاندید در دو جهت ساعتگرد و پادساعتگرد صورت میگیرد. این کار، با حفظ کاندیدهایی که نسبت به دوربین مایل هستند باعث افزایش صحت میشود. به منظور بررسی کارایی روش پیشنهادی، آن را روی مجموعهای از ویدیوهای ترافیکی تهیه شده توسط نویسندگان مقاله اعمال نمودیم. آزمایشات نشان داد که این روش قادر است انواع خودرو را در طی شبانهروز با شرایط روشنایی مختلف - ظهر، بعد از ظهر، غروب و شب هنگام - و با وجود چالشهای مرسوم بزرگراهها شناسایی کند. همچنین عواملی مانند وجود سایه و تاری تصویر تأثیری روی کارایی روش ندارند. روش پیشنهادی از نظر صحت نسبت به روشهای مشابه دارای برتری بوده و سرعت مناسبی دارد.
-1 مقدمه
افزایش ازدحام شهری باعث شده است که نیازی ضروری به سیستمهای هوشمند نظارت ترافیک احساس شود تا مدیریت و کنترل ترافیک را بهبود بخشند. در گذشته ابزارهای بسیاری مانند حلقههای بسته1، حسگرهای رادار و ماوراء صوت نقش اساسی در این سیستمها داشتهاند، اما این روشها محدودیتهای زیادی در سنجش برخی پارامترهای مهم ترافیکی داشته و هزینه بالایی دارند. [1] در حقیقت از آنجا که این روشها فاقد بینایی هستند، نمیتوانند بسیاری از اطلاعات صحنههای ترافیکی را استخراج نمایند.
به همین دلیل در دهههای اخیر استفاده از روشهای مبتنی بر بینایی ماشین به دلیل مزایای زیادی که دارند برای استخراج اطلاعات ترافیکی و توسعه سیستمهای حمل و نقل هوشمند به شکلی مطمئن مورد توجه بسیاری از محققان قرار گرفته است.[10-2] در این روشها از تصاویر و ویدیوهای نظارت ترافیکی استفاده میشود که توسط دوربینهایی ساکن ثبت میگردند. دوربینها میتوانند در کنار جاده، روی تیرهای چراغ برق، پلها یا ساختمانهای نزدیک جاده نصب شوند و به منظور نظارت در زمانی طولانی تنها با یک بار نصب و کالیبره کردن مورد استفاده قرار گیرند.
هدف تشخیص خودرو به عنوان یک کار پایهای و اساس کاربردهای مختلف نظارت ترافیکی، قضاوت در مورد این است که آیا یک خودرو در حال عبور از بزرگراه میباشد یا خیر. به این منظور لازم است خودروها از زمینه جدا گردند. با رشد تکنولوژی سیستمهای تعبیهشده و دوربینهای هوشمند، طراحی سیستمهای با دقت و سرعت بالا نیازی ضروری به شمار میرود و باعث شده تا محققان این حوزه با کاهش پیچیدگی الگوریتمها و استفاده از روشهای کارا درصدد رفع این نیاز برآیند.
در صحنههای ترافیکی حقیقی چالشهایی مانند تغییرات روشنایی و به دنبال آن وجود سایه، شرایط مختلف آب و هوایی و زمینه پیچیده وجود دارد که طراحی یک سیستم کارا را که بتواند با حفظ دقت و سرعت این چالشها را حل کند ارزشمند مینماید. از سال 1978 زمانی که آزمایشگاه پیشرانش جت2 روشی مبتنی بر بینایی ماشین را برای تشخیص خودرو به کار برد تا کنون پژوهشهای زیادی در زمینه تشخیص خودرو مبتنی بر بینایی و حل چالشهای مرتبط صورت گرفته است.
برخی از این پژوهشها از اطلاعات حرکت برای تشخیص خودرو استفاده نمودند. برای مثال در پژوهشی به منظور تشخیص خودروها از تصاویر مکان-زمان استفاده گردیده است.[11] در پژوهش دیگری از نسخه بهبودیافته الگوریتم FSSAD برای تشخیص خودروهای متحرک بهره برده شده است.[12] در مطالعهای روشی برای تشخیص خودرو در شرایط متفاوت آب و هوایی پیشنهاد شده است.[13] در این پژوهش از بسط هیستوگرام برای حذف تأثیرات آب و هوایی استفاده شده و استخراج اشیاء متحرک با روش مقدار تفاضل سطح خاکستری صورت گرفته است. در پژوهش دیگری یک مدل تخمین زمینه و یک روش حذف سایه جدید برای رویارویی با تغییرات ناگهانی آب و هوایی و لرزش دوربین پیشنهاد گردیده است.
[14] در کل، رویکرد کلی پژوهشهای مبتنی بر حرکتی که اخراًی صورت گرفته است، تفاضل فریمهای تصاویر ویدیویی به منظور رسیدن به نواحی متحرک میباشد. این روشهابعضاً نیازمند پردازشهای سنگین تخمین زمینه هستند و اغلب دقت کافی و بار محاسباتی مناسبی نداشتهاند. همچنین تطبیقپذیری کندی با تغییر شرایط محیطداشته و اکثراً مناسب صحنههای ترافیکی سنگین که در آن خودروها ساکن هستند یا حرکت کندی دارند نمیباشند.[15]
در کنار پژوهشهای مبتنی بر حرکت، روشهای دیگری نیز وجود دارند که از خصوصیات ذاتی خودرو مانند رنگ، بافت، لبه و تقارن به منظور تشخیص آن استفاده میکنند. این روشها مشکلات روشهای مبتنی بر حرکت را نداشته و در برخی موارد پیچیدگی بیشتری دارند. با بهرهگیری از روشهای مذکور میتوان علاوه بر پردازش ویدیوهای ترافیکی، تصاویر ترافیکی را نیز پردازش نمود. جدیدترین روشهای به کار رفته در این حوزه برگرفته از پژوهشهای انجام شده در زمینه تشخیص اشیاء است.
روشهایی که با در نظر گرفتن طرح کلی اجسام به تشخیص آنها میپردازند. به طور مثال در پژوهشی از یک مدل مرکب از اطلاعات رنگ، طرح کلی، بافت و همواری در سه مقیاس کوچک، متوسط و بزرگ برای تشخیص خودروهایی با فاصله متفاوت از دوربین در تصاویر ترافیکی استفاده شده است.[16] اما روش ارائه شده تنها قادر به شناسایی خودروهای سواری بوده و نمیتواند سایر خودروها را شناسایی نماید. در پژوهش دیگری روشی مبتنی بر گراف برای تشخیص خودرو در صحنههای شلوغ ترافیکی پیشنهاد گردیده است. این روش زمانبر بوده و قابل استفاده در کاربردهای بلادرنگ نمیباشد .[17] در مطالعه دیگری روشی مبتنی بر مدل پایه فعال3 و تقارن رنگ و لبه مطرح شده است.[18] این روش قادر به تشخیص انواع خودرو در شرایط روشنایی متفاوت میباشد اما دقت بالایی در شرایط واقعی ندارد.
پژوهشهای ذکر شده، برخی چالشهای پیش روی تشخیص خودرو را برآورده ساختند، اما همچنان لازم است بهبودهایی صورت گیرد. در کنار این روشها، پژوهشهایی صورت گرفته است که با وجود بار پردازشی کم نتایج خوبی کسب کردهاند مانند -19] [21 که در آنها روشهایی مبتنی بر تقارن لبه جهت تشخیص خودرو پیشنهاد شده است. از آنجا که لبهی خودرو در شرایط روشنایی و آب و هوایی مختلف به آسانی قابل دریافت است و اطلاعات کاملی از خودرو را به دست میدهد، استفاده از این ویژگی در امر بازشناسی خودرو از کارایی بالایی برخوردار است.
در این مقاله روشی پیشنهاد شده است که میتواند به خوبی خودرو را در فریمهای ویدیویی یا تصاویر نظارتی که از شرایط ترافیکی واقعی بزرگراهها گرفته شدهاند تشخیص دهد و مشکلاتی از قبیل داشتن زمینه پیچیده، تغییرات روشنایی و یا وجود سایه تأثیر ناچیزی روی کارایی آن دارد. در روش پیشنهادی از مدل پایه فعال ارائه شده در [22] استفاده شده است. این روش قادر است با تعداد نمونههای آموزشی کمی از هدف به طرح کلی آن برسد و به خوبی نمونههای مشابه هدف را در تصاویر آزمایشی معرفی کند.
سپس نمونه های مذکور بر اساس میزان شباهتشان به طرح کلی نوع خودرو و پس از پردازشهایی که به منظور بررسی تقارن لبه طرح کلی متناظر خودرو انجام میگردد تأیید یا رد میشوند. ساختار مقاله به قرار زیر است: در بخش 2 به معرفی سیستم پیشنهادی خواهیم پرداخت. به منظور ارزیابی روش پیشنهادی آزمایشاتی صورت گرفته است. این آزمایشات و نتایج حاصل از آنها در بخش 3 به تفصیل بیان میشود . در نهایت، در بخش 4 جمعبندی و نتیجهگیری مقاله ارائه خواهد گردید.
-2 روش پیشنهادی
روش پیشنهادی ما ترکیبی از دو بخش تشخیص خودرو با استفاده از مدل پایه فعال و بازشناسی با استفاده از تقارن لبه میباشد. به منظور حصول اطمینان از اینکه نمونههای معرفی شده خودرو هستند، ما از تقارن لبه حاصل از موجکهای گابور بهره بردهایم. با استفاده از ویژگی لبه میتوان به خوبی یک جسم را در شرایط روشنایی مختلف تشخیص داد. در روش پیشنهادی نمونههایی که نامتقارن تشخیص داده شدهاند به اندازه مشخصی در هر دو جهت ساعتگرد و پادساعتگرد چرخانده میشوند و تقارن آنها مجدداً بررسی میشود. ما در نهایت نمونههایی را که لبه آنها تا حد مشخصی متقارن شناخته شود، خودرو معرفی مینماییم. کلیات سیستم پیشنهادی در شکل 1 قابل مشاهده است. در ادامه، ابتدا به توضیح چگونگی تشخیص خودرو با استفاده از مدل پایه فعال و سپس تایید خودرو با بررسی تقارن لبه میپردازیم.
-1-2 تشخیص خودرو با استفاده از مدل پایه فعال
یک پایه فعال از تعداد کمی از عناصر موجک گابور در مکانی مشخص و با جهت انتخابی ساخته شده است. هر الگوی تصویر از ترکیب خطی تعدادی از این عناصر که دارای همپوشانی کمی بوده و به خوبی به هم متصل هستند تشکیل میشود. شکل 2 ایده اصلی روش را بیان میکند. مکان و جهت این عناصر به میزان کمی قابل تغییر است، بنابراین الگوی حاصل دگردیسپذیر4 میباشد. مکان و جهت عناصر پایه در مدل الگو، از روی تصاویر آموزشی و بر اساس الگوریتم طرح مشترک5 یاد گرفته میشود. الگوریتم مذکور عناصر را به شکل ترتیبی از یک دیکشنری انتخاب میکند. این دیکشنری حاوی موجکهای گابور با مکان و جهتهای دارای چگالی بالا در تصاویر آموزشی میباشد.
پس از اینکه یک عنصر انتخاب شد، توسط همه تصاویر آموزشی به اشتراک گذاشته میشود تا یک نسخه تغییریافته از عنصر انتخابی - از نظر مکان و جهت - برای بهبود کدگذاری هر تصویر به مدل در حال ساخت اضافه شود. مکان و جهت عنصر انتخابی به گونهای تغییر مییابد که بیشترین پاسخ محلی را در همسایگی عنصر داشته باشد. بنابراین نسخه تغییریافته عنصر انتخابی در هر تصویر آموزشی، نقشه سادهای از لبه مجاورش را بیان میکند. در شکل 3 نمونهای از مدل یادگرفته شده از روی تعدادی از تصاویر خودرو قابل مشاهده است. شکل :2 پایه فعال. هر عنصر پایه به شکل یک بیضی با مکان و جهتی مشخص نشان داده شده است. نیمه بالای تصویر تغییر یک عنصر پایه را نشان میدهد. هر عنصر پایه - بیضی مشکی - با تغییر در مکان یا جهت در ناحیهای محدود میتواند به دیگر عناصر موجک گابور - بیضیهای آبی - تبدیل شود.[22]
پس از آموزش پایه فعال با استفاده از تصاویر آموزشی، تشخیص الگوی دگردیسپذیر در تصویر آزمایشی به کمک یک ساختار محاسباتی از نقشههای جمع- بیشینه 6 صورت میگیرد. نقشههای جمع از عملیات فیلتر کردن محلی به منظور تشخیص قطعات لبه و اشکال حاصل میشوند و نقشههای بیشینه از عملیات محاسبه بیشینه که تغییرات شکل را دنبال میکنند حاصل میگردند. در نهایت از یک روش نمرهدهی بر اساس لگاریتم درستنمایی استفاده میشود تا شکلی که بیش از بقیه اشکال در تصویر آزمایشی به الگوی آموزش دیده شباهت دارد نمره بیشتری کسب کرده و به عنوان کاندیدی از هدف معرفی گردد.[22] در حقیقت الگوریتم مذکور با اعمال الگوریتم تطبیق الگو با پنجره لغزان روی تمام فریم ورودی، شبیهترین بخش تصویر را به الگوی هدف، کاندید خودرو معرفی میکند.
به منظور کاهش تشخیصهای نادرست مانند معرفی بخشی از جاده یا حاشیههای اطراف آن به عنوان کاندید خودرو، به خصوص زمانی که در فریم هیچ خودرویی در حال عبور نیست در این مقاله از یک میزان آستانه برای نمره شباهت استفاده شده است. به این ترتیب که کاندیدهایی که دارای نمره بیش از مقدار آستانه باشند معرفی میگردند. از آنجا که تنها معیار ما برای تشخیص خودرو در این بخش نمره کاندید است، بدیهی است که هر چه میزان آستانه کمتر باشد تعداد تشخیصهای نادرست و تشخیصهای درست با شباهت کمتر افزایش مییابد و مقدار آستانه بالاتر تشخیصهای نادرست را کاسته و کاندیدهای شبیه تر را معرفی مینماید. با توجه به اینکه روش پیشنهادی برای اعمال در تصاویر ویدیویی در نظر گرفته شده و از آنجا که در ویدیو به دلیل حرکت، خودروها در تفکیکپذیریهای مختلفی قرار میگیرند، تصاویر آزمایشی فقط در یک تفکیکپذیری بررسی میشوند. به این ترتیب نه تنها همه خودروهای عبوری در ناحیهای مشخص از فریمها تشخیص داده میشوند، بلکه سرعت الگوریتم نیز افزایش مییابد.
-2-2 تایید خودرو با بررسی تقارن لبه
تقارن یکی از مشخصههای اصلی اجسام ساخته دست انسان است. از میان انواع تقارن، تقارن انعکاسی با محور عمودی بسیار معمول است. اگر تصویر دارای تقارن انعکاسی را از روی محور آن تا بزنیم دو نیمه تصویر بر روی هم منطبق خواهند بود. به این ترتیب هر نیمه تصویر آیینهی نیمه دیگر محسوب میشود. این نوع تقارن به خوبی در شکل همه خودروها مشخص است و میتوان از آن به عنوان یک روش مناسب برای بازشناسی بهره برد.