بخشی از مقاله
بهبود تشخیص جاده با ترکیب روشهای بینایی و یادگیری ماشین
چکیده
توانایی ناوبری ازجمله مهمترین ویژگیهای مطرحشده در زمینه هوشمند سازی خودروها میباشد. برای نیل به ایـن هـدف لازم اسـت کـه خـودرو قابلیت تشخیص جاده را داشته باشد و با حفظ موقعیت خود در مسیر جاده، از مبدأ به نقطه مقصد حرکت نماید. این امر میتواند تأثیر شـگرفی در کاهش میزان تصادفات جاده ای ایفا نماید. در این مقاله با استفاده از تک دوربین نصب شده در جلوی خودروی در حال حرکـت، شناسـایی جـاده را انجام میدهیم. این روش در مقابل روشهایی نظیر بینایی استریو و لیزر از نظر هزینه بسیار مقرون بهصرفهتر میباشد.
ابتدا کنارههای جاده با استفاده از روش تبدیل هاف احتمالاتی استخراج شده و پیشبینی وضعیت آنها در فریمهای متـوالی توسـط فیلتـر کـالمن صورت میگیرد. در ادامه با فرض تفاوت توزیع رنگ جاده و پس زمینه، با استفاده از الگوریتم آبگیر، قطعهبندی تصویر را انجام میدهـیم. همچنـین با تشکیل بردار ویژگی مناسب شامل توصیفگر بافت هارالیک و ویژگیهای رنگی هر ناحیه از تصویر ، به کلاسبندی پیکسلها اقدام میکنیم. تلفیق خروجیهای حاصل از این روشها نشان میدهد که ویژگیهای ظاهری تصویر در کنار ویژگی های مربوط به بافت می تواند بهصورت موفقیتآمیزی سطح جاده را استخراج نماید و دقت محاسبات را افزایش دهد.
کلمات کلیدی
الگوریتم آبگیر، تبدیل هاف احتمالاتی، توصیفگر بافت هارالیک، ماشین بردار پشتیبان
-1 مقدمه
توانایی ناوبری ازجمله مهمترین ویژگیها در بحث هوشمندسازی خودروها محسوب میشود. در این راستا لازم است که خودرو بتواند با شناسایی جاده، ضمن تلاش برای باقی ماندن در سطح جاده، از نقطه مبدأ به سمت نقطه هدف حرکت نماید. برای نیل به این هدف، روشهای مختلفی ارائهشده که به طورکلی میتوان آنها را به سه دسته مبتنی بر فعالیت 4]و[13، مبتنی بر ویژگی 2]و[11 و مبتنی بر مدل [18] تقسیم نمود. روشهای مبتنی بر فعالیت از مزایای حرکت و فعالیت زیاد خودروها در سطح جاده استفاده کرده و بهطورکلی با استخراج نقشه فعالیت، تصویر را به دو ناحیه فعال و غیرفعال تقسیم میکنند. روشهای مبتنی بر ویژگی بر مبنای استخراج ویژگیهایی از تصویر استوار هستند که به شناسایی کنارههای جاده و مسیرهای خطکشی موجود در آن کمک میکنند. همچنین روشهای مبتنی بر مدل تلاش میکنند تا مدلی منطبق با تصویر جاده بیابند.
ویژگیهای استخراج شده از سطح جاده در پاره ای از موارد بر مبنای کنارههای جاده استوار است که روشهای مبتنی بر شناسایی لبه 9]و[14 و همچنین روشهای مبتنی بر تبدیل هاف [5] از جمله آنها میباشد. دسته دیگری از ویژگیها بر مبنای پردازش ناحیههای مختلف در تصویر عمل کرده که ویژگیهای مبتنی بر تحلیل بافت 7]و[8 و ویژگیهای رنگی [6] در این دسته قرار میگیرند. همچنین از ترکیب ویژگیهای بر پایه استخراج کنارههای جاده و نواحی تصویر نیز استفاده شده است 12]و.[17
علاوه بر موارد ذکر شده، پژوهش های مرتبط با شناسایی جاده با استفاده از امکانات و حسگرهای مختلفی صورت گرفته که تک دوربین، لیزر، بینایی استریو، اطلاعات جغرافیایی و مبتنی بر نقشه، دینامیک خودرو و همچنین رادار نمونههایی از این موارد میباشد که هریک نسبت به دیگری دارای مزایا و چالشهای گوناگونی هستند.
در این مقاله از تک دوربین نصب شده در جلوی خودروی در حال حرکت برای شناسایی جاده استفاده میشود که نسبت به روش بینایی استریو و لیزر بسیار کمهزینهتر بوده و بار محاسباتی آن نیز کمتر میباشد. برای این منظور، در بخش 2 ابتدا با استفاده از تبدیل هاف احتمالاتی
کنارههای جاده استخراج شده و با استفاده از ویژگیهای رنگی و الگوریتم آبگیر، قطعهبندی تصویر را انجام می دهیم. در ادامه بر اساس توصیفگر بافت هارالیک و ماشین بردار پشتیبان، آموزش را بر اساس نمونههای مثبت و منفی اولیه انجام داده و پیکسلها را کلاسبندی میکنیم. استفاده از این ویژگیها در کنار هم باعث میشود که شناسایی جاده با دقت مناسبی صورت گیرد. در نهایت در بخش 3 نتیجهگیری را خواهیم داشت.
-2 روش پیشنهادی
1-2 استخراج کناره های جاده
ابتدا فرض میکنیم که خودرو در سطح جاده واقع شده و محدوده جاده را میخواهد تشخیص دهد. برای این منظور، بر اساس جهتگیری دوربین نصب شده روی خودرو، نیمه پایینی تصویر را به عنوان ناحیه جالب در نظر گرفته و جستوجوی جاده را به همین ناحیه محدود میکنیم. با این کار باعث افزایش سرعت پردازش خواهیم شد. سپس با تبدیل تصویر رنگی به سطح خاکستری، ابتدا هیستوگرام آن را یکنواخت کرده و آن را بهبود میدهیم و سپس با اعمال فیلتر گوسی، اقدام به نرم کردن آن نموده و لبههای تصویر را با لبه یاب کنی استخراج میکنیم. این لبهها میتوانند نامزد مناسبی برای شناسایی کنارههای جاده باشند. اگرچه کنارههای جاده میتوانند منحنیهای گوناگونی را شامل شوند، اما در فواصل کوتاه میتوان آنها را به صورت خطی در نظر گرفت و بار محاسباتی را کاهش داد. بنابراین از تبدیل هاف احتمالاتی [15] برای برازش خط به کنارهها استفاده میکنیم. این تبدیل، نمایش خط را از فضای x و y به فضای ρ و ϴ تبدیل میکند که جستوجو در کل این فضای دوبعدی هم زمانبر بوده و هم باعث کاهش دقت در شناسایی کنارهها میشود.
برای این منظور بر اساس جهتگیری این خطوط کناری، فضای دوبعدی مذکور را محدود کرده و کنارههای راست و چپ جاده را فقط در بازههای زاویهای 85)و(5 و 175)و( 110 درجه جستوجو میکنیم و با اعمال آستانه مناسب روی تعداد آرای هر خط و همچنین حداقل طول خطوط و فاصله خطوط هم راستا از هم، از انتخاب خطوط نا مناسب به عنوان نامزد کنارهها جلوگیری مینماییم. علاوهبراین، در این روش در هر فریم تصویر، بدون توجه به فریمهای قبلی و بعدی آن، کنارهها را محاسبه میکنیم، لذا این امکان وجود دارد که در بعضی فریمها با ظاهر شدن خطوطی ناشی از صف خودروها در ترافیک و یا عبور خودرو از پستی و بلندیها و یا وجود نویز در تصویر، به اشتباه کنارهها تشخیص داده شوند و بنابراین بهتر است ارتباط بین محل قرارگیری کنارهها در فریمهای متوالی مورد بررسی قرار گیرد و در فریمهای بعدی، محل تقریبی این خطوط کناری به نوعی پیشبینی گردد. برای نیل به این هدف از فیلتر کالمن مطرح شده در [3] استفاده کرده و پارامترهای خط را در فریمهای متوالی پیشبینی میکنیم. این کار باعث میشود که از جابهجایی ناگهانی خطوط نامزد کنارهها در فریمهای متوالی جلوگیری شده و دقت افزایش یابد.
شکل 1 خروجی حاصل از اعمال تبدیل هاف احتمالاتی روی تصویر
2-2 الگوریتم ابگیر
از جمله ویژگیهای ظاهری جاده که آن را از سایر قسمتهای تصویر متمایز میسازد میتوان به رنگ آن اشاره نمود. بنابراین قطعهبندی تصویر بر اساس رنگ میتواند در جداسازی جاده از پسزمینه کمک نماید. برای این منظور، ابتدا فرض میکنیم که خودرو در سطح جاده قرار دارد ودقیقاً در جلوی آن خودروی دیگری قرار نگرفته است. بنابراین پیکسلهای جلوی آن را سطح جاده تشکیل میدهد. همچنین با در نظر گرفتن ناحیه جالب تصویر در نیمه پایینی آن، میتوانیم در حوالی نیمه تصویر و در نزدیکی نقطه محو شدن آن، خطی افقی در عرض تصویر در نظر بگیریم. رنگ پیکسلهای واقع در راستای این خط بیانگر توزیعی از رنگ پیکسلهای واقع در پسزمینه تصویر میباشند. علاوه بر آن، توزیع رنگ پیکسلهای واقع در جلوی خودرو که در نواحی پایینی تصویر واقع شده نیز میتواند با دقت قابل قبولی، توزیع رنگتقریباًیکنواخت سطح جاده را نشان دهد. پس دو توزیع رنگ تقریبی برای سطح جاده و پسزمینه در هر فریم به دست آورده و سپس با استفاده از الگوریتم آبگیر [16]، قطعهبندی تصویر را بر اساس این منحنیهای رنگ بهدستآمده انجام میدهیم. این الگوریتم خطوط یک تصویر را به صورت کوه و نواحی درونی آن را به صورت درههایی فرض میکند و با محاسبه گرادیان شدت روشنایی، گودالهای آب (نقاط پایینی فاقد بافت خاص) و کوهها (نقاط برجسته تصویر) را تشکیل میدهد. سپس آب گودالها با شروع از نقاط تعیین شده توسط الگوریتم (که در اینجا منحنیهای توزیع رنگ رسم شده در
تصویر میباشند) شروع به حرکت کرده و به صورت تناوبی بالا میآید و این نواحی را به هم متصل میکند و تصویر در نهایت به نواحی علامتگذاری متناظر ناحیه بندی میشود.
شکل 2 منحنیهای مربوطه برای استخراج توزیع رنگ جاده و پسزمینه
شکل 3 خروجی حاصل از اعمال الگوریتم آبگیر روی تصویر
3-2 استفاده از ویژگی بافت در کنار جاده
مفهوم بافت، نقش بسیار مهمی را در تحلیل تصاویر و درک آنها ایفا مینماید. همچنین این مفهوم در بحث قطعهبندی تصاویر نیز میتواند بسیار کارساز و پرکاربرد باشد. ویژگی بافت به منظور توصیف ساختارها و الگوهای تکراری موجود در هر ناحیه از تصویر مورد استفاده قرار میگیرد و بیانگر میزان نرمی، زبری، یکنواختی و غیره از هر ناحیه از تصویر میباشد. برای مشخص کردن بافت هر ناحیه راهکارهای گوناگونی وجود دارد. در این مقاله ما از توصیفگر بافت هارالیک [10] برای مشخص کردن بافت تصویر در نواحی مختلف استفاده میکنیم.
-1-3-2 استخراج ویژگی
در این مقاله از ویژگیهای آماری هارالیک برای توصیف بافت هر ناحیه از تصویر استفاده میشود. این ویژگیها شامل مواردی نظیر ممان مرتبه دوم زاویهای، کانتراست، همبستگی، واریانس، ممان تفاضلی معکوس، آنتروپی و ... میباشد که در مجموع در کنار هم برای توصیف بافت مورد استفاده قرار میگیرند. همچنین در کنار این ویژگیها، از نمایش رنگی فضای HSV که در مقابل تغییرات روشنایی مقاومتر از فضای RGB میباشد نیز بهره میگیریم. پس ویژگیهای هارالیک و ویژگی رنگی استخراج شده برای توصیف هر ناحیه از تصویر بکار گرفته شده و در کنار هم بردار ویژگی را تشکیل میدهند.
2-3-2 اموزش یادگیری و ارزشیابی تصاویر
برای آموزش یادگیر ابتدا با استفاده از دوربین متصل بر روی خودرو، پایگاهی از تصاویر شامل سطح جاده تشکیل دادیم که شامل 4700 تصویر بود. در این مرحله به تولید مثالهای آموزشی برچسبدار برای شناسایی جاده پرداختیم. برای این منظور، از بین تصاویر موجود، برشهای مختلفی از هر تصویر را در مکانها و اندازههای مختلف ایجاد نمودیم و آنها را به صورت دستی برچسبگذاری کردیم. با این کار، مثالهای آموزشی متعددی شامل برچسب جاده و غیر جاده فراهم نمودیم. در هریک از این مثالهای آموزشی، بردار ویژگی مذکور در قسمت قبلی را تشکیل داده و پارامترهای مربوط به بافت و رنگ را محاسبه کردیم. آنچه مشخص است این است که ارتباط بین دادههای موجود در کلاس جاده و کلاس غیر جاده و فضای ویژگی آنها، یک رابطه غیرخطی میباشد. بنابراین نمیتوانیم یک ابرصفحه خطی برای جداسازی آنها استفاده کنیم. در این مقاله از کرنل چندلایهای پرسپترون به عنوان کرنل ماشین بردار پشتیبان بهره گرفتیم و با استفاده از آن، آموزش را روی مجموعه برچسبدار جاده و غیر جاده انجام دادیم.
پس از آموزش، برای ارزیابی وضعیت هر فریم تصویر در جلوی خودرو، ابتدا این تصویر را به نواحی مستطیلشکل افقی مجاور هم بلوکبندی و تقسیم کرده و سپس در هر ناحیه مستطیلی، بردار ویژگی مربوطه را محاسبه کرده و با استفاده از ماشین بردار پشتیبان آموزش دیده، به آن ناحیه برچسب جاده یا غیر جاده را تخصیص میدهیم. هرچه اندازه این نواحی مستطیلی کوچکتر باشد، دقت محاسبات و برچسبزنی افزایش مییابد،