بخشی از مقاله
چکیده
شناسایی جاده یکی از اساسیترین مسائل در حوزه هوشمند سازی خودروها محسوب میشود. برای تحقق این هدف از حسگرهای مختلف نصب شده روی خودرو نظیر دوربین، لیزر، رادار و غیره بهره گرفته می شود. بخش عمدهای از تحقیقات در این زمینه با استفاده از روش های مبتنی بر بینایی صورت میگیرد. علت این امر را مقرون بهصرفهتر بودن حسگر دوربین نسبت به بقیه حسگرها و در دسترس بودن آن میتوان نام برد. در این مقاله از تک دوربین نصب شده در جلوی خودرو بهمنظور استخراج جاده استفاده میکنیم. برای این منظور ابتدا با استفاده از تفاوت رنگ جاده و پسزمینه، خوشهبندی بر اساس رنگ را انجام داده، در ادامه با روشهای یادگیری با ناظر و ویژگیهای مبتنی بر بافت، سطح جاده را به دست میآوریم. این ویژگیها شامل توصیفگر بافت الگوی دوتایی محلی و همچنین قطعهبندی بافت بر اساس بعد فراکتال میباشد. برای بهبود نتایج و دقت عملکرد، خروجی روشهای ارائهشده را با روش رأیگیری اکثریت وزندار شده ترکیب می کنیم. نتایج بررسیها نشان می دهد که روش ارائهشده در شرایط مختلف میتواند بهصورت موفقیتآمیز عمل کرده و با دقت قابل قبولی سطح جاده را از پسزمینه جدا نماید.
واژههای کلیدی:شناسایی جاده، خوشهبندی، الگوی دوتایی محلی، قطعهبندی بر اساس بعد فراکتال، رأیگیری اکثریت وزندار
مقدمه
شناسایی جاده ازجمله چالشهای اساسی در زمینه دستیابی به خودروهای هوشمند محسوب میشود. موفقیت در این امر میتواند به ناوبری هرچه بهتر خودروی هوشمند کمک کرده و ضمن حرکت در جاده، مسیر بین مبدأ و مقصد به خوبی طی شود و همچنین خطرات ناشی از رانندگی در اثر عواملی چون حواسپرتی راننده نیز بهشدت کاهش یابد.برای شناسایی جاده، از حسگرهای نصبشده روی خودرو بهره گرفته میشود که ازجمله این حسگرها میتوان به تک دوربین، بینایی استریو، لیدار و رادار اشاره نمود.[1] بینایی استریو بر خلاف تک دوربین، از دو دوربین همزمان در پردازش استفاده میکند. لیدار یا تشخیص نور و مسافتسنجی نیز از جمله حسگرهای پرکاربرد در زمینه شناسایی جاده میباشد که محدوده پوشش و دقت آن به نسبت بینایی استریو بیشتر بوده، اما به عنوان یک نقطه تاریک میتوان به هزینههای بالای آن اشاره نمود.
حسگر دیگری که در بحث شناسایی جاده به کار گرفته شده است رادار میباشد. این حسگر در کنار کاربردهای گستردهای که دارد فاقد قدرت تصمیمگیری در مورد خطکشیهای جاده و ساختارهای ظریف سه بعدی جاده است. با استفاده از رادار و خاصیت تفاوت در میزان بازتابش ناشی از سطح جاده و نقاط برون جاده می توان به تشخیص بهتر جاده کمک نمود. هریک از حسگرهای معرفی شده دارای مزایا و معایب مختلفی بوده و در پارهای از شرایط با چالشهایی روبهرو میشوند، لذا در برخی کاربردها به منظور دقت بیشتر محاسبات، از ترکیب حسگرهای مختلف در کنار هم بهره گرفته میشود و تلفیق خروجی آنها ، سطح جاده و پسزمینه را مشخص مینماید.
روش های مبتنی بر بینایی که الهام گرفته از سیستم بینایی انسان در شناسایی جاده است بیش از بقیه روش ها بکار گرفتهشده است. یکی از علل اساسی آن را در مقرونبهصرفهتر بودن استفاده از دوربین بهجای حسگرهای دیگر میتوان جستو جو نمود. در این روشها با استفاده از ویژگیهای بصری مشخصکننده سطح جاده، استخراج آن از پسزمینه تصویر انجام میگیرد2]و.[3 این روشها اگرچه بهکرات مورد استفاده قرارگرفتهاند، اما در شرایط روشنایی مختلف، وجود سایه، مسیرهای دارای پیچ و غیره با مشکلاتی روبهرو میشوند. این ویژگیها بهصورت پایین به بالا و با بررسی در سطح پیکسل، شناسایی جاده را انجام میدهند. پارهای دیگر از روشهای شناسایی، از یادگیری روی تصاویر استفاده کرده و با بررسی همسایگیهای مختلف، سعی در برچسب زنی پیکسل های تصویر دارند 4]و.[5
کلید اصلی این روشها، انتخاب ویژگیهای مناسبی است که بتوانند به خوبی تفاوتهای سطح جاده و پسزمینه را مشخص نموده و آنها را از هم تفکیک نمایند. همچنین مطالعاتی در زمینه برازش منحنی بر کنارههای جاده بهمنظور مدلسازی آن نیز صورت گرفته است .[6] در این روشها، کنارههای جاده با مدلهای مختلف خطی و یا چند جملهایهای مرتبه بالاتر تخمین زده شده و استخراج جاده صورت میگیرد. مدلهای چندجمله ای به نسبت خطی از دقت بالاتری برخوردار بوده، اما به همان نسبت بار محاسباتی بیشتری نیز دارد.
در این مقاله شناسایی جاده را با استفاده از تک دوربین نصبشده در جلوی خودرو و با ترکیب خروجیهای حاصل از روشهای مختلف ارائهشده انجام میدهیم. این روش های پایه، بر مبنای روش های یادگیری و استخراج ویژگی های رنگ و بافت است که در بخش 2 بهصورت مفصل شرح داده خواهد شد. در ادامه، در بخش 3 نتایج تجربی بدست آمده را خواهیم دید و در نهایت در بخش 4 نتیجهگیری بیان خواهد شد.
روش پیشنهادی
-1-2 خوشهبندی بر اساس رنگ
ازجمله ویژگیهای ظاهری جاده که آن را از سایر قسمتهای تصویر مجزا میسازد می توان به ویژگیهای رنگی اشاره نمود. سطح جادهمعمولاً از توزیع رنگ تقریباً یکنواختی برخوردار بوده که با توزیع رنگ پسزمینه تصویر که شامل چمنزار، آسمان، ابر، درختان و غیره است متفاوت است. از این ویژگی میتوان در جداسازی سطح جاده از پسزمینه استفاده نمود، برای این منظور پس از دریافت تصویر گرفتهشده توسط دوربین جلوی خودرو، تصویر RGB را به فضای رنگی L*a*b* تبدیل میکنیم. چشم انسان در نگاه اول با دیدن تصویر شامل سطح جاده میتواند بدون توجه به میزان روشنایی پیکسلها، به قسمتهای مختلف تصویر رنگهای مختلفی نسبت داده و آنها را از هم متمایز کند. استفاده از فضای رنگی L*a*b* میتواند در تفکیک این ویژگیهای بصری بسیار مفید باشد.
در این فضای رنگی L* لایه مربوط به درخشندگی تصویر، لایه رنگی a* موقعیت رنگ حول محور قرمز - سبز را نشان میدهد و همچنین لایه رنگی b* موقعیت رنگ حول محور آبی - زرد را بیان میکند. بنا بر آنچه ذکر شد مشخص میگردد که اطلاعات رنگی پیکسلهای تصویر در لایههای a* و b* قرار میگیرند و تفاوت بین رنگهای مختلف در این فضا با استفاده از رابطه اقلیدسی قابلمحاسبه و اندازهگیری است. با در نظر نگرفتن لایه L*، تأثیر شدت روشنایی در تصمیم گیری را به حداقل رسانده و الگوریتم نسبت به شرایط روشنایی مختلف مقاومتر میگردد.پیکسلهای تصویر هریک دارای اطلاعات رنگی مختلفی در فضای a*b* میباشند که با خوشهبندی آنها میتوان این رنگها را در تصویر ازهم تفکیک نمود.
در این مقاله، ما از روش خوشه بندی -kمیانگین [7]برای تفکیک پیکسلها استفاده می کنیم. این روش پیکسل های تصویر را بر اساس فاصله از هم طوری در خوشههای مختلف قرار میدهد که پیکسلهای هر خوشه تا حد امکان به هم نزدیک بوده و با پیکسلهای خوشههای دیگر فاصله قابل قبولی داشته باشند. در اینجا در فضای رنگی a*b* و بر اساس معیار فاصله اقلیدسی، به خوشهبندی پیکسلها میپردازیم. بررسیهای تجربی صورت گرفته توسط ما نشان میدهد که استفاده از 4 خوشه مختلف در این روش میتواند نتایج قابل قبولی داشته باشد، این 4 خوشه میتواند شامل سطح جاده، آسمان و حاشیههای چپ و راست جاده باشد.
در این مرحله با استفاده از خوشههای مختلفی که پیکسلهای تصویر در آن قرار میگیرند به قطعهبندی تصویر اولیه پرداخته وکنارههای جاده، سطح جاده، آسمان و غیره را از هم تفکیک میکنیم. هریک از خوشههای رنگی ایجادشده دارای مرکز خوشهای با میانگین مقادیر رنگی پیکسلهای موجود در آن میباشد.برای مشخص نمودن خوشه حاوی سطح جاده لازم است که مرکز خوشه دربرگیرنده آن را بتوانیم مشخص نماییم. بررسیهای تجربی روی تصاویر مختلف گرفتهشده توسط دوربین خودرو حاکی از آن است که مرکز خوشه شامل سطح جاده در زیر خط افق تصویر واقع است. برای بدست آوردن خط افق، ابتدا نقطه محو شدن تصویر [8] را محاسبه میکنیم. این کار با استفاده از صافیهای گابور و محاسبه جهتگیری غالب در هر پیکسل از تصویر صورت میگیرد.
در ادامه پیکسلی که بیشترین جهتگیری در راستای آن قرار دارد به عنوان نقطه محو شدن انتخاب شده وخط افقی عبوری از آن را به عنوان خط افق در نظر میگیریم. حال جستوجو برای یافتن مرکز خوشه شامل سطح جاده را به ناحیه جالب زیر خط افق محدود میکنیم. علاوه بر آن، در خوشههایی که مراکز آنها زیر خط افق قرار گرفته و نامزد انتخاب به عنوان خوشه جاده هستند،معمولاً خوشه مربوط به سطح جاده دارای جزء متصل بزرگتری بوده که این نکته در شناسایی خوشه مربوط به جاده میتواند بکار گرفته شود و آن را از خوشه کنارههای جاده متمایز سازد.شکل 1 خروجی حاصل از اعمال روش -kمیانگین بر روی تصویر شامل سطح جاده در خوشههای مختلف را نمایش میدهد.
در شکل 1 خوشه شامل سطح جاده را میتوان مشاهده کرد، اما قسمتهایی از پسزمینه نیز به دلیل نزدیکی فاصله و شباهت رنگی با سطح جاده به اشتباه در این خوشه قرارگرفته اند. برای حل این مشکل نیاز به اعمال یک مرحله فاز پس پردازش خواهیم داشت. پس از مشخص کردن خوشه شامل سطح جاده، با اعمال آستانهای مناسب، تصویر دوتایی متناسب با این خوشه را به دست میآوریم. سپس با استفاده از خط افق تصویر، جستو جوی جاده را به ناحیه جالب محدود کرده و پیکسلهای بالای خط افق را صفر - غیر جاده - در نظر میگیریم. با این کار قسمتهای زیادی از پیکسلهایی که به اشتباه به عنوان جاده شناسایی شده بودند تصحیح میشوند. حال لازم است که جزء های متصل با اندازههای کوچک که به جزء متصل جاده وصل نمیباشند را حذف کنیم.
این قسمتها بر اثر وجود اغتشاش در تصویر یا تشابه رنگی بخشهایی از پسزمینه با سطح جاده پدید میآیند . شکل 2، خوشه مربوط به سطح جاده را قبل و بعد از پس پردازش نشان میدهد.همچنین با در نظر گرفتن ماسک دوتایی نشان داده شده در شکل 2 برای مشخص نمودن سطح جاده، خروجی نهایی بهصورت شکل 3 خواهد بود.در پارهای از موارد، پس از خوشه بندی ممکن است که نشانهها و خطکشیهای سطح جاده بهاشتباه در خوشهای غیر از سطح جاده قرار گیرند که این موضوع باعث کاهش دقت الگوریتم شناسایی جاده میشود. برای رفع این مشکل بهتر است که در مرحله پس پردازش، حفرههای موجود در سطح جاده را پر نماییم. این پیکسلها که اطراف آنها را پیکسلهای جاده تشکیل میدهند با احتمال بسیار بالایی خود نیز بخشی از سطح جاده هستند که با پر کردن حفرهها این مشکل را میتوان برطرف نمود.در این روش، مدل جاده - صاف یا پیچدار بودن - به هیچ عنوان اثر منفی در کیفیت شناسایی جاده نداشته و در شرایط روشنایی مناسب نتایج خوبی دربر میگیرد.، اما وجود سایه و یا عدم وضوح تصویر تا حدی روش را با مشکلاتی روبهرو میسازد.
-2-2 اعمال روشهای یادگیری با ناظر
در قسمت قبلی، روشی مبتنی بر ویژگیهای رنگی تصویر برای استخراج سطح جاده از پسزمینه ارائه کردیم. در نظر گرفتن ویژگیهای رنگی بهتنهایی، ممکن است در پارهای از موارد مشکلاتی را ایجاد نماید و خوشهها بهخوبی موفق به تفکیک جاده از پس زمینه نشوند، لذا از ویژگیهای مبتنی بر بافت نیز برای شناسایی بهره میگیریم و با ایجاد بردار ویژگی مناسب برای توصیف نواحی تصویر و بهکارگیری روشهای مبتنی بر یادگیری ماشین، شناسایی جاده را انجام میدهیم.ابتدا لازم است که فاز آموزشی یادگیر را انجام دهیم. برای تشکیل نمونههای آموزشی مثبت و منفی بهمنظور اعمال به یادگیر، از تصاویر گرفته شده توسط دوربین نصبشده در جلوی خودرو استفاده کرده و با ایجاد برشهای مختلف بر روی تصویر، قسمتهای متعددی شامل سطح جاده و پس زمینه تصویر ایجاد میکنیم. مرحله برچسبزنی بهمنظور تشکیل مثالهای آموزشی، بهصورت دستی و توسط فرد خبره صورت میگیرد و با محاسبه بردار ویژگی مربوطه در هر ناحیه، آماده فاز آموزشی یادگیر خواهیم شد که در ادامه با ویژگیهای بکار گرفتهشده در این مقاله آشنا میشویم.
-1-2-2 استخراج ویژگی با استفاده از توصیفگر الگوی دوتایی محلی
همان طور کهقبلاً نیز ذکر شد، علاوه بر ویژگی های رنگی که در تمایز سطح جاده از پسزمینه میتواند مورداستفاده قرار گیرد، ویژگیهای مبتنی بر بافت نیز کمک شایانی میکنند. یکی از این ویژگیها، الگوی دوتایی محلی [9] است که ازنظر تئوری و محاسباتی بسیار ساده بوده و از این لحاظ میتواند در عمل بهخوبی مورداستفاده قرار گیرد.برای توصیف بافت موردنظر در این روش، ابتدا یک همسایگی 3*3 از پیکسلها را در نظر گرفته و نمایش بافت را بهصورت توزیع توأم 9 سطح خاکستری پیکسلهای این همسایگی در نظر میگیریم. شکل 4 موقعیت قرارگیری مقادیر شدت خاکستری در همسایگی پیکسل مرکزی در روش الگوی دوتایی محلی را نشان میدهد.ازآنجاکه مقدار سطح خاکستری پیکسل مرکزی - g0 - در بافت محلی همسایگی تأثیری ندارد، مقدار آن را از سایر مقادیر خاکستری gi کم کرده و برای پایدار کردن توصیفگر بافت نسبت به تغییرات شدت روشنایی، بهجای کار کردن با مقدار عددی این تفاضلها، تنها علامت آنها را در نظر میگیریم. بنابراین، رابطه مربوط به الگوی دوتایی محلی در 8 همسایگی پیکسل مرکزی بهصورت رابطه 1 به دست میآید: