بخشی از مقاله
چکیده- بازشناسی پلاك خودرو نقش مهمی در سامانههاي هوشمند حمل و نقل بازي میکند. هدف از بازشناسی پلاك خودرو تشخیص شناسههاي آن با بهره گیري از روشهاي کارامد پردازش تصویر میباشد. فرایند بازشناسی پلاك خودرو در سه مرحله مکان یابی پلاك، ناحیه بندي شناسهها و خواندن شناسهها انجام میپذیرد. در این مقاله روشی براي بازشناسی پلاك خودرو با بهره گیري از شبکههاي عصبی ژرف ارایه شده است. شبکه پیشنهاد شده به صورت ساختار رمزگذار-رمزگشا میباشد که میتواند شناسههاي پلاك را براي بازشناسی به صورت باینري تبدیل میکند. در نتیجه با جداسازي شناسههاي پلاك خودرو و حذف ناحیههاي اضافی از بدنه پلاك فرایند باشناسی پلاك به راحتی انجام خواهد شد. اعمال روش پیشنهادي روي یک پایگاه داده شامل 4000 پلاك خودروي ایرانی، نرخ تشخیص شناسه ها برابر 94 درصد را نتیجه داد.
١- مقدمه
امروزه یادگیري ژرف1 به یکی از موضوعات برجسته در زمینه یادگیري ماشین و پردازش سیگنال و تصویر تبدیل شده است [1]– [4] در این پژوهش با بهره گیري از توانایی یادگیري ژرف در بازشناسی پلاك خودرو به عنوان یکی از زمینههاي پردازش تصویر پرداخته شده است. سامانههاي هوشمند حمل و نقل پیشینه بسیار طولانی در پژوهشهاي گوناگون داشتهاند .[5]–[8] فرایند بازشناسی پلاك خودرو با چالشهاي گوناگونی مانند شرایط بد نوري، آلوده بودن پلاك خودرو، زاویه دار بودن پلاك خودرو با افق و یا به صورت دورنما2 دیده شدن همراه است. بازشناسی پلاك خودرو با هدف خواندن شناسههاي پلاك، یکی از موضوعات مهم در این زمینه میباشد. در عمل بازشناسی پلاك خودرو به سه مرحله تقسیم میشود:
• یافتن مکانی از تصویر که پلاك خودرو در آن قرار دارد.
• ناحیه بندي پلاك به شناسه و پس زمینه.
• بازشناسی شناسه پلاك.
پیدا کردن مکان پلاك خودرو به طور معمول با استفاده از روشهاي پردازش تصویر و بهره گیري از ویژگیهاي مختلفی مانند لبه، رنگ و بافت [9]–[12] انجام میشود. همچنین برخی پژوهشها با بکار گیري روشهاي یادگیري ماشین مانند دسته بندهاي آبشاري با ویژگیهاي شبه [13] Haar یا بر اساس شبکههاي عصبی همگشتی در تشخیص اشیا [8] مکان پلاك را پیدا میکنند. هدف از مرحله ناحیه بندي پلاك واضح تر کردن شناسهها یا باینري کردن پلاك است به گونهاي که بتوان شناسهها را تشخیص داد.
یکی از روشهاي جداسازي شناسههاي پلاك تحلیل اجزاي متصل به هم است .[14]–[16] اما پیش از این کار نیاز است که تصویر پلاك به یک تصویر باینري تبدیل شود. سپس هر ناحیه در تصویر باینري شده برچسب گذاري میشود تا بتوان نواحی اضافی ناشی از خطاي باینري کردن را حذف کرد .[17] بنابراین برخی از پژوهشها از آستانه گذاريهاي بهینه و وفقی استفاده کردهاند .[16] , [18] همچنین به دلیل برخی شرایط ناهمگن روشنایی، پیش از باینري کردن تصویر پلاك نیاز است که تصویر بهسازي شود. حتی پس از ارتقا شرایط روشنایی تصویر نیز پیدا کردن یک آستانه کلی میتواند کاري دشوار باشد، به این ترتیب شبکههاي عصبی مصنوعی میتوانند در پیدا کردن آستانه کارآمد باشند .[14]
هدف پژوهش حاضر یک سامانه جهت ایجاد تصویر باینري از پلاك خودرو و خواندن شناسههاي آن است به گونهاي که به روشهاي متعدد ارتقاي تصویر جهت حل مشکلات مختلف این سامانه نباشد. جهت رسیدن به این هدف از توانایی شبکههاي عصبی ژرف در حوزه کاربرد یادگیري ماشین در پردازش تصویر استفاده شده است. همچنین این مقاله روي یک پایگاه از تصاویر پلاك خودرو انجام شده است. در بخش بعد سامانه پیشنهادي معرفی شده و در بخش سوم نتایج این سامانه روي تصاویر که پایگاه داده بررسی خواهد شد. در نهایت در بخش چهارم مقاله جمع بندي شده است.
٢- سامانه پیشنهادي
در مقاله حاضر سامانه اي جهت خواندن پلاك هاي ایرانی ارایه شده است. در این سامانه سعی شده با آموزش شبکه هاي یادگیري عمیق، شناسههاي پلاك به صورت خودکار و بدون بهره گیري از سایر روش هاي ارتقاي تصویر استخراج شوند. ضمن اینکه اعمال روش هاي ارتقا زمانبر می باشند. ایده این پژوهش اینست که میتوان با استفاده از آموزش تصاویر به یک شبکه یادگیري عمیق، در زمان کم و بدون استفاده از روش هاي پیچیده ارتقا تصویر، تصویر پلاك را باینري کرد. روند پیشنهاد شده شامل دو مرحله باینري کردن شناسههاي پلاك و خواندن شناسهها میباشد.
باینري کردن شناسههاي پلاك با استفاده از شبکههاي عصبی همگشتی رمز گذار-رمزگشا1 انجام میشود. ساختار سامانه پیشنهادي در شکل 1 نشان داده شده است. در این ساختار تصویر پلاك جدا شده به ورودي رمزگذار داده میشود. در این بخش ویژگیهاي شبکه تصویر ورودي -که مناسب جهت ایجاد تصویر با شناسههاي باینري شده است- استخراج میشوند. به همین دلیل به رمز گذار، بخش استخراج ویژگی نیز گفته میشود. پس از استخراج ویژگی، رمزگشا با استفاده از ویژگیهاي بدست آمده از رمزگذار، تصویر پلاك با شناسههاي باینري شده را ایجاد مینماید.
پس از ایجاد تصویر باینري، در ابتدا شناسهها جداسازي شده و سپس با استفاده از روش بازشناسی حروف نوري، شناسههاي ناحیه بندي شده به کمک شبکه هاي عصبی مصنوعی خوانده میشوند. در روش پیشنهادي این تحقیق، برجسته و باینري کردن شناسههاي پلاك با استفاده از شبکه عصبی بر پایه رمزگذار- رمزگشا انجام میشود. هدف از این کار، ایجاد تصویري از پلاك است که در آن، شناسهها به رنگ سیاه و دیگر اجزاي پلاك به عنوان پس زمینه سفید رنگ باشند.
براي این منظور، دادهها جهت آموزش در دو دستهي تصویر ورودي و هدف جدا شدند. تصاویر ورودي نمونههاي پلاك خودرو هستند که از مرحله مکانیابی پلاك بدست آمدهاند. تصاویر هدف، نمونه دودویی تصویر پلاكها هستند که قبلا توسط کاربر اصلاح شدهاند. معماري رمزگذار بکار رفته شبکه پیشنهاد شده در جدول 1 نشان داده شده است. تصویر پلاکی که در مرحله قبل از تصویر اصلی جدا شده به عنوان ورودي این بخش استفاده میشود.
١-٢- آموزش شبکه رمزگذار-رمزگشا
در شبکه نشان داده شده در شکل 1، براي ایجاد تصویر باینري از شبکه رمزگشا استفاده شده است. مشخصات این شبکه در جدول 2 آمده است. تعداد نقشههاي ویژگی ورودي این رمزگشا برابر 16 و ابعاد آن برابر 20×100 میباشد. خروجی این شبکه، تصویر پلاك به صورتی است که شناسهها روي آن واضح تر شده و اجزاي پس زمینه محو شدهاند. روش آموزش شبکه پیشنهاد شده در شکل 2 نشان داده شده است. جهت آموزش رمزگذار آن را به صورت سري پیش از رمزگشا قرار داده و با استفاده از دادههاي آموزش و روش پس انتشار خطا، ضرایب شبکه جهت برجسته کردن شناسهها بهینه میشوند.
دادههاي آموزشی به صورت زوج تصویر پلاك و تصویر دودویی شناسهها استفاده میشوند. تصاویر رنگی نسبت به تصاویر خاکستري اطلاعات بیشتري درباره شناسههاي پلاك ندارند. همچنین یک تصویر در سه کانال رنگ در ورودي شبکه عصبی منجر به بزرگ شدن شبکه میشود، در حالی که تأثیري در فرایند یادگیري شبکه نیز ندارد، بنابراین در روش حاضر بجاي تصویر رنگی از تصویر خاکستري استفاده شد.
٢-٢- خواندن شناسههاي پلاك
پس از برجسته سازي شناسههاي پلاك، مرحله بعد خواندن شناسهها است. براي خواندن شناسههاي پلاك و ارزیابی روش باینري سازي پیشنهاد شده، ابتدا شناسهها از هم جدا میشوند و هر کدام با استفاده از یک شبکه عصبی پرسپترون به صورت جداگانه دسته بندي شوند. شکل2 است، بنابراین خروجی آن طیفی میان صفر و یک خواهد بود. پیش از محاسبه برون افکنی نیاز است که تصویر به طور کامل به صورت دودویی تبدیل شود. جهت ایجاد تصویر دودویی، تصویر ناحیه بندي شده با استفاده از روش OTSU آستانه گذاري میشود. روند بکار رفته براي خواندن شناسهها در شکل 3 نشان داده شده است. پس از آستانه گذاري و ایجاد نقاب باینري از شناسهها، با استفاده از نمودار برون افکنی عمودي3مکان هر شناسه از روي تصویر خروجی رمزگشا بدست میآید.