بخشی از مقاله
چکیده
در این مقاله، روشی جدید و سریع جهت تقطیع و شناسایی1 کاراکترهاي پلاك خودرو از تصویر پلاك هاي "ایران"، ارائه شده است. در الگوریتم پیشنهادي، به کمک فیلتر پایین گذر گوسی و یک تبدیل شبه لاپلاسین ابداعی، مشکل نویز و نور پردازي غیر یکنواخت در تصویر پلاك، مرتفع گشته و کاراکترها توسط یکسري ویژگی هاي ذاتی1 و نسبی1 از تصویر تقطیع می شوند. تصاویر کاراکترهاي بدست آمده توسط دو شبکه عصبی پرسپترون با روش تعلیم پس انتشار خطا شناسایی می گردند. این روش لزوما نیازي به تصویر دقیق پلاك ندارد و می تواند نواري1 از تصویر اصلی خودرو که حاوي پلاك است را به عنوان ورودي دریافت نماید. به منظور ارزیابی، روش پیشنهادي را بر روي پایگاه داده اي شامل 120 تصویر متفاوت از نظر روشنایی، فاصله و پس زمینه اعمال نموده و متوسط نرخ تقطیع صحیح کاراکترهاي پلاك را %98 و شناسایی صحیح آنها را %95بدست آوردیم.
کلید واژه- شناسایی پلاك خودرو، تقطیع و شناسایی کاراکترها، توزیع غیر یکنواخت نور.
١- مقدمه
سامانه تشخیص و شناسایی پلاك خودرو1 که طبق [1] از نظر کاربردي سابقه اي بیش از 10 سال در دنیا دارد، یک سیستم کاملاً هوشمند است که با استفاده از پردازش تصویر خودرو ها، شماره پلاك آنها را استخراج می کند. این سیستم شناسایی داراي کاربرد هاي زیادي در شهر هاي صنعتی امروزي است که از آن جمله می توان به کنترل عبور و مرور در جاده ها، پارکینگ ها، گذرگاه ها ، شناسایی خودرو هاي مسروقه و... اشاره نمود.[2]الگوریتم هاي شناسایی که در تحقیقات گذشته ارائه شده است، عموما از سه مرحله پردازش تشکیل گردیده است : -1 تشخیص و استخراج محل پلاك -2 تقطیع کاراکترها از پلاك -3 شناسایی هر کاراکتر.[1]
هدف این مقاله تقطیع و شناسایی کاراکترها از تصویر پلاك هاي تک سطري موسوم به "ایران" است که در واقع همان مراحل دوم و سوم ذکر شده می باشد. نویز موجود در تصویر، روشنایی غیر یکنواخت تصویر - مانند وجود سایه در پلاك - واستخراج غیر دقیق پلاك از تصویر اصلی خودرو در مرحله اول از مشکلات کار به حساب می آیند. روش هاي مختلفی جهت تقطیع هر کاراکتر از پلاك، مورد استفاده قرار گرفته است که تحلیل هیستوگرام تصویر[3] و [4]، استخراج بردار ویژگی و مورفولوژي ریاضی[5] و فیلدهاي رندوم مارکوف[6]2 از آن جمله می باشند. به کمک تحلیل نقش3تصویر باینري پلاك می توان محل کاراکترها را با توجه به مینیمم ها و ماکزیمم هاي نمودار، جستجو نمود.
سرانجام در [3]، کاراکترها توسط کادرهاي مستطیل شکلی از تصویر تقطیع می گردند و بنابراین انتخاب هر کاراکتر به طور مجزا می تواند صورت پذیرد. این روش با اینکه روشی سریع می باشد، به شدت به نویز هاي مختلف از جمله پیچ و مهره موجود در پلاك، تصویر غیر دقیق پلاك و توزیع روشنایی تصویر حساس است. در [5] یک دیدگاه تطبیقی براي تقطیع کاراکتر و استخراج بردار ویژگی از تصاویر سخت مرتبه پایین پیشنهاد می شود. الگوریتم بر اساس هیستوگرام به طور خودکار قطعات را تشخیص می دهد و قبل از تقطیع کاراکترهاي مجزا شده، این قطعات را ترکیب می نماید. یک الگوریتم کلفت سازي مورفولوژیکی به طور اتوماتیک، محل خطوط مرجع را جهت جداسازي کاراکترهایی که با هم تداخل کردند، تعیین می نماید.
یک الگوریتم نازك سازي مورفولوژیکی و محاسبه کننده ارزش تقطیع، به طور اتوماتیک خط پایه را جهت تقطیع کاراکترهاي متصل تعیین می نماید. نتایج رضایت بخش است و نشان می دهد که این روش می تواند براي تقطیع کاراکتر در پلاکی با کاراکترهایی که به آسانی قابل تمیز دادن نمی باشند، مورد استفاده قرار گیرد. اما از آنجایی که الگوریتم از نظر محاسباتی پیچیده می باشد، نمی تواند براي LPR بلادرنگ و سریع پیشنهاد گردد. ضمن اینکه تدبیري براي دقیق سازي و توزیع غیر یکنواخت روشنایی تصویر ورودي پلاك اندیشیده نشده است.یک دیدگاه متفاوت با رویکردهاي تک فریمی موجود، روشی است که در [6] پیشنهاد گردیده است.
در این روش اطلاعات زمانی و مکانی با هم به کار گرفته می شوند. ابتدا استخراج کاراکترها توسط MRF مدل می شوند که در آن جهت توصیف عدم اطمینان در تخصیص برچسب پیکسل از روش رندوم استفاده می گردد. با مدلسازي MRF استخراج کاراکترها به عنوان مساله ماکزیمم سازي احتمال خلفی مبتنی بر مشاهدات و آگاهی هاي بدست آمده پیشین، فرموله می شود. بعدها الگوریتم ژنتیک با یک عملگر جهش محلی مورد استفاده قرار گرفت تا تابع هدف را اپتیمم نماید.این روش جهت تقطیع پلاك خودرو در سکانس هاي ویدئویی گسترش یافته اما نتایج تقطیع براي شناسایی خودکار کاراکتر دور از حد مطلوب قرار دارد.
براي شناسایی کاراکترهاي تقطیع شده، الگوریتم هاي متعددي به کار گرفته شده اند که عمدتا از مدل هاي مخفی مارکوف[7] - HMM - 4 و [8]، شبکه هاي عصبی [9] و [10]، فاصله [11] Hausdorff، شناسایی کننده کاراکتر مبتنی بر ماشین بردار پشتیبان[12] - SVM - 5 و تطبیق الگو [13] استفاده کرده اند.هنگامیکه مدل هاي HMM به کار گرفته می شوند، شناسایی با یک پیش پردازش و پارامتري کردن ناحیه هاي مورد علاقه تشخیص داده شده در فاز قبلی، آغاز می گردد.نتیجه شناسایی در [8] بعد از یک پروسه پیچیده پیش پردازش و پارامتري کردن جهت HMM، %95/7 گزارش شده است. براي یک آنالیز کاراکتر خوب هنگامیکه ازHMM استفاده می نماییم، امکان محدودیت و قید گذاري در فاصله موثر سیستم شناسایی وجود دارد. این پیش نیاز در [7] نیز مشخص گردیده تا نتایج شناسایی به %92/5رسیده است.
در [9]، دو شبکه عصبی احتمالاتی6 به طور موفقیت آمیزي تعلیم و تست شده است: یکی براي شناسایی حروف و دیگري براي شناسایی اعداد. در یک مجموعه تست کوچک 280 - کاراکتر - ، نرخ عملکرد به ترتیب به %97/5 و %95 رسیده است. در این شبکه ها ممکن است تعداد نورون هاي بیشتري نسبت به شبکه هاي پرسپترون جلو سوي استاندارد نیاز باشد اما PNN می تواند در کسري از زمان طراحی شود تا شبکه هاي جلوسوي استاندارد را تعلیم دهد.این ویژگی مفید با اشکالاتی همراه است که از آن جمله می توان به حافظه عظیم مورد نیاز و سرعت اجراي کمتر نسبت به شبکه هاي عصبی اشاره نمود .[10]فاصله Hausdorff، روشی جهت مقایسه دو تصویر باینري - یا تصویري با دو دسته از پیکسل هاي فعال - می باشد. این روش، تمام خصوصیات و ویژگیهاي متري را در خود دارد. مشکل اصلی، هزینه محاسبات آن می باشد.[11]
در [12]، مولفان سیستمی را جهت SVM طراحی نموده اند که نرخ میانگین موثر شناسایی کاراکتر آن %97/2 شده است. اما این سیستم منحصرا براي پلاك هاي کره اي طراحی شده است و بنابر این براي پلاك خودروهاي دیگر کشورها کارایی ندارد.یک روش مناسب و خوب جهت شناسایی کاراکترهایی با یک نوع فونت مشخص که نچرخیده باشند و اندازه ثابتی نیز داشته باشند، تکنیک تطبیق الگو می باشد. یک کاربرد مشابه در [13] آورده شده است که در آن مولفان از یک عملگر همبستگی نرمالیزه شده استفاده نموده اند. فرآیند شناسایی مبتنی بر محاسبه مقادیر دیگر همبستگی نرمالیزه شده براي تمام شیفت هاي هر مبدل کاراکتري بر روي زیر تصویر شامل پلاك می باشد.
در این مقاله، روش جدیدي جهت تقطیع و شناسایی کاراکترها از تصویر پلاك خودرو آورده شده است. در این روش ابتدا با استفاده از یک تبدیل شبه لاپلاسین ابداعی وویژگی هاي فردي و نسبی تصاویر کاراکترها، عمل تقطیع انجام شده و سپس تصاویر بدست آمده جهت شناسایی به دو شبکه عصبی پرسپترون تحویل داده می شود. نتایج حاصل از پیاده سازي روش پیشنهادي با استفاده از visual c# 2008 و یک سیستم P4,2.4GH بر روي پایگاه داده اي شامل 120 تصویر متنوع در شرایط مختلف حاکی از آن دارد که الگوریتم ارائه شده به زمان پردازشی کمی نیاز داشته و تا حدود زیادي در برابر تغییرات غیر یکنواخت روشنایی بر روي سطح پلاك مقاوم می باشد.
همچنین از مزیت هاي مهم روش ارائه شده، عدم نیاز به تصویر دقیق پلاك به عنوان ورودي است که کارایی آن را به طور قابل توجهی افزایش می دهد.در بخش 2 روش پیشنهادي مقاله به تفکیک مطرح می شود. بخش 3 به بررسی نتایج عملی بدست آمده و خطاهاي احتمالی می پردازد و مقایسه اي بین عملکرد روش پیشنهادي و روش مطرح شده در [3] و [4] انجام می گیرد.جمعبندي و نتیجه گیري در بخش 4 آورده شده است.
٢- روش پیشنهادي
در روش پیشنهادي، تصویر پلاك خودرو به عنوان ورودي دریافت می گردد. از جمله ویژگی هاي الگوریتم پیشنهادي این است که نیازي به تصویر دقیق پلاك ندارد و می تواند نواري از تصویر اصلی که حاوي پلاك می باشد را به عنوان ورودي دریافت نماید - شکل . - 1 سپس با اعمال فیلتر گاووس و یک تبدیل شبه لاپلاسین بر روي تصویر ورودي، آن را براي تقطیع کاراکترها آماده می کند. این عملیات پیش پردازشی، سبب مقاوم شدن الگوریتم نسبت به تغییرات روشنایی و نویز تصویر می شود. در مرحله بعد با استفاده از یک سري ویژگی هاي فردي و نسبی تصاویر کاراکترها، عمل تقطیع انجام می گیرد. البته جهت تقطیع صحیح و کامل کاراکتر حرف فارسی موجود در پلاك، عملیات مضاعفی صورت می گیرد. نهایتا تصاویر بدست آمده جهت شناسایی به دو شبکه عصبی پرسپترون با روش تعلیم پس انتشار خطا، یکی براي ارقام و دیگري براي حرف فارسی موجود در پلاك، تحویل می گردد. شکل 2 مراحل کار را به صورت کلی نشان می دهد.
1-2 پیش پردازش تصویر ورودي
در ابتدا با استفاده از یک فیلتر پایین گذر گوسی متقارن، تصویر ورودي را نرم7 می نماییم - شکل . - 3 در واقع با این کار رنگ هاي موجود در تصویر، یکنواخت تر شده و جزئیات و نویزهاي تصویر حذف می شوند. سپس با استفاده از یک تبدیل شبه لاپلاسین، مرز هاي موجود برجسته و واضح می گردد. این کار در عمل به کمک کانولوشن تصویر با ماتریس نشان داده شده در شکل 4، انجام می گیرد. تصویر حاصل در شکل 5 نمایش داده شده است. این عملیات سبب می شود که ما بتوانیم مشکل توزیع غیر یکنواخت نور را در باینري کردن تصویر تا حدود زیادي مرتفع نماییم. بنابراین پس از تبدیل تصویر رنگی به خاکستري - با استفاده از رابطه