بخشی از مقاله
چکیده -
امروزه بازشناسی ارقام و حروف دستنویس فارسیاز اهمیت بسیار بالایی در کاربردهاي مختلف نظیر تشخیص خودکار مبلغ چکهاي بانکی، سیستم هاي پستی رایانه اي و ... برخوردار است. تشابه شکل نویسه هاي مجزا، روي هم افتادگی، اتصالات داخلی در نویسه هاي مجاور و ... از چالش هاي بسیار مهم در این زمینه است. در این مقاله از تبدیل ویژگیهاي مقاوم در برابر تغییر مقیاس - سیفت - 1 و روش بسته ویژگی هاي تصویري براي بازشناسی ارقام و حروف دستنویس فارسی/عربی استفاده می شود. به همین منظور ابتدا ویژگیهاي سیفت تصاویر استخراج می شود. سپس این ویژگی ها با استفاده از روش بسته ویژگی هاي تصویري2 بردارهاي ویژگی نهایی را تشکیل می دهند. براي افزایش کارایی روش بسته ویژگی هاي تصویري، ویژگیهاي هیستوگرام گرادیانهاي جهتدار3 و ویژگیهاي گابور نیز به این ویژگیها اضافه میشوند. از ویژگیهاي استخراج شده براي آموزش دسته بندي کنندة SVM استفاده می شود و در نهایت دسته بندي کنندة آموزش دیده شده قادر به بازشناسی ارقام/حروف فارسی است. روش پیشنهادي بر روي پایگاه داده هاي ارقام دستنویس HODA با نرخ تشخیص99.6 درصد و پایگاه داده حروف دستنویس HODA با نرخ تشخیص 94 درصد از روشهاي دیگر پیشی گرفته است
کلید واژه- ارقام دستنویس فارسی، حروف دستنویس فارسی، بسته ویژگیهاي تصویري، سیفت، ویژگیهاي گابور.4
-1 مقدمه
امروزه بازشناسی نویسه هاي دستنویس یکی از فعالترین زمینه هاي تحقیقاتی در پردازش تصویر و بینایی ماشین محسوب می شود. دلیل این امر کاربردهاي بالقوة بازشناسی این الگوها در حوزه هاي گوناگون است. پردازش خودکار چک هاي بانکی، خودکارسازي سیستمهاي پستی و ... برخی از کاربرهاي بازشناسی ارقام و حروف دستنویس است. تشخیص ارقام دستنویس فارسی و تشخیص حروف دستنویس فارسی امري سخت و دشوار محسوب می شود .[1] روشهاي بسیاري براي بازشناسی ارقام و حروف دستنویس لاتین پیشنهاد شدهاند که از کارایی بسیار بالایی برخوردار هستند و می توان گفت روشهاي بازشناسی خودکار ارقام و حروف دستنویس لاتین به بلوغ خوبی رسیده است .[2-5] درمقابل پیشرفت تحقیقات براي بازشناسی ارقام و حروف دستنویس فارسی/عربی پیشرفت چشمگیري نداشته است و تعداد پژوهشها در این حوزه بسیار اندك است 8]،.[7
تا کنون روشهاي مختلفی براي بازشناسی ارقام و حروف دستنویس فارسی ارائه شده است.[7-17] مقاله هاي زیادي در ارتباط با بازشناسی ارقام و حروف دستنویس فارسی وجود ندارند تلاش ما در این مقاله براي معرفی روشی جدید که وابسته به انجام پیش پردازش هاي مختلف نباشد، صورت گرفته است. به همین دلیل استفاده از ویژگیهاي مهمتصویر و ترکیب آنها با روش بسته ویژگی هاي تصویري به منظور معرفی روشی مؤثر در بازشناسی ارقام و حروف دستنویس فارسی مطرح میشود. ادامه مقاله به صورت زیر سازماندهی می شود. در بخش 2 روش بسته ویژگی هاي تصویري و روش هاي استخراج ویژگی هاي مختلف شامل سیفت، هیستوگرام گرادیانهاي جهتدار و ویژگی هاي گابور مرور می شوند. توصیفگر ترکیبی پیشنهادي در بخش 3 مورد بحث قرار می گیرد. نتایج آزمایش هاي عملی در بخش 4 و نتیجهگیريهاي حاصل در بخش 5 بیان میشود.
-2 استخراج ویژگی
در این قسمت روش بسته ویژگیهاي تصویري و روشهاي استخراج ویژگی سیفت، الگوي دودویی محلی و ویژگی هاي گابور به طور مختصر توضیح داده میشوند. -1-2 روش بسته ویژگیهاي تصویري - BoF - روش BoF به روش هاي تحلیل متن و اسناد مربوط می شود و پس از آن از این روش در الگوریتمهاي مربوط به پردازش تصویر و بینایی ماشین استفاده شده است 18]، .[19 روش BoF هر تصویر را به صورت مجموعه اي نامرتب از ویژگی هاي محلی نمایش می دهد .[20] به طور معمول پیاده سازي روش BoF شامل چهار مرحله زیر است:
-1 انتخاب قسمت ها/ بخش ها/ ناحیه ها و یا بلوك هایی از تصویر و استخراج ویژگیها از آنها توسط توصیفگرهاي محلی مانند سیفت.
-2 کوانتیزه کردن توصیفگرهاي مرحله - 1 - با استفاده از روشهاي مختلف خوشهبندي - مانند - K-means و ساختن دایره واژگان .[21]
-3 ساختن هیستوگرام واژه ها - با شمارش تعداد واژهها در هر تصویر - به عنوان بردار ویژگی.
-4 آموزش دسته بندمورد نظر با استفاده از بردارهاي ویژگی حاصل از مرحله . - 3 -
در این روش هر تصویر به صورت مجموعهاي از واژه هاي مختلف روي یک دایرة واژه هادر نظر گرفته می شود. در این مقاله دایرة واژه ها حاوي1024 واژه در نظر گرفته شده است، لذا بردارهاي ویژگی به صورت بردارهایی 1024 بعدي خواهند بود.
-2-2 توصیفگر سیفت
توصیفگر سیفت یکی از مقاومترین توصیفگرها در برابر انواع تغییرات مختلف هندسی است .[22] چنانکه ذکر شد ارقام دستنویس فارسی به صورت هاي مختلف و با چرخش ها و زوایاي متفاوت نوشته می شوند، این امر ایدة استفاده از توصیفگر سیفت براي حل مسئله بازشناسی ارقام دستنویس فارسی/عربی را موجه و معقولانه مینماید. در هیستوگرام گرادیان هاي جهت دار میزان و نوع زاویه گرادیان در قسمت هاي محلی تصویر محاسبه میشود که میتواند به طور مؤثري ویژگی شکل یک تصویر را ضبط کند. در روش هیستوگرام گرادیان هاي جهت دار تصویر به سلولهاي مربعی کوچک تقسیم میشود و در هر سلول بردار هیستوگرام زاویه گرادیان محاسبه میشود. سپس با استفاده از الگوي بلوکی نتایج هر سلول هنجار میشود ویک بردار ویژگی تشکیل میشود و در نهایت براي هر بلوك هیستوگرامی از ویژگی ها توصیف گر نهایی تصویر خواهند بود - شکل23] - 4،.[22
-4-2 ویژگیهاي موجک گابور
توصیفگرگابور به طور گستردهاي براي استخراج ویژگی هاي تصویر - به خصوص تصاویر بافتی - مورد استفاده قرار می گیرد. براي استخراج ویژگی هاي ارقام دست نویس توسط فیلترگابور رهیافت هاي مختلفی وجود دارد. در این مقاله براي استخراج ویژگی ها توسط فیلتر گابور، از تابع گابور دوبعدي به صورت زیر استفاده شدهاست [25-26] در مرحله اول به منظور استخراج ویژگی هاي سیفت ، هر تصویر نواحی مختلفی تقسیمبندي می شود وسپس ویژگی ها چنانکه ذکر شد، استخراج میگردد. در ادامه با استفاده از روش خوشهبندي K-means دایرة واژه ها ساخته می شود. در نهایت بردار ویژگی نهایی با شمارش تعداد واژه هاي هر تصویر روي دایرة واژه ها ساخته میشود.