بخشی از مقاله
چکیده
در این مقاله روشی برای شناسایی اعداد دستنویس فارسی ارائه شده است که در آن از ویژگیهای استخراج شده از گرادیان تصویر استفاده می شود. روش مزبور قبلا در زمینه شناسایی اعداد انگلیسی مورد استفاده قرار گرفته است. در این روش، ابتدا تصویر به اندازه استاندارد نرمال شده و گرادیان تصویر محاسبه میگردد. سپس برای هر نقطه از تصویر، زاویه گرادیان محاسبه شده و به 4 یا 8 زاویه استاندارد، تبدیل میگردد. از روی تصویر گردایان حاصل، 4 یا 8 تصویر مجزا ساخته می شود که هر کدام از این تصاویر مقادیر گرادیان مربوط به یکی از زوایای استاندارد را در خود نگه میدارد. با نمونه برداری از تصاویر فوق ویژگیهای نهایی استخراج میشوند. در روش ارائه شده، عمل دستهبندی با استفاده از ماشینهای بردار پشتیبان
(support vector machines) صورت گرفته است. روش معرفی شده، با استفاده از 3939 نمونه آزمایشی، مورد آزمون قرار گرفته است که میزان تشخیص 99/59 درصد بدست آمده است.
کلمات کلیدی
شناسایی الگو (Pattern Recognition)، شناسایی اعداد دستنویس فارسی (Persian Handwritten Digit Recognition)،
گرادیان تصویر (Image Gradient)، ماشین بردار پشتیبان (Support Vector Machines)
-1 مقدمه
بـرای شناسـایی اعـداد و حـروف دسـتنویس انگلیسی توسط کامپیوتر، تاکنون تلاشهای زیادی صورت گرفته است و موفقیـتهای خوبـی نیز در این زمینه بدست آمده است. روشهای جدید ارائه شده برای تشخیص اعداد انگلیسی به میزان تشخیص بالاتـر از 99 درصـد بـرای دسـتخطهای مـتداول، دسـت یافـته اند .[1] در زمینه تشخیص اعداد فارسی (عربی) در مقایسه با زبان انگلیسـی، تلاشـهای کمتری صورت گرفته و میزان تشخیص گزارش شده (مطابق اطلاعات نویسندگان مقاله) نیز پایین تر است
(برای نمونه .([2-12]
در ایـن مقالـه روشـی برای تشخیص اعداد دستنویس فارسی ارائه شده است که از میزان دقت بسیار بالایی برخوردار اسـت. شـکل 1، دیاگـرام کلـی روش ارائـه شـده را نشـان مـی دهـد. در ایـن روش ویژگیهای مورد استفاده از گرادیان تصویر استخراج می گردند. این روش نتایج بسیار خوبی برای شناسایی اعداد انگلیسی حاصل نموده است [1] و.[13]
کد رقم تصویر ارقام
دسته بندی استخراج ویژگی پیش پردازش
شناسایی شده بصورت مجزا
شکل -1 دیاگرام کلی روش ارائه شده برای شناسایی اعداد دستنویس فارسی.
در ایـن مقالـه، پـس از مقدمه در بخش دوم، روش استخراج ویژگی مورد استفاده، بررسی شده است. در بخش سوم دسـتهبـندی کنـنده SVM مـورد اسـتفاده، بصورت مختصر معرفی شده است. در بخش چهارم آزمایشات صورت گرفته و نتایج حاصل ارائه شده است. در نهایت در بخش پنجم جمع بندی و نتیجه گیری راجع به روش ارائهشده صورت گرفتهاست.
-2 استخراج ویژگی
پـس از دریافـت تصـویر ورودی حـروف بصـورت مجـزا و به فرم باینری، پیش پردازشهای مناسب برای کاهش نویز روی آنها صورت می گیرد و سپس از روی تصویر حاصل ویژگیهای مناسب استخراج می گردند. روش استخراج ویژگی بکار رفـته در ایـن مقالـه مشـابه روش ارائه شده در مقالههای [1] و [13] میباشد. برای استخراج ویژگی ابتدا تصویر به اندازه N×N
نـرمال مـی گـردد. سـپس گـرادیان (Gradient) تصویر با استفاده از ماسکهای سوبل (شکل (2 محاسبه میشود. در روش فوق، گرادیان در جهت عمودی (gy) و گرادیان در جهت افقی (gx) با استفاده از دو ماسک مجزا بدست میآید.
1 2 1 1 0 -1
0 0 0 2 0 -2
-1 -2 -1 1 0 -1
شکل -2 ماسکهای سوبل((Sobel Masks ، برای محاسبه گرادیان.
بـرای هرنقطه از تصویر، با استفاده از ماسکهای فوق بردار گرادیان بصورت [gx gy] محاسبه می گردد. مقدار و زاویه گرادیان برای هرنقطه از تصویر، با بدست آوردن اندازه و جهت بردار فوق بدست می آید. پس از بدست آوردن زاویه گرادیان در هر نقطه، لازم است که مقادیر زاویه به چند زاویه استاندارد تبدیل گردند. برای این منظور زاویه گرادیان، به یکی از 8 زاویه نشـان داده شـده در شـکل 3-a تـبدیل مـیگـردد. در صورتی که زاویه گرادیان بین یکی از دو زاویه استاندارد واقع شود، بردار گـرادیان مـربوطه، مطابق شکل 3-b به راستاهای مربوط به هر دو زاویه استاندارد فوق، تصویر میگردد .[1] در این حالت برای نقطه مربوطه بجای یک مقدار گرادیان، دو مقدار مختلف در دو زاویه متفاوت بدست خواهد آمد.
پـس از استانداردسـازی زوایـا، از روی تصـویر گـرایان 8 تصـویر مجـزا ساخته می شود که در هر تصویر تنها مقادیر گـرادیان نقـاط در یـک جهـت قـرار داده میشوند. در مواردی که برای یک نقطه دو زاویه استاندارد حاصل شده باشد (مطابق شـکل (3-b، مقـدار گـرادیان بـرای هر یک از زوایای فوق بصورت جداگانه در تصاویر مربوطه، قرار می گیرد. بدین ترتیب 8