بخشی از مقاله
چکیده
استخراج و انتخاب خصوصیات خوب یک پارامتر اصلی در سیستمهای تشخیص الگو میباشد و استفاده از روشهای یادگیری ماشین در دستهبندی و خوشهبندی الگوهای موجود در مجموعه دادههای تصویری و چندرسانهای در کنار خصوصیات خوب بسیار موردتوجه پژوهشگران است. این مقاله یک سیستم موثر را برای کلاسبندی حروف دست نوشته براساس روشهای یادگیری ماشین درخت تصمیمگیری C5.0 و K نزدیکترین همسایه نشان میدهد. با استفاده از تشخیص جهت خطوط متفاوتی که کاراکتر را شکل می-دهند، یک مجموعه ویژگی به نام خصوصیات جهت، در نواحی تقسیمشده تصویر حروف استخراج گردید.
هر حرف دستنوشته به 9 ناحیه مساوی تقسیم شد و برای هر ناحیه 8 خاصیت استخراج گردید، که یک بردار خاصیت با 72 عنصر برای هر حرف به دست آمد. یکی از مزیتهای این خصوصیات سادگی آنها است که نیازی به نرمال سازی ندارند. خصوصیات استخراج شده به دو مجموعه، 90 درصد برای آموزش و 10 درصد برای تست تقسیم شدند. این عمل با تستهایی برای حالتهای مختلف انتخاب دادههای آموزش و تست انجام گرفت و با استفاده از روشهای درخت تصمیمگیری C5.0 و K نزدیکترین همسایه نتایج مطلوبی به دست آمد.
مقدمه
تشخیص متون دستنوشته یکی از مسائل مشکل به دلیل تنوع شکل و کیفیت نوشتار در افراد متفاوت است. تشخیص دست-نوشتههای لاتین نسبت به دستنوشتههای فارسی به دلیل گسستگی حروف راحتتر میباشد. سیستمهای تشخیص زیادی در سالهای اخیر ارائه شدهاند که اغلب دارای دقت بالایی هستند. این سیستمها معمولا در سه مرحله اصلی عمل میکنند که شامل: پیش پردازش، استخراج و انتخاب خصوصیات، کلاس بندی و اعتبارسنجی میباشد.
تشخیص کامپیوتری حروف در بسیاری از موارد، مانند نسخههای پزشکی، نوشته های روی چک های بانکی، دستنوشتههای تاریخی و غیره کاربرد دارند که طراحی یک سیستم دقیق تشخیص میتواند درتشخیص دستنوشتهها و تبدیل آنها به متون قابل ویرایش کامپیوتری بسیار مفید و موثر باشد.دقت کلاسبندها در این سیستم ها از اهمیت بالایی برخوردار است و کیفیت خصوصیات استخراج شده برای بالابردن دقت این سیستمها اهمیت بیشتری دارد.
یک مجموعه خصوصیات خوب باید ویژگیهای منحصربفرد یک کلاس را نشان دهد و با تغییرات جزئی در عناصر کلاس، تغییر ننماید - . - Lauer and Suen,2007 خصوصیات مرسومی که در تشخیص حروف استفاده شدهاند شامل موارد: موقعیتهای ثابت - Hmimid et al,2015 - ، تجسم - - Reboredo et al,2013، خصوصیات ناحیه- بندی - - Impedovo and Pirlo,2014، توصیف کنندههای فوریه - - Timm and Martinetz,2010، هیستوگرام جهت کانتور - - Ren et al,2016 و بسیاری دیگر می باشند. در بسیاری از سیستمهای کلاسبندی ترکیبی از این گونه خصوصیات به عنوان بردار خصوصیت مورد استفاده قرار گرفتهاند.
این مقاله بر روی دو مقوله اصلی استخراج خصوصیت و کلاس بندی تمرکز دارد.تحقیقات فراوانی برای تشخیص حروف و ارقام دستنوشته برای زبان لاتین، فارسی و زبانهای دیگر انجام شده است. کیل و همکارانش یک کلاسبندی مبتنی بر ماشین بردار پشتیبان و K نزدیکترین همسایه با استفاده از خصوصیات موقعیت زرنیک برای تشخیص حروف دستنوشته ارائه دادهاند.
آنها ابتدا تصاویر کاراکترها را به اندازههای 30*30 تبدیل کردهاند و سپس آنها را به یکسری نواحی تقسیم نموده و خصوصیات موقعیت زرنیک را از این نواحی استخراج نمودهاند - . - Kale et al,2014 در- - Al Omari and Al-Jarrah.2004 - یک رویکرد شبکه عصبی احتمالی برای تشخیص اعداد دستنوشته هندی بر اساس مرکز ثقل و مجموعه بردارهای نقاط حاشیه این ارقام ارائه گردیده است. منتظر و همکارانش یک رویکرد جامع را با استفاده از شبکه عصبی-فازی برای تشخیص حروف و ارقام دستنوشته فارسی ارائه دادهاند - . - Montazer et al,2010
در مقاله - Agustín-Blas et al,2012 - یک رویکرد خوشه بندی مبتنی بر الگوریتمهای ژنتیک با استفاده از خصوصیات ناحیهای ارائه گردیده است. یک مجموعه خصوصیات براساس کد زنجیره کانتور اصلاحشده در - Alaei et al ,2009 - ارائه شده است. دو نوع مجموعه خصوصیت بر اساس فرکانسهای جهتی کد زنجیره اصلاح شده در پیکسلهای کانتور تصویر حروف ورودی و خصوصیات انتقال اصلاحشده در - Alaei et al ,2009 - نشان داده شده است.
روش تحقیق
ابتدا حروف موجود در پایگاه به اندازه های یکسان 30*30 برش داده شدند و سپس تصاویر برش داده شده به 9 ناحیه مساوی تقسیم شدند، که در نهایت استخراج خصوصیت از این 9 ناحیه صورت گرفت. خصوصیات استخراجشده با آزمایشهای مختلفی با 90 درصد داده یادگیری و 10 درصد داده تست به دو روش یادگیری ماشین، درخت تصمیم گیری C5.0 و K نزدیکترین همسایه داده شد که نتایج حاصل به خوبی کارایی روش مورد تحقیق را نشان میدهد. در ادامه روش استخراج خصوصیت، مجموعه داده استفاده شده، روشهای یادگیری ماشین برای کلاسبندی، طریقه پیاده سازی و نتایج حاصل بیان شدهاند.
استخراج خصوصیات
خصوصیات مورداستفاده در این پژوهش، جهت خطوط تشکیل دهنده کاراکتر دست نوشته در هر یک از 9 ناحیه مشخص شده است. برای شروع، ابتدا شروعکنندهها، تقاطع و شروعکنندههای جزئی در هر ناحیه مشخص میشوند. این پارامترها در واقع پیکسلهایی هستند که نشاندهنده نقاط شروع خطوط تشکیلدهنده حرف در ان ناحیه میباشند. شکل - - 1 این 3 پارامتر را نشان میدهد.
همانطور که در شکل دیده میشود، شروعکنندهها، پیکسلهایی هستند فقط با یک پیکسل همسایهاند. تشخیص تقاطعها در هر ناحیه مقداری پیچیدهتر از شروعکنندهها است. شرط ضروری اما غیر کافی برای یک تقاطع این است که بیش از یک همسایه داشته باشد.مورب یا مستقیم بودن پیکسل های مجاور با پیکسل موردنظر در اتخاب آنها بعنوان نقاط تقاطع تاثیر دارند. شروع-کنندههای جزئی، پیکسلهایی هستندکه در مسیر یک خط تغییرجهتهای جزئی پیکسلها را نشان میدهند.برای شروع، ابتدا پیکسلهای شروعکننده، تقاطعها و شروعکنندههای جزئی هر ناحیه مشخص شده و در یک لیست قرار میگیرند.
براساس پیکسلهای حاصل قرار گرفته در لیست، الگوریتم شروع به پیمایش پیکسلهای هر ناحیه مینماید و جهت تمام خطوط موجود در هر ناحیه را به دست میآورد. پیمایش هر ناحیه برای استخراج جهت خطوط، وقتی متوقف میشودکه همه پیکسلهای ناحیه موردنظر ملاقات شده باشند.فرض کنید پیکسلهای یک ناحیه به شکل - - 2 باشند و پیکسل بالا/چپ اگر با - 1,1 - مشخص شود. لیست شروع کنندهها در این ناحیه [ - 1,1 - , - 1,5 - , - 5,1 - , - 5,5 - ] خواهد بود و نقطه تقاطع فقط - 3,3 - است.