بخشی از مقاله
چکیده
از جمله سیستمهای پردازش تصویر، میتوان به یک سیستم تشخیص الگو اشاره کرد. تشخیص الگو امریست که به وفور در زندگی انسانها دیده میشود، مانند تشخیص دستخط انسانهای مختلف، تشخیص گفتار، تشخیص چهره، و غیره. تشخیص الگو مسیرهای مختلفی را در گذشته طی کرده و هدف آن، دستهبندی اشیاء به تعدادی کلاس میباشد. تشخیص حروف دستنوشته فارسی یکی از زیرشاخههای تشخیص الگو و هوش مصنوعی به حساب میآید که از سه بخش پیشپردازش، استخراج ویژگی و دسته-بندی تشکیل شده است.
در این مقاله، روشی بمنظور تشخیص حروف دستنوشته فارسی ارائه شده است. هدف از بخش پیشپردازش، نرمالیزه کردن و باینری کردن دادههای ورودی است. در بخش استخراج ویژگی، مجموعهای از ویژگیها استخراج میشوند که آن نمونه را از دیگر نمونهها جدا میسازد. در بخش دستهبندی، باید نمونههای هر الگو با مرز مشخصی از بقیه نمونهها تفکیک شوند. در چارچوب پیشنهادی، تعدادی ویژگی مکمل یکدیگر بر اساس معیار زاویه، و ویژگیهای آماری از حروف دستنوشته فارسی استخراج گردید و از دستهبند شبکه عصبی بمنظور آموزش سیستم استفاده شد. ارزیابی نتایج بر روی پایگاه داده حروف هدی انجام گردید و بهترین نرخ تشخیص، حدود 95/93 درصد بدست آمد.
مقدمه
دهههای آغازین سده بیستم میلادی و دوران پیشرفت شگرف صنعتی، انقلاب جدیدی در رشتههای مختلف بوجود آورده است
با توجه به تاثیرگذاری علم کامپیوتر در زندگی بشر، میتوان گفت که اکثر مسائل امروزی با علوم کامپیوتر عجین میباشند. امروزه ضرورت هوشمند شدن سیستمها و تاثیر آن بر اکثر زمینههای زندگی انسانها به روشنی قابل درک است، لذا ضرورت این امر، توجه بسیاری از پژوهشگران را به خود جلب کرده است.
پیشرفتهای تکنولوژیکی، به سرعت راه خود را در تمام زمینههای زندگی انسان میگشایند، بگونهای که علوم و فنون جدید، جوامع بشری را با شکلهای مختلفی از اطلاعات روبرو نموده است. در حقیقت، زندگی ما با سرعت به سمت هوشمند شدن پیش میرود. این روند، منجر به ایجاد دانشی بنام هوش مصنوعی گردید. هدف اصلی هوش مصنوعی این است که کامپیوتر یا ماشین بتواند به تدریج و با افزایش دادهها، بازده بالاتری در وظیفه مورد نظر پیدا کند
به نظر میرسد که هوش مصنوعی سمبل دوران فراصنعتی و نماد بیهمتای قرن آینده باشد، تا جایی که امروزه هوش مصنوعی یکی از داغترین مباحث مابین کارشناسان علوم رایانه و دیگر دانشمندان میباشد - یادگاری مهدیآباد و همکارش، . - 1395 طیف پژوهشهایی که در زمینه هوش مصنوعی مطرح شده، گسترده است - کریمی و همکارانش، تیرماه . - 1393 تکنیکهای هوش مصنوعی، اغلب بمنظور تصمیمگیری در زمینههای مختلفی مانند دادهکاوی، تشخیص و آشکارسازی الگو، ارزیابی و تخمین برخی مسائل، مسیریابی در شبکههای بیسیم، مسیریابی در شبکههای چندپخشی، پزشکی، تشخیص خطا، بیومتریک، زیستشناسی، و غیره بکار گرفته میشوند.
الگوریتمهای هوش مصنوعی از جمله تکنیکهایی هستند که قدرت یادگیری و هوشمندی را برای سیستمها و ماشینها به ارمغان میآورند و گزینههای مناسبی برای بهینهسازی بسیاری از مسائل میباشند - روزبان و همکارانش، . - 1395 این الگوریتمها که بعضاً از سیستمهای طبیعی الهام گرفته شدهاند، راهحلهای کلی برای مسائل گوناگون میباشند. از جمله این الگوریتمها، میتوان به نزدیکترین همسایگی، منطق فازی، شبکههای عصبی، نروفازی، الگوریتم تجمع ذرات پرندگان، الگوریتم مورچگان، الگوریتم ژنتیک، ماشین بردار پشتیبان، درخت تصمیم باینری، تئوری بیزین، و غیره اشاره کرد
تشخیص کاراکتر نوری، بخشی از تشخیص الگو، هوش مصنوعی، و دید ماشینی بحساب میآید. در واقع این روش، ترجمه یا تبدیل الکترونیکی یا مکانیکی تصاویر دستنویس یا تایپ شده میباشد، بگونهای که بتوان با کامپیوتر آنها را ویرایش نمود. امروزه تشخیص دقیق کاراکترهای تایپ شده، تقریبا حل شده است. با این حال، تشخیص کاراکترهای دستنویس نسبتا مشکل است، زیرا افراد مختلف دستخطهای مختلف دارند
سامانه نوری کاراکتر، شامل سه بخش اصلی پیشپردازش، استخراج ویژگی و دستهبندی میباشد. هدف از بخش پیشپردازش، حذف نویز، و نرمالیزه کردن دادههای ورودی است. در بخش استخراج ویژگی، به هر نمونه، بردار ویژگیای اختصاص داده می-شود و بدین ترتیب آن را از دیگر نمونهها متمایز میکند. برخی از این ویژگیها شامل کد حلقه مکانی، موجکها، پروجکشن-های افقی و عمودی، ویژگی گرادیان، کریش، ویژگیهای مکانهای مشخصه و غیره هستند. در بخش دستهبندی، باید مرزبندی صحیحی بین بردارهای ویژگی انجام شود، بطوریکه نمونههای هر الگو با مرز مشخصی از بقیه نمونهها تفکیک شوند. در این بخش نیز روشهای مختلفی از قبیل شبکههای عصبی، ماشین بردار پشتیبان، درخت تصمیم باینری، منطق فازی، تفکیک-کننده خطی فیشر، الگوریتم ژنتیک، مدل مخفی مارکوف، قانون بیزین، و غیره استفاده میشود
استفاده از یک سیستم تشخیص کاراکترهای دستنویس، در عمل با چالشهایی مواجه است که مهمترین آنها ضرورت بالا بودن دقت تشخیص است. به همین دلیل، توسعه روشهایی برای بهبود دقت و سرعت در آنها ضروری است.
تاکنون، تحقیقات و پژوهشهایی در زمینه تشخیص کاراکترهای دستنویس فارسی صورت گرفته، اما اکثر این تحقیقات در عمل با چالشهایی مواجه بودهاند که مهمترین آنها ضرورت بالا بودن دقت تشخیص بوده است. در این پژوهش، با بررسی برخی تحقیقات پیشین، بررسیهای لازم در هر یک از بخشهای پیشپردازش، استخراج ویژگی، و دستهبندی انجام شده است. دربخش دستهبندی، از شبکه عصبی بمنظور ارزیابی کار خود استفاده کردیم و چارچوبی در جهت افزایش دقت تشخیص حروف دستنوشته فارسی ارائه دادیم.
در ادامه مقاله، پیشینه تحقیق و شبکه عصبی مورد بحث قرار گرفته است. سپس چارچوب پیشنهادی و مراحل اجرای آن به همراه نتایج شبیهسازی آمده و نهایتا جمعبندی و نتیجهگیری شده است.
پیشینه تحقیق
در چند دهه اخیر، تشخیص دستنوشتهها همواره مورد توجه و علاقه پژوهشگران داخلی و خارجی بوده است -
اگر چه در زمینه تشخیص کاراکترهای دستنوشته انگلیسی، تحقیقاتی انجام گرفته است، اما تلاشهای روزافزون برای تشخیص دستنوشتههای فارسی و عربی نیز، از موضوعات مورد توجه پژوهشگران میباشد
ردپای اولیه اقدامات صورت گرفته در زمینه تشخیص حروف را در سالهای اول دهه 1900 میتوان یافت Arica and Yamin- - . - Vural, 2002 در حالی که تلاش برای تشخیص ارقام دستنویس انگلیسی با استفاده از منطق فازی، اولین بار به وسیله Siy و Chen، در سال1974 انجام گرفت
در اوایل دهه 90، روشهای پردازش تصویر با تکنیکهای کارآمد هوش مصنوعی ادغام شدند. محققان، الگوریتمهای پیچیدهای را در تشخیص حروف ابداع نمودند که قادر بودند دادههای ورودی با تفکیکپذیری بالا را دریافت کنند و در مرحله پیادهسازی، محاسبات بسیار زیادی را بر روی دادهها انجام دهند . - Arica and Yamin-Vural, 2001 - در کشور ما با توجه به نیازی که احساس شده است، محققان و پژوهشگران مختلف در این وادی قدم گذاشتهاند و به خصوص در دو دهه اخیر، فعالیتهایی صورت گرفته است. در ادامه، برخی از تحقیقات انجام شده در زمینه کاراکترهای دستنوشته که توسط دیگر محققان انجام شده، آورده شده است.
Chi و همکارانش در سال - Chi et al, 1995 - 1995، نشان دادند، نمونههای آموزشی در فاز یادگیری تولید میشود و این نمونههای آموزشی، برای مشخص کردن ناحیه فازی و توابع عضو استفاده میگردند.
عزمی و کبیر - عزمی و کبیر، - 1373، از ویژگیهای گشتاوری و طبقهبند بیز، برای تشخیص حروف دستنویس فارسی استفاده نمودهاند. مولایی و همکارانش - Mowlaei et al, 2002 - ، با استفاده از تبدیل موجک گسسته روشی به منظور تشخیص کاراکترها و ارقام دستنویس فارسی و عربی ارائه دادند. در این تحقیق، از تبدیل موجک و ضرایب آن با فیلتر HAAR به منظور استخراج ویژگی تصاویر کاراکترها استفاده شده است. همچنین آنها از شبکه عصبی پسانتشار، استفاده نمودهاند. مجموعه نمونههای آموزشی و آزمایشی در این تحقیق، از 579 آدرس پستی دستنویس در ایران جمعآوری شده است. دقت تشخیص در این سیستم به ترتیب برای حروف دستنویس فارسی، 91/81 درصد و برای ارقام دستنویس فارسی، 92/33 درصد گزارش شده است.
حقیقی و همکارانش - Jifroodian Haghighi et al, 2009 - به ارائه پایگاه دادهای متشکل از 432357 نمونه اعم از کلمات، حروف الفبا، ارقام مجزا، تاریخ، اعداد، نمادها، علائم خاص، و سمبلها پرداختند. تعداد ارقام دستنوشته مجزای موجود در این پایگاه داده شامل 24121 نمونه بوده که 14437 نمونه برای آموزش سیستم، 4824 نمونه برای اعتبارسنجی سیستم، و 4824 نمونه هم برای آزمایش سیستم در نظر گرفته شده است. در آزمایشی که حقیقی و همکارانش بمنظور تشخیس ارقام دست-نوشته فارسی با استفاده از پایگاه داده خودشان انجام دادند بهترین دقت تشخیص ارقام دستنوشته فارسی، 96/85 درصد گزارش شده است.
نظام آبادی پور و همکارش - نظامآبادی و کبیر، - 1379، با اصلاح الگوریتم عزمی و کبیر - 1378 - ، یک الگوریتم جداسازی برای متون چاپی قدیمی ارائه نمودند. برای حل مشکل نایکنواختی کرسی خط، روشی برای تعیین نوار زمینه پیشنهاد گردیده و با اصلاح روش برچسبزنی مرز بالایی و تکمیل قواعد جداسازی، دقت الگوریتم برای متون قدیمی افزایش یافته است.