بخشی از مقاله
تشخيص دست خط فارسي برخط با استفاده از کلاسيفاير حداقل فاصله
چکيده - امروزه يکي از مقوله هاي مورد توجه بشر در علم کامپيوتر تشخيص دست خط است . براي اين کار در زبانهاي مختلف روشهاي متعددي مطرح گرديده که در آنها از تکنيک هاي متنوعي همانند شبکه هاي عصبي، روشهاي آماري، روشهاي ساختاري و غيره جهت تشخيص استفاده شده است . در اين مقاله با استفاده از کلاسيفاير حداقل فاصله به تشخيص دست خط فارسي ميپردازيم . در اين راستا ابتدا تعدادي از ويژگيهاي حروف فارسي را بيان نموده سپس با تشکيل بردار ويژگي با استفاده از کلاسيفاير فوق حروف دستنويس را تشخيص ميدهيم .
کليد واژه : تشخيص دست خط ، زبان فارسي، استخراج ويژگي ١، کلاسيفاير حداقل فاصله ٢
١- مقدمه
امروزه بازشناسي برخط در تجارت و بانکداري الکترونيکي و روابط بين الملل از اهميت به سزايي برخوردار است ؛ زيرا در بسياري از مراکز اداري، تجاري و بانک هاي بين المللي بدليل عدم وجود يک صفحه کليد کامل روي کامپيوترهاي کوچک و يا عدم تسلط افراد بر تايپ متن هاي مختلف ، افراد ترجيح ميدهند درخواست هاي مورد نظر خود را به صورت دست نويس ارائه نمايند که در آن متن ورودي توسط يکي از ابزارهاي ديجيتالي مانند قلم نوري بر روي صفحات مخصوص اين قلم ها يا صفحات قابل لمس ٣ نوشته شده و سيستم متن ورودي را درست بعد از نوشته شدن آن تشخيص ميدهد. اين سيستمها را مدل برخط ٤ گويند ولي بيشتر تحت عنوان تشخيـص دست خط شناخته مي شوند[١][٦].
تاکنون روشهاي بسياري جهت تشخيص دست خط برخط براي زبانهاي گوناگون از جمله فارسي مطرح گرديده است .
روشهاي مختلفي همچون شبکه هاي عصبي (چند لايه پرسپترون، شبکه هاي عصبي با تأخير زماني و...)[٣] [٥] [٦]، روشهاي آماري (مدل مخفي مارکوف، چند جمله اي، ماشين بردار پشتيبان و ...)[٨] [٧] [٥] روشهاي ساختاري [٧] و غيره از اين جمله ميباشند. بيشتر اين روشها در کنار الگوريتم اصلي خود براي اجرا نيازمند دادههاي ابتدايي هستند که معمولاً در مرحله پيش پردازش و با استفاده از تکنيک هاي مختلفي بدست ميآيند. مرسومترين تکنيک مورد استفاده، استخراج ويژگيهاي حروف است که در هر يک از دو روش برونخط و برخط کاربرد فراواني دارد [٨] .
در اين مقاله ، ابتدا سعي بر آن داريم تا با بيان يکسري از ويژگيهاي حروف فارسي آنها را با تفکيک پذيري بالايي دسته بندي کنيم . سپس با استفاده از کلاسيفاير حداقل فاصله به تشخيص حروف دستنويس ميپردازيم . بدين منظور، در بخش دوم ويژگيهاي حروف فارسي را مطرح کرده ، به يک دسته بندي اوليه ميرسيم . سپس در بخش سوم، بردار ويژگيهاي هر حرف را تشکيل داده و با استفاده ازکلاسيفاير حداقل فاصله به تشخيص نهايي حروف مي - پردازيم . در پايان، در بخش چهارم و پنجم به بيان نتايج و جمع بندي نهايي خواهيم پرداخت .
٢ ويژگيهاي حروف
هدف اصلي در اين قسمت ، بيان آن دسته ويژگيهاي موجود در حروف فارسي است که معيار خوبي براي دسته - بندي ميباشند. اين ويژگيها را ميتوان به دو دسته تقسيم نمود که در هر قسمت مجموعه اي از ويژگيهاي خاص مورد بررسي قرار ميگيرند. اين دو دسته به شرح زير ميباشند :
١. ويژگيهاي قالبي ٥(الگو)
٢. ويژگيهاي آماري
٢-١- ويژگيهاي قالبي (الگو)
در اين بخش ويژگيهايي که مربوط به الگوي نوشتاري هر حرف است مورد بررسي قرار ميگيرد. اين ويژگيها بدون نياز به محاسبات پيچيده و از روي نحوه نوشتن و شکل طبيعي حروف بدست ميآيند که شامل موارد زير ميباشند:
١. تعداد بخش ها
٢. جايگاه بخش ها
٣. نوع بخش ها (شناسايي بخش ها)
٢-١-١- تعداد بخش ها
بيشتر حروف فارسي داراي بيش از يک بخش هستند که شامل نقطه ، دسته ، سرکج و مد مي باشند. اين ويژگي کمک شاياني به تفکيک آن دسته از حروفي ميکند که داراي بدنه اصلي مشابه و بخش (هاي) اضافي متفاوت در شکل طبيعي - شان هستند. به عنوان مثال، با استفاده از اين ويژگي مي - توان بين حرف "س " و همتاي نقطه دار آن يعني "ش " تمايز قائل شد. در جدول (١) حروف براساس تعداد بخش ها دسته بندي گرديده اند.
تکرار حروف در چندين بخش به جهـت تنـوع نوشـتاري بخش هاي حروف است . به عنـوان مثـال، بخـش اضـافي حرف "پ " را مي توان به سه صورت سه نقطه مجزا، دو نقطه به همراه يک نقطه و سه نقطه سرهم نوشت .
٢-١-٢-جايگاه بخش ها
اين ويژگي بيان کننده جايگاه قرارگيري بخش (هاي) اضافي هر حرف نسبت به بدنه اصلي آن است . به عنوان مثال قرار گرفتن نقطه ها در بالا در مورد حرف "ث " و در پايين در مورد حرف "پ " سبب تفکيک اين دو حرف از يکديگر مي - گردد. بديهي است که اين ويژگي تنها در مورد حروفي قابل استفاده است که حداقل بيش از يک بخش داشته باشند.
جدول (٢) حروف را براساس جايگاه بخش (هاي) اضافي آنها دسته بندي ميکند.
٢-١-٣- نوع بخش ها (شناسايي بخش ها)
علاوه بر تعداد و جايگاه بخش ها، نوع هر بخش نيز ميتواند در دسته بندي حروف مورد استفاده قرار گيرد. حروف مطابق
جدول (٣) در هفت دسته طبقه بندي ميشوند :
• نقاط : جداسازي حروف به چهار دسته بدون نقطـه ، تک نقطه اي، دو نقطه اي و سه نقطه اي
• ســرکج : تفکيــک دو حــرف "ک " و "گ " از کــل حروف و جداسازي اين دو از يکديگر
• دسته : تفکيک دو حرف "ط " و "ظ " از کل حروف
• مد : تفکيک حرف "آ" از ساير حروف
جدول (٣) دسته بندي حروف را براساس نوع بخش (هاي) آنها نمايش ميدهد.
جدول (٣): دسته بندي حروف براساس نوع بخش هاي اضافي
تا اين مرحله ،به تفکيک نسبتاً مناسبي از حروف دست يافتيم که در هر دسته ، تنها ساختار بدنه اصلي حروف متفاوت است . در ادامه ، به بررسي ويژگي هايي ميپردازيم که انواع ساختارهاي مختلف بدنه اصلي را در دسته هاي جدا تفکيک ميکنند.
٢-٢- ويژگيهاي آماري
ويژگيهاي آماري به آن دسته از ويژگيها اطلاق ميگردد که نيازمند محاسبات پيچيدهتري بوده و براساس اطلاعات آماريي که از يک حرف استخراج ميشود، بدست ميآيند. به منظور استخراج اين ويژگيها، از ٨٠ نفر مختلف نمونه هايي جمع آوري گرديد.
٢-١-٤-ناحيه بندي
به منظور ايجاد تمايز در ساختار بدنه اصلي حروف، از ناحيه بندي استفاده ميکنيم . بدين ترتيب ، هر حرف در چارچوبي فرضي در نظر گرفته شده و با استفاده از دو خط تقسيم کنندهاي که وسط اضلاع چارچوب را به هم متصل ميکنند، هر حرف به چهار قسمت مساوي تقسيم ميشود.
نسبت اندازه طول به عرض چارچوب فوق، تعداد و ترتيب نواحي پرشده،براي تشخيص مورد استفاده قرار ميگيرد:
• نسبت ارتفاع به پهنا
اين ويژگي در تفکيک حروفي که از نظر نسبت ارتفاع به پهنا يا بالعکس داراي شکل منحصر به فردي هستند قابل استفاده است . به عنوان مثال، اين ويژگي معيار خوبي براي جدا کردن حرف "ا" از حروف ديگر است . براين مبنا، دسته بندي طبق جدول (٥) صورت ميگيرد:
جدول (٥): دسته بندي حروف براساس نسبت ارتفاع به پهنا