بخشی از مقاله
چکیده –
انتخاب روش مناسب براي بازنمایی و توصیف شکل کلمات، در دقت و قوام سیستمهاي پردازش تصویر متون بسیار موثراست. با توجه به پیوستگی حروف در زبان فارسی، استفاده از روشهاي مبتنی بر شکل کلی به توصیف دقیقتر کلمات کمک میکند.
به دلیل تنوع در ساختار و پیچیدگی شکل زیر-کلمات، توصیف همهي آنها به یک روش چندان مناسب نیست. استفاده از نواحی مهم شکل یکی از راهکارهایی است که میتواند به منظور توصیف دقیقتر شکل زیر-کلمات استفاده شود. در این مقاله روشی براي تعیین نواحی مهم در شکل زیر-کلمات ارائه میکنیم.
بخشهایی از شکل که بین نمونههاي یک کلاس بیشتربن شباهت را دارند و در عین حال بیشترین تفاوت را با نمونههاي سایر کلاسها ایجاد میکنند، به عنوان بخشهاي مهمتر شکل انتخاب میشوند. روش ارائه شده بر مجموعهاي از شکل زیر-کلمات فارسی اعمال شده و نواحی مهم به دست آمده ارزیابی میشوند.
-1 مقدمه
روشهاي بازشناسی کلمات به دو دسته کلی تقسیم میشوند.
روشهاي مبتنی بر قطعه بندي و روشهاي مبتنی بر شکل کلی. در روش مبتنی بر قطعه بندي، تصویر هر کلمه به دنبالهاي از زیر-تصاویر تجزیه میشود که هر کدام، معمولا نشان دهنده یک حرف است. با ترکیب نتایج حاصل از بازشناسی هر یک از زیر- تصاویر، کل کلمه بازشناسی میشود. اما در روش مبتنی بر شکل کلی، هر کلمه جزئی مستقل در نظر گرفته میشود و به عناصر کوچکتر تجزیه نمیشود. در این روش بازشناسی در سطح کلمه انجام میشود.
در روشهاي مبتنی بر شکل کلی، توصیف هر کلمه بر اساس ویژگیهاي شکل کل کلمه انجام میشود و مجموعهي تصاویر کلمات بر اساس این ویژگیها از هم متمایز میشوند. در این روشها، براي هر کلمه یک کلاس در نظر گرفته میشود و بنابراین، ویژگیهاي منحصر به شکل هر کلمه در بازشناسی وارد میشوند.
کارایی روشهاي مبتنی بر توصیف شکل کلی در سیستمهاي بازشناسی کلمات در تحقیقات مختلف نشان داده شده است.
استفاده از اطلاعات شکل کلی کلمه در بازیابی میان مجموعه محدود کلمات، حجم پردازش را به شکل قابل ملاحظهاي کاهش میدهد. به کارگیري شکل کلی کلمه، روشی کارامد براي نشان کردن کلمات پرس و جو در تصاویر اسناد است. اگرچه به کارگیري روشهاي مبتنی بر قطعه بندي براي بازشناسی، باعث میشود مجموعهي کلاسهاي موجود به مجموعه حروف سازنده کلمات کاهش یابد، اما قطعه بندي تصاویر کلمات، همواره با خطا همراه است. به طور کلی، اطلاعاتی که از ویژگی هاي شکل کلی کلمات به دست میآید، مکمل اطلاعات حاصل از توصیف حروف آنهاست. این ویژگیها میتوانند در کاربردهاي مختلف و بنا بر نیاز مسئله در کنار سایر ویژگیها در بهبود کارایی سیستم موثر باشند.
تحقیقات متعددي به بررسی کاراریی روشهاي عمومی توصیف شکل براي توصیف شکل کلمات در زبانهاي مختلف پرداختهاند و توصیفگرهاي مختلف سراسري و محلی براي استخراج ویژگی از شکل کلمات ارائه شدهاند. [3-1]
با توجه به پیوسته نویسی در خط فارسی، ویژگیهاي مبتنی بر شکل کلی براي توصیف کلمات فارسی مناسب است. با این حال تحقیقات محدودي در این زمینه انجام گرفته است. در [4] از 45 گشتاور زرنیکی براي توصیف زیر-کلمات چاپی و دستنویس فارسی استفاده شده است.
در [5] از مدل پنهان مارکوف براي مدل کردن شکل کلمات استفاده شده است. براي تعیین ویژگیها در هر قاب تصویر، کد زنجیرهاي کانتور شکل در خانههاي قاب محاسبه میشود.
در [2] روشی دومرحلهاي براي بازشناسی زیر-کلمات چاپی فارسی ارائه شده است. در مرحله اول با استفاده از ویژگیهاي مکان مشخصه، مجموعه زیر-کلمات به تعدادي خوشه تقسیم میشوند و در مرحله دوم، هر کلمه با استفاده از توصیفگرهاي فوریه کانتور آن توصیف میشود.
پیوستگی خط فارسی و تنوع شکل حروف در موقعیتهاي مختلف کلمه باعث میشود، شکل زیر-کلمات از جهت ساختار و پیچیدگی بسیار متنوع باشند و از این رو موفقیت روشهاي مبتنی بر ویژگی هاي سراسري تنها در کاربردهایی است که تعداد کلمات محدود است. با توجه به اینکه در روشهاي توصیف سراسري، اطلاعات مربوط به جزئیات شکل از دست میرود، به دنبال راه هایی هستیم که بتوان از این اطلاعات نیز براي بهبود توصیف استفاده کرد.
موفقیت روشهاي مبتنی بر ویژگیهاي محلی در توصیف شکلهاي عمومی، باعث شده است تا در تحقیقات اخیر، از روشهاي مبتنی بر توصیفگرهاي محلی براي توصیف حروف و کلمات استفاده شود. [6]، .[7] با توصیف بخشهاي مختلف شکل کلمه با استفاده از توصیفگرهاي محلی، علاوه بر اینکه جزئیات شکل حفظ میشوند، میتوان راهکارهایی را به کار بست که براي توصیف شکل، از بخشهاي مهمتر شکل استفاده میکنند. منظور از بخشهاي مهمتر شکل، بخشهایی از شکل هستند که میتوانند توصیف بهتري از آن ارائه کنند و اطلاعات بیشتري براي بازشناسی شکل زیر-کلمه دربردارند.
براي مثال در [8] براي توصیف شکل کلمات، از بخشهایی از شکل استفاده میشود که داراي حفرههاي باز و بسته باشند. بعد از اسکلت بندي تصویر دودویی کلمه، حفرههاي باز و بسته از اسکلت آن استخراج میشوند. ویژگیها از بخشهایی از شکل استخراج میشود که شامل این حفرهها باشند. استفاده از حروف شاخص کلمه، راهکار دیگري است براي آنکه توصیف شکل کلمه بر عهده بخشهاي مهم آن قرار داده شود.
در این روشها، بخشهاي مهم شکل زیر-کلمات، بخشهایی از تصویر هستند که شامل یکی از حروف شاخص باشند. حروف شاخص حروفی هستند که بازشناسی آنها آسان است و جداسازي کلمات بر اساس آنها با دقت بالایی انجام میشود.
در [9] براي توصیف کلمات فارسی از حروف شاخص استفاده شده است. حروف ابتدایی، حروف میانی در صورتی که شامل یک بالارونده باشند و حروف انتهایی در صورتی که شامل بالارونده یا پایین رونده باشند، حروف شاخص در نظر گرفته میشوند.
در مقالات محدودي که به توصیف شکل کلمات بر اساس بخشهاي مهم آنها پرداخته شده است، انتخاب این بخشها تنها بر اساس فرضیات تجربی و دقت بازشناسی حروف انجام گرفته است. حال آنکه در انتخاب بخشهاي مهم، میتوان به خصوصیات متمایز کننده شکل کلمات توجه نمود و از ویژگیهاي مجموعه کلمات تحت بررسی براي تعیین نواحی مهم استفاده کرد. در این مقاله به بررسی بخشهاي مختلف شکل زیر-کلمات چاپی فارسی خواهیم پرداخت و چگونگی تعیین بخشهاي مهم زیر-کلمات را ارزیابی میکنیم. در بررسیهایی که انجام میدهیم، تنها شکل بدنه زیر-کلمات در نظر گرفته میشوند و نقاط حذف شدهاند.
در روشی که براي تعیین نواحی مهم شکل زیر-کلمات ارائه میشود، به دنبال بخشهایی از شکل هستیم که بین نمونههاي یک کلاس بیشتربن شباهت را دارند و در عین حال بیشترین تفاوت را با نمونههاي سایر کلاسها ایجاد میکنند. براي تعیین این نواحی، روش ارائه شده در [10] را به کار خواهیم برد. روش مرجع [10]، که به بررسی شکلهاي سه بعدي میپردازد، به هر ناحیه از سطح امتیازي نسبت میدهد که بر اساس نتیجه جستجوي شکل با استفاده از ویژگیهاي آن ناحیه تعیین میشود. بخشهایی که در بازیابی شکل بهترین نتیجه را داشته باشند، به عنوان بخشهاي مهم در نظر گرفته می شوند.
در ادامه در بخش 2 به مرور روشهاي عمومی میپردازیم که براي تعیین بخشهاي مهم در شکلها ارائه شدهاند. در بخش 3 روشی که براي تعیین نواحی مهم در شکل زیر-کلمات به کار بردهایم، شرح داده میشود. شرایط انجام آزمایش و نتایج به دست آمده در بخش 4 بررسی میشوند.
-2 تعیین نواحی مهم در شکلهاي عمومی
تعیین بخشهاي مهم یک شکل در کاربردهاي مختلف بینایی ماشین موثر است. با تعیین این نواحی، میتوان براي مقایسه دو شکل تنها به مقایسه نواحی مهم آنها پرداخت. در کاربردهایی که تنوع شکلها زیاد است، استفاده از نواحی مهم اهمیت بیشتري پیدا میکند. انتخاب نواحی مهم شکل براي کاربردهایی چون توصیف محلی اشکال، انطباق جزئی و هم ترازي شکل در مقالات بررسی شده است.
روشهاي مختلفی براي انتخاب بخشهاي برجسته شکل در تحقیقات پیشین ارائه شده است. در بیشتر موارد، انتخاب این نواحی بر اساس مجموعهاي از ویژگیهاي هندسی شکل انجام میشود. نقاطی از شکل که از نظر هندسی شرایط مفروض را برآورده سازند، به عنوان نقاط مطلوب تعیین شده و نواحی محلی را ایجاد میکنند. یافتههاي محققان نشان میدهد که سیستم بینایی انسان، نواحی با انحناي بالا، گوشهها و لبهها را سریعتر پردازش میکند. بر اساس این نتایج، معمولا از این ویژگیهاي هندسی براي تعیین نواحی برجسته اشکال استفاده میشود
اغلب روشهایی که براي تعیین نواحی مهم شکل کلمات ارئه شدهاند نیز، بر اساس ویژگی هاي ساختاري شکل، بخشهایی را براي استخراج ویژگی انتخاب میکنند.
نکته قابل توجه این است که تعیین شرایط لازم هندسی براي انتخاب نواحی مهم در شکل، خود مسالهایست که باید بررسی شود. علاوه بر این، به کارگیري این ویژگیهاي ساده هندسی، نواحی مطلوب زیادي روي شکل ایجاد میکند که انتخاب زیرمجموعه مناسبی از آنها به عنوان نواحی مهم، نیاز به پردازش جداگانهاي دارد.
علاوه بر ویژگی هاي هندسی، معیارهاي دیگري براي تعیین نواحی مهم شکل در تحقیقات ارائه شدهاند که به بررسی خصوصیات یک شکل در بین سایر شکلهاي پایگاه داده میپردازند. براي تعیین میزان شاخص بودن یک بخش از شکل، علاوه بر ویژگیهاي آن، یکتایی آن بخش در میان سایر کلاسهاي مجموعه داده نیز مهم است. یکی از این معیارها کمیاب بودن بخشهاي یک شکل در مجموعه شکلهاست.
بخشهایی از شکل که احتمال وقوعشان از سایربخشها کمتر است، به عنوان بخشهاي مهم انتخاب میشوند. در [14] با محاسبه توصیفگرهاي محلی در شکل پرس و جو، احتمال وقوع هرکدام بر اساس تابع توزیع توصیفگرها محاسبه شده است. تنها تعدادي از توصیفگرها براي انطباق به کار رفتهاند که کمترین احتمال رخداد را دارند.
در روش دیگري که براي تعیین نواحی مهم شکل بر اساس نمونههاي موجود در مجموعه داده ارائه شده است، بخشهایی از شکل که توصیف کاملتري از آن ارائه میکنند به عنوان بخشهاي مهم انتخاب شدهاند. به این منظور، توصیفگرهاي به دست آمده از بخشهاي مختلف شکل با معیارهایی معین، ارزیابی شده و بخشهاي مهمتر تعیین میشوند.
در [10] روشی پیشنهاد شده است که براي ارزیابی هر توصیفگر از نتایج بازیابی بر اساس آن توصیفگر استفاده میکند. در این مرجع که به بررسی سطوح عمومی شکلهاي سهبعدي میپردازد، به هر بخش از سطح امتیازي نسبت داده میشودکه بر اساس نتیجه پرس و جوي شکل بر میناي ویژگیهاي آن بخش تعیین میشود.
بخشهایی که بهترین نتیجه بازیابی را داشته باشند، به عنوان بخشهاي مهم در نظر گرفته میشوند. به عبارت دیگر، بخش هایی از شکل که کمترین فاصله را با نمونههاي مشابه، و بیشترین فاصله را با سایر نمونهها ایجاد میکنند، به عنوان بخشهاي مهم شکل انتخاب میشوند. در این مقاله براي تعیین نواحی مهم شکل زیر-کلمات چاپی فارسی از این روش استفاده خواهیم کرد.
-3 روش تعیین نواحی مهم در شکل زیر-کلمات
در این بخش، به تشریح روش به کار رفته براي تعیین بخشهاي مهم در شکل زیر-کلمات میپردازیم. با در اختیار داشتن تصاویر مجموعهاي از شکل زیر-کلمات که در کلاس هاي مختلف قرار گرفتهاند - براي هر زیر-کلمه، نمونههاي مربوط به قلمهاي مختلف در یک کلاس قرار می گیرند - ، بخش هاي مهم در هر تصویر تعیین میشود. براي تعیین بخشهاي مهم یک زیر-کلمه، ابتدا شکل آن به بخشهایی تقسیم میشود و ویژگیهاي توصیفگر هر بخش محاسبه میشود. بر اساس نتیجه بازیابی شکل زیر-کلمه با استفاده از توصیفگر هر بخش، امتیازي به آن بخش نسبت داده میشود. در این قسمت از مقاله، روش بخشبندي شکل، توصیف هر بخش و امتیازدهی به بخشهاي مختلف شرح داده میشود.
-1-3 بخشبندي شکل و استخراج ویژگی
براي بخش بندي شکل هر زیر-کلمه، تعدادي نقاط ویژه از شکل استخراج میشود. پنجرهاي با اندازه معین به دور هر نقطه قرار داده میشود و یک بخش از شکل مشخص میشود. با استخراج ویژگی از هر بخش، توصیفگر آن بخش به دست میآید. به این منظور، ابتدا تصویر زیر-کلمه با یک فیلتر گوسی هموار میشود.
در این مقاله براي تعیین نقاط مطلوب، از آشکارساز نقاط هریس [11] استفاده کردهایم. شکل - 1 - نقاط ویژه به دست آمده از شکل یک زیر-کلمه نمونه را نشان میدهد.
شکل:1 تعیین نقاط ویژه بدنه یک زیر-کلمه و بخشبندي آن