بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

بازشناسی قلمهای فارسی بر پایه فیلترهای گابور

چکیده: در این تحقیق، با استفاده از فیلترهای گابور، روشی برای استخراج ویژگیهای مناسب از تصویر متن و بازشناسی قلم آن ارائه شده است. روش پیشنهادی روی مجموعه ای شامل ۱۰۰۰ زیر - تصویر از ۲۰ قلم متداول فارسی آزمایش شده است. برای طبقه بندی از طبقه بند k همسایه نزدیکتر استفاده شده است. نتایج آزمایشی، متوسط نرخ طبقه بندی صحیح برای مجموعه آزمایش را معادل ۹۸/۷٪ نشان می دهد که مناسب بودن روش پیشنهادی برای بازشناسی قلم را تایید می کند.
کلمات کلیدی: بازشناسی متون چاپی، بازشناسی قلم، فیلترهای گابور، طبقه بندی.

مقدمه
یکی از اساسی ترین مراحل در تحلیل اسناد و تشخیص متون - که معمولا پیچیده و وقت گیر میباشد - بازشناسی قلم" است. هر چند که در زمینه بازشناسی متون چاپی، الگوریتمهای فراوانی ارائه شده است، اما متاسفانه تعداد انگشت شماری از آنها مرحله تشخیص قلم را در نظر گرفته اند. روشهای ابتدایی بازشناسی نوری متون ، روشهای تک قلمی محسوب شده و نوع قلم بکار رفته در متن، شناخته شده فرض می شود. در یک سیستم اتوماتیک چند قلمی بازشناسی متن وجود مرحله تشخیص قلم برای افزایش کارآیی سیستم و میزان بازشناسی صحیح اجتناب ناپذیر است. روشهای بازشناسی متون چاپی از دیدگاه توانایی در بازشناسی متون با قلمهای مختلف به ۳ دسته اساسی تقسیم می شوند
الف) روشهای تک قلمی : در این روشها، فرض بر این است که متن با یک قلم مشخص تایپ شده است. نرخ بازشناسی در این روشها بالا است هر چند که برای هر قلم، به یک سیستم مجزا نیاز است.
ب) روشهای مستقل از قلم : در این روشها، هیچ گونه پیش فرضی در مورد نوع قلم بکار رفته صورت نمی گیرد. به همین دلیل، نرخ بازشناسی این روشها نسبت به روشهای تک قلمی پایین تر است.
ج ) روشهای چند قلمی : در این روشها، فرض بر این است که قلم بکار رفته در متن یکی از قلمهای کتابخانه قلمها است. نرخ بازشناسی در این روشها، به تعداد و میزان شباهت قلمهای کتابخانه بستگی دارد. این روشها مخصوصاً در بازشناسی متونی که در تایپ آنها قلمهای مختلف به کار گرفته شده باشد، کارآیی بالایی دارند. بنابراین، در مورد روشهای اخیر تشخیص نوری قلم ،OFR، یکی از مراحل اساسی است که تاثیر فراوانی در نرخ بازشناسی نهایی سیستم بازشناس متن دارد. روشهای ارائه شده برای بازشناسی قلم را میتوان به دو دسته اساسی تقسیم کرد. الف) روشهای مبتنی بر تصویر کلمات یا یک خط از متن. ب) روشهای مبتنی بر تصویر یک صفحه از متن. در روشهای دسته اول، سعی بر این است که با تحلیل خصوصیات کلمات و حروف مانند شیب، انحنا و پروفایل و تفاوتهای بین آنها در قلمهای متفاوت، قلم بکار رفته را تشخیص داد. در روشهای دسته دوم، سعی بر استخراج ویژگیهای قلم از مجموع تصویر متن تایی بصورت کلی است. در این مقاله، با استفاده از فیلترهای گابور، روشی برای استخراج ویژگیهای مناسب از از تصویر متن و بازشناسی قلم ارائه شده است. روش پیشنهادی روی مجموعهای شامل ۱۰۰۰ زیر - تصویر از ۲۰ قلم متداول فارسی آزمایش شده است و برای طبقه بندی از طبقه بند k همسایه نزدیکتر استفاده شده است. سازماندهی این مقاله این گونه است که بخش دوم به مرور روشهای مختلف بازشناسی قلم میپردازد. بخش سوم، روش پیشنهادی بر پایه فیلترهای گابور را ارائه می کند. در بخش چهارم آزمایشها و نتایج بیان می شود و بخش پنجم به نتیجه گیری می پردازد.
۲ روشهای تشخیص قلم هر چند که در زمینه بازشناسی متون تحقیقات فراوانی انجام شده است، اما در زمینه بازشناسی اتوماتیک قلم تعداد مقالات و روشهای ارائه شده، انگشت شمار هستند. موریس در مقاله خویش، با استخراج ویژگی از کلمات در حوزه تبدیل فوریه و با استفاده از روش بیز اقدام به دسته بنلیی قلم می کند. در این تحقیق، ساده سازیهای زیادی انجام شده است از جمله تولید متنهای با قلمهای متفاوت توسط ماشین ( به جای تهیه تصویر از طریق اسکن کردن متن) یا اینکه متن فاقد هر گونه نویز میباشد. تحقیق دیگری ویژگیهای هندسی محلی را از تصویر ورودی استخراج و مجموعه این ویژگیها را با یک بردار ویژگی، با اجزای باینری، نمایش داده و به طبقه بند بیز تک مرحله ای می دهد. ویژگیهای هندسی از آنالیز گشتاورهای سطح و پیرامون اجزاء متصل، حفره ها، لبه ها و کمانهای محدب و مقعر محلی، بدست می آیند. در مرجع، از ویژگیهایی چون مقادیر پروفایل عمودی کلمات، چگالی پیکسلهای سیاه و واریانس پروفایل افقی استفاده شده است. در این روش از یک طبقه بند بیز برای طبقه بندی قلمها استفاده شده است. در مقاله دیگری ها، از یک خط متن، ویژگی از روی پروفایلهای عمودی و افقی و همچنین اجزا پیوسته، استخراج شده و طبقه بندی قلمها بر اساس این ویژگیها انجام شده است. شای و یولیدیس برای بازشناسی قلم بر اساس کلمه، هیستوگرام کلمات کوتاه متن نظیر is go at ،a و no را محاسبه کرده و با مقایسه آنها با هیستوگرامهای مربوط به همین کلمات که در مورد قلمهای کتابخانه محاسبه شدهاند، اقدام به تصمیم گیری می کنند. در پژوهشی دیگر، یک روش طبقه بندی قلم برای تسهیل باز شناسی حروف با اندازه ها و قلم های مختلف ارایه شده است . در این روش از ویژگیهای نوشتاری مانند قسمتهای زیر خط زمینه، بالای خط زمینه و سریف یا غیر سریف بودن خط استفاده شده است. این ویژگیها به یک طبقه بند شبکه عصبی داده می شود که در خروجی خود نوع قلم را مشخص می کند. داده های این پژوهشی شامل هفت قلم متداول با اندازه های از ۷ تا ۱۸ است.
ایده استفاده از فیلترهای گابور جهت تشخیص قلم های لاتین و چینی، نخستین بار در مرجع ارائه گردیده است. در این روش، برای بازشناسی قلم از روشی بر مبنای اطلاعات صفحه متن استفاده شده است. در این روش، تصویر برای استخراج ویژگی پیش پردازش می شود. در پیش پردازش ارتفاع خطوط متن به یک اندازه ثابت نرمالیزه شده و زیر تصویری با ابعاد ۱۲۸×۱۲۸ از تصویر متن نرمالیزه شده استخراج می شود. ویژگیهای استخراج شده در این تحقیق، میانگین و انحراف معیار ۱۹ کانال از فیلترهای گابور در ؛ جهت و ۶ مقیاس هستند. بنابراین بردار ویژگی ۳۲ بعد دارد. بعضی از تحقیقات به بازشناسی قلمهای دو زبان متفاوت پرداخته اندا ۹- ۱۱. در مراجع ۱۰ و ۱۱، با استفاده از ویژگیهایی که از تصویر کلمات استخراج می شود، نوع قلم فارسی و انگلیسی تشخیص داده می شود. در زمینه بازشناسی قلمهای فارسی و حتی عربی تا حد اطلاع ما، کار زیادی گزارش نشده است. در تنها تحقیق انجام شده در این زمینه ۱۲ ، روشی برای خوشه بندی ۲۳ قلم متداول فارسی ارائه شده است. در این روش، ورودی سیستم، تصاویر خطوط متن فارسی است که از آن ۱۶ ویژگی استخراج می شود. سپس از بین ویژگیهای معرفی شده با استفاده از الگوریتم وراثتی و خوشه بند FCM، ویژگیهای مناسب برای خوشه بندی به ۳ کلاس انتخاب شده اند.
۳ روش پیشنهادی
بلوک دیاگرام روش پیشنهادی در شکل ۱ آمده است. تصویر دو سطحی متن ورودی ابتدا پیش پردازش می شود. سپس یک زیرتصویر با ابعاد ۵۱۲ × ۵۱۲ از تصویر پیش پردازش شده، انتخاب می شود. در قسمت بعد ویژگیهای مناسب از این زیر - تصویر استخراج شده و به طبقه بند k همسایه نزدیکتر سپرده می شود. خروجی طبقه بند، نوع قلم تصویر ورودی را مشخص می کند. ادامه این بخش به تشریح قسمتهای مختلف روش پیشنهادی می پردازد.

۱-۳ پیش پردازش
پیش پردازش، شامل چند مرحله است که عبارتند از: پیدا کردن پهنای قلم تصویر متن ورودی ۱۹ ، نرمالیزه کردن تصویر متن به پهنای قلم از پیش تعیین شده، پیدا کردن خطوط متن و فاصله بین آنها و تنظیم فواصل بین آنها به اندازه پهنای قلم از پیش تعیین شده، حذف خطوطی از متن که پهنای آنها کمتر از ثلث پهنای تصویر است، پیدا کردن بخشهای همپوشان عمودی در تصویر هر خط متن و کاهش فاصله بخشهایی که فاصله بین آنها از ۲ برابر پهنای قلم بیشتر است و نهایتاً پر کردن فضاهای خالی -که در انتهای هر خط متن ایجاد می شود- توسط تصویر کلمات ابتدای همان خط. شکل ۲، تصویر یک صفحه متن با قلم زر، اندازه قلم ۱۶ که با درجه تفکیک ۳۰۰ نقطه بر اینچ نمونه برداری شده است را قبل و بعد از مرحله پیش پردازش نشان میدهد. لازم به ذکر است که پهنای قلم در تصویر اصلی ۵ پیکسل است که در تصویر پیش پردازش شده به ۹ پیکسل تبدیل شده است.
۳- ۲ استخراج ویژگی از تصویر متن پیش پردازش شده، یک زیر تصویر با ابعاد ۵۱۲ × ۱۲ ه انتخاب شده و ویژگیهای مناسب از آن استخراج می شود. شکل ۳، ۶ زیر تصویر با ابعاد ۵۱۲ × ۵۱۲ را نشان می دهد. در این تحقیق، از فیلترهای گابور برای استخراج ویژگی استفاده شده است. فیلترهای گابور به علت خاصیت تفکیک پذیری خوب و چندگانه در حوزه های مکان و فرکانس به عنوان ابزاری قوی در تحلیل بافت استفاده می شوند ۸ و ۱۳-۱۷. تابع یک فیلتر دو بعدی گابور متقارن زوج و تبدیل فوریه آن مطابق روابط ۱ و ۲ است .

شکل ۳ نمونه ای از زیر تصویرهای با ابعاد ۵۱۲ × ۵۱۲ الف) قلم کمپست ب) قلم فرناز ج) قلم ترافیک د) قلم ياقوت

که در آن u0 فرکانس مرکزی موج سینوسی را در راستای محور X، چنانچه جهت صفر درجه انتخاب شده باشد، مشخص می کند. , به ترتیب انحراف معیار تابع پوش گوسی در راستای محورهای X و y و به ترتیب انحراف معیار تابع گوسی در راستای محورهای u و V هستند. مجموعه ای از فیلترهای گابور از طریق گسترش و چرخش تابع (f(X,y که فیلتر مادر نامیده می شود، با ၆( مولد رابطه ۳، ایجاد می شوند.

که در آن fmn مقیاس شده و چرخش یافته ای از فیلتر مادر (a ،f(x,y ضریب مقیاسی، n اشاره گر مربوط به جهت فعلی، k تعداد کل جهتها ، m اشاره گر مربوط به مقیاس فعلی، S تعداد کل مقیاسها و x و y مختصات مقیاس شده و چرخش یافته هستند. ضریب " a برای مستقل کردن انرژی فیلتر از مقیاس m است. طراحی این فیلترها به گونه ای است که محل تقاطع آنها در صفحه نصف توان آنها باشد ۱۳ . به این ترتیب اطمینان حاصل می شود که خروجی فیلترها دارای حداکثر اطلاعات مفید و حداقل اطلاعات زائد هستند. چنانچه u h و u به ترتیب برای نمایش فرکانس مرکزی حداکثر و حداقل بکار روند، برای رسیدن به طرح مورد نظر، باید پارامترهای بانک فیلتر با توجه به رابطه 4 محاسبه شوند.

در این تحقیق به فیلترهایی با ابعاد ۵۱۲ × 512 نیاز است. بنا بر پیشنهاد مرجع ۱۵}، Uh برابر سیکل بر پهنای تصویر و U1 برابر سیکل بر پهنای تصویر انتخاب شده اند. بنابراین مقدار a برابر ۲ خواهد بود. برای تصویر تبدیل موجک گابور با استفاده از رابطه ۵ محاسبه می شود.

از آنجایی که بدست آوردن زیر تصویرهای Imn از طریق رابطه ۵ وقت گیر است، این زیر - تصویرها با استفاده از رابطه 6 در فضای تبدیل فوریه محاسبه می شوند.

که در آن (I(u,V تبدیل فوریه تصویر (I(X:y و (Fmn(u,V تبدیل فوریه (fmn(X,y است. بطور عموم، برای حذف حساسیت فیلترها به مقدار قدر مطلق شدت روشنایی تصویر، (0.0) Fm برابر صفر در نظر گرفته شده است. در مساله بازشناسی قلم، بهتر

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید