بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***


استخراج وشناسایی کلمات دست نویس با استفاده از شبکه های عصبی مصنوعی

و منطق فازی

خلاصه

در این مقاله روشی برای تشخیص و بازشناسی کلمات دست نویس انگلیسی بیان شده که از روشهای خاص به روش فازی استخراج می شود . تشخیص بدین صورت انجام می شودکه ابتداتصاویر اسکن شده بصورت یک فایل تصویری در بانک اطلاعاتی بصورت داده های Train و Test ذخیره می شود. این داده ها به سیستم داده شده و پس از آموزش، سیستم به صورت هوشمند وظیفه شناسایی خودکار کلمات مورد نظر را بر عهده دارد . که در سیستمهای شناسائی الگو باید دو مرحله را در نظر گرفت : -1 طراحی روشی جهت استخراج ویژگیها -2 دسته بندی ویژگیها. کلیه فعالیتهای این روش بر روی دو بخش فوق متمرکز می شود یک بخش مربوط به استخراج اتوماتیک ویژگیها که مبتنی بر شبکه های عصبی است و بخش دیگر جهت دسته بندی ویژگیها که مبتنی بر احتمالات و منطق فازی به عنوان پارادایهای Soft Computing می باشد.ویژگیهای استخراج شده بعد از کد شدن به شبکه عصبی جهت شناسایی کلمات دست نویس داده شده و نتایج بدست می آید.

کلمات کلیدی: شبکه عصبی ، منطق فازی ، شناسایی دست خط ،منطق فازی ، استخراج ویژگی

1. مقدمه

استخراج و بازشناسی متون دست نویس بدلیل نگارشهای مختلف با اشکالات فراوانی روبرو است. از کاربردهای بازشناسی متون دست نویس می توان به تشخیص پلاک خوردرو،شناسایی امضاء،بازشناسی دست خط و امضاء پویا ،چکهای بانکی ،قبوض آب، برق و اشاره کرد. برای اینکه بتوان به دقت لازم برای تشخیص برسیم ،بهتر است از ترکیب دو ویژگی استفاده کنیم. در یک سیستم خودکار تشخیص الگو به دلیل نویز،تنوع دست نوشته ها و طبیعت نگارشهای گوناگون پیچیدگی افزایش می یابد . طی دهه های گذشته روشهای مختلفی برای تشخیص حرف ارائه شده است که از جمله می توان به روشهای آماری،ساختاری ،مدل مخفی مارکوف و شبکه های عصبی اشاره کرد . منطق فازی از روشهای جدید بازشناسی ومبتنی بر تابع عضویت می باشد. که برای محاسبات مورد نیاز هر الگو و درجه شباهت آن بکار می رود. در سال 1958 آقای روزنبلات استاد روانشناسی دانشگاه کرنل آمریکا از طریق آنالیز ریاضی و شبیه سازی کامپیوتری ،نشان داد که نوعی از شبکه های عصبی موسوم به پرسترون را می توان برای حل مسئله طبقه بندی الگو آموزش داد. کار مهم آقای روزنبلات در ابداع قانون یادگیری برای شبکه پرسترون این قانون در داشت که در دهه هشتاد قرن بیستم توسط الگوریتم یادگیری جدیدی موسوم به پس انتشار خطا برای شبکه های عصبی پرسپترون چند لایه مرتفع شد. امروزه با

1

ترکیب شبکه عصبی و منطق فازی می توان بسیاری از مسائل راحل کنیم از جمله می توان به مسئله تشخیص حروف دست نویس اشاره کرد. هدف از انجام این پروژه این است که علاوه بر شناسایی دست خط ،قابلیت این را داشته باشد تادر مسائل زیست سنجی(بیومتریک)ازجمله شناسایی امضاء و تشخیص هویت استفاده شود. و همچنین آموزش افرادی جهت استفاده از این تکنولوژی در زمینه بانکداری و تشخیص نسخه های پزشکی در داروخانه ها.

2. ساختار کلی سیستم
-1پیش پردازش

-2استخراج ویژگیهای فازی

-3 کد کردن ویژگیهای استخراج شده

-4 شبکه عصبی


شکل - 1 اجزاءاصلی سیستم مورد ارزیابی شامل موارد زیر می باشد
-1-2 پیش پردازش

متون دست نویس را ابتدا به کلمات دست نویس بخش بندی و کلاس بندی می کنیم سپس فرض می کنیم هر کاراکتر یک تصویر باینری است و قبل از شروع به فرایند تقسیم بندی ما یک پیش پردازشی بر روی تصویر ورودی داریم که این پیش پردازش شامل مراحل زیر است(شکل(2

شکل -2 تصویر اصلی همراه با نویز- اعمال فیلتر – نازک سازی – رئوس تصویر

-2-1-2 مراحل پیش پردازش کاراکتر ورودی

فیلتر کردن: برای کاهش نویز و استخراج آسان ویژگیهای ساختاری


2

نازک سازی: با عمل فرسایش پیکسلهای خارجی را حذف کرده و اسکلت کاراکتر مورد نظر باقی می ماند.

پیدا کردن رئوس: در این مرحله محلهای اتصال کاراکتر استخراج می شود و ما به این محلهای اتصال رئوس می گوییم.
-2-2 استخراج ویژگیهای فازی

پس از مرحله پیش پردازش ما تصویری نازک با تعداد رئوس داریم که می توان با منطق فازی ویژپیهای آن را استخراج کنیم. برای بدست آوردن برداری از ویژگیهای اصلی یک تصویر باینری بخش بندی شده که هر سگمنت اندازه و زاویه مرتبط با موقعیت هر کاراکتر است.
-1-2-2 الگوریتم استخراج ویژگیهای حروف توسط فازی

در ابتدا باید تصویر را پیش پردازش کنیم و این پیش پردازش به ما کمک می کند که اطلاعات کافی در مورد الگوریتم ها و تخمین تاثیر نتایج حاصل بر کیفیت بازشناسی را انجام دهیم سپس الگوریتم استخراج ویژگیهای فازی آموزش داده می شود فرایند استخراج ویژگیهای هر حرف شامل یک سری قوانین و محاسبات بر روی عناصر تعیین کننده در گوشه های حروف و شاخه ها و بخشها هر تصویر می باشد.

در شکل3 شما این زوایا را می بینید:


شکل -3 حروف و شاخه ها و بخشها

هر نقطه یا VERTEX دارای دو مولفه Vx و Vy می باشد و تعداد شاخه ها که با Vn نمایش می دهیم شامل دو مولفه (Vx,Vy) می باشدبرای مثال نقاط انتهایی دارای یک شاخه می باشند. Vn=1

هر کاراکتر شامل یک سری منحنی ،شاخه های راست و رئوس می باشد که در کاراکتر شکل سه به تصویر کشیده شده است. -1 منحنیCurve Branch
-2 قله یا راس نقطه Vertex
-3 شاخه راست Stright Branch

بخشی های مختلفی از کارکتر را می توان به تصویر کشید و نمایش داد ولی تعدادی که ما نیازداریم بصورت بخش های ساده در جدول شماره 1 تعریف شده است که ویژگیهای جدول یک می توانند افزایش یابد مخصوصا زمانی که بخواهیم برای تایید امضاء افراد استفاده کنیم لازم است که ویژگیها را افزایش دهیم.

جدول شماره 1

-2-2-2 الگوریتم استخراج ویژگی


3

داده های ورودی

تصویر باینری با ابعاد M*N در ماتریسی مانند A لود میشود. ساختارگوشه ها V و تعداد گوشه ها Vcاستخراج می شود.

-3-2-2گامهای الگوریتم جهت استخراج ویژگیها

گام اول : دادن مقادیر اولیه به متغیرها

درگام اول متغیرهای jوi را برابر صفر قرار می دهیم که i اندیس گوشه ها و j اندیس شاخه ها برای بردارVi میباشد. سپس ماتریسی با سایز ماتریس اولیه با عناصر صفر به نام A' ایجاد می کنیم.

گام دوم: شاخه J را از ابتدا بصورت پیکسل به پیکسل پیمایش می کنیم و زیر بازه های vx(i) و Vy(i) بدست می آوریم.
ماتریس Aو'A را پیکسل به پیکسل بررسی می کنیم اگر معادل پیکسل موجود در ماتریس A در ماتریس A' نیز مقدار داشته باشد. بدین معنا است که ما قبلا" آن را پیمایش کرده ایم A'.را از روی آن بدون تغییرعبور می دهیم پیمایش زمانی متوقف می شود که به انتها رسیده باشیم. همه نقاط که پیموده می شود مقادیرشان درماتریس A' قرار داده می شود و همزمان در ماتریس P معادل آن نقاط ذخیره میشود و نقاط ابتدا و انتهای سگمنت و محدوده مرز((Bound Boxآن بخش درداده فازی F ذخیره می شود.

شکل – 4 ویژگیهای یک سگمنت

فرض کنید پیکسل های این بخش برابر K باشد.
گام سوم:اگر یک سگمنت بعنوان loop شناخته شد باید دارای شرایط زیر باشد:

D<=(K+D)*A/360

D فاصله نقطه شروع تا پایان بخش (SEGMENT)است. Kتعداد نقاط Segment است(تعداد عناصر ماتریس (p

:Aیک زاویه حدی است (ماکزیموم عرض یک زاویه برای یک بخش به عنوان یک (loop

شکل -5 کلاس بندی یک Loop
اگر شرایط برای Loop بودن چک شود اندازه آن بخش طبق گام 6 ،شکل 8 محاسبه می شود. رفتن به مرحله 7 گام چهارم:

محاسبه ضرایب aو b خط پایه )(Baseline) خطی که ابتدا و انتها را به هم وصل کند) محاسبه انحراف معیار D، که فاصله تمام نقاط

SEGMENT از خط Y= ax+bاست طبق رابطه D= شکل 6 محاسبه می شود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید