بخشی از مقاله

خلاصه
با گسترش شگرف اینترنت و استفاده روزافزون از آن در جهت ارایه و یا کسب اطلاعات، شاهد حجم انبوهی از اسناد متنی و تصاویر برخط هستیم که بعنوان یکی از مشخصات بارز زندگی مدرن امروزی، تحت عنوان افزونگی اطلاعاتی مطرح میگردد. دراین میان دسترسی سریع و صحیح به منابع مهم و مورد علاقه، یکی از دغدغههای استفاده کنندگان از این منبع اطلاعاتی بسیار بزرگ است. آنچه امروزه از اهمیت بسیار زیادی برخوردار گردیده، کمبود یا نبود اطلاعات نیست بلکه کمبود روشهایی در جهت یافت و بهره برداری از اطلاعات در دسترس به نحوی بهینه است. مسئله بزرگی داده های تصویری ، تلاش جهت حذف نویز و اختلالات تصویری نظیر پارامترهای حاصل از منابع نوری نامناسب ، عدم تناسب ترکیب رنگ ها و عوامل متعدد دیگر در تصاویر دریافتی ، از موضوعات بسیار مهم در کار با تصاویر و پردازش آنها می باشد. در این راستا روش دسته بندی متون حاصل از تصاویر با استفاده از یک الگورتیم مبتنی بر سیستم فازی و شبکه عصبی پیشنهاد می گردد . در این روش محل قرارگیری سیستم فازی در ابتدا و انتهای شبکه عصبی همگام با عملیات فازی سازی و برگردان فازی معرفی می شود. در واقع ایده اصلی در این پژوهش، حذف و یا حداقل سازی نویز در دسته بندی اسنادی می باشد که دارای نادقتی زیادی می باشند.

کلمات کلیدی: منطق فازی ، دسته بندی صفحات ، پردازش تصویر ، طبقه بندی متن

.1 مقدمه

پردازش زبان های طبیعی یکی از زیرشاخههای با اهمیت در حوزه گسترده علوم رایانه ، هوش مصنوعی و نیز دانش زبان شناسی محاسباتی است که به تعامل بین کامپیوتر و زبان های - طبیعی - انسانی میپردازد، بنابراین پردازش زبان های طبیعی بر ارتباط انسان و رایانه ، متمرکز است. همچنین پردازش تصاویر امروزه بیشتر به موضوع پردازش تصویر دیجیتال گفته می شود که شاخه ای از دانش رایانه است که با پردازش سیگنال دیجیتال که نماینده تصاویر برداشته شده با دوربین دیجیتال یا پویش شده توسط پویشگر هستند سرو کار دارد. پردازش تصاویر دارای دو شاخه عمده بهبود تصاویر و بینایی ماشین است. بهبود تصاویر در برگیرنده روش هایی چون استفاده از فیلتر محو کننده و افزایش تضاد برای بهتر کردن کیفیت دیداری تصاویر و اطمینان از نمایش درست آنها در محیط مقصد - مانند چاپگر یا نمایشگر رایانه ای - است.

در حالی که بینایی به روشهایی می پردازد که به کمک آنها می توان معنی و محتوای تصاویر را درک کرد تا از آنها در کارهایی چون رباتیک و محور تصاویر استفاده شود . از سویی دیگر ، بینایی رایانه ای یکی از شاخه های مدرن و پرتنوع هوش مصنوعی است که با ترکیب روش های مربوط به پردازش تصاویر و ابزارهای تعلم ماشینی رایانه ها را به بینایی اشیاء مناظر و درک هوشمند خصوصیات گوناگون آنها توانا می گرداندنرم افزارهای پردازش متن برای تشخیص و بازیابی حروف الفبا توسط کامپیوتر طراحی شده اند که برای ساخت وتوسعه چنین نرم افزارهایی نیازمند تحقیقات در زمینه های سیستم های بیومتریک ،پردازش تصویر، سامانه های هوشمند که بر گرفته از - سیستمهای خبره ،الگوریتم ژنتیک ومنطق فازی - می باشیم .نویسهخوان نوری - OCR - * به عنوان تنها ابزار بازیابی اطلاعات متنی از تصویر، یکی از مهمترین ابزارهای تبدیل اطلاعات موجود به صورت قابل استفاده و پردازش در رایانهها و در نتیجه یکی از ارکان مهم تحقق محیط رایانه های فارسی به شمار میآید.

سامانههای نویسهخوان مثل بسیاری از سامانههای هوشمند دیگر، پیچیدگی زیادی دارند. پردازش تصویر و بازشناسی الگو دو پایهی اصلی این سامانهها هستند. پیچیدگی این سامانهها برای زبان های گوناگون، متفاوت است. به عنوان مثال نوشتن OCR برای زبان های لاتین به دلیل اینکه حروف آنها به طور مجزا نوشته میشود آسانتر است از زبان هایی مثل فارسی و عربی که حروف یک کلمه به یکدیگر میچسبند. این موضوع به علاوهی جمعیت کم کاربران زبان فارسی، سبب شده سامانههای نویسهخوان کمیبرای زبان فارسی داشته باشیم. مراجع [1] در زمینه بازشناسی متون دستنویس است و هدف، بازشناسی حروف دستنویس فارسی است که بطور مجزا توسط افراد مختلف نوشته شده باشند. در[2] مطالعه بر روی شناسایی حروف تایپی فارسی با قلمهای متفاوت به کمک شبکه عصبی می پردازد. در[3] شبکه عصبی مورد استفاده، یک طبقهبندی کننده سه لایه پرستیرون با قانون یادگیری پس انتشاری است.

در[4] شناسایی حروف و علائم متون فارسی با کمک منطق فازی را انجام دادند. در[5] یک روش مبتنی بر کدهای فرکتالی برای شناسایی حروف و اعداد گسسته دستنویس فارسی ارائه شده است. کدهای فرکتالی براساس مجموعه ای از تبدیل مساوی بدست میآیند و هنگامیکه این کدها به مجموعه بلوکهای دامنه و برد در یک تصویر دلخواه چند بار متوالی اعمال میگردند، باعث ایجاد تصویری خواهند شد که به تصویر اصلی شباهت زیادی دارد. در[6]یک روش مبتنی بر استخراج ساختار پلکس برای شناسایی حروف و ارقام دست نویس فارسی ارائه شده است و همچنین روشی برای توصیف الگوهایی که دارای عناصر غیرمتصل هستند، مانند نقطهها در بعضی حروف فارسی، معرفی شده است.در[7] این روش ی ک تصویر باینری از حروف جزء بندی شده به مقدار ثابتی از تصاویر کوچکتر که قاب نامیده میشوند شکسته میشود. از هر جعبه با این روش دو ویژگی استخراج میشود:

الف - یک نقطه ثابت برای هر جعبه که فاصله آن تا مبد ا جعبه - گوشه پایین سمت چپ - برابر میانگین فاصله هر یک از پیکسلهای سیاه تا مبدا است .

ب: - یک زاویه کهاندازه آن برابر میانگین اندازه زاویههای هر یک از پیکسلهای سیاه نسبت به سطح افق است. این دو ویژگی برای هر جعبه استخراج میشود و مجموع این ویژگیها جهت آموزش به یک سیستم فازی وارد میشود. با توجه به ا ینکه، در این روش از دو ویژگی فاصله و زاویه به طور مناسب بهره برده شده است دقت بازشناسی حروف بسیار بالا میباشد. و به % 99 میرسد. این روش وابسته به نوع قلم و اندازه حرف ورودی نیست و با یک تغییر کوچک در مرحله پیش پردازش برای هر زبان میتواند کارا باشد.

در این مقاله روش جدید تقسیم بندی که یکی از مهم ترین مراحل پیش پردازش برای تشخیص الگو و درک تصویر است معرفی می گردد. در این بررسی یک روش تقسیم بندی تصویر متن پیشنهاد و با استفاده از سیستم استنتاج فازی اجرا شده است.که مراحل الگوریتم پیشنهادی به این صورت می باشد - 1: ابتدا عملیات پیش پردازش بر روی تصویر ورودی انجام می شود - 2 نتیجه آن پارازیت های موجود حذف می گردند - 3 در ادامه کاراکترهای موجود در متن از یکدیگر جدا شده و بوسیله یک شبکه عصبی مصنوعی تشخیص داده می شوند - 4. با وصل نمودن مجدد حروف به یکدیگر و تشکیل کلمات آنگاه به منظور تشخیص محتوا ، یک سیستم فازی شروع به کار می نماید و دسته بندی تصویر موجود می پردازد و به این ترتیب مشخص می گردد که هر تصویری دارای چه مفهومی می باشد و در چه دسته ای قرار می گیرد .

طبقه بندی متن، یعنی انتساب اسناد متنی بر اساس محتوی به یک یا چند طبقه از قبل تعیین شده، یکی از مهمترین مسایل در متن کاوی است، مرتب کردن بلادرنگ نامههای الکترونیکی یا فایلها در سلسله مراتبی از پوشهها، تشخیص موضوع متن، جستجوی ساختیافته و یا پیدا کردن اسنادی که در راستای علایق کاربر میباشد، از جمله کاربردهای مبحث طبقه بندی - دسته بندی-کلاسه بندی - متن است. در بسیاری از موارد، افراد حرفهای آموزش دیده، برای طبقه بندی متون جدید به کار گرفته میشوند. این فرآیند بسیار زمان بر و پرهزینه است و لذا کاربرد خود را محدود میسازد، به همین منظور علاقه روزافزونی به توسعه فناوریهایی در دسته بندی خودکار متن ابراز میشود. در الگوریتم زیر روند کلی فرآیند پردازش تصویر را میتوان دید.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید