بخشی از پاورپوینت
--- پاورپوینت شامل تصاویر میباشد ----
اسلاید 1 :
اگر ما متنی را روی کاغذ داشته باشیم و بخواهیم عین متن را بدون تایپ کردن وارد کامپیوتر كنيم چکار باید بکنیم؟ ما به وسیله «اسكنر» می توانیم تصويری از آن متن را وارد کامپیوتر كنیم، اما این فقط یک تصویر است و نمی توان روی آن پردازش انجام داد.
در واقع « تصوير ديجيتالشده» بايد به « تصوير قابل پردازش» تبدیل شود
پردازش و آنالیز تصاویر میتواند به عنوان یک ساختار کاربردی و تکنیکی جهت تسخیرکردن، تصحیح کردن، زیاد کردن و تغییر شـکل دادن تصاویری که مشاهده می شود تعریف کرد.
اسلاید 2 :.
یک سیستمOCR به ما این امکان را می دهد که یک کتـاب و یا یک مقاله را مستقیما به یک فایل الکترونیکی تبدیل نماییم و آن را با کمک یک پردازشگر تغییر دهیم این تکنولوژی مدتهاست که به وسیله کتابخانه ها وسازمان هـای دولتـی بـرای دسـتیابی الکترونیکـی سریع به مدارک حجیم به کارمی رود و از لحاظ سرعت و هزینـه روش مناسبی است .OCR از معدود زمینه های هوش مصنوعی است که میتوان در عمل به آن تکیه کرد.
اسلاید 3 :
اولين اقدامات صورت گرفته در زمينة بازشناسي حروف, در سالهاي اول دهه 1900 انجام گرفته است که دانشمندان روسي مي خواستند به افراد مبتلا به نارساييهاي بينايي كمك نمايد.
در ســـال1929 در آلمـــان و در ســـال 1933 در آمریکا ابداعاتی در زمینه OCR ثبت نمودند اینها اولین ایده ها ی شناسای ی حروف هستند.
اولین کامپیوتر تجـار ی در سال 1951 در آمریکا شروع به کار کـرد. در ایـن زمـان بـود کـه ایـده OCR به عنوان یک پدیده قابل پیاده سازی پذیرفته شد.
اسلاید 4 :
در اوايل دهه 90، روشهاي پردازش تصوير و بازشناسي الگو با تكنيكهاي كارآمد هوش مصنوعي ادغام گشتند.
امروزه علاوه بر وجود رايانههاي قدرتمندتر و تجهيزات الكترونيكي دقيقتر مانند اسكنرها، دوربينها و صفحات رقميكننده، استفاده از تكنيكهاي پردازشي مدرن و توانمند همچون شبكههاي عصبي ، مدلهاي ماركوف پنهان ، منطق فازي، و مدلهاي پردازش زبان طبيعي امكانپذير گشته است.
اسلاید 5 :
در کلمات فارسی برخی از حروف از یک یا دو طرف به حروف مجاور خود اتصال دارند و برخی نیز بصورت مجزا نوشته می شوند.
حروف فارسی ممکن است به چهار شکل متفاوت نگارش شوند.
حروف واقع در یک کلمه ممکن است همپوشانی داشته باشند.
در برخی از فونت ها بعضی از حروف، از یک سمت در دو محل به یکدیگر اتصال دارند.
اسلاید 6 :
حروف فارسی ممکن است در بالا یا پایین بدنه داراي اعراب باشند.
در بالاي بدنه یک حرف ممکن است علامت تشدید وجود داشته باشد.
برخی از حروف داراي علامت همزه هستند.
بیشتر حروف فارسی ( مخصوصا حروف چسبیده ) دندانه دار هستند.
اسلاید 7 :
شامل كلية اعمالي كه روي سيگنال تصويري خام صورت ميگيرند تا موجب تسهيل روند اجراي فازهاي بعدي گردند؛ مانند باينري كردن تصوير، حذف نويز.
از مجموعة اين پردازشها هدفهاي زير دنبال مي شود:
۱‐ كاهش نويز.
۲‐ نرماليزه نمودن داده ها.
۳‐ فشرده سازي
اسلاید 8 :
نويز ايجاد شده بواسطة دستگاه هاي اسكنر نوري يا ابزارهاي نگارشي منجر به ايجاد قطعه خط هاي گسسته، اتصال بين خطوط، فضاهاي خالي در خطوط متن، پر شدن حفره هاي موجود در تصوير برخي حروف و غيره مي گردد. همچنين اعوجاج هاي مختلف شامل تغييرات محلي، منحني شدن گوشه هاي حروف، تغيير شكل و يا خوردگي حروف را نيز بايستي مد نظر قرار داد.
اسلاید 9 :
به دلیل بی دقتی در مرحله اسکن یا بی دقتی نویسنده در هنگام نگارش متن دست نوشت، ممکن است خطوط متن نسبت به تصویر، اندکی انحراف یا چرخش داشته باشند.
آشکارسازي خط زمینه در بسیاري از تکنیک هاي قطعه بندي و بازشناسی متون فارسی عربی لاتین، نقش اساسی دارد.
اسلاید 10 :
در متون چاپي فارسي و لاتين ، كاراكترهاي داراي فرمت ايتاليك از راستاي عمود انحراف دارند. همچنين در متون دستنويس برخي از نويسنده ها حروف را بصورت زاويه دار مي نويسند. اين شناخته مي شود و مي تواند دقت برخي از الگوريتم هاي قطعه بندي « اريب شدگي » پديده تحت عنوان يا بازشناسي را تحت تأثير قرار دهد و لذا در اين سيستم ها لازم است كه در مرحلة پيش پردازش ، ميزان اريب بودن كاراكترها شناسايي و تصحيح گردد.