بررسی روش های پردازش متن

ممکن است پایگاه هایی از این نوع را نویسندگان موضوعی تهیه کنند و نرم افزار نیز به صورت تجاری در بازار موجود باشد. بعضی از میزهای راهنمایی از روش های پیشرفته ای برای پردازش زبان طبیعی بهره میگیرند. مثلاً آنیک (۱۹۹۳) سیستمی را توضیح میدهد که نوعی اصطلاح نامه نیز دربر دارد تا بتواند به بهره گیران در شناسایی اصطلاحات کاوشی مرتبط کمک کند؛ آتوروسامی (1993)سیستم تشخیصی را شرح می دهد که برای روشن ساختنِ ابهامات یا توصیفات ناقص، از فرآیندهای بسیار پیشرفته ای بهره می گیرد.

ممکن است نرم افزارهای میز راهنمایی که به صورت تجاری در بازار وجود دارند از قابلیت های ابررسانهای نیز برخوردار باشند و برای کمک به فرآیند تشخیص، از فایل های انتخاب شده اند

متنی، تصویری و صوتی استفاده کنند. راگوسا و توربان (۱۹۹۴) دربارهٔ ادغام ابررسانه و فناوری های سيستم خبره بحث کرده اند. تثبی (۱۹۹۶) از یک نرمافزار میز راهنمایی سخن به میان میاورد که به صورت تجاری در بازار وجود دارد.

شرکت ها، بیش از گذشته، درگیر فعالیت های پشتیبانی از مشتری شده و در پی آنند تامیزهای راهنمایی را ایجاد کنند که بهره گیران، خود، بتوانند از آنها استفاده کنند، به ویژه میزهای . راهنمایی که بتواند از طریق وب در دسترس قرار گیرند. اکنون نرمافزارهای میز راهنمایی که از طریق ودب قابل استفاده باشند، به صورت تجاری در دسترس قرار دارند (وارنی ۱۹۹۶)؛راپوزا(1996b) ازجمله این نرمافزارها، نرمافزارهایی هستند که به مشتریان اجازه میدهند تا از طریق مرورگرهای ایستگاه کاری خود را گزارش نمایند (والش1996)

نتایج

در همهٔ فعالیت های پردازشی پیش گفته، بازیابی اطلاعات وجود دارد. بازیابی جملات و پاراگرافها، از نظر پیچیدگی، در میانهٔ بین بازیابی ارجاعات کتاب شناختی (مثل اغلب جستجوهایی که به صورت درون خطی در کتابخانه ها انجام می شوند) و بازیابی پاسخ های واقعی برای سؤالات واقعی قرار دارد. کرافت و تورتل (۱۹۹۲) اظهار می دارند که پیشرفت چشمگیر در حوزه بازیابی به فنونی نیاز دارد که محتوای مدارک و درخواست ها را بفهمند" و سپس نتیجه گیری کنند که آیا یک مدرک مناسب است یا خیر. روشهایی که امروزه برای پردازش متن مورد استفاده قرار میگیرند جدید نیستند. سی سال قبلی، افرادی چون لوان، باکسن دال، ادموندسون، بوروکو، مارون، سیمونز، سالتون و بسیاری از محققین دیگر اغلب این روش ها را - شاید به صورت بسیار ابتدایی - مورد استفاده قرار داده اند (به فصل ۹ مراجعه کنید). همانطور که پیش از این گفته شد، امروزه نتایج بهتری به دست می آید، زیرا اکنون متون الکترونیکی زیادی در دسترس قرار دارد و قدرت پردازش رایانه های کنونی اجازه می دهند تا چنین حجمی از متون به شکلی کارآمد پردازش شوند. با این وجود، از نظر نتایج حاصله، زمان پردازش و هزینه های پردازش، حتی پیشرفته ترین روش های کنونی نیز از یک سیستم ایده آل بسیار فاصله دارند. بعلاوه، هنوز سیستم های نسبتاً کمی وجود دارند که بتوانند خدمات روزآمد و هر روزهای را ارائه نمایند. جاکوبز (۱۹۹۲a) این وضعیت را اینگونه توصیف میکند:

هرچند پیشرفت های چشمگیری برای ایجاد سیستم های هوشمندی متن پایه حاصل آمده است، اما هنوز با وضعیت دلخواه این فن آوری ها بسیار فاصله داریم. (ص ۵۰)

هابز و دیگران (۱۹۹۲) ادعا میکنند که هدف نهایی آن است تا سیستمی طراحی شود که بتواند: همهٔ اطلاعاتی که به طور ضمنی با تلویحی وجود دارند را زیر پوشش داشته باشد، و این وظیفه را بدون هیچ خطایی به انجام برساند. دراین زمینه، هنوز با وضعیت مطلوب بسیار فاصله داریم. دستیابی به چنین حدی از طریق بشر ناممکن است، بگذار تا ماشین آن را به انجام برساند. ( ص. ۱۴-۱۳)