نتایج استفاده از واژگان کنترل شده و نمایه سازی انسانی

چار نیاک (۱۹۹۵) اشاره کرده است که با اختصاص برچسب بخشی از گفتار ۶ به یک کلمه از طریق بیشترین احتمال (بیشترین بسامد) می توان به صحتی برابر با ۹۰٪ دست یافت و با بررسی های سادهٔ بافتی (یعنی جستجو براساس همجواری ) می توان این صحت را به ۹۵-۹۶ ٪ ارتقاء داد. در مقالهٔ لی کوک و دیگران (۱۹۹۳) می توان به نمونه ای از روش مجموع ، مبنا دست یافت که برای ابهام زدایی از واژگان، مورد استفاده قرار میگیرد. آدیسون  (۱۹۹۱) بر استفاده از بافت برای پرهیز از ابهام در سیستم بازیابی متنی تاکید کرده است.

با استان فیل و واتس (۱۹۹۲) روش های امروزی (که ادعا دارند از فنون استفاده از هوش مصنوعی استفاده میکنند) را با روش های سال های قبل، به شکل زیر، مقایسه کرده اند:

هوش مصنوعی - آنگونه که درگذشته تعریف شده - اگر نمرده باشد، درحال مرگ است. هوش مصنوعی جدیدی درحال جایگزین شدن است. هوش مصنوعی قدیمی بر قواعد و منطقی پایه گذاری شده بود. هوش مصنوعی جدید بر آمار استوار است، اما نه آماری که درگذشته فرمولبندی شده است. عملیات آماری، خود، درحال تغییری بنیانی است. (ص 215)

جاکوبز(1992a)اشاره میکند که روش های امروزی حجم زیاد مستور ذخیره شده -  حاصل امده اند نه از قوانین دستی قدیمی از انجا که در روش های کنونی پردازش متن میتوان رایانه ها را طوری برنامه ریزی کرد که متن را بفهمند، در نتیجه می توان انها را هوشمند به شمار اورد. دراینجا، فهمیدن به معنی توانایی تفسیرِ بدون ابهام يک جمله است. معمولا. انجام این کار به نوعی تحلیل نحوی نیاز دارد. تحلیل نحوی به دنبال آن است که عناصر ساختاری مختلف (گروه اسمی، گروه فعلی، گروه قیدی، و غیره) را مشخص سازد، و انواع وابستگی  های جمله (مثل فاعل، ضمایر فاعلی،مفعول,ضمایر مفعولی)راتعیین کند.

- پردازش هوشمند متن - چه به صورت ازمایشی و چه عملیاتی - در تعدادی از برنامه های کاربردی مثل رده بندی متن، استخراج متن، خلاصه نویسی و افزایش متن، تولید متن، بازیابی . پیشرفته اطلاعات و نیز ترجمه ماشینی مورد استفاده قرار گرفته است  اغلب تحقیقات جاری در این خصوص، برآنند تا از طریق نوعی استخراج یا خلاصه نویسی و به منظور اهداف بازیابی، متن کامل را به قالبی کوتاهتر کاهش دهند. در فصل بعد، این روش ها و نیز برآوردی از دست آورده ای آنها را بررسی خواهیم کرد. در این فصل، جستجوی متنی به تنهایی مورد بحث قرار گرفت و از نمایه سازی خودکار یا روش های خلاصه نویسی صحبتی به میان نیامد؛ هرچند ایجاد تمایز بین این مفاهیم چندان ساده نیست و فصل های ۱۴ تا ۱۶ کاملاً به هم مرتبط هستند.

نتایج

سیستم هایی که با واژگان کنترل شده و نمایه سازی انسانی اجرا می شوند خوب عمل کرده و در طول یک دوره ۴۰ ساله، کارایی خود را به اثبات رسانده اند. با این وجود، انجام جستجوهای مفهومی عام در آنها دشوار است. هرچند زبان طبیعی مزایای مشخص و مستلمی دارد، اما بهبود بخشی مناسب آن (استفاده محدود از نمایه سازی و / یا گسترش ابزارهای کمکی) احتمالاً باعث خواهد شد تا کارایی سیستم های زبان طبیعی افزایش یابند. بعلاوه، همانطور که اینترنت تعداد متون تمام متن قابل دسترس برای جستجو را به چندین برابر افزایش داده است، به همان ترتیب استفاده از سیستم هایی که بتوانند مدارک بازیابی شده را براساس ربط احتمالی - و نه از طریق تقسیم مدارک به بازیابی شده و بازیابی نشده رتبه بندی نمایند را نیز بیش از پیش ضرورت بخشیده است (مارون، ۱۹۸۸(