بررسی زبانهای مختلف و روش های مقایسه ای مختلف

زبانهای مختلف از روش های مقایسه ای متفاوتی استفاده می کردند (یعنی، استفاده از همهٔ روشهای مقایسه برای همهٔ زبانها مناسب نبود). در بعضی از مقایسه ها، از مجموعهای متشکل از ۲۴۱ مدرک و شصت درخواست کاوش استفاده شده است. نتایج مقایسه های مختلف، اغلب در قالب نسبت های جامعیت ارائه شدند؛ درنتیجه به تعداد نامحدودی از مدارک بازیابی شده نامرتبط دست یافتند. شاید چندان دور از انتظار نباشد که این تحقیق به نتایجی دست یافته باشد که یافته های بررسی های پیشین را اثبات می نماید: زبان های کنترل نشدهٔ مورد بررسی، درست شبیه به زبانهای کنترل شده، از طریق ایجاد یک کارایی بازیابی عالی و عملکرد مناسبی که هرگز به بدی بدترین زبانهای کنترل شده و نه به خوبی بهترین آنها نبوده است، عملکرد مناسبی را ارائه دادهاند. (جلد 1، ص ۶۷- 1۶۶)

محققین ادعا میکنند:

بدیهی است که استفاده از بهترین زبان نمایه، یکی از بالاترین جزء نگری های ممکن را به دست میدهد بدون آنکه از ابزارهای مانعیت پیشرفت های - جز استفاده از یک همارایی ساده - استفاده شده باشد. به نظر میرسد که کلمات مفردو زبان طبیعی در انگلیسی، میتوانند بالاترین سطح جزء نگری را ارائه دهند. (جلد ۱، ص. ۱۶۹)

کین و دیگر اظهار داشته اند که آزمایشی انجام شده بر روی واژگان کنترل شده، اکنون به خوبی اثبات شده است؛ در واقع آنها می خواهند بگویند که دفعه آخر باشد که زبان های نمایه ای کنترل شدهٔ سنتی را با نمایش بی فایده بودن انها تحقیر می کنند. (جلد ۱، ص. ۷۰).

 لنکستر و دیگران (۱۹۷۲) بر روی جستجوی درون خطی محققین زیست پزشکی در سیستم بازیابی چکیده های صرع (ایرز) تحقیقی را انجام دادند. هدف آن بود تا مشخص شود که این محققین در جستجوی متن چکیده ها در حوزه صرع، چه مقدار خوب عمل میکنند. همچنین برای مقایسه، این جستجو با اصطلاحات متن ازاد / کنترل شده نیز تکرار شد. نتیجه آن بود که در بیش از ۴۷ جستجو که از اصطلاحات نمایه ای اکسرپتا مدیکا استفاده شده بود، نتایجی برابر با نصفی نتایج حاصل از جستجو بر روی چکیده ها حاصل آمد.

توجه داشته باشید که چکیده ها عموما نقاط دسترسی بیشتری فراهم می اورند. بنابراین، این مقایسه بیشتر بر روی طول رکورد بود، نه یک مقایسه واقعی که بین جستجو از طریق متن آزاد و اصطلاحات کنترل شده صورت گرفته باشد. این محققین نتیجه گرفتند که جستجوی متنی، به دلایل زیر جامعیت بیشتری رائه میدهد؛ الف) تعداد نقاط دسترسی، ب) افزونگی بیشتر، ج) انطباق بهتر بین اصطلاحات بهره گیر و کلمات متن، د) خطاها و فقدان انسجام در نمایه سازی انسانی، ح) همپوشانی موجود در بین اصطلاحات نمایه ای.

فرض بر این بود که اگر نوعی " اصطلاح نامه جستجو به سیستم افزوده شود، میزان کارایی افزایش زیادی خواهد یافت. با استفاده از مدارک و پرسشهایی که برای ارزیابی مدلارز (لنکستر، a ۱۹۶۸) تهیه شده بود، سالتون (۱۹۷۲) به نتایجی دست یافت که مشخص میکرد سیستم اسمارت " او بهتر از فعالیت های نمایه سازی و کنترل واژگان موجود در مدلارز عمل میکند. این مقایسه تا حدودی با مقایسه معمول جستجو در پایگاه های زبان طبیعی و واژگان کنترل شده تفاوت داشت. سیستم اسمارت براساس منطق جبر بول عمل نمیکرد بلکه براساس نوعی شبه متن طراحی شده بود، یعنی متن چکیده ها با درخواست ها - به زبان طبیعی - تطابق داده شده و سپس یک مجموعه از گزینه های کاوش - با سطوح مختلفی از پیچیدگی - به بهره گیر عرضه می شد. در بررسی های سالتون، سیستم اسمارت زمانی از مدلارز عملکرد بهتری ارائه میداد که بازخوردهای بهره گیر را به سیستم ارائه می دادند.

یعنی، بهره گیران نتایج حاصل از جستجوی اولیه را ارزیابی کرده و براساس بازخوردهای مرتبط خود، جستجو را دوباره تکرار میکردند. چنین امری این سؤال را مطرح میکند که اگر مدلارز نیز بازخوردهای مرتبطی را دریافت کند چقدر خوب عمل خواهد کرد. در فصل بعد درباره سیستم اسمارت بیشتر بحث خواهد شد.