بررسی جامعیت پایگاه های مقالات تمام متن پزشکی نسبت به پایگاه مدلاین

سی ورت و دیگران (۱۹۹۲) دریافتند که جستجو در پایگاهی که در بر دارندهٔ مقالات  تمام متن پزشکی است، به نسبت جستجو در پایگاه مدلاین، جامعیت بهتری ارائه می دهد، گرچه جستجوهای تمام متن مانعیت کمتری ارائه دادند. به هرحال، در یک مقاله قبلی، آنها با تحلیل نتایج مدارکی مرتبطی که در مدلاین بازیابی شده بودند، به مشکلات مربوط به جستجوی تمام متن اشاره کردند. (سی ورت و مک کینینا، ۱۹۸۹)،

محققین بسیاری، ازجمله مککین و دیگران (۱۹۸۷)، افزایش جامعیت با استفاده از اصطلاحات متنی بعلاوهٔ اصطلاحات کنترل شده را نشان دادهاند. مککین نتایج حاصل از جستجوی یازده موضوع در حوزه موضوعی علوم رفتاری را در پنج پایگاه اطلاعاتی با یکدیگر مقایسه کرده است. تحقیقات مختلفی دیگری نیز وجود دارند که نتایج جستجوهای خود بر روی پایگاه های تمام یا نیمه متنی را ارائه داده اند، اما انها این نتایج را با نتایج حاصل از جستجوی اصطلاحات کنترل شده مقایسه نکرده اند. بعضی از این مطالعات مستلزم استفاده از سیستم هایی بوده است که (به نوعی شبیه به اسمارت) از احتمالات و / یا روش های زبانی - براساس شباهت آنها به گزاره های درخواست یا راهبردهای جستجو - برای رتبهبندی مدارک یا پاراگراف هایی از آنها استفاده می کردند. مثلاً برنس تاین" و ویلیامسون" (۱۹۸۴) چنین فرآیندهایی را در متون مربوط به بیماری هپاتیت ارزیابی کرده اند، و تانگ" و دیگران (۱۹۸۵) نیز فنون مربوط به هوش مصنوعی که بر روی بازیابی متون تمام متن در یک پایگاه خبری اعمال شده بود را بررسی کردهاند.

فیدل (۱۹۹۲) پیش بینی کرده است که چه عواملی از جستجوی کنترل واژگانی و کدام ها از جستجوی متنی پشتیبانی میکنند. در یک بررسی که در آن ۴۷ کاوشگر آموزش دیده ۲۸۱ جستجوی واقعی را انجام داده بودند، فیدل عوامل مختلفی را شناسایی کرد که بر انتخاب کاوشگران در استفاده از اصطلاحات کنترل شده در برابر کلمات متنی تاثیرگذار بودهاند. او دریافت که در بعضی از حوزه های موضوعی بیشتر می توان بر جستجوی متنی تکیه کرد (هرچند این مسئله کمتر به ویژگی های موضوع یا زبان آن مرتبط است و بیشتر به کیفیت  واژگان های مورد استفاده در پایگاه های اطلاعاتی، به ویژه به جزء نگری آنها، و به کیفیت نمایه سازی از طریق واژگان کنترل شده ربط مییابد).

بررسی دقیق متونی که در این بررسی وجود داشت باعث نشد که نظر خود دربارهٔ مزایا و معایب روش ها، که در شکل ۱۰۴ ارائه شده است، را تغییر دهم. حقیقت آن است که هر یک از دو روش جستجو مزایا و معایب خاص خود را دارند. رکوردهاي متن آزاد طولانیتر هستند، در نتیجه نقاط بازیابی بیشتری را فرآهم میآورند و اغلب اصطلاحاتی را دربر دارند که بسیار خاص تر و روزآمدتر از اصطلاحاتی هستند که در هر واژگان کنترل شده ای وجود دارد و معمولاً افزونگی بیشتری نیز ارائه می دهند. ازسوی دیگر، واژگان کنترل شده در ارائهٔ محتوای موضوعی مدارک انسجام بیشتری را ایجاد کرده و از طریق ساختار سلسله مراتبی و ارجاع متقابل، اصطلاحات مفهومی عامی فرآهم میآورند که اغلب در متن وجود ندارند، و به بهره گیر کمک میکنند تا بتواند اصطلاحات مناسبی را برای جستجو شناسایی کند.