در سیستم سایت، اصطلاحات مرتبط با کلمات درخواست فقط پس از پردازش درخواستها در برابر پایگاه شناسایی می شدند. مجموعهٔ کلمات (اصطلاحات) وابسته به مدارک بازیابی شده، مواد خامی هستند که این سیستم با آنها کار میکند. درنتیجه، در مدارکی که از طریق اصطلاحات “الف” ، “ب” و “ج” بازیابی شده اند، ممکن است اصطلاحات “ن” و “ی” نیز رخ داده باشند که استفاده از آنها ممکن است برای بسط جستجو مناسب باشد. به هرحال، اصطلاحات “ن” و “ی” با اهمیت تلقی نخواهند شد مگر آنکه در مجموعهٔ بازیابی شده بیش از حد انتظار دهند. بنابراین، باید بسامدی رخداد یک اصطلاح در کل پایگاه را نیز مورد توجه قرارداد. مثلاً، با انجام یک جستجوی نمونه دربارهٔ موضوع ارزیابی مجموعه در یک پایگاه در حوزه علوم کتابداری، ممکن است.

۸۵ چکیده حاصل آید (این موضوع ممکن است به صورت “ارزیابی و مجموعه تفسیر شده باشد). در ۵۹ مدرک از ۸۵ مدرکی بازیابی شده، اصطلاح “کتابخانه نیز وجود دارد اما با اهمیت تلقی نخواهد شد زیرا میزان رخداد این اصطلاح در مجموعهٔ بازیابی شده     بیش از میزان رخداد آن در کل پایگاه نیست. از سوی دیگر اصطلاح تحویل مدرک را باید بسیار با اصطلاحات “ارزیابی و مجموعه مرتبط قلمداد کرد: هرچند این اصطلاح فقط در ۸ چکیده از ۸۵ چکیده رخ داده است اما میزان رخداو آن در مجموعهٔ بازیابی شده     بیش از میزان رخداد آن در کل پایگاه است. یکی از مزایای روش دوس کوک آن است که به پیش محاسبهٔ رابطه اصطلاح – موضوعی دلهره آور در پایگاه های بسیار بزرگ – نیاز ندارد.

توانایی استخراج روابط سودمندی بعدی اصطلاح (یعنی پس از آنکه درخواست در برابر پایگاه پردازش شد)، که به فرآیندی انطباق بسیار کمتری نیاز دارد، باعث می شود تا بتوان فرآیندهای خودکار کاوش در سیستم های اطلاعاتی بسیار بزرگ را بهبود بخشید. همانطور که بعداً توضیح داده خواهد شد، اکنون سیستم هایی وجود دارند که بر مبنای جستجو به زبان طبیعی و رتبه دهی به مدارک بازیابی شده عمل می کنند.

یک واسط غیرمعمول زبان طبیعی، که کلمن سین (۱۹۸۸) آن را شرح داده است، به مشترک خود اجازه می دهد تا در بخش آگهی هاي راهنمای درون خطی تلفن فرانسه و با گزاره هایی چون من می خواهم یک دوربین قدیمی را تعمیر کنم”، “من می خواهم یک راننده خصوصی پیدا کنم”، برف پاک کن من شکسته است یا قوزک پایم پیچ خورده است درخواست خود را ارائه دهد. برنامهٔ میانجی، در پاسخ به چنین گزاره هایی، بر روی حرفه ها یا شرکت های مرتبط موجود در فهرست جستجو کرده و موارد مرتبط را ارائه می دهد.

در سیستمی به نام گریت فول بدا از روشی نسبتاً متفاوت استفاده شده است (اسنو” ودیگران، ۱۹۸۶؛ بونهام” و نلسون”، ۱۹۸۸)، یک نمایش درون خطی ساختار بندی شده به بهره گیر کمک میکند تا راهبرد کاوش خود را فرمولبندی نماید. این سیستم همچنین به بهره گیر، اصطلاحات کاوشی دیگری (که از مدارکی مرتبط و بازیابی شده قبلی استخراج شده اند) را پیشنهاد میکند. در صورتی که راهبرد کاوشی تدوین شده هیچ مدرکی را بازیابی نکند، یک صفحهٔ راهنما ظاهر شده و پیشنهادهایی را برای تغییر اصطلاحات راهبرد کاوش ارائه میدهد.