انواع روش های مختلف جست و جوی متنی

جستجوی متنی را به دو روش می توان انجام داد .در روش اول، کلمات مهم در فایل های ”مغلوب“ وارد شده و نشان میدهند که برای هر کلمه چه مدارکی (و اغلب جایگاه دقیق کلمه در آن مدرک) وجود دارند. جستجو نیز در این نمایه ها (که اولین بار در پیتسبورگ مورد استفاده قرار گرفت و آن را "کشف الغات " نامیدند)، و نه در خود متن، انجام میگرفت.

روش جست و جوی متنی جایگزین دیگر، جستجوی متوالی، کلمه به کلمه، در متن بدون استفاده از نمایه ها است. این نوع جستجو روشی بود که پیش از همه گیری نظام های درون خطی، عموماً برای تهیهٔ خدمات اشاعهٔ اطلاعات گزیده (اس دی آی) پایگاه های اطلاعاتی مورد استفاده قرار می گرفت. یعنی، همزمان با روزآمد سازی دورهای پایگاه، پرونده های ذخیره شدهٔ علایق مطالعاتی بهره گیران را با اطلاعات پایگاه (در کلمات عنوان یا چکیده) تطبیق می دادند. این روش سطح بندی " در جستجوی متن، برای کاربران خدمات اس دی آی بسیار جذابتر از جستجویگذشته نگر بود زیرا در اسدی آی، مقدار اطلاعاتی که در هر دوره زمانی باید مرورمیشد بسیار کم بود.

هرحال ، بعدها رایانه هایی با کاربری خاص برای جستجوی متن توسعه یافتند که سرعت آنها به قدری زیاد بود که امکان جستجوی سطح بندی شده را حتی در پایگاه هایی بسیار عظیم نیز کاملاً فرآهم میآوردند. مثلاً رایانهٔ فست دیتا فایندر" ادعا میکرد که می تواند با سرعتی برابر با ۱۲/۵ میلیون نویسه" در هر ثانیه جستجو کند که این رقم برابر با ۱۲/۵ کتاب رمان ۵۰۰ صفحه ای در هر ثانیه است. ویس چندیک(۱۹۹۳) روش های جستجوی متنی سخت افزارهای دیگر را بررسی کرده است. گرچه روش سطح بندی از نظر مفهومی با روش نمایهٔ مغلوب تفاوتی ندارد اما روش سطح بندی تواناییها را افزایش داد. مثلاً جستجو بر روی بخش های کلمه، به ویژه زنجیره هایی از نویسه ها که در وسط یا انتهای یک کلمه می آیند، بسیار ساده تر شد. موتورهای کاوش که در اینترنت گسترش یافته اند، از طریق گردآوری نمایه های متنی" از سایت های مختلفی که چیزی بیش از فایل های مغلوب دربر ندارند، کار میکنند.