بررسی تاریخچه ی بازیابی اطلاعات با استفاده از رایانه

 وقتی در اواخر دهه ۱۹۵۰ و اوایل دهه ۱۹۶۰، برای اولین بار و در سطحی وسیع از رایانه ها برای بازیابی اطلاعات استفاده شد، جستجوی متن و حتی جستجوی تمام متن به واقعه ای جذاب بدل شد. در پی گیری تاریخچه نظام های رایانه مبنا برای بازایابی اطلاعات، میتوان دو خط مشی و جریان اصلی را در توسعه آنها شاهد بود. یک جریان از سیستم های عظیمی نشات میگیرد که شرکت هایی چون کتابخانه ملی پزشکی، وزارت دفاع" و سازمان فضایی امریکا (ناسا) بانیان بوده اند. این سیستم ها براساسی اصطلاحاتی نمایه ای عمل میکردند که از واژگان کنترل شده استخراج شده بود و نمایه سازان انسانی آنها را به مدارک اختصاص میدادند.

جریان یا سویه دیگر توسعه، در حوزه موضوعی حقوق آغاز شد و مستلزم آن بود تا متن کامل مدارک (مثلاً قوانین) به قالب الکترونیکی تبدیل شده و از رایانه برای جستجوی کلمات یا ترکیباتی از کلمات در متن استفاده شود، کارهایی از این دست، واقعاً از توسعهٔ اصطلاح نامه ها و ظهور سیستم های عظیم وابسته به نمایه سازی انسانی قدیمی تر بودند. بازیابی تمام متن متون حقوقی را میتوان در مقاله هورتی" و همکارانش در مرکز قوانین بهداشتی" در دانشگاه پیتسبورگ سراغ گرفت (هورتی، ۱۹۶۰، ۱۹۶۲؛ کهل و دیگران، ۱۹۶۱). در حوزه موضوعی حقوق بود که برای اولین بار فنون نوینی برای جستجوی تمام متن ابداع شد و اولین کاری که در پیتسبورگ انجام شد زیربنای لازم را برای توسعه نظام های عظیم بازیابی حقوقی فرآهم آورد. لگزیس و وستلا پایگاه های اطلاعات حقوقی ] نمونه هایی از این نظام ها هستند. میرز(۱۹۷۳) دربارهٔ حد اعلای پیشرفت در هرچند قدیمی است اما همچنان به عنوان منبعی بنیانی مورد توجه قرار دارد. کتاب دابنی" (۱۹۸۶) به عنوان ویرایش جدید این اثر عمل میکند.

ایجاد تمایز بین آن دسته از نظام هایی که اصولاً به واژگان کنترل شده و رکوردهایی نمایه ای وابسته بودند که از طریق نیروی های انسانی تهیه می شدند (که اغلب به غلط نظام های " کتاب شناختی" نامیده می شوند) و آن دسته از نظام هایی که بر مبنای جستجوی متن عمل میکردند، با گذشت سالها بیش از پیش مبهم و دشوار گشته است. نظام های کتاب شناختی به تدریج این امکان را فراهم آوردند تا کلماتی که در عناوین، و بعدها، در چکیده ها وجود داشتند بازیابی شوند. برای گسترش دستیابی، به بعضی از نظام های تمام متن اصطلاحاتی نمایه ای افزوده شد که نیروی های انسانی به مدارک اختصاص داده بودند، و بعضی از پایگاه ها (مثل پایگاه INSPEC) از همان ابتدا برای در برداشتن هم واژگان کنترل شده و هم "کلیدواژه های کنترل نشده طراحی شدند.

هرچه متون بیشتر و بیشتری در قالب الکترونیکی، و به عنوان پیامد جانبي فعالیت های انتشاراتی و اشاعه ای، عرضه شدند جستجوی متنی در چکیده ها رواج بیشتری یافت و اکنون جستجوی متنی در حوزه حقوقی نیز به خوبی توسعه بافته است: اکنون روزنامه ها، مجلات عامهپسند، مجلات علمی، دایرةالمعارف ها، و سایر منابع در قالب تمام متن در دسترس قرار دارند. سایت های وبی اینترنت اغلب از متن تشکیل شده اند، طوری که اگر بگوییم امروزه جستجوی متنی بیشتر از جستجوهایی است که از طریق واژگان کنترل شده انجام می شود، بدون شک صحیح خواهد بود.