شناخت سیستم های دورگه در جستجوی متن آزاد

سیستم های دورگه

تقریباً همهٔ نویسندگانی که دربارهٔ جستجوی متن آزاد مطلب نوشته اند، ازجمله هنسلر" (۱۹۷۸) و برز" (۱۹۸۲) و نیز بیشتر نویسندگانی که قبلاً از آنها یاد شد به این نتیجه بی سابقه رسیده اند که یک سیستم بازیابی مناسب باید از اصطلاحات کنترل شده و متن آزاد، هر دو، تشکیل شده باشد. مزایای چنین سیستم های دورگه ای کاملاً روشن است و سالها پیش، نویسندگانی چون هالست (۱۹۶۶)، آلمن (۱۹۶۷) و لنکستر (۱۹۷۲) درباره آن بحث کرده و آنها را به نمایش گذاشته اند. با توجه به این حقیقت که در اغلب بررسیهای انجامشده، جستجوی متنی تعدادی از مدارک مرتبط را بازیابی کرده است که در جستجو با واژگان کنترل شده بازیابی نشده اند و بر عکس، اهمیت روشهای دورگه را بیشتر اثبات میکند. اصطلاح دورگه می تواند برای اشاره به هر نوع سیستم عاملی مورد استفاده قرار گیرد که از ترکیبی از اصطلاحات کنترل شده و زبان طبیعی تشکیل شده اند، ازجمله: سیستمهایی که در آنها هر دو نوع اصطلاحات کنترل شده و زبان طبیعی را نیروی انسانی اختصاص میدهند و نیز سیستمهایی که در آنها با ترکیبی از اصطلاحات کنترل شده ای که نیروی های انسانی اختصاص داده اند و نیز براساس تکرار یا وجود کلمات در عنوان ها، چکیده ها و کل متن می توان جستجو کرد.

مثلاً سیستمی را درنظر بگیرید که براساس سه جزء واژگانی مجزا شکل گرفته است:

۱. یک واژه نامه کوچک از برچسب های کلی موضوعی، شاید ۳۰۰ رمز؛

۲. فهرستی از برچسب هایی که مناطق جغرافیایی را ارائه می دهند؛

۳. کلیدواژه ها یا عباراتی که در معنوان یا متن مدارک وجود دارند. نمایه سازی با استفاده از چنین عناصر واژگانی، به دو دلیل باید صرفه اقتصادی بیشتری را به نسبت آن نوع از نمایه سازی هایی ارائه دهد که از واژگانی به دقت کنترل شده استفاده میکند:

۱. کدهای موضوعی به اندازهای عام هستند که یک نمایه ساز با سطح تحصیلی یا تجربه موضوعی نه چندان زیاد میتواند بدراحتی انها را به مدارک اختصاص دهد

۲. تعداد برچسب ها (موضوعی و جغرافیایی) آنقدر کم است که نمایه ساز میتواند اغلب آنها را به خاطر بسپارد و دائماً به فهرست واژگان مراجعه نکند.

گرچه هر یک از عناصر واژگانی در جای خود نسبتاً پیش پاافتاده و ناپخته هستند، اما استفاده مشترک از یک کلیدواژه (برای ایجاد جزه نگری) و یک موضوع یا رمز جغرافیایی (برای ایجاد بافت) ابزاری فوق العاده قدرتمند خواهد بود. مثلاً کلیدواژه گیاهان وقتی با یک رمز موضوعی مرتبط با کشاورزی ترکیب شود ممکن است معنایی کاملاً متفاوت از زمانی ارائه دهد که با یک رمز موضوعی مربوط به صنعت ترکیب می شود. همچنین، اگر کلیدواژه هجوم با یک رمز جغرافیایی استفاده شود، ممکن است بیانگر یک عملیات نظامی برائی کشوری مانند لبنان باشد؛ از سوی دیگر، اگر همین اصطلاح با رمزی جغرافیایی برای کشور انگلستان هم آرایی شود، احتمالاً نشانگر یک مناقشهٔ کاری خواهد بود. بعلاوه، استفاده مشترک از رمزهای کلی موضوعی، رمزهای جغرافیایی و کلیدواژه ها به شدت در بیان نوع رابطه مؤثر است، حتی وقتی که این رابطه ها صریحاً مشخص نشده باشند

. میتوان بسیاری از پایگاه هایی که اکنون از طریق شبکه های درون خطی در دسترس قرار دارند را براساس ترکیبی از اصطلاحات کنترل شده و کلیدواژه ها یا عباراتی موجود در عناوین یا چکیده ها مورد جستجو قرار داد. استفاده از کلیدواژه ها یا عبارات موجود در عناوین یا چکیده ها جزء نگری بیشتری فرآهم می آورند.