واژه نامه پس کنترل شده

نویسندگان متعددی اشاره کردهاند که از طریق ساختار بندی و استفاده از انواع ابزارهای کمکی می توان روشیں جستجو به زبان طبیعی را به طور قابل ملاحضه ای بهبود بخشید. پیتر نیک” (۱۹۸۴) بعضی از ابزارهایی از این نوع را شرح داده است، همانطور که لنکستر (۱۹۷۲)، لنکستر و دیگران (۱۹۷۲) و لنکستر (۱۹۸۶) با جزئیاتی بیشتر شرح دادهاند، استفاده از یک ” اصطلاح نامه جستجو یا واژه نامه پس کنترل شده بدیهی ترین ابزار کمکی است.

اولین سیستمی که برای جستجوی حجم زیادی از متن های حقوقی (در پیتسبورگ) ایجاد شد، از نوعی اصطلاح نامه برای کمک به فرآیند جستجو استفاده می کرد. این اصطلاح نامه از مجموعه ای از کلمات متشابه تشکیل شده بود که بیشتر به اصطلاح نامه را گیت شباهت داشت نه به ساختاری اصطلاح نامه ای که عموماً در بازیابی اطلاعات مورد استفاده قرار میگیرد. چنین اصطلاح نامه ای، حتی بدون هیچ ساختار معناداری ، میتواند ابزار کمکی بسیار باارزشی به شمار اید؛ کلماتی با معانی متشابه، بالقوه، برای جستجو مناسب هستند و چنین ابزاری کاوشگران را از تفکر دربارهٔ همهٔ کلماتی که باید یک ایده واحد را بیان کنند رهایی میبخشد. سرمایه گذاری برای ایجاد چنین ابزاری کمکی باعث صرفه اقتصادی مشهود در سیستمی میشود که در آن جستجوهای بسیار زیادی انجام میگیرد. این اصطلاحنامهٔ ساده، نوعی از واژگان کنترل شده است که در آن کنترل، به جای ورودی، در خروجی اعمال می شود. این اصطلاح نامه در واقع یک واژه نامهٔ پس کنترل شده است.

با یک مثال می توان ویژگی های واژه نامه پس کنترلی را بهتر به نمایش گذاشت. یک پایگاه اطلاعات عمومی را در نظر بگیرید که با استفاده از یک اصطلاح نامه نمایه شده است. در اصطلاح نامه اصطلاح خطوط هوایی وجود دارد، بنابراین می توان برای انجام یک جستجوی عام درباره این موضوع از آن استفاده کرد. به هرحال، نمی توان یک جستجو را به شرکت هواپیمایی خاصی محدود کرد، زیرا نامه ای خاص در اصطلاح نامه ارائه نشده اند. بنابراین، محدودکردن یک جستجو به وضعیت مالی شرکت هواپیمایی واریج” ناممکن است؛ دراینجا، بهترین شیوه جستجو آن است که هر آنچه درباره وضعیت مالی شرکت های هواپیمایی وجود دارند را بازیابی کنیم. انجام جستجوهای کلی در واژگان پیش کنترل شده ” به نظر ساده می آید اما انجام جستجوهای خاص عملاً ناممکن است.