بررسی روش های ساخت یافتهٔ نمایه سازی

تقسیمات فرعی

استفاده از روش های بسیار ساخت یافتهٔ نمایه سازی که با استفاده از اتصالات و نشانگرها یا با رمزهای معنایی نشان داده می شدند، در اوایل دهه ۱۹۶۰ رواج داشتند، یعنی زمانی که نظام های رایانه مبنا هنوز در مراحل اولیهٔ توسعه خود قرار داشتند. در آن زمان، برای پرهیز از بازیابی مدارک نامرتبط، دستیابی به نتایج بسیار دقیق ضروری بود. در آن زمان نیازی که به طور گسترده حس می شد ضرورت تمایز قایل شدن بین پرده کرکرهای و کرکره پرده ای بود! بی معنا بودن این مثال بر هیچ کس پوشیده نیست: آنچه محتمل است این که مقالات درباره هر دو موضوع یادشده در یک پایگاه اطلاعاتی ظاهر می شوند و مگر دربارهٔ پرده کرکرهای چند مقاله وجود دارد؟ امروزه فرد این حقیقت را تشخیص داده و می پذیرد که به دلیل اشتباه یا رابطهٔ کاذب " ممکن است بازیابی ناخواسته روی دهد. به هرحال، انتظار میرود که این خطاها در محدوده قابل پذیرشی دهند.

در ارزیابی مدلارز (لنکستر، ۱۹۶۸a)، در حدود ۱۸٪ ازتقریباً ۳۰۰۰ خطای مانعیتی که در ۳۰۲ کاوش روی داد، به دلیل ارتباطات مبهمی بود که دربین اصطلاحات وجود داشت. به نظر میرسد که خطاهایی از این دست بسیار پذیرفتنی تر از آن باشد که برای پرهیز از خطا، از روش های نمایه سازی بسیار پیچیده و پرهزینها ی استفاده کنیم. امروزه مشکل خطا یا پیوندهای مبهم بسیار کم اهمیت تر از سی یا چهل سال گذشته است چراکه اکنون در اغلب نظام های بازیابی، سطح بالایی از پیش همارایی وجود دارد.

در نظام هایی که به نمایه سازی تک واژه ای (تک اصطلاحی) وابسته اند یا در نظام هایی که بر مبنای زبان طبیعی کار می کنند  این مشکلات رواج بیشتری دارد. از انجا که اصطلاحنامه سطح بالایی از پیش همارایی را در خود دارد، احتمال خطا یا پیوندهای مبهم کاهش مییابد. مثلاً اصطلاحات رایانه ها و طراحی که به یک مدرک اختصاص داده شده مبهم اند: آیا رایانه ها طراحی شده اند یا از رایانه ها برای طراحی چیزهای دیگر استفاده شده است؟ از سوی دیگر، هرچه پیش همارایی بیشتر باشد، مثل رایانه ها

طراحی هواپیما  

ابهام کمتری به وجود میآید، و ترکیب زیر

طراحی هواپیما

طراحی به کمک رایانه

کاملاً روشن و خالی از ابهام است.