برتون (۱۹۹۱) بعدها از انجام تحقیقی دربارهٔ نظام نمایهسازی خبر داد که در نظریات او وجود داشت. هدف از این نظام، کمک به اختراعات عنوان شده بود. این نظام ازمایشی ازنمایه سازی هزاران کالای صنعتی براساسی وظایف و صفات شاخص " هر یک از آنها بوجود آمده بود. بک تر"، "ارزان تر، مطمئن تر و مقاوم تر ازجمله این صفات بودند.
در سالهای اخیر متداول شده است که مشکل بازیابی اطلاعات را معضل اولیهای تعریف میکنند که در انطباق بین وضعیت نابهنجار دانش را درخواست کننده با وضعیت بسیار منسجم. دانش نویسندگان وجود دارد (برای مثال به بلکین" و دیگران (۱۹۸۲) نگاه کنید). معنی ضمنی این گفته آن است که مشکلات بیشتر به علت خروجی نظام است نه ورودیه آن. این گفته تاحدودی گمراه کننده است. اگر کسی بپذیرد که گرایش به سوی نیازهای گروه ویژه ای از بهره گیران، نمایهسازی را کاراتر خواهد کرد، آنگاه باید پذیرفت که وظیفه نمایه ساز پیش بینی انواع درخواستهای خواهد بود که با مدرکی خاص می توان به آنها پاسخ مناسبی داد. این وظیفه دشوارتر از پیش بینی انواع مدارکی خواهد بود که احتمالاً میتوان با آنها یک درخواست ویژه را پاسخ داد. برخی بر این عقیده اند که پیشبینی انواع مدارک برای پاسخگویی به پرسشی خاص، وظیفه اصلی کاوشگران است. دراین صورت، ممکن است کسی استدلال کند که وضعیت نابهنجار دانش بیشتر بر ورودی نظام بازیابی اثر میگذارد تا بر خروجی آن. اولاف سنو و کاک" (۱۹۸۳) به وضوح به این مسئله اشاره کرده اند:
نمایه ساز باید حدس بزند که در آینده بهره گیر چه سؤالاتی را از سیستم درخواست خواهد کرد. صرف نظر از اینکه این وظیفهٔ حدسی چقدر روشن و واضح خواهد بود، باید پذیرفت که آنها صرفاً حدس و گمانی بیش نیستند، درحالی که بهرهگیر با پرسش واقعی و مشخص خود به سیستم مراجعه میکند و ممکن است روش ارتباط و تداعی او با روش نمایه ساز متفاوت باشد. ( ص. ۲۴۹)
آنها، همچنین، در مواجهه با پرسشهای بهره گیر، آنها را بیش از حد ساده و مشخص تصور می کنند، درحالی که واقعیت جز این است. باوجود این، در این نکته که مشکلات کارآمدی ورودی به یک سیستم بازیابی بیش از مشکلات خروجی از آن سیستم است حق با آنها خواهد بود. همانطور که فایر ثورن " (۱۹۸۵) سالها پیش اشاره کرده است: نمایه سازی، مسئله اصلی و نیز پرهزینه ترین گلوگاو بازیابی اطلاعات است .
شاید در برخی از برنامه های کاربردی نمایهسازی، بتوان بر آنچه که قابل نمایه درنظر
گرفته می شود بیشتر دقیق شد. مثلاً به هنگام بحث دربارهٔ نمایه سازی یک دایرةالمعارف، پرشل (۱۹۸۱) دستورالعمل های زیر را پیشنهاد می دهد:
همهٔ متن اطلاعاتی یک گونهٔ واقعی" باید نمایه شود. دراینجا، "واقعی اطلاعاتی تعریف شده است که ۵ تا ۸ خط از متن را تشکیل دهد، یا "منحصربه فرد یا "برجسته بوده و مطمئناً در هیچ جای دیگری از دایرةالمعارف تکرار نشده است. (ص. ۲)
در هیچ جای دیگری نمی توان تعریفی اینچنین دقیق را یافت. درحقیقت، وقتی کسی بخواهد آثار تخیلی مثل قصه، فیلمهای آینده گرایانه یا تصاویر را نمایه کند، پرسش از اینکه مدرک دربارهٔ چیست بسیار دشوار خواهد شد. معنی درباره مورد استفاده در این متنها را درفصل های بعدی مورد بحث قرار خواهیم داد.
البته، در محیط های ابرمتن ابررسانه ای موجود، پرسش از همه انواع درباره بسیار
پیچیده شده است. وقتی یک موضوع یا مدرک می تواند به چندین موضوع یا مدرک دیگر ربط یابد، دیگر نمی توان نقطه شروع یک مدرک و پایان دیگری را کاملاً مشخص کرد. آیا یک مدرک صرفا درباره موضوعی است که مستقیما با ان سروکار دارد یا با موضوعاتی که به ان ربط یافته اند نیز سروکار دارد؟ هرچند در متون مربوط به ابرمتن ابررسانه، درباره نمایه سازی متون ابرمتن تاحدی بحث شده است اما تاکنون مطالب اندکی دراین باره منتشر شده است. ساووی (۱۹۹۵) و سالتون و دیگران (۱۹۹۷) درباره روش های ممکن برای ایجاد خودکار اتصالات ابرمتنی بحث کرده اند که می توان آن را نوعی نمایه سازی خودکار در نظر گرفت. در فصل های بعد دربارهٔ این موضوع بحث خواهد شد.