به جای نگاه صرف به اصطلاحات اختصاص یافته، می توان کار نمایه سازان را به روشی دقیق تر بررسی کرد؛ روشی که فراتر از انتظار از یک عملیات بررسی معمولی است. بدیهی ترین روش شبیه سازی از یک ارزیابی واقعی است. این شبیه سازی به روش زیر حاصل می آید:
اگر تعداد مدارک نمونه به اندازه کافی انتخاب شده و از بهترین راهبرد کاوش نیز استفاده شده باشد، این روش به عنوان روشی برای ارزیابی کارای یک گروه از نمایه سازان، به خوبی عمل خواهد کرد. این بررسی را میتوان در طول چند هفته انجام داد. البته، اگر مجموعه های مشابهی از مدارک در چند زمان متفاوت و هر بار توسط نمایه سازان متفاوتی نمایه شوند، طوری که بتوان براساس معیاری واحد کارایی نمایه سازان را با یکدیگر مقایسه کرد، بسیار مناسب تر خواهد بود، اما به دلیل تخصص موضوعی موجود در گروه، انجام این کار همیشه میسر نیست.
در مراکز اطلاع رسانی بزرگ که تعداد زیادی نمایه ساز به صورت غیرمتمرکز مشغول به کارهستند، اعمال نوعی کنترل کیفیت ضروری است. اگر حجم مدارک نمایه شده بسیار زیاد است، به دلایل اقتصادی نمی توان همهٔ رکوردها را پیش از ورود به پایگاه بررسی کرد. بنابراین، اعمال نوعی نمونه گیری ضروری است. می توان نمونه ای کاملاً اتفاقی از رکوردها انتخاب کرد؛ اما اگر میزان خطاهای نمایه سازی پایین است، کارای این نمونه چندان اهمیتی ندارد. آنچه که مورد نیاز است فرآیندی خودکار جهت اعلامت گذاری رکوردها برای ارزیابی متخصصین است. این ارزیابی باید بر این حقیقت استوار باشد که این رکوردها مشکوک به نظر می آیند.
تاد شینی روش هوشمندانه ای را برای شناسایی چنین رکوردهای مشکوکی ابداع کرده است (تادشینی و فرل ، ۱۹۸۹؛ تاد شینی و تولستنکوف. ۱۹۹۰)، تقریباً یک دهه است که درآژانس بین المللی انرژی اتمی، وین، از این فرآیند برای کنترل کیفیت اطلاعات ورودی به پایگاه اینیس" استفاده میشود (تادشینی، ۱۹۹۷). این روش بر این حقیقت استوار است که هر مدرک اضافه شده به پایگاه، با استفاده از توصیفگرهای اصطلاحنامه اینیس (به طور متوسط هفده اصطلاح برای هر مدرک) نمایه میشود و در یکی از ۲۳۷ رده کلی (موضوعی) این اصطلاحنامه قرار میگیرد. دراصل، سیستم می تواند رکوردهایی را شناسایی کند که توصیفگرهای آنها با توصیفگرهای وابسته به ردههای از پیش تعیین شده نامانوس هستند. اگر توصیفگرهای اختصاص یافته به یک مدرک خاص، که به رده X وابسته است، با پروندهٔ توصیفگرهای رده X نامانوس باشد، این رکورد گزینه مناسبی برای ارزیابی کیفیت خواهد بود چرا که ممکن است در رده یا نمایه سازی آن خطایی وجود داشته باشد.