سالتون و مکگیل (۱۹۸۳) نمونه هایی از مدخل های اصطلاح نامه ای را ارئه کرده اند که به طور خودکار از مجموعه ای از مدارکی مربوط به مهندسی استخراج شده اند (شکل ۱۰۰۷). با چنین اصطلاح نامه ای، درخواست اطلاعاتی دربارهٔ ویژگی های سرمازاییل ماده xممکن است به "اصطلاح x در رابطه با مفهوم ۴۱۵ بسط یابد. در نتیجه، باید مدارکی دربارهٔ ابررسانایی (یعنی، ریشهٔ "ابرسانا را در بر داشته باشند) مادهٔ x بازیابی شوند.
این بحث تاکنون فقط روش هایی را مورد توجه قرار داده است که از طریق آنها و برپایهٔ مدارکی که اصطلاحات در آنها رخ داده اند، ممکن است. طبقات اصطلاحات شکل گیرند. داده هایی که اجازه شکل گیری چنین طبقه بندی را می دهند از ماتریسی حاصل امده اند که نشان میدهد کدام اصطلاحات در کدام مدارک رخ داده اند (ماتریس اصطلاح / مدرک). بدیهی است که در خلال استفاده از این دادهها ممکن است عملیات معکوسی نیز رخ دهد. یعنی، ممکن است طبقه های مدارک براساس اصطلاحاتی که این مدارک دربر دارند شکل گیرند. سالتون (۱۹۷۵) و سالتون و مکگیل (۱۹۸۳) انواع مختلفی از چنین طبقاتی را شناساییکرده اند:
۱. دسته. که در آن همهٔ اصطلاحات الف تا ث به شدت به یکدیگر وابسته اند.
۲. ستاره. که در ان یک طبقهٔ (الف ب پ ت ث) با توجه به این حقیقت شکل گرفته است که ب، پ، ت و ث همگی به نحوی با الف پیوند نزدیکی دارند.
3- زنجیره، که در آن با با الف، ب با با و ت با پا شدیداً متصل هستند و ث که به هیچ یک از موارد دیگر، به جز ات، متصل نیست.
۴. کپه، که میتواند براساس هر یک از چند معیار شکل گیرد. به هرحال، هر عضو فقط با دیگر اعضای گروه که در بالای آستان های مشخص قرار دارند رابطه دارد.استخراج شده است
همانطور که توضیح داده شد، ستاره، زنجیره و گپه همگی نمونه هایی از گروه های تکپیوندی هستند.
نمایه سازی معنایی پنهان روشی است که به دسته بندی مدارک مرتبط بسیار شباهت دارد. این روش بر یک نظام طبقه بندی استوار است که با تحلیل عامل رابطه نزدیکی دارد (مثلاً به دیو مایس، ۱۹۹۵ نگاه کنید).