تحقیق درباره ی نمایه سازی ماشینی

تحقیق دربارهٔ نمایه سازی ماشینی به صورت درون خطی برای کتابها، مقالات و سایر انتشارات به سی سال قبل بازمیگردد (برای مثال به پنتا، ۱۹۶۹ و پنت و دیگران، ۱۹۷۲ نگاه کنید). راهنمای درون خطی می تواند به چند صورت ارائه شود؛ پیشنهاد اصطلاحات به نمایه سازان (مثلاً براساس عنوان، چکیده یا سایر بخش های متن ازطریق رایانه یا بر مبنای اصطلاحاتی که قبلاً نمایه ساز وارد کرده است)، نشان دادن خطاهای نمایه ساز (مثلاً استفاده از اصطلاحاتی که در واژگان سیستم وجود ندارند یا ترکیبات غلط اصطلاح)، جایگزینی اصطلاحات پذیرفته نشده با اصطلاحات پذیرفته شده، و برقراری ارتباط با پایگاه برای ایجاد امکان بازيابي روشي استفاده از اصطلاحی معین یا روش نمایه سازی اصطلاحاتی مشخص در محیط های اجرایی کنونی، سیستم های نمایه سازی درون خطی راهنماهایی را با پیچیدگی متفاوت و در سطوح مختلف ارائه میدهند. مثلاً سیستمی که اکنون در کتابخانه ملی پزشکی مورد استفاده قرار میگیرد - یعنی سیستم مدیریت و نمایه سازی خودکار (آیمز) - قابلیت های زیر را در بر دارد: در صورت درخواست، برای هر سرعنوانی که نمایه ساز وارد می کند، سیستم نشان میدهد که چه تقسیمات فرعی را می توان با آن مورد استفاده قرار داد؛یادداشت دامنه و توضیحات مربوط به اصطلاح را نمایش میدهد؛ از یک اصطلاح غیرمُرجح " یا اختصاری به اصطلاحی مرجح " ارجاع می دهد؛ بخشی از واژگان کنترل شده را در قالب سلسله مراتبی یا به صورت الفبایی نشان میدهد؛ و مجموعه کوچکی از اصطلاحات عام و قابل استفاده را نمایش میدهد که نمایه ساز می تواند آنها را انتخاب کند. برای بحث درباره

سیستم آیمز به فصل ۳ مراجعه کنید. نمایه سازی جزئی یک مدرک یا، حداقل، پیشنهاد اصطلاحات به نمایه ساز از جمله ویژگی سیستم های نمایه سازی ماشینی پیشرفته تر است. یکی از این سیستم ها سیستم کین" است که برای استفاده با پایگاه آگرپ توسعه یافته است. آگریپ پایگاهی متعلق به جامعه اروپا است که طرح های جاری در حوزه کشاورزی را دربر دارد. عنوان، چکیده، و اصطلاحات کنترل نشده که بیانگر حوزه موضوعی پروژهها هستند، ازجملهٔ توصیفات این پروژهها هستند. سیستم کین این متن را با دو واژگان کنترل شده (اصطلاح نامه های اگرووک" و کب ") انطباق داده و براساس این منابع اصطلاحات مناسب را پیشنهاد می دهد (فریس، ۱۹۹۲). بعضی دیگر از سیستم هاي عامل نیز از قابلیت های مشابهی برخوردارند. سیستم های عاملی که بر روی متن های کوتاه و / یا واژگان کنترل شده نسبتاً محدود عمل میکنند، ممکن است بتوانند بسیاری از نمایه سازی ها را به درستی انجام دهند قبل از آنکه نمایه ساز انسانی آن را بررسی کرده و حذف و اضافات ضروری را انجام دهد.

در مرکز اطلاعات فضایی ناسا یک سیستم نمایه سازی کاملاً ماشینی وجود دارد که سيلوستر و دیگران ) ۱۹۹۴) آن را توصیف کرده اند. برای بازنمایی اصطلاحات اصطلاحنامه ناسا، از مجموعه ای از عبارات در حوزه علوم فضایی ( ۱۱۵,۰۰۰ مدخل از سال ۱۹۹۳) استفاده شده است. یعنی، رخداو این عبارات در متن ورودی (معمولاً عنوان ها و چکیده ها) باعث می شود تا سیستم فهرستی از توصیفگرهای پیشنهادی را برای بررسی نمایهساز ارائه دهد. عمل مشابهی در سیستم کین باعث میشود تا اصطلاحاتی که سایر مؤسسات و بااستفاده از سایر واژگان ها به مدارک اختصاص دادهاند بر اصطلاحات اصطلاحنامهٔ ناسا بازنمایی شده و بر آنها منطبق شوند (سیلوستر، ۱۹۹۳).