عوامل تاثیر گذار بر کارایی نظام بازیابی اطلاعات

جامع نگری نمایه سازی

عواملی که بر کارآیی نظام بازیابی اطلاعات اثر میگذارند و مستقیماً از نمایه سازی ناشی می شوند را میتوان به صورت زیر دسته بندی کرد:

۱. سیاست نمایه سازی

۲. صحت نمایه سازی

تحلیل مفهومی

ترجمه

سیاست گذاری برعهدهٔ مدیران مراکز اطلاع رسانی است؛ بنابراین، از کنترل نمایه ساز خارج. است؛ بنابراین، صحت نمایه سازی است که زیر نظر نمایه ساز قرار دارد. سیاستگذاری عمده در رابطه با جامع نگری نمایه سازی است که تقریباً به تعداد متوسط اصطلاحات اختصاص یافته مرتبط است. تاثیر جامع نگری، پیش از این، در شکل ۳ نشان داده شد. نمایه سازی جامع بر استفاده از اصطلاحات کافی برای پوشش نسبتاً کامل محتوای موضوعی یک مدرک دلالت دارد. از سوی دیگر، نمایه سازی گزیده مستلزم استفاده از تعداد کمتری از اصطلاحات برای پوشش صرفی محتوای اصلی یک مدرک است. هرچه از اصطلاحات بیشتری برای نمایه سازی یک مدرک استفاده شود، مدرک بیشتر قابل دسترس بوده و احتمال بازیابی آن بیشتر خواهد شد. یک مرکز اطلاع رسانی ممکن است، به دلیل اینکه بهره گیران آن بارها تقاضای انجام جستجوهای جامعی را داشته اند، بخواهد نمایه سازی جامع انجام شود. درخواست کننده ای که میخواهد، هرطور که شده، همه مدارک مرتبط با سازمان آزادی بخش فلسطین را بازیابی کند، انتظار دارد که مدرک نمایش داده شده در شکل ۳ را نیز بازیابی کند، اما این امر در صورتی محقق خواهد شد که نمایه سازی بسیار جامع باشد.

در تصمیم گیری در زمینهٔ جامع نگری، نباید به تعیین مطلق حداکثر مجاز تعداد اصطلاحات اختصاص یافته بسنده کرد. در سیاستگذاری، باید محدوده ای از اصطلاحات پیشنهاد شود؛ مثلاً: بیشتر مدارک باید با ۸ تا ۱۵ اصطلاح نمایه شوند. در یک مرکز اطلاع رسانی بزرگ که با انواع مختلفی از منابع سروکار دارد، ممکن است براساس نوع مدرک سیاستگذاری تغییر کند. مثلاً یک مرکز اطلاع رسانی در یک شرکت بزرگ باید اینگونه سیاستگذاری نماید:

گزارشات فنی مربوط به خود سازمان                 ۲۵-۱۵ اصطلاح

سایر گزارشات فنی                                      ۱۵- ۱۰ اصطلاح

پروانه های ثبت اختراع                                    ۲۰-۱۵ اصطلاح

مقالات مجلات                                              ۱۰-۵ اصطلاح

و مواردی از این قبیل. به عنوان راهکاری دیگر، میتوان براساس محتوای موضوعی سیاستگذاری کرد؛ یعنی به موضوعاتی که بیشتر مورد توجه سازمان است اصطلاحات بیشتری اختصاص داد.

هرچند پایگاهی که نمایه سازی آن جامع است امکان جستجوهای گسترده تری را فرآهم می آورد (جامعیت بالا)، اما نمایه سازی جامع احتمالاً از نمایه سازی گزیده پرهزینه تر است. بعلاوه، نمایه سازی جامع در هنگام جستجو مانعیت کمتری به دست میدهد؛ یعنی، مدارک زیادی بازیابی خواهند شد که درخواست کننده انها را با نیازهای

۱. با تعداد اصطلاحات اختصاص یافته، همنشینی نادرست" نیز افزایش خواهد یافت. برای مثال، ممکن است با جستجویی درباره تحقیقات در زمینهٔ تلفن در مصر به مدرک ارائه شده در شکل ۳ دست یافت اما این مدرک هیچ چیزی در زمینهٔ این موضوع در بر ندارد.

۲. هرچه از اصطلاحات بیشتری برای نمایه سازی یک مدرک استفاده شود، احتمال بازیابی مدرک در جستجوهایی که ارتباط کمتری با موضوع آن دارد بیشتر می شود. ممکن است در جستجو برای مقالاتی دربارهٔ رهبران سیاسی عرب، مدرک ارائه شده در شکل ۳ بازیابی شود اما درخواست کننده این جستجو ممکن است اعلام کند که ارتباط مدرک با موضوع به قدری کم است که به سختی می توان آن را مفید دانست.

ایده جامع نگری را میتوان برای یک نظام بازیابی که بر روی متن قابل جستجو عمل می کند نیز به کار برد (به فصل ۱۴ نگاه کنید). عنوان در مدرک ارائه شده در شکل ۳، بازنمود جامعی از محتوای موضوعی آن نیست. با افزایش تعداد کلمات در بازنمود، جامع نگری افزایش می یابد.

از اصطلاح عمق" بارها برای اشاره به تعداد اصطلاحاتی استفاده شده که به یک مدرک اختصاص یافته است. یعنی، از عمق به جای جامع نگری استفاده شده است. هر دو اصطلاح نادقیق بوده و می توانند گمراه کننده باشند. برای درک بهتر تاثیر افزایش تعداد اصطلاحات مورد استفاده برای نمایه سازی یک مدرک، همانند شکل ۶، میتوان آن را از دو بعد مورد توجه قرار داد. اجازه دهید بگوییم که یک نمایه ساز میتواند ۱۰ موضوع مرتبط که در یک مدرک مورد بحث قرار گرفته را شناسایی کند. میتوان این مسئله را به عنوان گسترهٔ پوششی "مدرک در نظر گرفت. اگر نمایه ساز تلاش کند تا همهٔ این موضوعات را زیر پوشش قرار دهد می توان گفت که این نمایه سازی جامع است (یعنی نمایه سازی، بازنمود جامعی از محتوای موضوعی است). هرچه موضوعات بیشتری پوشش داده شوند، نمایه سازی جامع تر خواهد بود. به عبارت دیگر، هر چه موضوعات کمتری پوشش داده شود، نمایه سازی گزیده تر

1

 

شکل ۶ دو بعد نمایه سازی یک مدرک

است. بدیهی است که نمایه سازی جامع مستلزم استفاده از اصطلاحات بیشتری است.

بعد دیگر مدرک در شکل ۶، از دید نمایه سازی، به جزء نگری اشاره دارد. یعنی، بعضی از موضوعات شناسایی شده باید در بیش از یک سطح جزء نگری نمایه سازی شوند. فرض کنید معماری کلیسای جامع اولین موضوع باشد. این موضوع باید با اصطلاح معماری کلیسایی که کاملا خاص نیست، نمایه شود. برای افزایش جزء نگری، نمایه ساز باید اصطلاح دوم، یعنی کلیسای جامع را اضافه کند. استفاده ترکیبی از این دو اصطلاح می تواند موضوع مورد بحث را پوشش دهد. از سوی دیگر افزودن اصطلاح معماری بومی باعث افزایش جامع نگری می شود نه جزء نگری، زیرا این اصطلاح مفهوم جدیدی را به نمایه اضافه میکند.

به عبارت دیگر، افزودن اصطلاحات دیگر به نمایه ممکن است باعث افزایش جامع نگری یا افزایش جزء نگری آن شود. بنابراین، اگرچه صحیح است گفته شود که جامع نگری کاملاً به تعداد اصطلاحات اختصاص یافته وابسته است اما هیچ ارتباط دقیق و یک به یکی بین جامع نگری و تعداد اصطلاحات وجود ندارد. در این کتاب همانند شکل ۶، جامع نگری به گستره پوششی در نمایه سازی اشاره دارد. عمق اصطلاحی است که مناسبت کمتری دارد زیرا بر معنایی مخالف با گستره " دلالت دارد اما به نحو شایسته ای در بعد جزء نگری که در شکل ۶ نشان داده شده است کاربرد دارد.

تعداد اصطلاحاتی که برای یک مدرک تعیین می شود به ندرت از نظر اقتصادی مقرون به صرفه است. به طور کلی، هرچه نمایه سازی جامع تر باشد، هزینه های آن بیشتر است . اغلب گرایش کمی به نمایه سازی جامع تر وجود دارد چرا که نیازهای بهره گیران از خدمات، آن را ضرورت نمیبخشد. اگر تقاضاهای بسیار زیادی برای جستجوی جامع وجود داشته باشد، سطح بالاتری از جامع نگری ضرورت خواهد یافت. اگر جستجوی جامع به ندرت انجام می شود، سطح پایین تری از جامع نگری کافی خواهد بود.

بدیهی است که هرچه حجم پایگاه اطلاعاتی افزایش یابد، تعداد مدارکی که ممکن است براساس هر اصطلاح خاص بازیابی شوند نیز بیشتر می شود. بنابراین، نمایه سازی با اصطلاحات بیشتر (و نیز خاصی تر) ضرورت مییابد طوری که نمایه سازی به حدی دقیق می شود که به کاوشگران اجازه می دهد تا به سطح مناسبی از جامعیت و سطح قابل تحملی از مانعیت دست یابند. متاسفانه، این نکته در فهرست نویسی موضوعی کتابها در جامعه کتابخانه ای آمریکا مورد توجه قرار نگرفته است. محتوای موضوعی کتابها در سطحی بسیار کلی و سطحی ارائه میشوند (براساس گزارش آنایل" و آلوری آن ۱۹۸۱، به طور متوسط کمتر از دو موضوع به هر مدرک اختصاص مییابد). اگرچه این مسئله ممکن بود در پنجاه سال قبل یا بیشتر - یعنی زمانی که مجموعه های کتابخانه ای بسیار کوچکتر بودند - قابل اغماض باشد اما تقریباً در برگه دانهایی که از چندین میلیون مدرک تشکیل شده اند بلااستفاده است.

تبدیل فهرست های برگ های به فهرست های درون خطی برای بهره گیران فواید بالقوه بیشتری در پی دارد: توانایی جستجوی مدارک با استفاده از ترکیبات منطقی، اما با سطح پایین جامع نگري بازنمودها در فهرست، ارزش بالقوه آن بسیار کاهش مییابد. در نتیجه، کاوشگران درون خطی کراراً صدها مدرک را از فهرستهای کتابخانه های بزرگ دانشگاهی بازیابی می کنند که اغلب آنها کاملاً نامرتبط با نیازهای آنان است (لنکستر و دیگران، ۱۹۹۱). پدیده بازیابی بیشتر، تحقیقات قابل توجهی را برانگیخت. هدف این تحقیقات، جستجوی فهرست هایی عظیم به روشی بسیار دقیق مثل محدودکردن به تاریخ، زبان و سایر معیارها بود (برای مثال به پرابا"، ۱۹۹۱ نگاه کنید). بیشتر فهرست های درون خطی به کاوشگران اجازه می دهند تا بر روی عنوان (و شاید شماره های رده بندی) و موضوع جستجو کنند. به نظر می رسد تا وقتی که کلمات عنوان، موضوع و شماره های ردهبندی بارها یکدیگر را تکرار کنند، تاثیر بسیار اندکی بر جامع نگری داشته باشند (زو" و لنکستر، ۱۹۹۸).

شکل ۷ قانون نزولي بازده در نمایه سازی را نشان میدهد. در خدمات اطلاعرساني فرضي ارائه شده، اختصاص متوسط X اصطلاح، در حدود ۸۰٪ از نیازهای بهره گیران را برآورده خواهد کرد. برای افزایش رضایت مندی به ۹۰ ٪ تا ۹۵٪ به جامع نگری بیشتری در نمایهسازی نیاز داریم. در این منحنی، جایی که نقطه X قرار میگیرد و تعداد اصطلاحاتی که x ارائه می دهد، به این نکته که سیستم چقدر جزء نگراست بستگی زیادی خواهد داشت. مدیران مراکز اطلاع رسانی دستورالعملهایی را دربارهٔ جامع نگری نمایه سازی تهیه می کنند که براساس آگاهی و دانش آنان نسبت به نیازهای بهره گیران ایجاد شده است. به نظر میرسد که این دستورالعملها بیشتر براساس شهود ایجاد می شوند، هرچند تجربیات نیز نقش دارند؛ براساس تجربه، نمونه هایی از نیازهای اطلاعاتی با مجموعه ای از مدارک، که تعداد متنوعی از اصطلاحات نمایه شده را دربر دارند، مطابقت داده می شوند.

البته، تصور مناسب ترین سطح جامع نگری که بر همهٔ عناوین موجود در یک پایگاه اطلاعاتی قابل اعمال باشد قدری گمراه کننده است، چراکه مناسبترین سطح برای مدارک

2

شکل ۷ بازده نزولی اصطلاحات در نمایه سازی

 

مختلف، به درخواستی وابسته است که بهره گیران از سیستم ارائه می دهند (مارون، ۱۹۷۹). مناسبترین جامع نگری کاملاً به درخواست وابسته است.

در بعضی از انواع مدارک قابل نمایه، توافق بر سر اینکه دربارهٔ چه چیزی بحث می کنند فوق العاده دشوار است. در اینجا دستیابی به توافق و انسجام در نمایه سازی به هیچ عنوان ساده نیست. بنابراین، برای ارضای نظرات مختلف باید آنها را در سطحی جامع نمایه سازی کرد. این مسئله، برای مثال، دربارهٔ نمایهسازی تصاویر صادق است؛ نمایهسازان می توانند آن را از سطوح مختلف - از سطحی بسیار خاص تا سطحی بسیار موجز و خلاصه - مورد توجه قرار دهند (انسر، ۱۹۹۵).

اینت نر (۱۹۸۴) اشاره کرده است که در تصمیم گیری درباره چیزی که باید شامل شود و تعداد اصطلاحاتی که باید مورد استفاده قرار گیرد، یک نمایه ساز می تواند با کوتاهی در پوشش دادن برخی از جنبه های اثر که مورد تایید او نیست، نوعی سانسور را اعمال کند. البته،وضعیت معکوس، استفاده از تعدادی اصطلاحات ناموجه و بی فایده است که باعث می شود تا مدرک تا حد ممکن بازیابی شود؛ این اغواگری زمانی روی می دهد که قدری منافع مالی یا سایر مسائل در بازیابی دخیل باشند. به وجود این پدیده در محیط اینترنت نیز اشاره شده است (به فصل ۱۶ نگاه کنید، جایی که با اصطلاح حقه زدن " به آن ارجاع شده است)

بل" (۱۹۹۱a) با توجه به نمایه های انتهای کتاب وضعیت مشابهی را مورد بحث قرار داده است: نمایه سازان، یا شاید ناشران، با حذف موضوعاتی مشخص از نمایه یا از طریق تقویت نظریات نویسنده یا به وسیله معرفی گرایشات شخصی نمایه ساز، میتوانند سوگیری خاصی را اعمال کنند. او نمونه هایی از چنین سوگیری هایی را ارائه داده است.

تعداد اصطلاحاتی که به یک مدرک اختصاص مییابد، عامل مهمی در تعیین قابلیت بازیابی یک مدرک به شمار خواهد آمد. اما عوامل دیگری نیز وجود دارند که در این رابطه نقش ایفا می کنند. بسیار بدیهی است که فرد انتظار داشته باشد که در راهبرد کاوش، هر چه اصطلاحات بیشتری را با عملگر " و " ترکیب کند، تعداد مدارک بازیابی شده کاهش یابد در یک جستجو، دامنه ای که در آن اصطلاحات می توانند با موفقیت با یکدیگر ترکیب شوند، به تعداد اصطلاحاتی وابسته است که در نمایه سازی مورد استفاده قرار گرفته است. مثلاً اگر به طور متوسط به هر مدرک مورد استفاده در نمایه سازی ۲۰ اصطلاح اختصاص یافته باشد، ترکیب سه اصطلاح (الف، ب، ج) ممکن است تعداد زیادی مدرک را بازیابی کند، اما در پایگاهی که در آن به طور متوسط سه اصطلاح به هر مدرک اختصاص یافته، دستیابی به چنین نتیجه ای بعید است (به دلیلی که قبلاً ذکر شد، ممکن است در هنگام جستجو در یک فهرست کتابخانه ای درون خطی، مدارک زیادی - در صورت وجود - بازیابی نشود). هرچه نمایه سازی گزیده تر باشد، ترکیب اصطلاحات با عملگر "یا " ضرورت بیشتری می یابد تا بتوان بر جامعیت بازیابی افزود. اسپارک جونز" (۱۹۷۳) ارتباط بین جامع نگری نمایه سازی وویژگی های راهبردهای کاوش را مورد بحث قرار داده است. در آثار شاو" (۱۹۸۶، ۱۹۹۰a) و بورگین" (۱۹۹۱، ۱۹۹۵) می توان تاثیر جامع نگری بر روش های بازیابی خودکار (به فصل ۱۵ مراجعه کنید) را مطالعه کرد.

در برخی از مراکز اطلاع رسانی، ممکن است با دو هدفی تا اندازه ای متفاوت نمایه سازی انجام شود: الف) ایجاد دسترسی به مدرک از طریق نمایه چاپی، و ب) ایجاد دسترسی همزمان به همان مدرک در یک پایگاه الکترونیکی. در این وضعیت، ممکن است نمایه ساز مجبور باشد تا در سطح از پیش تعیین شده ای از جامع نگری نمایه سازی کند و زیرمجموعه ای از اصطلاحات نمایه ای (شاید ۲ تا ۴ اصطلاح) اختصاص یافته را برای ایجاد دسترسی در نمایه چاپی برگزیند. اصطلاحات موجود در زیرمجموعه، اصطلاحاتی خواهند بود که نمایه ساز اعتقاد دارد که جنبه های با اهمیت مدرک را به بهترین وجه ارائه می کنند. این نوع از نمایه سازی را می توان نوع ابتدایی یک "نمایه سازی وزنی به شمار آورد؛ یک اصطلاح می تواند یکی از دو وزن را به خود اختصاص دهد: "اصلی " (محتوای اصلی موضوعی در نمایه چاپی) یا فرعی " (سایر اصطلاحات). در فصل ۱۱ درباره نمایه سازی وزنی به تفضیل بحث شده است.