هدف اصلی از نمایه سازی چکیده نویسی

البته در جستجوی یک پایگاه اطلاعاتی، فرد می خواهد عناوینی را بیابد که برای ارضای برخی از نیاز های اطلاعاتی او مفید هستند، و از بازیابی عناوین نامناسب بپرهیزد. اصطلاحاتی چون “ربط” و”مناسبت” بار ها برای ارجاع به عناوین “مفید” مورداستفاده قرار گرفته وبه روش های مختلفی تعریف شده اند. درباره ی معنای واقعی “ربط” و”مناسبت” اختلاف نظر های زیادی وجود دارد(لنکستر و وارتر1993)در این کتاب اصطلاحات “مفید” “مناسبت” و مرتبط بایک نیازاطلاعاتی را مترادف در نظر خواهم گرفت یعنی مدرکی مناسب (مفید)است که بتواند در ارضای برخی از نیاز های اطلاعاتی نقش ایفا میکند.درشکل2 مشکل بازیابی اطلاعات به صورت تصویری نمایش داده شده است مستطیل کامل یک پایگاه وعناوین موجود درآن رانمایش میدهدعناوینی که با علامت(+)مشخص شده اند .عناوینی هستند که یک درخواست کننده فرضی آن را برای ارضای برخی از نیاز های اطلاعاتی جاری خود مفید خواهد یافت  عناوینی که با علامت منفی (-) مشخص شده اند عناوینی هستند که درخواست کننده آنها را غیر مفید تشخیص خواهد داد. برای هر نیاز اطلاعاتی خاص، عناوین منفی (-) بسیار بیشتر از عناوین مثبت (+) خواهند بود. بازیابی هرچه بیشتر عناوین مفید و هر چه کم دو مستطیل داخلی در شکل ۲، نتایج حاصل این جستجو بود که ۶ عنوان مفید و ۵۱ عنوان غیرمفید تشخیص داده شدند. نسبت عناوین مفید به کل عناوین بازیابی شده (در این مثال با 56 یا در حدود ۱۰٪) را نسبت مانعیت" میگویند. عموماً برای بیان دامنه ای که در آن همهٔ عناوین مفید بازیابی می شوند از اصطلاح نسبت جامعیت ۵ استفاده میشود. در این مثال، نسبت جامعیت 000000 یا در حدود ۵۴٪ است. در این شرایط و برای افزایش جامعیت، فرد باید کلی تر جستجو کند. چنین جستجویی از طریق مستطیل بزرگتر (از دو مستطیل داخلی) نمایش داده شده است. با جستجوی کلی تر، نسبت جامعیت به  57افزایش یافت اما مانعیت کاهش بیشتری یافت و به یا 58در حدود ۷٪ رسید. این یک ویژگی ناگوار در بازیابی اطلاعات است که افزایش جامعیت و برعکس.

111111111

شکل ۲. مشکل بازیابی عناوین مناسب از یک پایگاه اطلاعاتی

شکل ۲ پدیده دیگری را نیز توصیف می کند. ممکن است بتوان با افزایش کلیت جستجو همهٔ عناوین مفید را بازیابی کرد (یعنی به جامعیت ۱۰۰٪ دست یافت) اما احتمالاً مانعیت تحمل ناپذیر خواهد بود. بعلاوه، هرچه پایگاه بزرگتر باشد، مانعیت کم و ضعیف تحمل ناپذیرتر خواهد شد. برای مثال، ممکن است بهره گیرای علاقمند باشد تا برای یافتن ۶ مدرکی مفید، در میان ۵۷ عنوان جستجو کند اما به بازبینی ۵۷۰ چکیده برای دستیابی به ۶۰ مدرک مفید اشتیاق کمتری نشان خواهد داد. بنابراین، در پایگاههای بسیار بزرگ، دستیابی به سطح قابل قبولی از جامعیت و سطح قابل تحملی از مانعیت - موقعیتی که برای جستجوی اطلاعات در اینترنت به وضع بحرانی رسیده است - بیش از پیش دشوار خواهد شد.

در این کتاب، من از اصطلاح جامعیت برای اشاره به بازیابی مدارک و عناوین مفید و از اصطلاح مانعیت برای ارجاع به توانایی پرهیز از بازیابی مدارک غیر مفید استفاده خواهم کرد. مقیاس های دیگری نیز برای سنجش کارایی " جستجوها در یک پایگاه اطلاعاتی وجود دارند (برای مثال به روبرتسون"، ۱۹۶۹ مراجعه کنید). برخی از این مقیاس ها کاملاً ریاضی هستند،

اما جامعیت و مانعیت، تصویری کلی از جستجو ارائه می دهند و به نظر میرسد که هنوز مقیاسه ای ساده ای باشند که میتوانند برای بیان نتایج هر کاوشی که پایگاه را به دو بخش (بازیابی شده و بازیابی نشده)" تقسیم میکنند مورد استفاده قرار گیرند. شکل ۱ نشان میدهد که در تعیین میزان موفقیت یا عدم موفقیت جستجو در یک پایگاه اطلاعاتی، عوامل زیادی دخیل هستند. دامنهٔ پوششی پایگاه اطلاعاتی، سیاست گذاری نمایه سازی، شیوه کار نمایه سازی، سیاستگذاری و شیوه کار چکیده نویسی، کیفیت واژگان مورد استفاده در نمایه، کیفیت راهبردهای کاوش و مواردی ازاین قبیل، از جمله این عوامل هستند. در این کتاب هیچ تلاشی برای بررسی همهٔ این عوامل (هرچند که به یکدیگر مرتبط اند) صورت نگرفته است اما بر فعالیت های اصلی در توصیف مدارک یا، حداقل، بر فعالیت های مرتبط با محتوای مدارک تکیه شده است.