نمایه سازی ماشینی

مقدمه

در دهه های اخیر با ورود رایانه به عرصه سازماندهی اطلاعات، نمایه سازی خودکار مورد توجه قرار گرفته و با سرعتی فزاینده رو به رشد است. نمایه سازی خودکار، فرایند تخصیص واژه های نمایه به مدرک بدون دخالت نسان و با هدف کاهش زمان، هزینه و تلاش فکری است. سالهای اخیر تلاش های فراوان در ساخت چنین فرایندهایی صورت گرفته است. امروزه برنامه های رایانه ای بسیاری برای شناسایی واژه های موجود در متن، مکان آنها و ایجاد نظم الفبایی به وجود آمده است که در اغلب آنها از فهرستی موسوم به سیاهه واژگان بازدارنده استفاده شده است. با این حال، نتایج حاصل از این نرمافزارها بیشتر به عنوان کشف اللغه یافهرست واژه های موجود در متن و نه نمایه های قابل استفاده، توصیف می شوند. رایانه ها نمی توانند به صورت کاملا خودکار نمایه ها را تولیدکنند زیرا در نمایه سازی، تشخیص مفاهیم مهم تر از استخراج واژه و الفبایی کردن است. در ایجاد نمایه به وسیله نمایه ساز، با استفاده از فرایندهای فکری، محتوای مدارک شناسایی می شود؛ اما رایانه ها تنها با فرایندهای الگوریتمی به ایجاد نمایه میپردازند. از سوی دیگر تخصیص اصطلاحات نمایه ای تنها به واژه های موجود در مدرک بستگی ندارند؛ بلکه به واژه هایی که کاربران در جستجو استفاده می کنند و میزان آشنایی آنها با مدرک نیز وابسته است که توجه به آنها به وسیله رایانه دشوار است. به علاوه، مدارک معمولاً دارای واژههای بسیاری هستند که در مورد آنها اطلاعاتی ارائه نشده است؛ برنامه های رایانه ای، این واژهها را نیز نمایه می کنند؛ زیرا آنها هوشمندی لازم برای تمایز واژه های موضوعی که اطلاعاتی درباره آنها ارائه شده است از واژه های غیر اطلاعاتی ندارند. بنابراین نمایه سازی خودکار در ایجاد نمایه های ساده کاربرد دارد و نمی تواند محتوای مدرک را تحلیلی کند (تولیک ، ۲۰۰۱). در یک تعریف ساده می توان گفت، نمایهسازی خودکار، فرایند انتخاب توصیفگرها توسط رایانه است (نیاکان، ۱۳۸۳: ۱۰)