تحلیل عملکرد موتورکاوش آلتاویستا

در بعضی موارد، رتبه دهی براساس چندین معیار صورت میگیرد. مثلاً موتورکاوش آلتاویستا ادعا دارد که برای امتیازدهی از الگوریتمی استفاده میکند که به موارد زیر وابسته است:

  • محل ظاهرشدن کلمات در مدرک (کلماتی که در بخش های اولیه مدرک، مثل عنوان یا سرعنوان ها ارائه شده اند امتیاز بالاتری می گیرنده
  • میزان نزدیکی کلمات کاوش به یکدیگر
  • بسامد رخداد کلمات / عبارات کاوشی در منبع.

هیچ مدرکی وجود ندارد تا مشخص کند که روش ترکیب این معیارهای مختلف برای استفاده در امتیازدهی مدارک چگونه است یا اینکه کدامیک از این معیارها از ارزش بیشتری برخوردار است. موتور کاوش هات بات، محصولی از شرکت اینکتومی ، ادعا می کند که بیش از ۵۰ میلیون منبع را زیر پوشش دارد و نتایج را براساس معیارهایی چندگانه رتبه بندی میکند: بسامد واژه در متن، محل آن در متن (کلمات عنوان به نسبت کلمات متن، وزن بیشتری دریافت میکنند؛ امتیاز کلیدواژههایی که در فیلد کلیدواژه ظاهر شدهاند نیز بیشتر است)، و طول مدرک (کلمات کاوشی که در متن های کوتاه ظاهر شده اند به نسبت متن های طولانی تروزن بیشتری میگیرند). برای مطالعهٔ ارزیابی مفصلی دربارهٔ این موتورهای کاوش به هوکا، ۱۹۹۷ مراجعه کنید.

هولزبرگ (۱۹۹۶) عاملهایی را توضیح داده است که برای سفارشی کردن ارائه اخبار از طریق اینترنت طراحی شده اند و گریس و ولد "سایر عامل های مرتبط با شبکه را تحلیل کرده است. به هرحال، تغییرات آنقدر سریع رخ میدهند که حتی تحقیقات نیز در عرض چند ماه قدیمی می شوند.

به طور کلی، اغلب این ابزارها را می توان در مقوله هایی چون مراقبین"، " جستجوگران و تحلیل گران" دسته بندی کرد (بلیک، ۱۹۹۴)، آیچمن" بسیاری از عاملهایی که به عنوان عنکبوت شناسایی می شوند را چنین تعریف کرده است؛ برنامهای که به طور آزاد ساختار وب را جستجو کرده و بر روی مصنوعاتی که با آنها مواجه می شود عملیاتی را انجام می دهد. "آدمواره تشخیصی و آدمواره نرم افزاری سایر اصطلاحاتی هستند که در متون با آنها برخورد میکنیم. آدمواره نرمافزاری، اصطلاحی عام برای اشاره به عامل های نرم افزاری است، درحالی که اصطلاح آدمواره تشخیصی برای اشاره به عامل هایی مورد استفاده قرار گرفته است که می توانند بر روی تعدادی از منابع اطلاعاتی متفاوت جستجو کنند (رواستلر و هاوکینز، ۱۹۹۴). در مقالهٔ میز" (۱۹۹۴)، نقد و بررسی جالبی دربارهٔ تواناییهای عامل هایی از این نوع را میتوان یافت.

این ابزارهای مختلف را می توان "هوشمند" نامید زیرا بعضی از آنها حداقل از توانایی فراگیری محدودی برخوردارند. مثلاً در یک خدمت خبری، این عامل ها می توانند براساس بازخورد بهره گیر در زمینهٔ مدارک انتخابی یا حذف شده، پرونده علایق اطلاعاتی بهره گیر را اصلاح نمایند. می توان چنین اصولی را بر روی عاملهای گزینش سرگرمی ها نیز اعمال کرد.