بررسی بزرگترین مشکل اینترنت

با ایجاد صفحاتی که مغرضانه موتورهای کاوش را گول زده و باعث میشوند تا صفحات نامرتبط با کاوش را بازیابی کنند یا امتیاز بالایی را به مدارک آنها اختصاص دهند بسیار رواج یافته است - یافته است. تکرار هزاران بارهٔ کلمات در بخش کلیدواژه ها یاا ظهارنظرها، با گنجاندن زیادی از کلمات " نامرئی در فونتهای ریز با به رنگی مشابه با رنگ پس زمینهٔ صفحه، مثال هایی از حقه زدن هایی است که عمومیت دارند. چنین حقه هایی باعث میشود تا هاتبات به دو روش به این صفحات امتیازات کمتری را اختصاص دهد: اول، حجم این ملارک طولانی تر است، دوم، اگر هاتبات یک روش حقه زدن متدوال را تشخیص - به شدت امتیاز آن صفحه را کم خواهد کرد:

متاسفانه مشخصں نیست که این موتور کاوش چگونه روش های حقه زدن متدوال راتشخیص میدهد . . . . . به هرحال، بزرگترین مشکل اینترنت همان است که قبلاً اشاره شد: کمیت محض، بدون هیچ نشانه ای از پالایش کیفی قابل ملاحضه متاسفانه، به نظر میرسد که وضعیت، به جای بهترشدن، درحال وخامت است. گزارشی از انجمن هوش مصنوعی آمریکا (ولد و دیگران،1995)دربارهٔ زیرساختار ملی اطلاعات، وضعیت به صورت زیر توصیف کرده است:

گرایشات اخیر به فشردهسازی نیمه هادی ها، سرعت پردازش و پهنای بانلی شبکه ای، نشان می دهد که زیرساختار باید هزاران بار بزرگتر از سیستم های موجودی چون اینترنت باشد؛ مجموعه خدماتی که از طریق زیرساختار ملی اطلاعات پشتیبانی خواهد شد بسیار گسترده خواهد بود (ص ۴۵)، .

زیرساختار ملی اطلاعات، آرایه ای از سیستم هایی خواهد بود که از سیستم های کنونی بسیار پیشرفته تر هستند؛ این زیرساختار، هزار تویی از پایگاه ها و خدماتی خواهد بود که برای متخصصین مزاحمت ایجاد کرده و برای بسیاری از آمریکائیان غیرقابل دسترس خواهند بود (ص ۴۶).

گرچه به نظر میرسد که بسیاری از امور در جامعه رایانهای و در مراکز اطلاع رسانی مشکلات را به حداقل می رسانند، اما گفتن این نکته خالی از لطف نیست که بسیاری از بهره گیران پیشرفته و جدی، در برخورد با اینترنت به عنوان یک ابزار بازیابی اطلاعات سرخورده شدهاند. مثلاً: پالمر (۱۹۹۶) به نقل از یک محقق در حوزهٔ شیمی میگوید:

اگر مجموعهای با حجم عالی وجود داشته باشد اما شما نتوانید از آن چیزی دریافت کنید فایدهای نخواهد داشت، مگر آنکه فرد بگوید، "به هرحال، وقتی هفتهٔ گذشته در یک همایشی با فردی صحبت میکردم، به من گفت که اگر از رایانه ای که اینجا وجود دارد استفاده کنی می توانی به آدرسی دست پیدا کنی که در آن آنچه که بخواهی وجود دارد. این چه رفتار نامعقولی است؟ (ص. ۱۷۳).

حتی پیش از آنکه از رایانه، در هر حدی، برای حل مشکلات استفاده شود، فایر ثورن (۱۹۵۸) اشاره کرده بود که نمایه سازی و پرهزینه بودن گلوگا و بازیابی اطلاعات، مشکلی اساسی است . اندازهٔ اینترنت، به خودی خود، چالش هایی را در زمینهٔ نمایه سازی ایجاد میکند که به مراتب عظیم تر از هر مشکلی است که در زمان فایر ثورن در چهل سال پیش قابل پیشبینی بود.

اخیراً ولیش (۱۹۹۴) ادعا کرده است که مجلات الکترونیکی، به دلیل بی ثباتی متن آنها،بعید است نمایهسازی شوند. از آنجا که اغلب منابع در اینترنت، به نسبت مجلات، از پایداری بسیار کمتری برخوردارند، او احتمالاً احساس کرده است که همهٔ موارد - یعنی، نمایه سازی متونی که کراراً دستخوش تغییر می شوند - نیز چنین هستند. در سویهٔ دیگر، به نظر میرسد که واینبرگ (۱۹۹۶) پیچیدگی مشکل را، از نظر حجم و ناپایداری منبع، کاملاً برآورد کرده و میگوید که ممکن است راه حل این مشکل، نمایه سازی براساس ساختار نمایهٔ آخر کتاب باشد.

او میگوید که ممکن است با دریافت هزینهٔ استفاده بتوان تولیدات نمایه اي به صرفه ای ازاین نوع را ایجاد کرد. اون (۱۹۹۴) نویسنده دیگری است که ادعا میکند می توان از نمایه سازی حرفه ای برای توجیه ایجاد پایگاه های بارزشي قابل دسترس از طریق اینترنت استفاده کرد. در گزارش ولد و دیگران (۱۹۹۵) تاکید شده است که حوزهٔ هوش مصنوعی می تواند در افزایش دسترسی به اطلاعات در این شبکه گسترده نقش به سزایی داشته باشد؛ اما در گزارش آنها این نکته نیز مشهود است که اغلب سیستم های هوشمند آنقدر سالم و قوی بنیه نیستند که بتوانند در زندگی روزمره و در گستردهای وسیع مورد استفاده قرار گیرند. همچنین این احتمال وجود دارد که زنجیرهٔ گستردهٔ منابع اطلاعاتی از هیچ یک از مقیاس های کارآمد نظارت و دستیابی - حداقل فرایندهای خودکاری که در مقیاسی وسیع اعمال شدهاند - تاثیرپذیر نباشند. در فصل بعدی و پایانی یک روش جایگزین توضیح داده شده است.