ابزار كاوش اينترنت۱ چيست ؟
بسياري از ما اولين تجربه استفاده از اينترنت را از طريق ابزارهاي كاوش كسب كرده ايم اما براستي ابزارهاي كاوش اينترنت كا روزانه ميليون ها نفر د رسراسر جهان از آن استفاده مي كنند ، چه ويژگيها و امكاناتي دارند ؟ و چگونه كار مي كنند ؟

ابزار هاي كاوش : اينترنت ، پايگاههاي اطلاعاتي قابل جستجو۲ يا مرور۳ هستند كه با استفاده از آنها مي توان به « بخشي » از اطلاعات موجود را اينترنت دست يافت . اين ابزارها به دو شيوه « جستجوي كليد واژه ها » يا « مرور وانتخاب » پيوند هاي فرامتني ۴كاربران را به سوي اطلاعات مورد نظر ، هدايت مي كنند .
ابزارهاي كاوش اينترنت را مي توان به دو نوع اصلي تقسيم بندي كرد : راهنماي موضوعي ۵و موتورهاي كاوش۶ . موتورهاي كاوش اينترنت و راهنماي موضوعي نسبت به يكديگر مزايا و محدوديتهايي دارند و رويكرد آنها براي انتخاب گرد آوري و نمايه سازي اطلاعات در محيط اينترنت ، متفاوت است در اين كتاب ، اصطلاح «ابزارهاي كاوش اينترنت » بر دو مفهوم موتور كاوش و راهنماي موضوعي دلالت مي‌كند .
در حال حاضر ، تقريبا كليه ابزارهاي كاوش اينترنت به منظور جستجو وبازيابي اطلاعات در محيط شبكه جهاني وب طراحي مي شوند ودر دسترس قرار مي گيرند به همين دليل ، از آنها به عنوان « موتورهاي كاوش وب » و«راهنماهاي موضوعي وب » نيز نام برده مي شود يكي از راهنماهاي ابزارهاي كاوش اينترنت به نام Search Engine Guide مدعي است كه تاماه جولاي ۲۰۰۱ بيش از ۲۵۰۰ راهنماي موضوعي و موتور كاوش را در زمينه هاي مختلف ، شناسايي وبه صورت موضوعي ،تقسيم بندي كرده است ( ۱۰ ) از آنجا كه ابزارهاي كاوش اينترنت ، تنها راه رويارويي با حجم فزاينده ي اطلاعات در محيط وب هستند ، دور از انتظار نخواهد بود كه چنين ابزارهايي بسرعت رشد وتوسعه پيدا كنند .

راهنماهاي موضوعي : رويارويي انسان با محيط وب
راهنماهاي موضوعي وب : پايگاههايي هستند كه اطلاعات صفحات يا سايت هاي وب منتخب را توسط نيروي انساني در پايگاه خودنمايه مي كنند در راهنماهاي موضوعي وب فرايند شناسايي بررسي ، تجزيه و تحليل ، ارزيابي و نمايه سازي صفحات يا سايت هاي وب توسط نيروي انساني و براساس معيارهاي از پيش تعيين شده انجام مي شود راهنماهاي موضوعي وب براي در دسترس قرار دادن اطلاعات
صفحات يا سايت هاي وب اغلب از نظام سلسله مراتب موضوعي استفاده مي كنند .
درسال ۱۹۹۴ اولين راهنماي قابل جستجوي وب ، تحت عنوانEINET Galaxy با اين ويژگي ها در دسترس عموم قرار گرفت و كمي پس از آن ابتكار و دانشجو در ارائه يك فهرست موضوعي از سايت هاي منتخب ، باعث پديد آمدن ( www. Yahoo . com ) yahoo شد كه هم اكنون يكي از رايج ترين و پر استفاده ترين ابزارهاي كاوش اينترنت بشمار مي آيد . ( ۱۴ :ص ۲۹۰)

راهنماهاي موضوعي ، اغلب از طريق ويراستاران يا متخصصان موضوعي به تجزيه وتحليل محتوايي ، ارزيابي و گزينش صفحات يا سايت هاي وب مي پردازند با اينكه راهنماهاي موضوعي وب در مقايسه با موتورهاي كاوش ، بخش كمي ازاطلاعات موجود در اينترنت را پوشش مي دهند اما از آنجا كه فرايند گرد آوري و تجزيه و تحليل اطلاعات توسط نيروي انساني انجام مي شود اغلب كيفيت و ارزش نسبت بالايي دارند براي نمونه بيش از ۴۰ هزار ويراستار و متخصص و داوطلب در سراسر جهان با راهنماي موضوعي ( http // moz ) open Directory جهت شناسايي ، انتخ

اب و ارزيابي صفحات يا سايت هاي وب همكاري دارند و راهنماي موضوعي! yahoo براي انجام فعاليتهاي مشابه از بيش از ۱۵۰ نفر ويراستار و متخصص موضوعي استفاده مي كند ( ۳) راهنماهاي موضوعي وب اغلب توضيح مختصري درباره محتواي صفحات يا سايت هاي وب موجود در پايگاه خود كه توسط ويراستاران تهيه و تنظيم شده است ارائه مي دهند همين موضوع باعث مي شود تا به سهولت بتوان از موضوع و محتواي صفحات يا سايت هاي وب آگاهي يافت دو نوع موضوعات و حوزه هاي دانش بشري را پوشش مي دهند ، مانند( www . look smart . com ) look smart , open Directory , yahoo ! وراهنماي موضوعي خاص ۲كه منحصرا براي دسترسي به اطلاعات حوزه خاصي مانند فيزيك ، شيمي ، زيست شناسي ، كتابداري و .. ارائه مي شوند براي مثال ( www . iranhoo . com ) Iranhoo يك راهنماي موضوعي به زبان فارسي مختص سايت هاي ايران است .
راهنماهاي موضوعي ، ساختار موضوعي و سلسله مراتب منطقي دارند به طوري كه از طريق موضوعات كلان مي توان به موضوعات خاص تر دسترس پيدا كرد براي مثال راهنماهاي موضوعي , yahoo ! داراي ۱۴ بخش موضوعي كلان نظير هنر و علوم انساني ،آموزش و پرورش ، كامپيوتر و اينترنت ، علوم ، علوم اجتماعي و .. است كه با انتخاب هر يك از آن ها مي توان به صورت سلسله مراتبي به موضوعات خاص تر است دست يافت نمونه ساختار سلسله مراتب موضوعي براي دسترسي به مجلات حوزه كشاورزي در شكل زير نمايش داده شده است .
Yahoo scienc > Agriculture > journals – Micro Soft Internet Explorer
File Edit View Favorites Tools Help
Address | http : // dir . yahoo . com Go
Yahoo ! compaa Help – check Email
Jobs yahoo ! careers
Search

 

در مثال زير ساختار سلسله مراتبي راهنماي موضوعيyahoo !برا ي دسترسي به صفحات يا سايت هاي وب در زمينه برنامه هاي درسي و گروههاي كتابداري دانشگاهها نشان داده شده است .
Socil science
Library and In formation Science
Education College and university

Depar tments and programs
بسياري را راهنماهاي موضوعي وب علاوه برساختار سلسله مراتب موضوعي امكاناتي هم براي جستجوي كليه واژه ها در نظر گرفته اند تا مانند موتورهاي كاوش بتوان در پايگاه آنها به جستجوي كليه واژه هاي مورد نظر پرداخت حتي برخي از راهنماهاي موضوعي نظير yahoo ! open Directory امكاناتي براي جستجوي كليه واژه ها در بخشهاي موضوعي خاص پيش بيني شده است اين قابليت در راهنماي open Directory از طريق گزينه category only this قابل دسترسي است فرض كنيد به دنبال اطلاعاتي درباره تجهيزات چشم پزشكي هستند شما مي توانيد به ترتيب پس از وارد شدن به بخش موضوعي بهداشت ، پزشكي ، تخصص هاي پزشكي و درنهايت چشم پزشكي كليه واژه هاي مرتبط با تجهيزات چشم پزشكي را دركادر جستجو تايپ و گزينه category only this را انتخاب كنيد به اين ترتيب كليه واژه هاي فقط در بخش موضوعي چشم پزشكي مورد جستجو قرار مي گيرند وتا حدود بسيار زيادي از بازيابي اطلاعات نامرتبط ( مربوط به بخشهاي موضوعي ديگر ) جلوگيري مي شود .

نقش كتابداري در طراحي راهنماهاي موضوعي :
يكي ازدلايل موفقيت راهنماي موضوعي yahoo! كه هم اينك پر مراجعه ترين ابزار كاوش اينترنت به شمار مي آيد استفاده از دانش چندين ساله علم كتابداري در سازماندهي سلسله مراتبي اطلاعات بود ه است .
متوليان اصلي yahoo ! در نخستين روزهاي تاسيس آن يك كتابدار با تجربه را به خدمت گرفتند تا بتوانند اطلاعات گرد آوري شده را در قالب سلسله مراتب موضوعي سازماندهي كنند ودر دسترس استفاده كنندگان قرار دهند كتابداران ساليان متعادي و طيفه نقد و بررسي ونيزانتخاب و سفارش منابع چاپي را برعهده داشتند بنابراين دور ا ز انتظار نيست كه امروز مسئوليت اصلي ارزيابي و تجزيه وتحليل محتواي منابعي اطلاعاتي دروب را نيز برعهده بگيرند درحال حاضر ، بسياري از راهنماهاي موضوعي وب در حوزه هاي مختلف توسط كتابداران تهيه و گرد آوري مي شود .
براي نمونه راهنماي موضوعي ( http // infoine edu ) Infomine كه اطلاعات بيش از ۲۳ هزار سايت علمي را پوشش مي دهد توسط كتابداران راه اندازي شده است . بسياري از كتابداران بويژه دركتابخانه هاي دانشگاهي و تحقيقاتي وظيفه اصلي طراحي راهنماهاي موضوعي به منابع اطلاعاتي در وب را بر عهده دارند زيرا آنها از يك سو با نيازهاي اطلاعاتي استفاده كنندگان آشنا هستند واز سوي ديگر براي تجزيه وتحليل محتوا و ارزيابي اعتبار وصحت و كيفيت اطلاعات دانش و تجزيه لازم را دارند ( www. Lit ory ) librarian Indento Internet يكي از مهمترين راهنماهاي موضوعي است كه توسط كتابداران و متخصصان موضوعي دردسترس همگان قرار گرفته است .

موتورهاي كاوش : تقابل ماشين به محيط وب
موتورهاي كاوش : پايگاههاي اطلاعاتي قابل جستجويي هستند كه از طريق برنامه
هاي كامپيوتري به شناسايي و نماي سازي خود كار صفحات وب مي پردازند موتورهاي كاوش برخلاف راهنماهاي موضوعي برنامه هاي خود كاري هستند كه هيچ گونه وابستگي به نيروي انساني ندارند به تعبير ديگر ، فرايند شناسايي ، انتخاب و نمايه سازي اطلاعات وب توسط برنامه هاي كامپيوتري انجام مي شود .
هر موتور كاوش منفرد ، داراي سه جزئي اصلي است روبات ها ،پايگاه اطلاعاتي و نرم افزار بازيابي اطلاعات كه فرايند جستجو و بازاريابي اطلاعاتي از طريق ارتباط متقابل ميان آنها صورت مي پذيرد .
۱- روبات ها۱ : بارشد روز افزون شبكه جهاني وب ، اين موضوع روشن شد كه از طريق نظامهاي

نمايه سازي ودستي ومبتني بر نيروي انساني نمي توان باحجم فزاينده اي از اطلاعات در اين محيط روبرو شدن به همين دليل برنامه هاي خودكاري براي شناسايي ، گرد آوري ونمايه سازي صفحات وب تحت عنوان روبات ها توسعه يافتند در برخي متون به جاي روبات ها از اصطلاحاتي مثل عنكبوت ها ۲، خزندها ۳،يا كرمها۴ استفاده شده است روبات ها برنامه هاي خودكاري هستند كه به طور پيوسته در فواصل زماني معين ، (اغلب يك يا چندماه ) فضاي اينترنت را مبتني بر ساختار فرا پيوند

ي وب مورد جستجو قرار دهند وبه شناسايي ونمايه سازي صفحات وب جديد يا اصلاح اطلاعات موجود در پايگاه اطلاعاتي موتورهاي كاوش مي پردازند .
با وجود اينكه روبات ها يكي از مهمترين اجزاي تشكيل دهنده موتورهاي كاوش هستند ، ولي برخي از موتورهاي كاوش براي ارائه نتايج اصلي جستجو از پايگاههاي اطلاعاتي ديگر ابزارهاي كاوش استفاده مي كنند براي مثال ، ابزارهاي كاوش Northern light Google Encite Altavista داراي روبات هاي و Lgcos با مبتني بر اطلاعات موجود در پايگاه هاي اطلاعاتي ديگر ابزارهاي كاوش است .
۲-پايگاه اطلاعاتي : هر گونه اطلاعاتي كه روبات ها از صفحات وب جمع آوري مي كنند به بخش دوم موتورهاي كاوش يعني پايگاه اطلاعاتي افزوده مي شود در برخي از متون اصطلاح فهرست

يا نمايه به جاي پايگاه اطلاعاتي موتور كاوش به كار رفته است پايگاه اطلاعاتي موتور كاوش شامل فهرست نظام مندي از صفحات وب است كه اطلاعات مربوط به صفحات وب در آنجا ذخيره مي شود .
۳- نرم افزار بازيابي اطلاعات :نرم افزار بازيابي اطلاعات : درواقع واسط جستجو و برنامه اي است كه از طريق وارد كردن كليه واژه هاي در فيلد هاي مختلف مي توان در ميليونها صفحه وب نمايه شده در پايگاه اطلاعاتي موتورهاي كاوش به جستجوي اطلاعات موردنظر بپردازد .
به طور كلي همه موتورهاي كاوش فرايند جستجو وبازيابي اطلاعات را از طريق برقراري ارتباط ميان سه جزء اصلي تشكيل دهنده خوديعني روبات ها ، پايگاه اطلاعاتي ونرم افزار بازيابي اطلاعات انجام مي دهند مهمترين :
مراحل اين فرايند عبارتند از :

۱- شناسايي و نمايه سازي اطلاعات صفحات يا سايت هاي وب توسط روبات ها
۲- انتقال ودرج اطلاعات گرد آوري شده در پايگاه اطلاعاتي موتور كاوش
۳- جستجوي اطلاعات در پايگاه اطلاعاتي از طريق نرم افزار بازيابي اطلاعات
۴- بازيابي ، رتبه بندي ونمايش اطلاعات مبتني بر اطلاعات موجود در پايگاه اطلاعاتي

 

مزايا راهنماهاي موضوعي نسبت به موتورهاي كاوش
طبق بررسيهاي به عمل آمده پيش از ۴۱ درصداز كاربران اينترنت در امريكا از راهنماي موضوعي yahoo! براي دسترسي به اطلاعات استفاده مي كنند اين راهنما رايج ترين و پر استفاده ترين ابزار كاوش وب محسوب مي شود در حالي كه بزرگترين موتور كاوش از لحاظ جامعيت اطلاعات يعني Google تنها توسط حدود ۱۴ درصد از كاربران از اينترنت درامريكا مورد استفاده قرار ميگيرد برخي عقيده دارند كه هم كه اسم yahoo! يكي از دلايل مهم مراجعه بسيار زياد كاربران به اين سايت است اما آيا واقعا اين تنها دليل موفقيت اين راهنماي موضوعي وب در ميان انبوهي از ابزارهاي كاوش است يا بايد به دنبال عوامل تاثير گذار ديگري نيز بود ؟
• دسترس بهتر به اطلاعات مرتبط : رويكرد نمايه سازي انساني در راهنماهاي وب و همچنين گنجاندن اطلاعات در قالب تقسيمات موضوعي باعث شده است تا ريزش كاذب ( بازيابي اطلاعات غير مرتبط ياناخواسته ) آنها نسبت به موتورهاي كاوش ، بسيار كمتر باشد از طريق تقسيمات سلسله مراتب موضوعي را در راهنماهاي موضوعي مي توان به طور يكپارچه به اطلاعات موردنظر درهمان زمينه موضوعي كه قبلا توسط ويراستاران مورد ارزيابي و تجزيه وتحليل قرار گرفته است نيز يافت .
• صرف زمان كمتر براي دسترسي به اطلاعات : ساختار موضوعي و سلسله مراتبي در راهنماهاي موضوعي وب با استفاده كنندگان امكام مي دهد با انتخاب موضوعات اصلي وسپس فرعي از وجود يا عدم وجود اطلاعات مورد نظر درراهنماهاي موضوعي آگاه شوند وزمان نسبتا كمتري را در مقايسه باموتورهاي كاوش ضرب بازيابي اطلاعات كمتر جستجو از طريق موتورهاي كاوش اغلب منجر به بازيابي صدها ياهزاران پيوند فرامتني به صفحات وب مي شود كه بررسي كليه آنها براي استفاده كنندگان نهايي ، بسيار وقت گير يا امكان ناپذير است .
• سهولت مرور و بازيابي اطلاعات : ساختار سلسله مراتبي راهنماهاي موضوعي وب در بسياري از موارد به استفاده كنندگان امكان مي دهد با انتخاب موضوعات كلان و سپس خاص تر ، اطلاعات را به آساني مرور و بازيابي كنند برخلاف موتورهاي كاوش ،استفاده كنندگان نيازي به دانستن مهارت و امكانات پيچيده جستجو و عملكردهاي بول ،جستجوي عبارتي ، نزديك يابي و .. ) ندارند .
باوجود اين بسياري از راهنماهاي موضوعي وب مانند yahoo ! open Directory, علاوه بر ساختار موضوعي و سلسله امكان جستجوي كليه واژه ها را نيز در پايگاه اطلاعاتي خود در اختيار قرار مي دهند .

محدوديتهاي راهنماهاي وب نسبت به موتورهاي كاوش
با اينكه راهنماهاي موضوعي ، يكي از پر استفاده ترين ومهمترين ابزارهاي كاوش به وب هستند اغلب اطلاعات پالايش شده مرتبط وبا كيفيت مناسب در اختيار استفاده كنندگان خود قرار مي دهند اما محدوديتهايي نيز دارند كه بايد مد نظر داشت . برخي از مهمترين محدوديتهاي راهنماهاي موضوعي وب نسبت به موتورهاي كاوش عبارتند از :
• پوشش كم اطلاعات موجود در وب : وابستگي تنگاتنگ راهنماهاي موضوعي وب به نيروي انساني در گرد آوري و ارزيابي محتوايي صفحات وب باعث شده است كه آنها نتوانند بارشد شگفت آور و فزاينده اطلاعات در وب همگام باشند از آنجا كه روزانه بيش از ۷ ميليون صفحه به فضاي وب افزوده مي شود شناسايي و بررسي اين حجم اطلاعات خارج از توان نيروي انساني است به همين دليل ، پوشش اطلاعات موجود در وب درراهنماهاي موضوعي نسبت به موتورهاي كاوش ، بسيار كمتر است بزرگترين راهنماهاي موضوعي وب يعني open Directory تا ماه سپتامبر ۲۰۰۱ در حدود ۸/۲ ميليون صفحه وب در پايگاه خود پوشش داده بود .

• روز آمد نبودن اطلاعات : هنگامي كه ويراستاران راهنماهاي موضوعي توانايي بررسي و ارزيابي سايت هاي وب جديد را در مدت زمان كوتاه نداشته باشند بديهي است پايگاه اطلاعاتي روز آمدي نيز مي توان در اختيار استفاده كنندگان قرار داد به اين ترتيب روز آمد سازي اطلاعات توصيفي ارائه شده براي هر مدخل نيز دشوار خواهد بود زيرا ممكن است محتواي صفحات يا سايت هاي وب در مدت زمان كوتاهي تغيير كنند درحالي كه موتورهاي كاوش از طريق روبات هاي خود تا حدود بسياري زيادي مي تواند اين مشكل را حل كند .
تغيير نشاني صفحات يا سايت هاي وب به هر دليل ، يكي ديگر از مشكلات اساسي راهنماهاي موضوعي براي روز آمد سازي نشاني هاي جديد است به همين دليل پيوندهاي كور ( نشاني هاي از طريق آنها نمي توان صفحات وب را مشاهده كرد ) در پايگاه اطلاعاتي راهنماهاي موضوعي وب بيشتر از موتورهاي كاوش است .
• نياز به آگاهي از ساختار سلسله مراتب موضوعي علوم : يكي ديگر ا زمحدوديتهاي استفاده از راهنماهاي موضوعي وب اين است كه كاربران بايد تا حدودي از سلسله مراتب موضوعي علوم ، اگاهي داشته باشند براي نمونه . فرض كنيم به دنبال اطلاعاتي درباره« علم ژنتيك »هستند آيا مي دانيد با انتخاب كدام بخش موضوعي كلان ( نظير علوم انساني ،علوم ،علوم اجتماعي و .. ) در راهنماي open Directory مي توانيد به اطلاعات مورد نظر دسترسي پيدا كنيد ؟ از طرف ديگر

تقسيم بندي موضوعي در راهنماهاي موضوعي مختلف ممكن است با يكديگر تفاوت داشته باشد براي مثال موضوع در علوم كتابداري و اطلاع رساني در راهنماي! yahoo در بخش Social Science ودر راهنماي open Directory در بخش Social Science ودر راهنماي open Directory در بخش Refernce > Libraries آورده شده است بنابراين ، استفاده مناسب از قابليت مرور در راهنماهاي موضوعي تا حدود زيادي مستلزم داشتن آگاهي كافي از تقسيمات موضوعي دانش بشري است .