بخشی از مقاله
تكامل وب و مقايسهء ابزارهاي جستجو در اينترنت
چكيده
اين مقاله تكامل وب را در رابطه با وب و فناوريهاي بازيابي اطلاعات بررسي ميكند. در اين بررسي بين عناصر مختلف وب در زمينهء نمايهسازي و صفحات جستجوي وب وجه تمايز وجود دارد. ده ابزار اصلي و مهم وب براساس معيارهاي انتخاب و تعداد اتصالها با يكديگر مقايسه و ارزيابي شدهاند. ابزارهاي جستجو مانند راهنماها و موتورهاي جستجوگر نيز مورد بررسي و مقايسه قرار گرفتهاند.
كليدواژه : وب، راهنماهاي جستجوگر، موتورهاي جستجوگر
مقدمه
كلمه اينترنت مخفف "Interconnected Networks" و به معني شبكههاي بههممرتبط است. اينترنت سيستمي براي توزيع و تبادل اطلاعات در سطح جهان است كه براساس آخرين آمار موجود در حال حاضر 226 كشور به آن متصل هستند. اين مجموعه به همراه فناوريهاي ساده كاربردي، سبب كاهش هزينهء نشر الكترونيكي شده است (1).در هر صورت، وب يك عنصر منسجم و واضح مستقل نيست، بلكه دو عنصر مجزاي وب وجود دارند: وب قابلرويت و ديدني، و وب نامرئي و غيرقابل رويت(2).
براي فهم كاربرد اين دو عنصر و براي ارزيابي اطلاعات ضرورت دارد كه از موضوع خارج شويم و ببينيم چگونه صفحات وب توليد ميشوند.
دو نوع صفحهء وب وجود دارند: استاتيك و ديناميك.
صفحات وب استاتيك توسط طراح وب، در خدماتدهندهء وب نصب ميشوند و براي هر كس و هر چيزي كه وب سايت را مشاهده كند قابل دسترساندو هر تغييري هم بايد به صورت دستي انجام شود.
صفحات وب ديناميك توسط رايانه با بهكارگيري دستورهاي يك زبان دستنوشته(1) و اغلب «سيجيآيجاوا»(2)كه به عنوان پلي بين سرويسگرهاي پروتكل انتقال ابرمتن (3) و كاربران وب عمل ميكند، ايجاد مي شود.
دستورهاي يك زبان دستنوشته، نتايج را در يك صفحهء خالي وب جا ميدهند و به كاربر، صفحهء وب ديناميك را ارائه ميدهند. صفحات وب استاتيك اطلاعات عام و كلي را براي كاربر تهيه ميكند، در حالي كه صفحات وب ديناميك، اطلاعات منحصربهفرد را براي كاربر تهيه مينمايند. صفحات وب استاتيك براي همهء كاربران قابل رويتاند و در دسترس مي باشند.
صفحات وب ديناميك صفحات وب استاتيك
توسط رايانه توليد ميشوند دستي توليد ميشوند.
اطلاعات منحصربهفرد است اطلاعات عام و كلي است
قابل نمايهسازي نميباشند اكثر آنها قابل نمايهسازي هستند
اولين مطالعه در موسسه تحقيقاتي «انئيسي» در پرينستون آمريكا در دسامبر سال 1997 نشان داد كه صفحات وب قابل رويت، حداقل 320 ميليون صفحهء وب را شامل ميشوند، در حالي كه دومين مطالعه تخمين زد كه تعداد صفحات وب رشد كرده و به 800 ميليون صفحه در فوريه سال 1999 رسيدهاند. در هر صورت، اكثر ناشرين اطلاعاتشان را بر روي وب به وسيلهء پايگاههاي اطلاعاتي بزرگ توزيع ميكنند. اين اطلاعات اساسا جنبه تجاري دارد (2).
موتورهاي جستجوگر(4) و راهنماهاي وب
2. 1. راهنماهاي وب
چه تفاوتي بين راهنماي وب و موتور جستجو وجود دارد؟
راهنماي وب:
الف. فهرستي از سايتهاي وب كه از قبل تعيين شدهاند، ميباشد؛
ب. توسط ويراستاران جمعآوري شده؛
ج. براساس موضوع و عنوان طبقه بندي شده؛
د. انتخابي است.
با توجه به اين كه راهنماهاي وب توسط افراد جمعآوري ميشوند, تصميمگيري دربارهء كيفيت محتواي هر يك از سايتهاي وب قبلا انجام شده است. در نتيجه راهنماهاي وب در اينترنت بسيار مورد مراجعه قرار ميگيرند، زيرا كاربران به دنبال موضوعات خاصي در اينترنت هستند كه اين راهنماها، نقطهء شروع خوبي در تشخيص بهترينها در وب ميباشند.
در كاربرد راهنماهاي وب، كاربر ميتواند در بين فهرستهاي راهنما حركت نمايد. راهنماهاي اصلي وب همچنين اجازهء عبور از ديگر موتورهاي جستجو را هم ميدهند. مثلا بزرگترين راهنماي وب، يعني «ياهو»، اجازهء عبور از موتور هاي جستجوي ديگر را ميدهد.
سايتهاي وبي كه به وسيلهء راهنماي وب نمايهسازي شدهاند، به علت روند تكميل به صورت دستي، در آن راهنماها باقي ميمانند؛ مگر اين كه به احتمال بسيار ضعيف به صورت دستي حذف شوند. در حالي كه وجود دائمي يك ليست يا يك فهرست در موتور جستجو هميشه ضمانت نميشود، اما ساختن و حضور دائمي يك فهرست در يك راهنماي وب مثل «ياهو» امكانپذير ميباشد.
2. 2. موتورهاي جستجوگر
وقتي كه يك موتور جستجوگر را به كار ميبريد، كاربر، پايگاه اطلاعاتي سايتهاي وب را جستجو مينمايد. همه موتورهاي جستجوگر داراي سه جزء تركيبي هستند:
الف. «اسپايدرها»(5)كه سايتهاي وب را بررسي ميكنند،
ب. فهرستها و نمايه پايگاه اطلاعاتي؛
ج. نرمافزار بازيابي اطلاعات.
2 . 2 .1. اسپايدرهاي موتورهاي جستجوگر
پايگاه اطلاعاتي موتورهاي جستجوگر ابتدا توسط «اسپايدرها» ساخته ميشود و توسط موتورهاي جستجوگر به مأخذ اصلي اعزام ميشود.«اسپايدرها» برنامههايي هستند كه وب را به دنبال صفحات جديد وب جستجو مينمايند، كلمات را نمايهسازي ميكنند و اتصال را به صفحات برقرار مينمايند، سپس كلمات نمايهشده را با آدرسي كه به يك صفحهء وب يا هر منبعي كه بر روي وب جهاني و به طور كلي اينترنت قرار دارد اشاره مينمايد,(6) مقابله ميكنند.
2. 2 .2. نمايهء پايگاه اطلاعاتي موتور جستجو
اين بخش عنصر اصلي از هر موتور جستجو است. اين همان چيزي است كه كاربر به دنبال آن است. در طي سال 1998 تعدادي از توليدكنندگان موتورهاي جستجو آغاز به كار كردند. اين شركتها نمايهها را مطابق با معيارهاي گوناگون ساختند. بطور مثال مي توان از نمايهء «دايركت هيل» و «گوگل» (7) نام برد و نيز «نمايهء نامهاي حقيقي» (8) كه شركتها را قادر ميسازد واژههاي كليدي خود را براي حمايت از محصولات خود ثبت نمايند.
2 . 2 . 3 . نرمافزار بازيابي اطلاعات
تمامي موتورهاي جستجوگر، نرمافزار مختص به خود براي پاسخگويي به سوالات دارند.
موتورهاي جستجوگر مطابق با قوانين مشابه به شرح زير عمل مينمايند: هر سايت وب شامل كلمات يا واژههايي است كه سوءال كاربر را با آنها مقابله ميكند. و در صفحهء نمايش، به صورت فهرستوار نمايش ميدهد و با توجه به سوال كاربر و ارتباط موضوعي، فهرستي از مطالب را طبقهبندي مينمايد. تفاوت مختصري در چگونگي كار الگوريتمها بين موتورهاي جستجو وجود دارد، كه دليلي بر اين مدعااست كه كاربران، با يك پرسش واحد, از موتورهاي مختلف نتايج متفاوتي را كسب مينمايند. در هر صورت، دليل مهم ديگر اختلاف نتايج جستجو، نسبت پايين همپوشاني، در بين موتورهاي جستجوگر ميباشد.
3 . پورتالها
«پورتال»(9) ها سايتهاي وبي هستند كه خود عرضهكنندهء خدمت خاصي نيستند، ولي مراجعين را به صورت ساده و دوستانه به اطلاعات و سايتهاي موردعلاقهشان هدايت ميكنند. «پورتال» ها نقاط اصلي براي راهبردهاي تجارت الكترونيكي هستند و به تدريج از سال 1994 به وسيلهء سه نوع شركت اينترنتي به وجود آمدند. اين شركتها كه نقش اساسي در توزيع زنجيرهء اطلاعاتي براي كاربر ايفا ميكنند به شرح زير ميباشند:
الف. توليدكنندگان خدمات اينترنتي(10)
ب. سايتهاي جستجو(11)
ج. توليدكنندگان مرورگر(12)
سايت «اكسايت»(13) نمونهاي كه از يك سايت پورتال موفق است(1).
4. توسعه و تكامل فناوري جستجو
همهء ما تكامل زندگي بشر بر روي كره خاكي را به خاطر داريم. همانطور كه همگي ما ميدانيم، شكلهاي مختلف زندگي سلولي براي مدتهاي بسيار طولاني قبل از تكامل زيستي وجود داشته است. در هر صورت هنگامي كه به اين نقطه از تكامل دست يافتيم، تغييرات به فرم سازمانيافتهء آن در مدت زمان كمتري به انجام رسيد.
همين مطلب براي فناوري جستجوي وب نيز صادق است. با تاكيد بر روي پورتاليزيشن و تجارت الكترونيكي، اولين نسل سايتهاي جستجو، عملاً و به تدريج فراموش شدند و اين در حالي است كه آنها تا سالهاي متمادي، حكومت اصلي را به عهده داشتند؛ اما بدليل اين كه نتوانستند خودشان را با تغييرات محيطي وفق بدهند، فراموش گرديدند و انواع جديدي از توليدكنندگان جستجو به بهرهبرداري رسيدند.
4 .1. موتورهاي جستجوي ماورا
موتورهاي جستجوي ماورا(14) به كاربر اين امكان را ميدهند كه از ميان موتورهاي جستجوي متعدد و راهنماهاي وب به طور مقارن و همزمان، جستجو نمايد (2و3).
محبوبترين موتورهاي جستجوي ماورا به شرح زير ميباشند:
- Dogpile ( www.dogpile.com )
- Mamma ( www.mamma.com )
- 2Q ( www.2q.com )
- Infind ( www.infind.com )
- Insleuth ( www.isleuth.com )
- Surfy ( www.surfy.com )
- Webtaxi ( www.webtaxi.com )
4 .2. نسل اول موتورهاي جستجو كه توسط سايتهاي وب بصورت«اسپايدر», نمايهسازي را ايجاد كردند، انبوهي از واژهها و كلمات را تجزيه و تحليل نمودند. راهنماهاي وب به طور دستي گردآوري شدند و از آوريل 1998 مورد بهرهبرداري قرار گرفتند: يكي از اين راهنماها به نام «دايركت هيل»(15)يك حركت ريشه اي را آغاز كرد و اصلاحاتي انجام داد و روش خود را «راه سوم»(16) ناميد.
اين راهنماي وب ادعا ميكرد كه در زمان جستجو، كنترل با كاربر است و نتايج به صورت طبقهبندي شده بر روي سايت وب نمايان ميشوند. اين موتور جستجو، آنچنان كه ادعا ميكرد نتوانست خدمات منحصربهفردي را ارائه نمايد. بنابراين موتور جستجوي ديگري به نام «هاتبات»(17)به جاي آن توليد شد (2).