بخشی از مقاله
مباحثي عميق تر در باب جستجو در اينترنت
اگر چه مبحث جستجو در اينترنت از نظر مفهومي ساده به نظر مي رسد، اما در عمل به وسعت و پيچيدگي شبكه اينترنت، مسائل و معضلات خاص خود را به همراه دارد. اگاهي از اين مسائل براي كساني كه به طور جدي خواهان استفاده از اينترنت هستند (يعني مثلا مي خواهند براي خود وب سايتي را – حقوقي يا حقيقي- نصب و از آن به عنوان يك ابزار قوي اطلاع رساني استفاده كنند)
واقعا لازم است. امروزه ديگر فقط حضور داشتن در اينترنت و نصب يك وب سايت اطلاعات كافي نيست بلكه بايد سعي كرد به طور فعالانه مخاطبين و يا در حقيقت بازديدكنندگان بيشتري را به وب سايت خود جذب نمود. ارائه اطلاعات در اينترنت تنها زماني مفيد است كه كاربران و جستجوگران و محققان اينترنت از وجود اين اطلاعات، اگاه، و حاضر باشند وقت و منابع كامپيوتري خود را صرف بازديد از وب سايت حاوي آن اطلاعات نمايند. روشهاي گوناگون ارتقاء وب سايت در شبكه اينترنت مساله اي است كه هم اكنون ذهن و قواي بسياري از متخصصين اينترنت را مشغول كرده است زيرا امروزه ديگر در اين مورد كه اينترنت يك رسانه بسيار قوي اطلاع رساني است ترديدي وجود ندارد
بلكه مساله اصلي، آن است كه چگونه مي توان با ايجاد استراتژيهاي موثرتر براي انجام جستجوهاي بهينه و سريع، اطلاعات موجود در وب سايتها را به بهترين نحو ارائه داد. يك شركت، دانشگاه، تاجر، محقق، كتابخانه، خطاط و يا نمايشگاه به راحتي مي تواند با صرف هزينه اي مشخص وب سايتي براي خود طرح و در اينترنت نصب نموده و ظرفيت هاي خدماتي و توليداتي خود را معرفي كند اما چگونه مي تواند مطمئن باشد كه تمام مخاطبيني كه ممكن است اين وب سايت برايشان جالب باشد از وجود آن آگاهي پيدا كرده و از آن بازديد به عمل مي آورند و در نهايت خدمات آنها را بر مي گزينند؟ اهميت اين سئوال هنگامي روشن مي شود كه انبوه وب سايتهاي متنوع و رقيب دراينترنت را به خاطر بياوريم.
در چنين بازار آشفته اي كه هيچ معياري براي ارزيابي جز سليقه شخصي بر آن حكمفرما نيست، لازم است هر كس كه مي خواهد به نحوي نامش در اينترنت مطرح شود نكات و راهنمايي هاي تكنيكي و منطقي خاصي را به كار بندد تا تلاش او براي عرضه اطلاعات بي نتيجه نماند و بهترين بازدهي را برايش داشته باشد.
گرافيستي را در نظر بگيريد كه براي خود يك وب سايت طرح و در اينترنت نصب كرده باشد. اين وب سايت ممكن است شامل نمونه هايي از كار خود، اطلاعات تماس، تخصص هاي ويژه و مسائل مربوط ديگر باشد. آنچه براي اين گرافيست اهميت دارد اين است كه، كسي که به دنبال خدمات گرافيكي مي گردد بتواند زودتر به وب سايت او برسد. به عبارت ديگر و عملي تر، هنگامي كه كسي عبارتي چون "خدمات گرافيكي" را به ماشين جستجوگر معتبي چون Alta Vista يا Lycos وارد مي كند، سايت وي در فهرست نتايج حتما موجود باشد تا بدين ترتيب، جوينده بتواند آن را مشاهده و انتخاب كند.
پس در واقع دو عامل اصلي در اجراي موثرتر و بهتر جستجوها دخيل هستند: اول ساختار خود ماشين جستجوگر (يعني اينكه اصولا نرم افزار آن چگونه كار مي كند و كدام سايتها را برمي گزيند.) و ديگري خود وب سايت، و اينكه از چه اصولي بايد پيروي كند تا در جستجوها مطرح شود و ترجيحا با يك رتبه بالا معرفي گردد.
ماشين جستجو گر چگونه كار مي كند؟
ماشين جستجوگر در حقيقت يك بانك اطلاعات از منابعي است كه طي يك فرآيند كاوشگرانه اتوماتيك از اينترنت استخراج شده اند. اين بانك، از طريق پرسشهاي كاربران قابل جستجو است؛ بدين ترتيب كه كلمات يا عباراتي كه كاربر در ناحيه مخصوص جستجو (Search Box) وارد مي كند با منابعي از بانك اطلاعات كه حاوي آن عبارات يا كلمات هستند تطبيق داده مي شوند. سپس اين منابع بر اساس ربطي كه با پرسش كاربر مي توانند داشته باشد مرتب و ارائه مي شوند؛ به طوري كه سايت هايي كه احتمال داده مي شود ربط بيشتري دارند در ابتداي فهرست نتايج ظاهر مي شوند. به عبارت ساده تر، پس از آن كه ماشين جستجوگر با استفاده از عبارات وارد شده، سايت هايي را از بانك اطلاعات خود بازيابي نمود، اين سايت ها را بر اساس یك الگوريتم خاص –كه مربوط بودن آن سايت را به عبارت كاربر تخمين مي زند- مرتب كرده و در قالب فهرست نتايج به كاربر باز مي گرداند. اما بايد توجه كرد كه رويه ها و عواملي كه اين رتبه بندي را تعيين مي كنند معمولا جزو اسرار شركت ها هستند و در نتيجه معمولا مشكل مي توان فهميد كه دقيقا چرا يك سايت در فهرست نتايج برتر ظاهر مي شود.
پيش بيني ربط
عواملي كه براي پيش بيني مربوط بودن يك سايت با عبارت جستجوي كاربر استفاده مي شود را مي توان به طور كلي به دو قسمت تقسيم كرد: عوامل دروني (يعني عواملي كه مربوط به صفحه وب مي شوند) و عوامل بيروني (يا عواملي كه خارج از صفحه وب هستند)
عوامل دروني
• فراواني كلمات در سند موجود؛ يعني فهرستي از تمام كلماتي كه در سند به كار رفته اند و ميزان فراواني هر كلمه در سند.
• محل كلمات مورد جستجو در سند؛ يعني اينكه كلمات كليدي و تعريف كننده در عنوان (title)، سرتيتر (heading)، پاورقي (footer) و ... آمده اند يا خير.
• خوشه بندي رابطه اي (Relation Clustering)؛ يعني اينكه چند صفحه از اين سايت حاوي كلمات مورد جستجو هستند.
• طرح HTML سند؛ چگونگي فريم ها و لينك ها، سرعت انتقال، Metatags و ALT.
عوامل بيروني
هر ماشين جستجوگر از الگوريتم خاص خود با انديس بندي و امتياز دادن به صفحات وب استفاده مي كند و سعي مي كند كه با بهبود بخشيدن به اين فرمول، به جستجوگران، مربوط ترين نتايج را بازگرداند. در اين راستا عوامل مطرح شده ارزيابي مي شوند و با يكديگر تركيب مي شوند تا بهترين فرمول براي بازيافت بهترين نتايج پيدا شود. كساني كه تمايل دارند وب سايت آنها در زمره 20 سايت اولي كه يك ماشين بر ميگرداند باشد بايد با دقت اين عوامل را بررسي نمايند.
• محبوبيت لينكي: هر چه لينك هاي بيشتري به يك سايت نشانه رفته باشند بدين معني است كه محبوبيت آن سايت بيشتر و در نتيجه رتبه آن بالاتر است.
• محبوبيت كليكي: سايت هايي كه به لحاظ تعداد دفعات و مدت زمان بيشتر مورد بازديد عموم قرار گرفته باشند از محبوبيت بيشتر و در نتيجه رتبه بالاتري برخوردار هستند.
• محبوبيت گروهي: با ردگيري مسيرهاي كليك قشرهاي خاص جامعه مشخص مي شود كه كدام گروه ها بيشتر از اين سايت بازديد مي كنند و در نتيجه رتبه سايت براي گروه هاي مورد جستجو كننده مختلف، متفاوت است.
• پيوندهاي بازرگاني ميان شركتهاي خدماتي: يعني سايتهايي كه مربوط به شركاي بازرگاني و يا خدمات خاصي باشند رتبه هاي بالاتري دارند.
• امكان كسب جايگاه در ازاي پول: بعضي ماشين هاي جستجوگر مي پذيرند كه در ازاي دريافت وجهي مشخص، سايت را در مرتبه بالاتري قرار دهند.
• اسم URL: برخي ماشين هاي جستجوگر سايتي را كه URL آن حاوي كلمات كليدي مورد جستجو باشد را رتبه بالاتري مي دهند.
محتويات ماشين جستجوگر
محتويات يك ماشين جستجوگر در واقع همان بانك اطلاعات آن است. اما اين بانك اطلاعات چگونه تشكيل مي شود؟ ماشين هاي مختلف از روشها و تكنولوژيهاي مختلفي استفاده مي كنند و اين باعث مي شود كه اگر يك عبارت جستجو را در دو ماشين مختلف وارد كنيم با دو نتيجه متفاوت رو به رو بشويم. اين مساله ناشي از تفاوت در برنامه ريزي نرم افزارهايي است كه ماشين هاي جستجوگر براي گزينش و بازيابي اطلاعات از آنها استفاده مي كنند.
اما به طور كلي همه ماشين هاي جستجوگر از سه قسمت مجزا تشكيل شده اند:
قسمت اول «عنكبوت» (spider) نام دارد. عنكبوت نرم افزاري است كه يك صفحه وب را ملاقات مي كند، آن را مي خواند و لينك هاي به صفحات ديگر را دنبال مي كند. به اين كار اصطلاحا كاوش مي گويند. عنكبوت به طور منظم، مثلا هر ماه يا دو ماه يكبار مجددا به سايتها و فضاي وب سر مي زند. به عنكبوتها، كاوشگر و روبات نيز مي گويند. اين روبات ها مثل تمام بازديدكنندگان ديگر در «كارنامه دسترسي» سايت ثبت مي شوند (بدين معني كه روبات از آن سايت ديدن كرده است). بر طبق همين كارنامه است كه مي توان متوجه شد يك ماشين جستجوگر از سايت بازديد كرده است يا خير.
البته بايد توجه كرد كه عنكبوتها نيز اسامي خاص خودشان را دارند و در اينجا، فهرست كوتاهي از اسامي عنكبوتهاي معروف ترين ماشين ها ذكر گرديده است. با مشاهده اين اسامي در كارنامه دسترسي وب سايت، مي توان فهميد كه آيا ماشين جستجوگر، آن وب سايت را تا به حال بازديد كرده است يا خير.
AltaVista Scooter
HotBot Slurp
Netscape Mozilla
InfoSeek Infoseek Sidewinder /0.9
WebCrawler Robot libwww /5.0
در سايت Market ware (با آدرس www.marketware.com) ابزاري عرضه شده كه براي تحليل كارنامه دسترسي و گرفتن اطلاعاتي كامل تر در مورد بازديد عنكبوتها از يك محل، قابل استفاده است. با اين ابزار حتي مي توان فهميد كه جويندگان از كدام كلمات كليدي براي جستجوهاي خود استفاده مي كنند.
هر چند كه از نظر طراحان و صاحبان وب سايت، عنكبوت مهم ترين قسمت ماشين جستجو گر است، اما هر ماشين دو قسمت اصلي ديگر نيز دارد:
تمام اطلاعاتي كه عنكبوت مي يابد وارد قسمت دوم ماشين جستجوگر، يعني انديس (index) مي شود. انديس يا كاتالوگ مثل كتاب بزرگي است كه صفحات آن كپي همان صفحه- وب هايي است كه عنكبوت بازديد كرده. اگر صفحه وبي عوض شود، اين كتاب نيز تغيير مي كند.
بعضي وقتها بين زمان يافت شدن يك صفحه توسط عنكبوت و اضافه شدن آن به انديس، فاصله اي مي افتد. به عبارت ديگر، ممكن است عنكبوت از يك صفحه بازديد كرده باشد، اما هنوز آن صفحه به انديس وارد نشده باشد. تا زماني كه صفحه به انديس نرفته باشد، مورد جستجو و بازيابي قرار نخواهد گرفت.
سومين قسمت ماشين، نرم افزار جستجوگر آن است. اين برنامه قادر است ميليونها صفحه اي كه در انديس وجود دارد را گشته و موارد هماهنگ با كلمات جستجو را بيابد و آنها را بر اساس موارد هماهنگ با كلمات جستجو را بيابد و آنها را بر اساس الگوريتم خاص خود، رتبه بندي نمايد.
وجوه تمايز ماشين هاي جستجوگر
دو عامل مهمي كه كيفيت يك ماشين را تعيين مي كنند، «وسعت» و «عمق» جستجو هستند:
وسعت: منظور از وسعت، محدوده جغرافيايي اينترنت است كه مورد جستجو قرار مي گيرد. به طور كلي سه رده جغرافيايي براي جستجو وجود دارد : 1- سرورهايي كه در كشور مبدا ماشين جستجوگر وجود دارند. 2-سرورهايي از تمام قاره 3-سرورهايي از تمام دنيا
عمق: منظور از عمق ماشين اين است كه چه مقدار از سايت بازيابي شده در اختيار كاربر قرار مي گيرد. اين موضوع مي تواند چند سطح به ترتيب زير از حداقل تا حداكثر را در بر بگيرد:
• فقط URL (http://...)
• عنوان (title)
• سر تيتر اول
• اولين 200 كلمه ابتدايي
• متن كامل سند
• متن كامل به همراه برخي از لينك هاي اتصالي آن
• متن كامل به همراه تمام لينك هاي اتصالي آن
جستجو بر اساس موقعيت كلمه در سند
برخي ماشين ها به جوينده اين امكان را مي دهند كه محل مورد جستجو در سند درخواستي را تعيين كند. اين ويژگي بسيار مفيدي است زيرا از يك طرف به كارگيري صحيح آن باعث مي شود كه نتايج متمركزتر و مربوط تري بازيافت شود و از طرف ديگر، تهيه كنندگان صفحه وب مي توانند با جاسازي دقيق كلمات كليدي، احتمال بازيابي صفحه وب خود را افزايش دهند. به عنوان مثال، با محدود كردن جستجو به اسنادي كه عبارت مورد جستجو را در عنوان (title) خود دارند يقينا نتايج بهتري عايد شما خواهد شد.
هر سند از اجزايي تشكيل شده كه هر كدام مي توانند به عنوان محل جستجو مورد استفاده قرار بگيرند. البته بايد دقت كرد، زيرا هر ماشين جستجوگر روش خاص خود را براي انجام جستجو دارد و ممكن است همه اين اجزا اساسا قابل جستجو نباشد. اجزا تشكيل دهنده سند عبارتند از:
- URL
- عنوان
- قلمرو يا كشور
- سرور اينترنتي
- لينك
- تصوير
با توجه به اين توضيحات، مي توانيد جستجويي را آغاز كنيد كه در آن عبارت «lit» در URL آن قيد شده باشد. چنين جستجويي ممكن است وب سايتي با آدرس www.literary.com را برگرداند يا مي توانيد جستجوهايي را انجام دهيد كه قلمرو يا كشور وب سايت را قيد كرده باشد مثلا سايتهاي كه مربوط به كشور انگلستان هستند، قلمرو آنها .uk است. با توجه به اين امر، به صاحبان وب سايت ها توصيه مي شود كه حتي المقدور اسامي و عناوين مربوط و با مسمايي براي وب سايت خود برگزينند.
از ديگر امكاناتي كه ماشين هاي جستجوگر مختلف ارائه مي دهند، امكان محدود كردن جستجو بنابر «تاريخ سند» است. اين امكان براي كساني كه به دنبال جديدترين اخبار، پيرامون موضوعي خاص يا اخبار مربوط به زماني مشخص هستند بسيار مفيد است. اما بايد به مفهوم «تاريخ» دقت كرد، زيرا تاريخي كه در يك سند وب مشاهده مي شود ممكن است يكي از چند معني زير را داشته باشد:
- تاريخي كه آن سند ساخته شده
- تاريخي كه در سرور قرار گرفته
- آخرين باري كه تغيير داده شده
- تاريخي كه به بانك اطلاعات ماشين جستجوگر اضافه شده
جستجو بر اساس نوع فايل
در بعضي ماشين هاي جستجوگر اين امكان وجود دارد كه جستجو بر اساس نوع فايل يا رسانه پايه ريزي شود. اين بدين معني است كه جوينده مي تواند نوع فايل درخواستي خود را در بدو جستجو مشخص كند. فايل هاي مختلفي در اينترنت وجود دارند كه از جمله رايج ترين آنها عبارتند از:
- تصاوير (فايلهايي با پسوند jpg، gif و ...)
- فايلهاي صوتي و تصويري
- فايلهاي MP3
- آكروبات
- جاوا
روشهاي ارائه نتايج
نحوه ارائه فهرست نتايج و نوع اطلاعات داده شده در آن، در هر ماشين، شكل خاص خود را دارد، اما اغلب ماشين ها به كاربر اين امكان را مي دهند كه نحوه ارائه نتايج را تا حدي كنترل كنند تا بتوانند آن را حتي المقدور به شكل مطلوب خود مشاهده كنند. اين كنترل به طرق زير انجام پذير است:
دسته بندي نتايج
برخي ماشين ها براي آنكه بتوانند تعداد بيشتري وب سايت در فهرست نتيجه نشان دهند، تمام صفحات مربوط به يك سايت را تحت يك عنوان، جمع كرده و فقط يكي از آنها را نشان مي دهند. براي مشاهده بقيه صفحات مربوط به آن سايت معمولا لينكي تحت عنوان More from this site وجود دارد كه با كليك روي آن ظاهر مي شوند.
بازيابي از ساير صفحات مشابه
در بعضي ماشين ها مي توان صفحات شبيه به صفحات موجود در فهرست نتايج را بازيابي كرد. براي اين منظور، معمولا لينكي تحت عنوان More like this وجود دارد كه با كليك روي آن، صفحات مشابه ديگر ظاهر خواهند شد.
جستجو در فهرست نتايج
"Search Within these results" يك ويژگي براي متمركز كردن فهرست نتايج است. با اين ويژگي، مي توان جستجوي دومي را درون فهرست نتجه اي كه حاصل جستجوي اول بوده، انجام داد.
فرض كنيد جوينده اي عبارتي چون "modern art" را وارد يك ماشين جستجوگر كرده باشد. چنين عبارتي كه بسيار كلي است ممكن است چند ميليون سايت در فهرست نتايج معرفي نمايد. با استفاده از امكان فوق، مي توان اين فهرست وسيع را كوچك تر نمود. وارد كردن يك عبارت جستجوي ديگر، مثلا Ancdy" Warhol" يا "France" باعث مي شود تمام سايت هاي بازيابي شده از جستجوي اول براي يافتن اين كلمات مورد جستجو قرار بگيرند.
توصيف سايت هاي پيدا شده
با توجه به افزايش حجم اطلاعات در اينترنت، يك بررسي اجمالي و كوتاه سايت، قبل از ورود به آن مي تواند در صرفه جويي در وقت و رسيدن به اطلاعات صحيح بسيار مفيد باشد. معمولا در فهرست نتايج فقط چند كلمه اول سايتهاي بازيافت شده نمايش داده مي شوند و به سختي مي توان كيفيت و ارزش يك سايت را از اين چند كلمه فهميد. لذا بسياري از ماشين هاي جستجوگر اين امكان را به جويندگان مي دهند كه ميزان توصيفات سايت ها را به اختيار خود تنظيم كنند، كه البته چنين امري روي تعداد سايت هايي كه در هر صفحه از فهرست نتايج قابل ارائه هستند تاثير خواهد گذاشت.
نحوه رتبه بندي اسناد وب توسط ماشين هاي جستجوگر
معمولا در فهرست نتايجي كه در پايان جستجو ارائه مي شود، تعدادي وب سايت كاملا بي ربط به موضوع وجود خواهد داشت و اين تعداد شايد كم هم نباشد. اما اين مساله، كاملا هم تقصير ماشين جستجوگر نيست. فرض كنيد وارد كتابخانه اي بشويد و از كتابدار بخواهيد كتابهاي مربوط به مسافرت را به شما معرفي كند
. طبيعي است كه او عكس العمل جالبي نخواهد داشت، و بايد در نظر گرفت كه ماشين جستجوگر، برخلاف كتابدار قادر نيست با چند سئوال، محدوده جستجو را مشخص تر سازد، اگرچه امروزه عوامل هوشمند در اين راه نيز قدم گذاشته اند اما در حال حاضر فقط چند قاعده از پيش تعيين شده وجود دارد كه به نكات اصلي آنها در بالا اشاره شد و در ادامه به توضيح دقيق تر اين نكات مي پردازيم.
راههاي هل دادن صفحه وب به رده هاي بالاتر
اين موضوع هميشه ذهن صاحبان وب سايت را مشغول كرده كه جويندگان معمولا فقط 10 سايت اولي را از زير نظر مي گذرانند و غالبا ميان همان 10 سايت اول يكي را برمي گزينند بنابراين همه مي خواهند جزو 10 سايت اول باشند، زيرا گرفتن رتبه 11 به بالا بدين معني است كه وب سايت در صفحه اول فهرست نتايج، نمايش داده نمي شود و از نظرها دور مي ماند.
در اين ميان، كلمات كليدي از اهميت بسيار حياتي برخوردارند. ماشين هاي جستجوگر تاكيد بسياري روي «محل» و «دفعات تكرار» اين كلمات دارد. پس لازم است كه صاحبان و طراحان وب بر اين موضوع تاملي كنند تا بتوانند رتبه اي كه نمايانگر ارزش واقعي سايت شان باشد را به دست آورند.
انتخاب كلمات كليدي مهم
فكر مي كنيد جويندگان، چگونه به دنبال صفحه وب شما مي گردند؟ كلماتي را كه تصور مي كنيد آنها وارد ناحيه جستجو مي كنند، كلمات كليدي استراتژيك شما هستند
معمولا كلمات كليدي استراتژيك بايد بيشتر از دو كلمه باشند، زيرا صفحات وب بسيار زيادي هستند كه فقط در حد يك يا دو كلمه قابل تعريف هستند و همه اين صفحات، رقيب صفحه شما محسوب مي شوند. هر چقدر رقابت بيشتر باشد طبيعتا احتمال موفقيت در ماشين جستجوگر كمتر مي شود اما با انتخاب كلمات كليدي طولاني تر و مشخص تر، مي توان ضريب اين احتمال را افزايش داد.
مكان و تكرار كلمات كليدي- دو عامل اصلي
به طور كلي مي توان گفت كه قاعده اصلي براي تعيين رتبه يك صفحه، مكان و ميزان تكرار كلمات كليدي آن است.
در مثال كتابدار، همان طور كه منطقي به نظر مي رسد كه او براي آوردن كتابي در مورد «مسافرت» در مرحله اول به كتابهايي مراجعه كند كه لغت «مسافرت» يا «سفر» در عنوان آن به كار رفته باشد، يك ماشين جستجوگر هم معمولا ابتدا عنوان (title) يك سند را چك مي كند، با اين فرض كه عنواني كه حاوي عبارت جستجو باشد، حتما به نوعي مربوط تر به خواسته جوينده است. در مرحله بعدي، خطوط اول صفحه و سرتيتر آن (heading) مورد جستجو قرار مي گيرند. در اينجا فرض بر اين است كه اگر سندي مربوط به عبارت جستجو باشد، از همان ابتداي صفحه آن را مطرح مي كتد.
يكي از دلايل اصلي پايين بودن رتبه صفحات در عين مربوط و موجه بودن آنها اين است كه اين صفحات، كلمات كليدي استراتژيك را در عنوان صفحه به كار نبرده اند. به جرات مي توان گفت كه عنوان صفحه، مهمترين محل براي جادادن كلمات كليدي است. ماشين هاي جستجوگر عموما صفحاتي را ترجيح مي دهند كه كلمات كليدي در قسمتهاي اول يا بالاي آن ظاهر شده باشند. بنابراين، فقط درج كلمات كليدي در عنوان كافي نيست و حتي الامكان بايد آنها را در سر تيتر (heading) و پاراگرافهاي اول صفحه نيز شامل كرد. در برخي سايت ها با عناوين بزرگي روبه رو مي شويم كه فرمت گرافيكي دارند، اين گونه صفحات اگر چه ظاهري جذاب دارند ولي ماشين جستجوگر قادر به خواندن گرافيك نيست.
ميزان تكرار، عامل اصلي ديگري است كه چگونگي رتبه بندي از نظر ماشين جستجوگر را تعيين مي كند. يك ماشين جستجوگر، صفحه وب را تحليل مي كند تا دريابد كلمات كليدي نسبت به كلمات ديگر چه مقدار تكرار مي شوند، و صفحاتي كه كلمات كليدي در آنها بيشتر شده باشند، مربوط تر فرض مي شوند. به عنوان يك اصل كلي، بايد سعي كنيد كه تا حد ممكن، از متون HTML استفاده كنيد. به علاوه بايد مطمئن شويد كه متن HTML قابل رويت باشد. برخي طراحان سعي مي كنند با تكرار بيش از حد كلمات كليدي با يك قلم بسيار ريز و يا همرنگ با رنگ زمينه، مشاين جستجوگر را فريب دهند اما امروزه ماشين ها به اين گونه شگردها هوشيار شده اند و مي توانند در برابر آنها واكنش نشان دهند به طوري كه اگر متني در مرورگر، قابل رويت نباشد به احتمال قوي توسط ماشين جستجوگر انديس نمي شود.
محبوبيت لينكي
ماشين جستجوگر Excite، جستجوهاي مفهومي بسيار قدرتمندي انجام مي دهد. Excite، سايتي را كه لينك هاي بيشتري به آن اشاره مي كنند را رتبه بالاتري مي دهد، زيرا فرض مي كند صفحه اي كه داراي لينك هاي زيادي است و افراد متعددي با آن پيوند برقرار كرده اند، احتمالا از اعتبار بيشتري برخوردار خواهد بود.
اندازه گيري محبوبيت صفحه
یک راه خوب برای پی بردن به محبوبیت یک سایت این است که با استفاده ماشین های جستجوگر، لینک های پیوند داده شده را پی گیری کنیم، بدین ترتیب معلوم می شود که ماشین جستجوگر آن سایت را تا چه اندازه محبوب و پر طرفدار می داند و این عاملی است که می تواند در رتبه بندی سایت بسیار موثر باشد. در ماشین های متفاوت، دستورات مختلفی برای این موضوع به کار می رود به عنوان مثال در ماشین های AltaVista و InfoSeek هر دو از طریق یک دستور صفحات متصل به صفحه مورد نظر را بر می گردانند.
در قسمت جستجو باید نام حوزه (domain) را بدون عبارت www پس از کلمه link: وارد کنید:
Link: yourdomain.com
این دستور تمام صفحاتی را که حاوی لینک هایی به نام حوزه مورد نظر شما هستند را برمی گرداند.
منابع دیگر برای تعیین محبوبیت لینکی
در سایت www.linkpopularity.com یک سرویس رایگان برای محاسبه آسان و تقریبی محبوبیت لینکی وجود دارد. کافی است اسم حوزه را وارد کنید و گزارشی از لینک های متصل به آن حوزه را تحویل بگیرید.
لينك هاي HTML
طراحان صفحات وب معمولا در صفحه شروع سايت وب خود لينك هايي قرار مي دهند كه به صفحات دروني سايت پيوند داده شده اند. اگر اين لينك ها به صورت تصوير باشند، ماشين هاي ناآشنا با لينك هاي تصويري طبيعتا نخواهند توانست به سايت وارد شوند و اين مساله به ضرر صاحب سايت تمام مي شود زيرا اغلب صفحات مفيد (ومربوط به كلمات مورد جستجو) درون سايت قرار دارند نه صفحه شروع. راه حل مشكل،اضافه كردن لينك با استفاده از زبان HTML است. اين راه حل مي تواند براي بازديدكنندگان غير روباتيك و انسانها نيز مفيد واقع شود. لينك ها را مي توان در پايين صفحه گذاشت و ماشين ها حتما آنها را پيدا و دنبال مي كنند.
يك راه حل جامع تر آن است كه يك صفحه از نقشه سايت (site map page) با لينك هاي منتهي به تمام صفحات وب سايت خود درست كرده و به ماشين جستجوگر مورد نظر ارسال نماييد. چنين صفحه اي مي تواند به يافتن صفحات شما توسط ماشين كمك زيادي بكند.
احتياط در مورد فريم
بعضي از بزرگترين ماشين هاي جستجوگر قادر به دنبال كردن لينك فريم ها نيستند. با طراحي دقيق و استفاده از Metatags سعي كنيد راههاي ديگري به جز فريم را براي وارد شدن به سايت خود در اختيار بازديدكنندگان قرار دهيد.
متا تگ ها (Metatags)
يكي ديگر از عناصري كه بسياري از طراحان وب به اشتباه مي پندارند كليد موفقيت و راهي مطمئن براي اخذ رتبه هاي بالا در ماشين جستجوگر است، Metatags مي باشد. قبل از هر چيز، بهتر است اين نكته را متذكر شويم كه Metatags يك راه حل معجزه آسا نيست! و حداكثر مي توان گفت كه روش مفيدي براي كنترل خلاصه (Summary) وب سايت شما در بعضي از ماشين هاي جستجوگر است. استفاده از كلمات كليدي در اين برچسب ها بدون شك تا حدودي باعث ارتقاء صفحه وب از نظر برخي ماشين ها مانند Hotbot و Infoseek است،
اما بايد در نظر گرفت كه نه تنها ماشين Lycos به آنها اصلا اعتنا نمي كند بلكه موارد و نمونه هاي زيادي از صفحات وب وجود دارند كه به رتبه هاي بالا دسترسي پيدا كرده اند بدون آنكه از Metatags استفاده اي بكنند. به عبارت واضح تر، اگر چه استفاده صحيح از Metatags بي تاثير در رتبه صفحه وب نيست، اما اتكاء به آن به تنهايي كافي نيست و نبايد آن را به منزله «عنصر جادويي» براي ارتقاء صفحه وب پنداشت.
بايد توجه داشت كه ماشين هاي جستجوگر غالبا صفحاتي را كه با استفاده نادرست از Metatags سعي مي كنند به رتبه هاي بالايي دست پيدا كنند امتياز منفي مي دهند و گاهي حتي از انديس خود حذف مي كنند.
در يكي از ساده ترين و رايج ترين حقه ها، كلمه اي را كه نقش كليدي دارد به طور بي ربط و بي معني چند بار در صفحه تكرار مي كنند. يا در حقه اي ديگر، عباراتي محبوب اما بي ربط (نظير اسامي ستارگان سينما و قهرمانان ورزشي) را در Metatags اضافه مي كنند.
هر چند اين ترفندها در كوتاه مدت ممكن است جواب دهد و افراد بيشتري را جذب صفحه وب نمايد اما چون يك افزايش كاذب است در دراز مدت نه تنها تاثير مثبت نخواهد داشت بلكه با دادن امتياز منفي به آن صفحه و يا حذف مطلق آن از انديس كاشين هاي جستجوگر، نتيجه منفي به بار خواهد آورد.
دو Metatag اصلي
چند نوع Metatag وجود دارد اما از نظر انديش شدن توسط ماشين جستجوگر، دو Metatag وصفي و كليدي از همه مهمتر هستند.
Metattag وصفي: توصيفي كوتاه از صفحه شما را به طور خلاصه ارائه مي دهد. اين توصيف، جايگزين خلاصه اي مي شود كه ماشين جستجوگر طي روند كاوش تهيه مي كند.
Metatag كليدي: كلمات كليدي مربوط به صفحه شما را براي ماشين جستجوگر تعيين مي كند.
در زير نمونه كدنويسي يك سايت مربوط به اطلاعات تمبر و استفاده از Metatag را مشاهده مي كنيد:
<HEAD>
<TITLE> My World </TITLE>
<META name = "description" content = "Every thing you wanted to know about stamps, from prices to history.">
<META name = "keywords" content = "stamps, stamp collecting, stamp history, prices, stamps for sale">
</HEAD>
حروف بزرگ و كوچك در ماشين هاي جستجوگر
برخي از ماشين ها نسبت به حروف بزرگ حساس بوده و در نتيجه جستجو با عبارت مثلا "Game" نتايج متفاوتي از جستجو با عبارت "game" باز مي گرداند. اين مساله به ويژه هنگام طرح Metatagهاي وصفي و كليدي مطرح مي شود و چاره اي كه بسياري از مردم در پيش گرفته اند اين است كه تا حد امكان تمام اشكال متفاوت يك عبارت را با توجه به حروف بزرگ و كوچك در Metatag خود بگنجانند.
اما اين روش يك اشكال عمده دارد و آن اين است كه تكرارهاي فراوان يك لغت ممكن است ماشين جستجوگر را به اشتباه به اين فكر بيندازد كه سايت، مي خواسته آن را فريب دهد و در نتيجه مانع از انديس شدن آن بشود. اين مساله هنگامي حاد مي شود كه با چند كلمه سروكار داشته باشيم در اين صورت به راحتي مي توان مجسم كرد كه ماشين با چه فهرست عظيم تكراري روبه رو خواهد شد.
و اگر بخواهيم موضوع جمع و مفرد را نيز در نظر بگيريم قضيه از اين هم پيچيده تر مي شود. راه حل چيست؟ با توجه به اينكه فقط دو ماشين جستجوگر وجود دارد كه چند درصد ميان حروف بزرگ و كوچك تمايز قائل مي شود و اصولا كاربران، عبارات جستجو را با حروف كوچك وارد مي كنند، توصيه مي شود كه فقط از حروف كوچك براي تعيين كلمات كليدي استفاده كنيد.
نكته ديگر آن است كه گر چه اسامي خاص به لحاظ دستور زبان بايد با حروف بزرگ شروع شوند اما عموما مردم به هنگام جستجو به اين قاعده توجه نمي كنند.
رمز عبور یا ثبت نام در سایت
سایت هایی که برای ورود به آنها نیاز به «رمز عبور» یا « ثبت نام» باشد، ماشین های جستجوگر را متوقف می کنند. Crawlerها یا همان روبات ها (که وظیفه شکار کلمات و تحویل آنها به سیستم بانک اطلاعات ماشین جستجوگر را دارد) نمی تواند هیچ نوع فرمی را پر کند. اگر برای رسیدن به صفحه بعد باید فرمی را پر کنیم، روبات همانجا متوقف شده و برمیگردد. اگر می خواهید درباره کاربران یا اعضاء سایت خود اطلاعاتی را جمع آوری کنید و همچنین مایلید صفحاتتان ایندکس بشوند، عملیات ثبت نام را به صورت اختیاری عرضه کنید.
استفاده از صفحه شروع
حتما از صفحه شروع یا چیزی معادل آن استفاده کنید. صفحه ای که به عنوان یک مرکز ناوبری یا دروازه ورود به سایت شما عمل کند و صفحات دیگر به آن اشاره داشته باشند. به عنوان یک قاعده کلی، نباید بیشتر از سه کلیک صرف شود تا از هر صفحه ای در یک سایت به هر صفحه دیگری در همان سایت برویم.
متن درون تصاویر و فایل های چندرسانه ای
متن درون تصاویر و همچنین نوشته هایی که در فایل های چندرسانه ای (یعنی صوتی/ تصویری) ظاهر می شوند نمی توانند ایندکس شوند ولی خود این فایل ها در قسمت MP3/Audio و Video قابل ایندکس هستند.
آموزش جستجو در شبکه اینترنت
شما چگونه در اینترنت جستجو (Search) میکنید ؟
احتمالا به یک سایت جستجو همچون گوگل وارد می شوید ، عبارت مورد نظر را وارد می کنید و با فشردن دکمه، کار تمام است. بله این راه اشتباه نیست اما اگر بخواهید دانش بهینه سازی یا SEO را بیاموزید بهتر است روش درست جستجو را بیاموزید.
راهنمای جستجو در اینترنت:
اینترنت بیش از 10 میلیون دامنه و 9 میلیارد صفحه (تخمینی) را شامل می شود.
تقریبا هر عبارتی را که در یک موتور جستجو وارد کنیم نتیجه هایی را در بر دارد. حتی اگر اشتباه تایپی داشته باشیم! و خیلی طبیعی است اگر برای جستجوی یک عبارت، چند میلیون نتیجه ظاهر شود. در زیر به روشهایی برای بدست آوردن بهترین نتایج اشاره شده:
مبانی و اصول اولیه جستجو در وب
1- کلمات کلیدی:
برای پیدا کردن هر صفحه،وب سایت یا هر مطلبی نیاز به تایپ کلید واژههایی است. انتخاب کلید واژههای مناسب به شما کمک خواهد کرد به سرعت به نتیجه دلخواه خود برسید. اما این کلمات کلیدی را چگونه انتخاب کنیم؟بهترین کلماتی که میتوانید به عنوان کلمات کلیدی به کار برید واژهها و نامهای تخصصی یک حوزه علمی یا مبحث است.
معمولا اینگونه کلمات در عنوان و یا متن مقالات و یا صفحات وب سایتها بکار میروند.هر چقدر این کلمات تخصصیتر باشند نتایج جستجو به درخواست شما نزدیکتر خواهد بود. دقت داشته باشید که گوگل به طور خودکار از جستجوی کلمات بسیار رایج مثل a ، for و how صرف نظر می کند. همچنین نوشتن کلمات با حروف بزرگ یا کوچک با یکدیگر فرقی نمی کنند.
در صورتی که بدنبال مبحثی میگردید که چندان تخصصی نیست و یا واژههای بکار گرفته در آن جنبه عمومی دارد میتوانید کلماتی که احتمالا در عنوان مطالب یا صفحات بکار میرود را انتخاب کنید حتی به صورت پیشرفته تر میتوانید یک جمله را که احیانا عنوان مقاله است را به صورت کامل انتخاب و برای جستجو وارد کنید. به خاطر داشته باشید که استفاده از واژگان رایج مثل ضمایر ، افعال و... چه در زبان فارسی و چه در زبان انگلیسی نمی تواند بعنوان یک واژه کلیدی مهم به حساب آید چرا که استفاده از آنها آنقدر زیاد است که دیگر تاثیری در جستجو ندارد.
2- نحوه ورود کلمات کلیدی و استفاده از عملگرها:
در صورتی که تنها مایلید یک کلمه را جستجو کنید نیازی به استفاده از عملگرها ندارید اما معمولا برای حصول نتیجه دلخواه نیاز به انتخاب و جستجوی چند واژه به صورت همزمان است.ساده ترین راه برای جستجوی چند واژه، ورود همه آنها ولی با فاصله ای بین کلمات است برای نمونه با جستجوی عبارت WORD1 WORD2 صفحات یا متونی که در بخشی از آنها کلمات WORD1 و WORD2 استفاده شده باشد در نتیجه جستجو ظاهر خواهد شد.
توجه کنید که در این حالت کلمات میتواند در هر جای صفحه باشند و حتما در کنار هم نیستند. همانطور که در بالا اشاره شد ورود کلمات با فاصله و در کنار هم یک روش ساده و مناسب برای جستجوی صفحاتی است که کلمات کلیدی مورد نظر در آنها باشد. اما زمانی نیاز است که واژه ها عیناً و به همان ترتیبی که نوشته شده اند جستجو شوند برای نمونه میخواهید یک جمله را جستجو کنید یا بدنبال اطلاعات فیلمی مثل (Terminator 3) و یا حتی در جستجوی نام شخصی هستید در این حالت میتوانید با استفاده از امکانات موتورهای نتایج دقیقتری را کسب کنید.
برای جستجوی دقیق چند کلمه کلیدی میبایست آنها را در بین کوتیشن قرار دهید برای نمونه "Terminator 3" ، "X Men" ، "what is computer" ،"persian weblogs" ، "صادق هدایت" و ... در موارد بالا صفحات سایتهایی در نتیجه جستجو ظاهر خواهند شد که کلمات بالا دقیقاً و به همان ترتیب بین کوتیشنها در متن آنها آمده باشد.
3- استفاده از عملگرهای منطقی برای جستجو در وب:
جستجو در اینترنت یک فن است و افراد موفق در این زمینه کسانی هستند که نهایت توانایی جستجوگر مورد علاقه خود را بدانند. یکی از قابلیتهای جستجوگرهای پیشرفته امکان استفاده از عملگرهای منطقی در عبارت جستجو است. استفاده از این عملگرها علاوه بر اینکه فهم آن برای کاربران فارسی زبان راحتتر است استفاده از آن در بین کلمات فارسی نیز راحت تر است.
عملگر و و یا + و یا AND با استفاده از این عملگرها و استفاده از آن در کنار دو واژه میتوانید برای جستجوگر تعیین کنید که به دنبال صفحاتی بگردد که دو واژه فوق در آنها باشد (در واقع واژه اول و واژه دوم در محتوای صفحات باشند) .
در صورتی که واژه ها را با فاصله و کنار هم بنویسد نیز نتیجه ای مشابه با استفاده از این عملگر خواهید داشت.بنابراین معمولا نیازی به استفاده از این عملگر نمی باشد. مانند iran+culture ، iran and culture ، iran culture و یا فرهنگ و ایران ، فرهنگ ایران عملگر یا ویا | ویا ORبا استفاده از این عملگرها و استفاده از آن در کنار دو واژه میتوانید برای جستجوگر تعیین کنید که به دنبال صفحاتی بگردد که یکی از دو واژه فوق در آنها باشد (در واقع واژه اول یـا واژه دوم در محتوای صفحات باشند) .
مانند iran | iranian و یا iran or iranian و یا ایران یا ایرانیان عملگر ونه ویا ANDNOTاستفاده از این عملگر به شما توانایی جستجوی صفحات وبی را میدهد که در آن یک واژه مشخص باشد اما محتوای آن صفحه شامل یک واژه بخصوص نباشد.(در واقع واژه اول باشد اما واژه دوم نباشد). مانند iran andnot farsi ویا ایران و نه فارسی. نکته ای که باید به آن توجه داشته باشید اینست: در صورتی که مایلید جملهای را جستجو کنید که در آنها کلمات و یا حروف عملگرهای منطقی آمده است مانند AND و یا و نه ,... و میخواهید که این کلمات عیناً جستجو شوند و نه به عنوان عملگر در جستجو تاثیر داشته باشند میتوانید عبارت خود را داخل کوتیشن قرار دهید برای مثال در عبارت (Iran And iranian , IRAN AND IRANIAN ) یک نتیجه را خواهند داد.
اگر قصد جستجوی یک عبارت خاص را دارید باید این عبارت در دابل کوتیشن یعنی "" قرار بگیرد. مثلاً اگر می خواهید عبارت classic music را جستجو کنید این عنوان به صورت "classic music" خواهد بود.
4- فیلتر کردن یک عبارت خاص:
خیلی طبیعی است که شما بخواهید یک دسته از نتایج را حذف کنید. این کار زمانی به درد میخورد که شما بدانید یک عبارت نا مطلوب ممکن است شما را از نتایج مورد انتظار دور کند. در چنین مواقعی کلمه نامطلوب را با عملگر - بکار ببرید. بله با یک علامت «منها» صفحه های حاوی آن عبارت از نتایج جستجو حذف می شوند.
برای مثال اگر با رشته زیر به دنبال مقاله ای در زمینه تحلیل سیستمها می گردید که فاقد مطالب مهندسی برق باشند بسیاری از مطالب تحلیل سیستمها در زمینه مهندسی الکترونیک را به عنوان نتیجه بدست خواهید آورد که مطلوب نیستند.
"مهندسی صنایع" +"تحلیل سیستمها" -"الکترونیک"
به این ترتیب تنها صفحاتی نشان داده میشوند که حاوی عبارت مهندسی صنایع به صورت کنار هم و همچنین عبارت تحلیل سیستمها باز هم درکنار هم باشند ولی فاقد عبارت الکترونیک هستند.
نتایج در این حالت صدها برابر محدود تر و بسیار دقیقتر خواهد بود.
اگر به دنبال فایل خاصی هستید چه باید بکنید ؟
ممکن است شما به دنبال نوع خاصی از فایل باشید. مثلا یک سند WORD با پسوند DOC. و یا فایلهای PDF. در این حالت بایستی نوع فایل مورد نظر را به کمک این عبارت به موتور جستجو معرفی نمایید.
عبارت مورد جستجو filetype:ppt مشاهده می کنید که پسوند فایل مورد نظر را پس از عبارت مورد نظر درج می کنیم. انواع پسوند های معتبر عبارتند از :
DOC. یا فایلهای Word
PPT. یا فایلهای پاور پوینت
XLS. یا فایلهای نرم افزار اکسل مایکروسافت
PDF. یا فایلهای مقاله (مستقل از فونت) که با نرم افزار آکروبات قابل مشاهده هستند.
فایلهای دیگری همچون TXT. یا RTF. نیز که هر دو متن هستند توسط بزخی موتورهای جستجو قابل گزینش اند.
معرفی مهمترین موتورهای جستجو در اینترنت
تنوع موضوعات در شبکه اینترنت و توسعه روزافزون حجم اطلاعات و ایستگاههای مختلف سبب پدید آمدن موتورهای جستجوی مختلفی شده است که هر یک از آنها به کمک امکانات نرم افزار کاوش خود سعی دارد اطلاعات دقیق تری را در اختیار کاربران قرار دهد. لیکن باید توجه داشت پوشش موضوعی هیچیک از این نرم افزارها کامل نیست و به همین دلیل نیز برای دریافت اطلاعات بهتر و کاملتر لازم است از چند موتور کاوش برای جستجوی منابع مورد نیاز، بهره برد. در ذیل به چند نمونه از موتورهای جستجو اشاره شده: