بخشی از پاورپوینت
اسلاید 1 :
موضوع ارائه :
Web spam
اسلاید 2 :
فهرست مطالب
مقدمه
تعریف اسپم
انواع اسپم
اسپم وب چیست
تاریخچه اسپم وب
دستهبندیهای اسپم وب
مقابله با اسپم وب
مسیر آینده
اسلاید 3 :
مقدمه
یکی از موانع عمده فعلی برای موتورهای جستجو در کمک به ارائهی خدمات کارامد تحت وب صفحات اسپم میباشد.
اسلاید 4 :
اسپم به معنای یک پیام الکترونیکی است که بدون درخواست گیرنده و برای افراد بیشماری فرستاده میشود.
تعریف اسپم
اسلاید 5 :
انواع اسپم
اسلاید 6 :
اسپم وب چیست
این اصطلاح به روشهایی گفته میشود که میزبانهای وب با تخریب الگوریتمهای رتبه بندی موتورهای جستجو سعی در افزایش رتبهی صفحات وب خود دارند.
تکنیکی است برای تغییر الگوریتمهای رتبهبندی موتوهای جستجو در وب.
اسلاید 7 :
تاریخچه اسپم وب
واژه spamming برای وب اولین بار در سال 1996 مطرح شد.
سابقهی اسپم وب تقریبا به اندازهی موتوهای جستجوی تجاریست.
اسلاید 8 :
دستهبندی اسپمهای وب :
اسپمهای مبتنی بر محتوا
اسپمهای مبتنی بر لینک
اسپمهای مبتنی بر پنهانسازی صفحه
اسلاید 9 :
اسپمهای مبتنی بر محتوا :
اسپمهای محتوا اولین و گستردهترین شکل اسپم وب هستند که به پنج دسته تقسیم میشوند :
اسپم بدنه
اسپم عنوان
اسپم فرا برچسپ
اسپم آدرس اینترنتی
اسپم متن
اسلاید 10 :
اسپمهای مبتنی بر لینک :
که این دسته از اسپمها شامل دو دسته میشوند :
اسپمهای لینک ورودی
اسپمهای لینک خروجی
اسلاید 11 :
اسپمهای مبتنی بر پنهانسازی صفحه :
در این روش اسپم وب محتوای متفاوتی نسبت به آنچه کاربر میبیند را برای موتورهای جستجو نمایش میدهد.
این دسته از اسپمها شامل دو دسته میشوند :
پنهان سازی
تغییرمسیر
اسلاید 12 :
مقابله با اسپم
اسپم وب برای کاربران موتور جستجو ناخوشایند و برای موتورهای جستجو مختل کننده است. بنابراین، بیشتر موتورهای جستجوی تجاری سعی در مقابله با اسپم وب دارند.
اسلاید 13 :
مقابله با اسپم وب توسط گوگل
الگوریتم پاندا
میزان ماندگاری در سایت
میزان گردش در سایت
میزان فرار از سایت
شبکه های اجتماعی
برندسازی اینترنتی
محتوای تکراری
عدم اعتبار مطالب
حجم بالای تبلیغات
وبسایت بلاک شده
محتوای ناچیز و بیکیفیت
محتوای نامرتبط با جستجو
حساسیت رفتاری پاندا
حساسیت محتوایی پاندا
مقابله با اسپم محتوا
اسلاید 14 :
مقابله با اسپم وب توسط گوگل
الگوریتم پنگوئن
کار الگوریتم پنگوئن شناسایی و جریمه و یا حذف وب سایتهایی است که اسپم میکنند و بعبارتی از تکنیکهای Black Hat SEO برای جذب کاربر استفاده میکنند.
مقابله با اسپم لینک
با روش توطئه لینکی (link schemes)
اسلاید 15 :
تشخیص صفحات اسپم وب
به کمک تکنیکهای داده کاوی
روش یادگیری ماشین :
روش جستجوی گرانشی:
الگوریتمهای
SVM
Naïve Bayesian
Neural network
ANN
NB
الگوریتمهای
گرانشی پیوسته
گرانشی باینری
اسلاید 16 :
در مسیرآینده
موتورهای جستجو همچون اسپمها بصورت قابل توجهی در حال پیشرفت و نفوذ به هوش بشر هستند. تمایز بین ویژگیهای محاسباتی در رتبهبندی و تشخیص اسپم وجود دارد و مرز مابین رتبهبندی و سرکوب اسپمها بعنوان موتورهای جستجو تکامل مییابند.