بخشی از پاورپوینت

--- پاورپوینت شامل تصاویر میباشد ----

اسلاید 1 :

  • درخت تصميم
  • شبکه عصبي
  • HITS
  • Page Rank
  • کاربردهاي وب کاوی
  • Googleو وب و کاوی
  • Ebay و وب و کاوی
  • نتيجه گيري
  • فهرست منابع
  •  
  •  
  •  
  •  
  • مقدمه
  • مشکلات کاربران در استفاده ازوب
  • Web Mining
  • مراحل وب کاوي
  • وب کاوي و زمينه هاي تحقيقاتي مرتبط
  • وب کاوي و داده کاوي
  • تفاوت وب کاوي و داده کاوي
  • وب کاوي و يادگيري ماشين
  • انواع وب کاوي
  • چالش هاي وب کاوي
  • انواع الگوریتم های وب کاوی

اسلاید 2 :

  • . وب، محيطي وسيع، متنوع و پويا است که کاربران متعدد اسناد خود را در آن منتشر مي کنند. در حال حاضر بيش از دو بيليون صفحه در وب موجود است و اين تعداد با نرخ 7.3 ميليون صفحه در روز افزايش مي يابد.
  •  
  • با توجه به حجم وسيع اطلاعات در وب، مديريت آن با ابزارهاي سنتي تقريبا غير ممکن است و ابزارها و روش هايي نو براي مديريت آن مورد نياز است.
  •  
  • با توسعه سيستم هاي اطلاعاتي، داده به يکي از منابع پراهميت سازمان ها مبدل گشته است. بنابراين روش ها و تکنيک هايي براي دستيابي کارا به داده، اشتراک داده، استخراج اطلاعات از داده و استفاده از اين اطلاعات، مورد نياز مي باشد.

اسلاید 3 :

  • يافتن اطلاعات مورد نياز در وب دشوار مي باشد و کاربران معمولا از موتورهاي جستجو که مهمترين و رايج ترين ابزار براي يافتن اطلاعات در وب مي باشند، استفاده ميکنند.
  •  
  • اما موتورهاي جستجو داراي دو مشکل اصلي هستند.

vدقت موتورهاي جستجو پايين است، چراکه اين موتورها در پاسخ به يک پرس و جوي کاربر صدها يا هزاران سند را بازيابي مي کنند .

vميزان فراخوان اين موتورها کم مي باشد، به آن معني که قادر به بازيابي کليه اسناد مرتبط با نياز اطلاعاتي کاربر نيستند. چرا که حجم اسناد در وب بسيار زياد است و موتورهاي جستجو قادر به نگهداري اطلاعات کليه اسناد وب، در پايگاه داده هاي خود نمي باشند .

اسلاید 4 :

  • ايجاد دانش جديد با استفاده از اطلاعات موجود در وب
  • بتوان داده هاي فراوان موجود در وب را به دانشي قابل استفاده تبديل کرد، به طوري که يافتن اطلاعات مورد نياز در آن به سادگي صورت بگيرد .
  • خصوصي سازي اطلاعات

براي اين منظور با توجه به خواسته ها و تمايلات کاربران متفاوت، نحوه ارائه اطلاعات به آنها بايد سفارشي گردد.

تکنيک هاي وب کاوي قادر به حل اين مشکلات مي باشند

اسلاید 5 :

  • وب کاوي، فرآيند کشف اطلاعات و دانش ناشناخته و مفيد از داده هاي وب مي باشد.
  •  
  • وب کاوي به کارگيري تکنيک هاي داده

کاويبراي کشف و استخراج خودکار

 اطلاعات از اسناد و سرويس هاي

وب مي باشد.
 

اسلاید 6 :

üپيدا کردن منبع

اين مرحله شامل بازيابي اسناد وب مورد نظر مي باشد

در مرحله اول داده ها از منابع موجود در وب مانند خبرنامه هاي الکترونيکي، گروه هاي خبري، اسناد HTML، پايگاه داده هاي متني و ... بازيابي مي شوند.

üانتخاب اطلاعات و پيش پردازش

در اين مرحله به صورت خودکار اطلاعات خاصي از اسناد بازيابي شده، انتخاب و پيش پردازش مي شوند.

اين پيش پردازش مي تواند کاهش کلمات به ريشه آنها، حذف کلمات زائد، پيدا کردن عبارات موجود در متن و تبديل بازنمايي داده ها به قالب رابطه اي يا منطق مرتبه اول باشد.

اسلاید 7 :

 

üتعميم

در اين مرحله به صورت خودکار الگوهاي عام در يک يا چندين سايت وب کشف مي شود
در این مرحله از تکنيک هاي داده کاوي و يادگيري ماشين براي تعميم استفاده مي شود.

ü

üتحليل

در اين مرحله الگوهاي به دست آمده در مرحله قبل اعتبار سنجي و تفسير مي شوند

کاربران نقش مهمي در فرآيند تحليل ايفا مي کنند.

اسلاید 8 :

  • وب کاوي با زمينه هاي مختلف تحقيقاتي علوم کامپيوتر همچون
  • داده کاوي،
  • پايگاه داده،
  • بازيابي اطلاعات،
  • هوش مصنوعي،
  • يادگيري ماشين،
  • پردازش زبان طبيعي،
  • استخراج اطلاعات،
  • انبار داده ها،
  • طراحي واسط کاربر و ... در ارتباط تنگاتنگ است.

اسلاید 9 :

  • وب کاوي و داده کاوي ارتباط بسيار نزديکي با يکديگر دارند.
  •  
  • داده کاوي فرآيند ارائه پرس­وجوها و استخراج الگوها و اطلاعات مفيد و ناشناخته از داده هايي است که معمولا در پايگاه داده ها ذخيره شده اند.
  •  
  • بسياري از تکنيک هاي داده کاوي قابل استفاده در وب کاوي هستند.
  •  
  • حوزه وب کاوي وسيع تر از داده کاوي است .

اسلاید 10 :

  • در وب دو نوع داده اصلي براي کاوش مورد استفاده قرار مي گيرند.
  •  

نوع اول، اطلاعات ساختاري وب است که منظور از آن پيوندهاي بين صفحات وب مي باشد.

نوع دوم نيز، اطلاعات مربوط به نحوه استفاده کاربران از وب است. در واقع تحليل رفتار کاربر در استفاده از وب، ترجيحات و علايق وي درباره نوع و قالب اطلاعات، ... بخش مهمي از وب کاوي است.

در داده کاوي اين دو نوع از داده وجود ندارند .

در متن اصلی پاورپوینت به هم ریختگی وجود ندارد. برای مطالعه بیشتر پاورپوینت آن را خریداری کنید