بخشی از مقاله
چکیده
امروزه وب یک منبع مهم بازیابی اطلاعات است و کاربران در حال دسترسی به وب دارای زمینه های متفاوتی هستند. بررسی رفتارهای کاربران در وب، به عنوان روشی جهت کشف دانش نهفته در نحوه تعامل کاربران با وب، یکی از ابزارهای مهم در حوزه کاوش در وب شناخته می شود. با شناسایی رفتار کاربران می توان در مواردی مانند تبلیغات هدفمند، موتورهای جستجو و ... نتایج مطلوبی را به کاربران ارائه داد. بنابراین، تحلیل رفتار کاوشی کاربران وب و مدل کردن رفتار آنها اهمیت خاصی پیدا کرده است.
در این مقاله روشی جهت مدلسازی رفتار حرکتی کاربران وب ارائه می نماییم که از تکنیک خوشهبندی و کشف الگوهای ترتیبی استفاده میکنیم. در این الگوریتم نمایههای کاربرانی که دارای رفتارهای حرکتی مشابهی هستند را خوشهبندی میکنیم. سپس برای مدل سازی رفتار حرکتی کاربران، از نشستهای کاربران هر خوشه با استفاده از مدل مارکوف با همه مرتبه 4، الگوهای ترتیبی را استخراج می نماییم. الگوهای ترتیبی صفحاتی که توسط کاربر دیده شدهاند را به همان ترتیب دیدهشدن آنها در نظر میگیرد.
این مدلسازی که بهوسیله مدل مارکوف با همه مرتبهها از مرتبه بالاتر بر روی خوشه کاربران انجام شده، به طوری که توانسته است کاربرانی که رفتار حرکتی مشابه دارند را مدل کند، میتواند تحلیل دقیقتری از رفتار کاربران را با استفاده از نشستهای همگنتر و محدودتری را تولید کند.
-1 مقدمه
یکی از تکنیک های کاوش در وب، کاربرد کاوی وب است که به عنوان استخراج الگوهایی با معنی از فایل ثبت وب شناخته میشود و از فایلهای ثبت در وب سرور برای استخراج الگوهای رفتاری کاربر در سایت استفاده می کنند
تشخیص و شناخت علایق کاربران میتواند براساس دانش بهدست آمده از علایق کاربران پیشین سایت باشد. بهطور معمول، نمایههای کاربری که از دادههای فایل ثبت وب استخراج میشوند، علایق کاربران آن سایت را بیان میکنند. شناسایی رفتار کاربران موجب فراهم نمودن محتوای سفارشی شده، بهبود کیفیت و تحویل سرویس های اطلاعاتی به کاربران وب می شود و در نتیجه با علاقهی کاربر تطبیق بیشتری خواهد داشت
اخیرا تکنیک های کاربرد کاوی وب به طور گسترده برای کشف الگوهای حرکتی کاربران و مدلسازی رفتارهای حرکتی کاربران سایت بکار برده می شوند. کشف الگوهای ترتیبی، کاوش قوانین انجمنی و خوشه بندی، الگوهای دسترسی مختلفی را از ثبت های وب کشف میکنند که میتواند برای پیشنهاد دادن سرویس های شخصی شده وب به کاربران استفاده شود. با داشتن یک مجموعه از تراکنشها، تکنیکهای متنوع کشف دانش بدون ناظر میتوانند برای استخراج الگوها بهکار روند
در کاوش استفاده از وب، الگوهای ترتیبی برای یافتن الگوهای پیمایش کاربران که در نشستهای آنها مکررا ظاهر میشوند، مورد استفاده قرار میگیرند. این الگوها صفحاتی که توسط کاربر دیده شدهاند را به همان ترتیب دیدهشدن آنها در نظر میگیرد. مدلهای مارکوف، روشی برای کشف الگوهای ترتیبی و یک مدل ریاضی قوی برای مطالعه و درک فرآیندهای تصادفی1 هستند که برای مدلسازی رفتار پیمایشی کاربر بر روی وبسایت خوب عمل میکنند. این مدل سازی براساس احتمال انتقال بین صفحات وب است که در نشست های کاربران ذخیره شده است. در زمینه کاربردکاوی وب و کارهای انجام شده در زمیته تحلیل رفتار کاربران می توان به کارهایی مانند زیر اشاره کرد:
در این مقاله نشست کاربر به صورت یک بردار دودویی نسبت داده می شود که حضور یا عدم حضور یک صفحه را در یک نشست نشان می دهد. همچنین معیار شباهت جدیدی ارائه شده است که هم URL صفحات و هم ساختار سایت در آن لحاظ می شود. همچنین، برای ارزیابی خوشه بندی از فاصله بین خوشه ها و فاصله درون خوشه ها استفاده کرده است
ژانگ و لی، بیان کرده اند که تکنیک های آماری به دنبال ارتباطات نهفته بین اشیای هم رخداد میگردند و معروف ترین آنها روش LSA2 است. از جمله کارهای صورت گرفته در این مقاله براساس این روش، در زمینه مدل سازی کاربر است. در این کار پس از سه مرحله، نمایه کاربران ساخته می شود. مرحله اول تشخیص داده های کاربردی نام دارد. اگر وب سایت، شامل n صفحه باشد که m کاربر در طول یک بازه زمانی معین از آن دیدن کرده اند، P که شامل کل صفحات دیده شده در این بازه است و مجموعه نشست های کاربران - s - به صورت P={p1, p2'…' Sn} , s={s1,s2 '…'Vm} si={ - p1,ai1 - , - p2,ai2 - , - pn,ain - } نشان داده میشوند، که aij وزن pj در si است. در نتیجه، کل داده های نشست کاربران را میتوان به صورت یک ماتریس نشست- مشاهده صفحه یعنی spm*n={aij} نشان داد.
در مرحله دوم نشست های کاربران براساس الگوریتمLUI 3 خوشه بندی میشوند و در مرحله سوم نمایه کاربران از روی خوشههای بدست آمده ساخته می شود. برای این کار مرکز هر خوشه از طریق بردار میانگین آن محاسبه می شود و در نهایت نمایه کاربر به صورت برداری از مشاهده صفحات و وزن آها نمایش داده میشود. نتایج حاصل از کار این واقعیت را می رساند که تکنیک های مبتنی بر LSA نقش موثری در بهبود مدل کاربر در مقایسه با کلمات کلیدی دارند
پندی و همکاران، یک مدل یکپارچه از مدل مارکوف با خوشهبندی برای پیشبینی دسترسی به صفحه وب ارائه نموده اند. در این مدل، نشستهای حاصل از دادهی پردازششده به خوشههای معنیداری تقسیمبندی میشوند و سپس خوشهها بهعنوان مجموعه آموزش بهکار میروند. انگیزه اساسی پشت خوشهبندیها، گروهبندی نشستهای مربوط به هم، براساس سرویسهای وب درخواست شده به جهت بهبود در دقت مدل مارکوف است. سپس هر خوشه به داده اولیه برگردانده میشود و مدل مارکوف مرتبه 2 را بر روی هر خوشه ایجاد کرده تا نتایج خوشهها را پیشبینی کند
ماکر و رادی، رویکردی با استفاده از تحلیل رفتار کاربران، به منظور پیشواکشی، پیشبینی و افزایش عملکرد وب سرور که از پیشپردازش فایل ثبت استفاده میکند، ارائه دادهاند. در این رویکرد، با استفاده از سه تکنیک، خوشهبندی، مدل مارکوف و قوانین انجمنی، صفحهای که دقت پیشبینی بالایی دارد، پیشنهاد میشود. بدین ترتیب که پس از مرحله پیشپردازش و شناسایی نشستها، نشستهای وب به وسیله الگوریتم خوشهبندی و اندازهگیری شباهت خوشهبندی میشوند.
هر مجموعه داده در خوشهای متفاوت گروهبندی میشود. سپس مدل مارکوف، نتایج خوشهها را پیشبینی میکند. در صورت وجود ابهام، قوانین انجمنی برای ارائه نتیجه دقیق اعمال میشود
گیریجا و کاویتا، یک مدل ترکیبی جهت بهبود پیشبینی صفحه وب ارائه کرده اند. هدف اصلی این مقاله، بهینهسازی کارایی مدل مارکوف با استفاده از الگوریتم طبقهبندی کنندهای بهنام K-NN4 است.

