بخشی از مقاله
چکیده :
امروزه با توسعه سریع اینترنت و رشد ﻋﻈﯿﻢ صفحات وب، بسیاري از وبسایت هاي الکترونیکی به منظور هدایت کاربران به محصولات مورد نیازشان، از سیستمهاي پیشنهاد دهنده محصول استفاده میکنند. چنین سیستمهایی معمولا براي کاربر یک لیست از آیتم هاي پیشنهادي را که ممکن است کاربر آنها را ترجیح دهد فراهم می کنند. در این مقاله یک سیستم پیشنهاد دهنده محصول مبتنی بر فیلترینگ مشارکت محور ارائه شده است که از خوشهبندي ژنتیک به منظور بهبود مجموعه پیشنهادي محصولات پیشنهادي استفاده میکند. در ابتدا با استفاده از پیش پردازش به حذف داده هاي غیرضروري می پردازیم و امتیاز کاربران را پردازش می کنیم. سپس با استفاده از خوشه بندي ژنتیک، کاربرانی که شباهت بیشتري به یکدیگر دارند را در یک خوشه قرار میدهیم. در مرحله بعدي با استفاده از ضریب همسبتگی پیرسون و فاصله اقلیدسی به اندازه گیري شباهت کاربر تازه وارد با خوشه می پردازیم و لیستی از پیشنهادات را ارائه می کنیم. نتایج آزمایشگاهی نشان میدهد که الگوریتم پیشنهادي، در پیشنهاد صفحات به کاربران، دقت و فراخوانی بالایی دارد. این موضوع اهمیت خوشهبندي ژنتیک را نشان میدهد که امکان همپوشانی خوشهها را فراهم میکند.
کلید واژه: پیشنهاد دهنده محصول، خوشه بندي ژنتیک، همبستگی پیرسون، فاصله اقلیدسی.
.1 مقدمه
در سالیان اخیر گسترش روزافزون اینترنت، سازمان ها و مشتریان را به بهره گیري از خدمات تجارت الکترونیکی1 متمایل ساخته و سهولت برقراري تعاملات مجازي سبب ترویج و رونق فرآیند خرید و فروش برخط میان مشتریان شده است. در فضاي رقابتی کسب و کارهاي برخط ، ابقا یا حفظ مشتریان از محورهاي مهمی است که در تدوین برنامه هاي حوزة مدیریت ارتباطبا مشتري2 مد نظر مدیران قرار می گیرد. زیرا حفظ مشتریان سازمان می تواند به مراتب از به دست آوردن مشتریان جدید دشوارتر باشد. از طرفی دیگر زمانیکه مشتریان براي خرید محصولات و خدمات خود به وب گاه هاي تجارت الکترونیک مانند فروشگاه هایی نظیر eBay یا amazon مراجعه می کنند ، براي هر آیتم با تعداد زیادي برند و مدل هاي متفاوت رو به رو می شوند.
با چنین حجم بالایی از اطلاعات ، آنها بدون داشتن اطلاعات مورد نیازشان قادر به تصمیم گیري صحیح نیستند ؛ پس اگر در انتخاب محصول مطمئن نباشند ، با سرریز اطلاعات رو به رو می شوند.[1,3] سیستم هاي پیشنهاد دهنده محصول یکی از نمونه هاي اصلی سیستم هاي شخصی سازي وب هستند. این سیستم ها به کاربران در پیمایش وب ، بافتن اطلاعات مفید و مناسب ونیز دریافت پیشنهادهاي پوبا راجع به محصولات و سرویس هاي در یک وب سایت کمک می کنند. هدف سیستم هاي پیشنهاد دهنده وب هدایت کاربران به سمت صفحاتی است که به بهترین وجه نیاز ها و علایق آنها را برآورده سازد. در حال حاضر صفحات به صورتی طراحی میشوند که تنها توسطانسان خوانده شوند.
در این تحقیق بر آنیم تا با بهره گیري از مجموعه اي از روش هاي داده کاوي 3 و الگوریتم هاي هوش مصنوعی مدلی براي توسعه یک سیستم پیشنهاددهندة محصول به مشتریان یک خرده فروشی برخط با قابلیت یادگیري ارائه نماییم. با استناد به چارچوب پیشنهادي مدل، نخست مشتریان با تکیه بر الگوریتم ژنتیک4 که در قسمت تابع تناسب5 آن از رویکرد بخش بندي مبتنی بر ارزشطول عمر و با لحاظ کردن نسبی ترجیحات، بر اساس مشخصه 6RFM و همچنین داده هاي جمعیتی 7 - سن، شهر، جنسیت و ... - استفاده شده است، خوشه بندي 8 می شوند. سپس با بهره گیري از ساختار پیشنهاددهی دومرحله اي پیشنهادهاي گونا گون به هر یک از مشتریان هدف ارائه می شود.
.2 کارهاي گذشته
در مقاله - - M. rizvi, 2015 از داده هاي جستجو شده تاریخی براي پیدا کردن کلمات کلیدي جستجو و صفحات مرتبط کاربران استفاده میشود. تمامی فعالیت هاي کلیکی کاربر مانند تعداد دفعاتی که بازدید کرده، زمانی که به دیدن یک آیتم پرداخته، حرکات ماوس وي و چندین متغییر دیگر در پایگاه داده ذخیره میشود. سیستم پیشنهادي از این پایگاه داده استفاده می کند و به فرآیندها امتیاز میدهد.در مقاله - - Wang, J., 2015 یک روش جدید مبتنی بر تکرار، تازگی و پولی براي توصیه گر تجارت همگانی با دسترسی زمان واقعی ارائه شده است. در این مقاله از مشخصات کاربران استفاده نشده است و از روش ضمنی بدون سوال و پاسخ به کاربران در سیستم امتیاز دهی RFM بهره گرفته شده است.
روي چِنگ و همکارانش - - Cheng, R., 2016، یک سیستم پیشنهاد دهنده موزیک مبتنی بر فیلترینگ مشارکت محور ارائه کرده اند. ایده اصلی این مقاله برخلاف روش هاي قبل که فقط از علایق کاربر استفاده می کردند، بدین ترتیب است که با استخراج ویژگی هاي یک آهنگ از قبیل موضوع، نوع ساز و ... و ترکیب آن با علایق کاربر، محصولاتی را پیشنهاد میدهد. در واقع در این روش ویژگی ها و شخصیت کاربران با ویژگی هاي صوتی از آهنگ ترکیب شده و بااستفاده از ماشین بردار پشتیبان پیشنهاداتی به کاربران داده میشود.در مقاله - Wei, S., 2016 - یک سیستم توصیه گر فیلم با ترکیب تگ و رتبه بندي ارائه شده است. ترکیب این دو تکنیک منجر به تولید یک سیستم توصیه گر فیلم دقیق تري شده است. براي این منظور از مجموعه داده MovieLens استفاده شده است. الگوریتم پیشنهادي از قرار زیر است:
1.در ابتدا، یک شبکه اجتماعی فیلم و مدل اولویت- موضوع ساخته میشود.
2.سپس به استخراج، نرمال سازي و جمع آوري تگ هاي شبکه اجتماعی با توجه به اولویت کاربر میپردازیم.
3.در نهایت با تجزیه شخصیت فرد و نمره دهی به این شخصیت، بهترین تگ براي وي انتخاب شده و پیشنهاد میشود.
در - Mitra, A., 2016 - یک سیستم پیشنهاد دهنده محصول مبتنی بر تجزیه و تحلیل خرید محصول ارائه کرده اند. در واقع در این روش، زمانی که یک کاربر خریدي را انجام میدهد، آن خرید براي پیش بینی خرید بعدي کاربر استفاده میشود چرا که تکرار در خریدمعمولا رخ میدهد.در - Pan, W., 2016 - یک سیستم توصیه گر مبتنی بر فیلترینگ مشارکت محور و محتوا ارائه شده است. ترکیب این دو تکنیک منجر به تولید یک سیستم توص یه گر فیلم دقیق تري شده است. براي این منظور از مجموعه داده MovieLens استفاده شده است. نکته اي که در این مقاله وجود دارد این است که فیلترینگ مبتنی بر محتواي آنبا شبکه عصبی مصنوعی ترکیب شده است.
ریاز و همکارش - - Riyaz, P. A., & Varghese, S. M ., 2016مقاله اي تحت عنوان سیستم پیشنهاد دهنده محصول مقیاس پذیر با استفاده از فیلترینگ مشارکت محور مبتنی بر مجموعه داده بزرگ هادوپ ارائه کرده اند. با توجه به گسترده بودن اینترنت و مقیاس بالاي آن و از طرفی حجم درخواست هاي کاربران، نیاز به تجزیه و تحلیل فراوانی نیاز است که د ر این مقاله به این مساله پرداخته شده است. براي مقابله با این مشکلات، ریاز و همکارانش یک سیستم پیشنهاد دهنده محصول مبتنی بر داده بزرگ هادوپ ارائه کرده اند. این سیستم بر روي مجموعه داده آمازون ارزیابی شده است.یکی از روش هایی که در سیستم هاي پیشنهاد دهنده محصول میتواند بسیار موثر باشد، استفاده از تکنیکی به منظور اندازه گیري شباهت کالاي مورد علاقه کاربران با کالاهاي تاکنون دیده نشده توسط آن ها می باشد.
دانگ و همکارانش - - Dong, R., 2016 مقاله اي ارائه کرده اند که از ویژگی هاي قابل استخراج از کالاها و دیگر عناصر توصیفی آن ها به منظور اندازه گیري شباهت کالاهاي مورد علاقهکاربران با کالاهاي تاکنون دیده نشده توسط آن ها، استفاده می کنند. در این روش ، متون توصیفی خام و اولیه کالا ها با استفاده از تجزیه و تحلیل گیرهاي bi-gram و unigram به عنوان ورودي سیستم تزریق می شوند. سپس با خصیصه هاي ادراکی از محصولات - براي مثال براي یک دوربین میتواند کیفیت لنز - ترکیب می شود . سپس شباهت بین کالاي درخواستی با کالاهاي تاکنون دیده نشده سنجیده می شود ویک نمره اي اختصاص داده می شود. در نهایت محصول به کاربر پیشنهاد میگردد. این سیستم بر روي مجموعه داده آمازون مورد ارزیابی قرار گرفته است.
کاپلی و همکارانش - - Kuppili, V., 2016 یک سیستم مبتنی بر واریانس به منظور ارائه پیشنهاد محصول ارائه کرده اند. در این مقاله، اطلاعات مفیدي از یک محصلول موفق در فروش استخراج می شود و سپس به کاربرانی که یک نمره بالا به یک محصول داده اند و شباهت به این محصول دارد، پیشنهاد میشود. در واقع امتیازي که توسط کاربر داده میشود و امتیازي که سیستم به محصول موفق میدهد با یکدیگر ترکیب شده و محصولی که شباهت بیشتري داشته باشد به عنوان محصول جدید توسط سیستم پیشنهاد میگردد.در - Zhao, W., 2016 - یک سیستم توصیه گر محصول با متصل کردن کاربران در شبکه هاي اجتماعی و وب سایت هاي تجارت الکترونیک ارائه شده است. روش مذکور به تجزیه و تحلیل اطلاعات ویژگی هاي کاربران در شبکه هاي اجتماعی پرداخته و سپس با داده هاي جمع آوري شده از وب سایت هاي تجارت الکترونیک مقایسه کرده و با استفاده از شبکه عصبی یک درخت را تشکیل میدهد. این درخت یک ماتریسی از کاربران و ویژگی هاي آنهاست که در مقابل محصولات شکل گرفته است. در نهایت بهترین محصول به کاربرانارائه میشود.
.3 روش پیشنهادي
کاربران جدید و تازه وارد با خوشه ها، از ضریب همبستگی پیرسون و فاصله اقلیدسی استفاده می شود. در نهایت سیستم پیشنهادي لیستی از محصولات مورد علاقه کاربر را به وي پیشنهاد میدهد. سیستم پیشنهادي شامل چند مرحله است که هر مرحله را در بخش هاي بعد شرح میدهیم.
.A خوشه بندي داده با استفاده از الگوریتم ژنتیک
یکی از بخش هاي تشکیل دهنده یک روش خوشه بندي، انتخاب رویکردي جهت جستجوي فضاي جواب و بهینه سازي تابع هدف و دستیابی به جوال با مقدار تابع هدف بهتر است. یکی از تکنیک هاي جستجوي فضاي جواب و بهینه سازي، روش هاي فراابتکاري9 هستند که از آن جمله میتوان به الگوریتم ژنتیک، الگوریتم کلونی مورچگان10 و روش جستجوي ممنوعه11 اشاره نمود - چیو و لان،2001 - . الگوریتم ژنتیک به طور محاسباتی ساده است و یک جستجویی کارآمد در فضایی ممکن و متفاوت حل مسئله انجاممیدهد. رویه معقول به این صورت است که به طور متقابل یک
مجموعه از گروه هاي نمون ه - جمعیت - با توجه به دامنه ي مسئله،انتخاب و نگهداري می شوند. یکی از بخش هاي تشکیل دهنده یکروش خوشه بندي انتخاب رویکردي جهت جستجوي فضاي جواب و بهینه سازي تابع هدف و دستیابی به جواب با مقدار تابع هدف بهتر است. هر رشته دنباله اي از اعداد واقعی است که نشان دهنده K مرکز خوشه می باشد. در یک فضاي N بعدي طول هر کروموزوم برابر N*Kخواهد بود.
روش پیشنهادي
در این مقاله براساس رویکرد کاربرد کاوي داده هاي وب سرور است. در این روش ابتدا پایگاه داده آمازون پیش پردازش میشود و حاصل آن نرمال سازي مجموعه داده می باشد .سپس امتیازات کاربران به هر آیتم مورد بررسی قرار می گیرد. این آیتم ها شامل فیلم، موزیک، سی دي و کتاب می باشد. در مرحله بعدي به منظور قرار گیري کاربران در هر خوشه و خوشه بندي آنها، از الگوریتم زنتیک استفاده می شود. در نهایت به منظور بررسی شباهتبه عنوان نمونه فرض کنید N=4 و K=3، این بدین معناست که