بخشی از مقاله

چکیده

امروزه فروش متقابل محصولات در عرصه تجارت الگترونیک یکی از موضوعات بسیار مهم در راستای افزایش فروش عرضه کنندگان کالا و رضایتمندی خریداران اینترنتی میباشد. سیستمهای توصیهگر ابزارهای مناسبی برای ارائه کالاهای متناسب با نیازهای کاربران میباشند. این سیستمها اغلب آیتمهایی را پیشنهاد میدهند که متعلق به یک دامنه خاص است، در حالی که ممکن است کاربر به کالاهایی غیر از کالاهای یک دامنه خاص نیاز داشته باشد.

برای نمونه، کاربری که یک کتاب خریداری مینماید ممکن است به فیلمها و آلبوم های موسیقی مرتبط با آن نیز نیاز داشته باشد. راهکار اصلی این مسأله، فراهمسازی امکان فروش متقابل محصولات از طریق اتصال دامنهها به یکدیگر است. در این رابطه راهکارهای مختلفی مانند، فاکتورسازی ماتریس و تکنیکهای خوشهبندی ارائه شده است.

در اکثر آنها نادیده گرفته شدن رابطه معنایی آیتمها، اکتفا نمودن به امتیازات داده شده کاربران به محصولات و نادیده گرفتن مشکل پراکندگی داده سبب شده از کارآیی لازم برخوردار نباشند. در این مقاله روشی را ارائه خواهیم داد که ابتدا مشکل پراکندگی داده را در دامنهها رفع نمودهسپس، ارتباط پُرمعنایی بین دامنهها برقرار میگردد تا امکان فروش متقابل محصولات فراهم شود. نتایج ارزیابی کارآیی مدل پیشنهادی را نسبت به دیگر روشهای ارائه شده نشان داده است.

1 -مقدمه

سیستم توصیه گر، ابزارهای نرم افزاری و تکنیک هایی هستند که طی یک فرآیندِ تصمیم گیری پیش بینی می کنند کدام آیتم به کاربر پیشنهاد شود که به سلایق او نزدیکتر باشد. بر مبنای کارهای انجام شده رویکرد مبتنی بر محتوا و رویکرد فیلترهمکار پرکاربردترین راهکارها بشمار میروند. در رویکرد مبتنی بر محتوا پیشنهادات بر اساس محاسبه شباهت آیتم های کاندید با آیتم هایی کهقبلاً توسط کاربر ارزیابی شده ارائه می گردند و آیتمهایی که بیشترین شباهت را داشته باشند پیشنهاد خواهند شد. در رویکرد فیلترهمکار، رفتار کاربر به یک ماتریس رتبه کاربر-آیتم نگاشت می شود که هر درایه آن بیانگر میزان علاقه کاربر به آیتم متناظر با آن درایه است.

امروزه اکثر سیستم های توصیه گر آیتمهایی را پیشنهاد می دهند که متعلق به یک دامنهی خاص است. برای مثال، وبسایتِ نتفلیکس فیلم و برنامههای تلویزیونی را پیشنهاد می دهد. وبسایتِ بارنزاند نوبل کتاب و وبسایت لستافام آهنگ و آلبومهای موسیقی را به کاربران پیشنهاد میدهد. از آنجا که نیازهای کاربران تنها محدود به یک دامنه خاص نمی باشد بنابراین، همکاری سیستم های توصیه گر به منظور ارائه کالاهای مکمل به مشتریان می تواند مزیت های فراوانی از جمله، افزایش فروش محصولات، افزایش وفاداری مشتریان و ... برای فروشندگان و همچنین، مزیتهایی از جمله پاسخگویی به نیازهای ضمنی خریداران اینترنتی داشته باشد.

مشکل پراکندگی داده یکی از اصلی ترین مشکلات موجود در برقراری ارتباط بین سیسنم های توصیه گر بشمار می آید. در بیشتر مقالات ارائه شده برای ایجاد ارتباط بین دامنه ها این مشکل نادیده گرفته شده است. در این مقاله یک سیستم توصیه گر چند دامنهای کارآمد برای فروش متقابل کارآمد ارائه خواهیم داد به طوریکه علاوه بر رفع مشکل پراکندگی داده، روابط معنایی بین آیتمهای دامنههای ناهمگن نیز در نظر گرفته شدهاند.

2 -پیشینه تحقیق

سیستم توصیهگر چند دامنهای قادر است آیتمهای متعلق به دامنه B را به کاربرانی که تنها آیتمهای دامنه A را ارزیابی کردهاند پیشنهاد نماید. دامنه A اشاره به دامنه منبع و دامنه B اشاره به دامنه هدف دارد. برای مثال، کتابها یا فیلمهایی را به کاربرانی که تنها آهنگهایی را شنیده و ارزیابی نمودهاند پیشنهاد مینماید.[1] سیستمهای توصیهگر چند دامنهای از جنبههای مختلف و در حوزههای تحقیقی مختلفی بررسی شده است.

این موضوع موجب شده است رویکردهای گسترده و زیادی در مورد سیستمهای توصیهگر به وجود بیاید و مقایسه این رویکردها در بسیاری از موارد کار سختی است چرا که نوع ترجیحاتی که در مورد کاربران استفاده میکنند متفاوت است. همچنین سناریوهای چند دامنهای و نیز دادهها و الگوریتمهایی که بر روی آنها کار میکنند متفاوت هستند.

در [2] چارچوبی ارائه شد که بستههای پیشنهادی را که ممکن است انواع مختلفی داشته باشند و متعلق به دامنه های مختلفی نیز باشند فراهم می کرد. این چارچوب سه سطح از تجمیع پیشنهادها را در بر می گرفت: پیشنهاد آیتم های مشابه، پیشنهاد آیتم هایی که دارای انواع مختلفی بوده وتعلق به یک دامنه داشتند و پیشنهاد دامنه های متقابل که شامل آیتم های متعلق به دامنه های مختلفی بودند. نویسندگان بیان کردند که پیشنهادهای تجمیع شده میتوانند با استفاده از حداقل سه رویکرد زیر تولید شوند:

-    فیلترینگ کلی: نمونه سازی یک مدل توصیه گر برای چندین نوع آیتم که ممکن است متعلق به دامنههای متفاوتی باشند.

-    فیلترینگ اجتماعی: استفاده از امتیازهای اشتراک گذاری شده در بین چندین سیستم که ممکن است با انواع متفاوت آیتم ها و دامنهها سروکار داشته باشد.

-    تحلیل سبد بازار: به کار بردن داده کاوی برای استقراء و پیش بینی کردن ارتباطات مخفی بین آیتم ها با انواع یا دامنه های متفاوت و ساختن مدلی برای فیلترینگ آیتمها. در [1] در مورد تکنیک های انتقال یادگیری در دامنه های متقابل مبتنی بر فیلترهمکار ارائه کرده است. در آن مقاله، یک دستهبندی جایگزین بر اساس انواع دامنه ها ارائه شده است که به طور کلی دامنه ها را به سه دسته تقسیم کرده است:

- دامنه های سیستمی: تشکیل شده از سیستم های توصیه گر مختلف می باشد و از طریق داده های مرتبط به هم در سیستمهای توصیه گر، پراکندگی داده در دامنه هدف را برطرف می نماید. در این حالت هر سیستم توصیه گر به عنوان یک دامنه محسوب می شود به طوری که دانش آن را می توان به سایر دامنه های سیستمی دیگر انتقال داد.

یک دامنه سیستمی به دو زیر دامنه کاربر و آیتم تقسیم می شود. بنابراین، می توان دانش مربوط به هر یک از زیر دامنه ها را به دامنه های سیستمی دیگر منتقل کرد. معمولاً مجموعه های کاربر-آیتم در دامنه های سیستمی مرتبط دقیقاً مشابه یکدیگر نیستند. کاربران دامنه ها می توانند بواسطه ترجیحات و علاقه مندیها و آیتمهای دامنهها میتوانند بواسطه ویژگی هایشان با یکدیگر مرتبط شوند. [5 ,4,3] نمونههایی از کارهای انجام شده در این زمینه هستند.

-دامنه های داده ای: دومین سناریو چندین منبع داده ای است که در هر یک انواع داده ای ناهمگن وجود دارند و هر منبع داده ای به عنوان یک دامنه محسوب می شود. این مورد بر اساس این فرض که می توان برخی از انواع داده ها را از دامنههای جانبی - از طریق کلیک کردن، یا نظرات مثبت-منفی - ساده تر از دامنه هدف بدست آورد. معمولاً لازم است دامنهها مجموعه دادهای کابر-آیتم در دامنههای مختلف مشابه باشند. بنابراین دانش بدست آمده را میتوان از طریق یافتن روابط بین دامنهها منتقل نمود. [6] و [7] نمونههایی از کارهای انجام شده در این زمینه هستند.

-دامنه های زمانی: سناریوی دیگر وقتی است که امتیاز ها وابستگی زمانی داشته باشند. با تقسیم داده ها بر اساس برش زمانی، هر برش یک دامنه محسوب می شود. این مسأله برای برداشت لحظه ای از علایق کاربران کاربرد زیادی دارد. یک کاربر در دامنه های زمانی مختلف می تواند کاربران همتایی با سلایق مختلف داشته باشد. بنابراین، می توان این دانش را به کاربران همتا در هر دامنه انتقال داد. [8] نمونهای از کارهای انجام شده در این زمینه است.

همانطور که در قبل اشاره شد، در اغلب کارهای بررسی شده برای اتصال دامنه ها از تکنیک هایی نظیر، فاکتورسازی ماتریس، خوشه بندی استفاده شده است که تنها به ماتریس امتیازات اولیه اکتفا شده است. این درحالی که ممکن است در ماتریس ارزیابی مشکل پراکندگی داده وجود داشته باشد. همچنین، در برخی از آنها علاوه بر نادیده گرفتن مشکل پراکندگی داده، روابط معنایی آیتم ها نیز نادیده گرفته شده است.

در مدل پیشنهادی، به ازای هر دامنه، دامنه های همگنی را در نظر خواهیم گرفت که از آن طریق ابتدا مشکل دامنه های اصلی را رفع می نماییم. سپس با ایجاد یک واژه نامه معنایی روابط بین دامنه ها را بر قرار می کنیم. در نهایت با استفاده از یک الگوریتم توصیهگر فیلترهمکار آیتمهای مکمل هر دامنه را به کاربر پیشنهاد خواهیم نمود.

3 -مدل پیشنهادی

یکی از راهکارهای کارآمد به منظور برقراری ارتباط بین دامنهها تجمیع دانش میباشد. بنابراین، یک دانش عمومی بوجود آمده که بوسیله آن میتوان ارتباط بین دامنه ها را برقرار نمود. تحقیقات نشان میدهد که وقتی چندین منبع شامل ترجیحات شخصی با هم ترکیب می شوند پروفایلهای غنیتری می توان برای کاربران تولید کرد و به سلایق و علایق آنها که از دامنههای مستقل به راحتی به دست نمیآیند پی برد.[10 ,9]

همچنین نشان داده شده است که غنی سازی داده های پراکنده کاربران در یک دامنه خاص به وسیله اضافه کردن داده های ترجیحات کاربران از دیگر دامنه ها نیز می تواند پیشنهادهای تولید شده در شرایط پراکندگی داده ها به طرز چشمگیری بهبود بخشد.[12 ,11] ساختار کلی مدل پیشنهادی در شکل - - 1 نشان داده شده است.

به طور کلی، در این مدل، ابتدا مشکل پراکندگی هر یک از دامنه های اصلی بررسی و در صورت وجود رفع میگردد. سپس با ایجاد یک واژهنامه معنایی مشترک بین دامنه ها روابط بین آنها برقرار خواهد شد و در نهایت توسط یک الگوریتم توصیه گر فیلترهمکار آیتم های مکمل هر دامنه را به کاربر پیشنهاد خواهد شد. در ادامه شرح هر یک از بخشهای این مدل را ارائه مینماییم.

-1 3 -رفع مشکل پراکندگی داده

برای این منظور، با استفاده از روش غنی سازی دامنه ها به ازای هر دامنه اصلی، یک یا چند دامنه همگن با آن را که فاقد پراکندگی داده هستند در نظر می گیریم و از آن طریق بر این مشکل غلبه می نماییم. دامنههای همگنی که توسط این ماژول مورد استفاده قرار می گیرند مخازن اطلاعاتی مرجعی هستند که توسط شرکت های مادر و معروفی همچون، Imdb، GoogleBooks، Last.fm و غیره... مدیریت می شوند.

این منابع به صورت آنلاین قابل دسترس بوده و همیشه شامل اطلاعات بروز شده می باشند. نوع منبع اطلاعاتی که مورد استفاده قرار میگیرد بستگی به دامنه اصلی مربوط به سیستم توصیه گر دارد. به عنوان مثال، اگر سیستم توصیه گر در رابطه با فیلم فعالیت می نماید می توان از مخازن داده ای آنلاین Imdb استفاده نمود.

معمولاً مخازن داده ای آنلاین شامل ویژگی ها و دادههایی هستند که در صورت افزوده شده به دانش سیستم توصیه گر موجب کاهش مشکل پراکندگی داده و به تبع آن بهبود مسأله پراکندگی داده خواهند شد. لازم به ذکر است برای تبادل داده ها بین مدل پیشنهادی و مخازن دادهای آنلاین از قالبهای استاندارد XML یا JSON استفاده شده است.

-2 3 -اتصال دامنهها

یکی از بهترین راه حل ها برای برقراری این ارتباط شناسایی ویژگی های مشترک بین دامنه ها است. به این منظور، یک واژ نامه معنایی که تناظر بین مهم ترین ویژگی های هر دامنه را برقرار مینماید ایجاد میگردد. در این واژه نامه ارتباط معنایی هر ویژگی متعلق به هر دامنه با ویژگی های سایر دامنه ها یافت میشود. این ارتباط از طریق منابع اطلاعاتی معتبر و مختلفی چون dictionary.com یا thousands.com قابل استخراج میباشند. پس از ایجاد واژهنامه، با تعریف تابع g : XIS XIT عمل نگاشت ویژگی های میان هر جفت دامنه انجام می شود.

XIS ویژگی دامنه منبع و XIT ویژگی دامنه هدف را مشخص مینماید. به عنوان مثال، دو دامنه فیلم و کتاب را در نظر می گیریم. این تابع با نگاشت ویژگی ژانر در دامنه کتاب به دامنه فیلم، تمامی فیلم های مربوط به کتاب موردنظر کاربر یافت خواهد شد. در نتیجه الگوریتم فیلترهمکار قادر است فیلم های مرتبط با کتاب های مورد علاقه کاربر را لیست پیشنهادات خود قرار داهد.

-3 3 -الگوریتم توصیهگر

از آنجا که الگوریتم فیلترهمکار به عنوان کارآمدترین الگوریتم در سیستم های توصیه گر محسوب میشود اما قادر است تنها آیتم های یک دامنه را به کاربر پیشنهاد کند. 

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید