بخشی از مقاله

چکیده

در سالهای اخیر، روشهای مبتنی بر پالایش گروهی - CF - 1 برای سیستمهای توصیه گر به صورتی گسترده مورد پذیرش قرار گرفتهاند. یکی از این روشها، مبتنی بر کاربر بوده که توصیههای کارآمدی را بر مبنای شباهت و از طریق رتبهبندی2 کاربران با نظراتی مشابه، ایجاد میکند. اما این سیستمها دارای چند نقص ذاتی همانند مشکلات مربوط به پراکندگی3 دادهها و شروع سرد4 میباشند. با توسعه شبکههای اجتماعی، مقیاس اعتماد5 به عنوان رویکردی جدید برای غلبه بر مشکلات پالایش گروهی ارائه شده است. سیستمهای توصیه گر6 آگاه از نظر اعتماد، روشهایی برای استفاده از گزارشهای اعتماد و دادههای شخصی کاربر در شبکههایاجتماعی برای ارتقای دقتِ پیشبینی رتبهبندی برای کاربران با شروع سرد میباشند.

همچنین، سیستمهای توصیه گر مبتنی بر خوشهبندی7، نوعی دیگر از سیستمها برای بهکارگیری کارآمد و قابل مقیاس بندی برای مجموعه دادههای بزرگ میباشند، اما این سیستمها نیز از دقت و پوشش نسبتاً پایین رنج میبرند. بر این اساس در این مقاله برای مد نظر قرار دادن این مشکلات، ما یک خوشهبندی چند منظری را بر مبنای فاصله اقلیدسی8 برای ترکیب هر دو مورد دیدگاه مربوط به شباهت و روابط اعتماد ارائه نموده که دربردارنده اعتمادهای صریح و ضمنی میباشد. نتایج آزمایش نشان میدهند که رویکرد ما میتواند به صورتی کارآمد دقت9 و به صورتی ویژه، پوشش10 توصیهها را ارتقا داده و مشکل شروع سرد را کاهش دهد.

-1 مقدمه

سیستمهای توصیه گر برای ایجاد فهرستی از آیتمها که برای کاربران مناسب بوده ایجادشده که مبتنی بر نظرات افراد برای پیدا کردن اطلاعات مربوط به علائق آنها میباشد2]،.[1 انواع زیادی از روشها برای سیستمهای توصیه گر پیشنهاد شده اما پالایش گروهی یکی از مشهورترین روشها است 3]،.[4 هدف سیستمهای توصیه گرِ مبتنی بر پالایش گروهی، کشف کاربران مشابه بر مبنای رتبهبندی پروفایلهای آنها بوده که بر این اساس شباهت، نقشی مهم در روشهای پالایش گروهی ایفا میکند. هرچند که سیستمهایتوصیه گرِ مبتنی بر پالایش گروهی به دلیل سادگیشان بسیار رایج هستند، اما به مشکل پراکندگی دادهها و شروع سرد دچار هستند4]،.[5اطلاعات مربوط به اعتماد در مقایسه با عضویت و دوستی، دارای ابهام کمتری بوده و بیشتر به شباهت کاربر ارتباط دارد و بر این اساس اعتماد به صورتی قوی و مثبت با شباهت کاربر، همبستگی دارد.

از اینرو رویکرد مبتنی بر اعتماد قادر است تا مسائل پالایش گروهی سنتی همانند پراکندگی دادهها و شروع سرد را کاهش دهد 6]،.[7 تحقیقات نشان دادهاند که افراد، توصیه از سوی دوستان را به توصیههایی که از سوی سیستمهای توصیه گر ارائه شده ترجیح میدهند. اسام و آوِسانی [6] نواقص سیستمهایتوصیه گرِ مبتنی بر پالایش گروهیِ سنتی را تحلیل نموده و این منطق را توضیح میدهند که چرا دربرگیری اعتماد، این گونه مشکلات را کاهش میدهد.

آنها الگوریتم اعتماد Mole را ارائه داده که جستجوی عمق در ابتدا را انجام داده تا اعتماد را در شبکههای اعتماد، انتشار داده و مورد استنباط قرار دهند. گائو و همکاران [4] یک روش جدید برای ارزیابی همسایگان قابلاعتماد در درون روشهایپالایش گروهیِ سنتی را ارائه نمودهاند. آنها رتبهبندیهای همسایگان مورد اعتماد را ترکیب کرده تا پروفایل رتبهبندی جدید و کاملتری برای کاربران فعال ایجاد نموده که هدف آن حل مشکلات شروع سرد و پراکندگی دادهها بوده که در پالایش گروهی وجود دارند.

از سوی دیگر، ما - Ma - و همکاران [9] یک روش اعتماد گروهی اجتماعی را پیشنهاد داده که به صورت خطی، یک اعتماد اجتماعی و یک رویکرد فاکتورگیری ماتریس بنیادین را با هم ترکیب میکند. این روش توسط جمالی و ایستر [10] ایجادشده که رویکرد آنها در جایی متمرکز شده که انتشار در شبکههای اجتماعی فعال شده است. در نتیجهگیری آنها نشان داده شده است که توصیههای آگاه از نظر اعتماد میتوانند عملکرد سیستمهای توصیه گر پالایش گروهی را ارتقا داده که در این راستا، اعتماد قادر بوده تا نمایشی کارآمد از اولویت کاربر در کنار شباهت ایجاد نماید.

از سوی دیگر، در حالی که تائید شده است که رویکردهای مبتنی بر خوشهبندی برای مجموعه دادههای با مقیاس بزرگ ، کارآمد و قابل مقیاس بندی میباشد، اما توصیه مبتنی بر خوشهبندی به صورتی گسترده در سیستمهای توصیه گر بکار گرفته نشدهاند. اکثر محققان قبلی بر روی خوشهبندیکاربران از دیدگاهِ شباهت تمرکز نمودهاند. به عنوان مثال ساروار و همکاران [11]، بهواسطه بهکارگیری الگوریتم kمیانگینِ- برای خوشهبندی کاربران در توصیه مبتنی بر خوشه، شکلگیری همسایه را بر خوشهبندی اعضا  مبتنی میکنند.

در نهایت آنها به این نتیجه رسیدهاند که در روش آنها، دقت در مقایسه با روش پالاش گروهی -k نزدیکترین همسایه، در حدود 5 درصد افزایش یافته است. بلوگین و پاراپار [12] نشان دادهاند که بهواسطه بهکارگیری روشهای خوشهبندی پیشرفتهتر، دقت میتواند در مقایسه با دیگر رویکردهای پالایش گروهی، ارتقا یافته یا حتی بهتر عمل کند. بر این اساس تحقیقات قبلی نشان میدهند که توصیه بر مبنای رویکردهای خوشهبندی از دیدگاه مربوط به شباهت، از دقت پایین نیز رنج برده و مسئله پوشش هم یک مسئله حل نشده باقی میماند.

این مقاله در این راستا بر روی ایجاد یک رویکرد مبتنی بر خوشهبندیبر اساس هر دو موردِ روابط اعتماد اجتماعی و شباهت بر مبنای الگوهای رتبهبندی متمرکز میشود. ما اعتماد را به عنوان عقیده یک شخص با مد نظر قرار دادن توانایی دیگر کاربران قابلاعتماد در فراهمسازی رتبهبندیهای ارزشمند، مد نظر قرار میدهیم.با این حال سیستم توصیه گرِ مبتنی بر خوشهبندی به دقت و پوششِنسبتاً پایین دچار است. بر این اساس برای غلبه بر این مسائل، ما با استفاده از هر دو موردِ دیدگاه شباهت و دیدگاه اعتماد اجتماعی بر مبنای فاصله اقلیدسی، یک رویکرد خوشهبندی را ایجاد نمودهایم. در رویکرد خوشهبندی پیشنهادی، کاربران با دیدگاههای متفاوت بدین منظور با یکدیگر ترکیب شده تا توصیه کاربران بیشتری بتوانند به عنوان گزینهای برای کاربران دیگر انتخاب شده و بر این اساس پوشش بتواند به صورت مستقیم ارتقا پیدا کند.

از سوی دیگر به منظور اصلاح پیشبینی دقت برای کاربران با شروع سرد - یعنی کاربرانی که به دلیل دادههای ناکافی نمیتوانند خوشهبندی شوند - ، ما بهواسطه ارزیابی همسایگان قابلاعتماد صریح و ضمنی، یک رویکرد مبتنی بر اعتماد جدید را ارائه دادهایم. تفاوت روش ارائه شده در این مقاله با سایر مطالعات همچون روش ارائه شده در [ 4] این است که این مقاله از رویکرد خوشه بندی برای شناسایی کاربران با دیدگاه و سلایق مشابه و گروه بندی آن ها معرفی شده است.

سیستمهای توصیهگر پالایش گروهی مبتنی بر کاربر پیشبینی را از طریق سابقه همسایگان کاربران محاسبه میکنند و انتخاب درست نزدیکترین همسایگان که بیشترین شباهت را با آیتم مورد نظر داشته باشند تاثیر زیادی بر افزایش دقت پیشبینیها خواهد داشت.[2] در پالایش گروهی برای یافتن نزدیکترین همسایگان باید شباهت بین تمام آیتمهای موجود در سیستم محاسبه شود، که همین امر تاثیر بسزایی در کاهش سرعت این مدل دارد. با توجه به این شرایط خوشهبندی داده ها میتواند تعداد جفت مقایسه های لازم را کاهش دهد و تنها با محاسبه شباهت بین اعضایی که در یک خوشه قرار دارند، پیشبینیها تولید خواهند شد.

ادامه این مقاله به صورت زیر سازماندهی شده است: قسمت 2 مروری کوتاه بر روی سیستم توصیه گرِ آگاه از نظر اعتماد انجام داده است. ما در قسمت 3 یک روش چند منظری را بر مبنای دیدگاههای اعتماد و شباهت ارائه دادهایم. روش پیشنهادی، دربرگیرنده ترکیب همسایگان قابلاعتماد و رتبهبندی آنه؛اتعیینِ شباهت بر مبنای اطمینان؛ و پیشبینی رتبهبندی بر روی یک آیتم هدف بوده که به صورت کامل در قسمت 4 ارائه گردیده است. ما در قسمت 5 تعدادی از آزمایشات را بر روی مجموعه دادههای واقعی اعتماد به فیلم انجام داده تا کارآمدی روش پیشنهادی را تائید کنیم. در نهایت نتیجهگیری این مقاله در قسمت 6 ارائه شده است.

-2 سیستم توصیه گرِ آگاه از نظر اعتماد

تحقیقات اخیر نشان میدهند که وارد کردن اطلاعات اعتماد در سیستمهای توصیه گر، کیفیت توصیه را ارتقاء میبخشد .[13] استفاده از اعتماد میتواند به صورتی کارآمد، دقت پیشبینی سیستم توصیه گر را در مقایسه الگوریتمهایپالایشِ گروهی سنتی بهبود بخشد .[14] در کنار شباهت، عواملی دیگر همانند اعتماد، نقشی مهم در ایجاد توصیههایی با کیفیت بالا ایفا میکنند. اعتماد به عنوان روشی کارآمد برای ارتقای کیفیت توصیه و استفاده از شبکه اجتماعی مورد شناسایی قرار گرفته است.

در این رابطه، روشهای مختلفی برای بهکارگیری اطلاعات اعتماد در درون رویکردهای پالایش گروهی ارائه شده که به صورت خاص، سیستم توصیه گرِ آگاه از نظر اعتماد نامیده شدهاند. [15] روشهایسیستمِ توصیه گرِ آگاه از نظر اعتماد به دو رویکرد عمده یعنی صریح و ضمنی تقسیم شدهاند 17]،[.16اعتماد صریحِ دیگر کاربرها برای محاسبه مقدار اعتماد مستقیم بین هر جفت از کاربران در شبکه اجتماعی مورد استفاده قرار گرفته است.

اعتماد ضمنی از طریق اطلاعاتِ ضمنیِ به دست آمده از یک شبکه اجتماعی محاسبه میشود .[17]  رویکرد ضمنی همچنین استنباطهایی از گزارشهای اعتماد بین کاربران را نیز بر مبنای رتبهبندی آیتم به عمل میآورد [.18]یک مقدارِ تعریف نشده اعتماد به صورتی تقریبی بر مبنای این فرضیه پیشبینی شده است که کاربرانی که در شبکه اعتماد به کاربر فعال نزدیکتر بوده، دارای مقدار اعتماد بالاتری میباشند .[14] در نهایت، سیستمهای توصیه گرِ آگاه از نظر اعتماد ارائهدهنده فرصتی برای توصیهها بهواسطه استفاده از گزارشهای اعتماد کاربران، بهویژه برای سیستمهایی  بوده  که  دادههای  رتبهبندی  آنها  پراکنده میباشد.[19]

-3 خوشهبندی در سیستم توصیه گر

تحلیل خوشه، یک حوزه پژوهشی مهم در داده کاوی بوده که هدف اصلی این الگوریتمها تشخیص گروههای طبیعی در میان هزاران الگو میباشد . پس الگوریتم خوشهبندی قادر به گروهبندی کاربران یا آیتمهایی با ویژگیهای مشابه میباشد .[20] الگوریتمهای K-mean و K-medoids مشهورترین روشهای خوشهبندی تقسیمبندی به دلیل کارآمدی و سادگیشان میباشند .[21] از آنجایی که الگوریتم K-mean یک مرکز خوشه را بهواسطه میانگینگیری همه مقادیر هر ویژگی تولید کرده، اطلاعات شخصی مهم همانند همسایگان مورد اعتماد را حذف خواهد کرد. الگوریتم خوشهبندی K-medoids به عنوان یک جایگزین، یک کاربر واقعی را به عنوان مرکز ثقل انتخاب کرده که جمعِ فواصل جفتی در درون یک خوشه را به حداقل میرساند.

[22] ایده بنیادین در اینجا جستجو برای خوشهبندیدر فضاهای فرعی مختلفِ یک فضای کاربر میباشد.کاربران دارای دو نوعِ مختلف از اطلاعات، یعنی اطلاعات مربوط به اعتماد - ارتباطات اجتماعی - و اطلاعات مربوط به رتبهبندیها بوده که در رابطه با آیتمهای مورد علاقه برای کاربران بکار گرفته شدهاند. از اینرو، این نوع اطلاعات، کاربران مربوط به منظری مختلف، لینکهای اعتماد و الگوهای رتبهبندی - رفتارهای کاربر - را با یکدیگر توصیف میکنند. ما در این قسمت در پی خوشهبندی کاربران با استفاده از هر دو مورد اطلاعات رتبهبندی و اعتماد میباشیم.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید