بخشی از مقاله
چکیده امروزه با افزایش چشمگیر اطلاعات مواجه هستیم، که یافتن اطلاعات مناسب برای کاربران دشوار شده است. هدف سیستمهای پیشنهاددهنده، شخصی سازی توصیهها به کاربران برای آیتمهای خاص است. تکنیکهای محبوب شامل مدلهای مبنی بر محتوا و رویکردهای پالایش مشارکتی است. در این مقاله، با مسئلهی مهم شروع سرد در سیستمهای پیشنهاددهنده مقابله میکنیم. این مسئله به پیشنهادات برای کاربران جدید وابسته است. سیستم در مورد عملکرد کاربران حدید اطلاعاتی ندارد.
مدلی در این مقاله پیشنهاد میشود که از الگوریتم ژنتیک در خوشهبندی استفاده میشود. رویکرد پیشنهادی با ورود کاربر جدید، اطلاعات جمعیتی وی را استخراج میکند و کاربران مشابه با کاربر جدید را مییابد و با استفاده از الگوریتم ژنتیک خوشهبندی بهینه را انجام میدهد، تا بتواند امتیازدهی مناسب را برای کاربر جدید پیش بینی کند. خوشهبندی مناسب برای کاربر شروع سرد انجام میشود و آیتمهای مناسب به وی پیشنهاد میشود. نتایج تجربی با استفاده مجموعه داده Movielens پیاده سازی شده است.
.1 مقدمه
در حال حاضر، سیستمهای پیشنهاددهنده در زمینههای کاربردی بسیار کاربرد دارد. سیستمهای پیشنهاددهنده، آیتمهای مورد علاقه کاربران را بر اساس عملکردشان، به آنها توصیه میکند. در کل، پیشنهادات مبنی بر مدلهایی از خصوصیات آیتمها یا محیط اجتماعی کاربران است. هدف اصلی حداکثرسازی کیفیت پیشنهادات است. طوری که میزان تطابق بین آیتم خاص و کاربر خاص است.[1] به طور کلی هر سیستم پیشنهاددهندهای برای تولید پیشنهادات از یک فرآیند خاص استفاده میکند . روشهای پیشنهادی بر اساس منابع اطلاعاتی مورد استفاده طبقهبندی میشوند.
سه نوع منبع اطلاعاتی قابل دسترس میتوانند به عنوان ورودی فرآیند پیشنهاد شناخته شوند. منابع قابل دسترس عبارتند از اطلاعات آیتم - کلمات کلیدی، ژانرها - و امتیازات کاربران - از طریق تراکنش اطلاعاتی، امتیازات صریح - . روش های اتخاذ شده در سیستمهای پیشنهاددهنده به صورت زیر میباشند: - - 1 روش پالایش مشارکتی و - 2 - روشهای مبتنی بر محتوا. سیستمهای پالایش مشارکتی سعی در بازیابی نتیجه پیشنهاد نهایی در عملکرد، دارند. اغلب، در چنین سیستمهایی، به خصوصیات کاربر یا اطلاعات جمعیتی توجه نشده است.
به خصوص، رویکردهای پالایش مشارکتی، مبنی بر امتیازهایی که سایر کاربران دادهاند، به کاربر هدف توصیه میشود. الگوریتمهای بسیاری، برای محاسبهی شباهت بین کاربران یا آیتمها استفاده شده است. انتخاب الگوریتم، نقش مهمی در کیفیت پیشنهادات دارد. سیستمهای مبنی بر محتوا، سعی میکنند پروفایلهای کاربر را با توضیحات آیتمها، تطابق دهند. رویکردهای مبنی بر محتوا، نیاز به امتیازدهی دارند که توسط خود کاربر در مدلهای پالایش مشارکتی وجود دارند، که نمیتوان از امتیازدهی سایر کاربران نتیجه گرفت. همچنین، روشهای ترکیبی برای رفع معایب مدلهای مبنی بر محتوا و پالایش مشارکتی ارائه شدهاند.[8]
یکی از مشهورترین مسائل سیستمهای پیشنهاددهنده، مسئله شروع سرد است. مسئله شروع سرد به پراکندگی اطلاعات بستگی دارد. سه نوع مسئله شروع سرد تعریف شده است: - 1 - پیشنهادات برای کاربران جدید، - 2 - پیشنهادات برای آیتمهای جدید، و - 3 - پیشنهادات آیتمهای جدید برای کاربران جدید. در این مقاله، تمرکز بر روی حل مسئله شروع سرد کاربری است. به طوری که، وقتی کاربر جدید درخواست توصیه دارد در حالی که هیچ اطلاعاتی از عملکرد او وجود ندارد، اطلاعاتی از قبیل امتیازدهی او برای آیتم ها. امتیازدهی برای نشان دادن عملکرد کاربر خاص، بسیار مهم است.
علاوه بر این، هیچ تاریخچهی دادهای وجود ندارد. رویکردی ارائه کردیم که خروجی آن به صورت زیر است. کاربر جدید را با استفاده از الگوریتم ژنتیک خوشهبندی میکند. سپس با استفاده از فرمول شباهت پیرسون، همسایگان کاربر را مییابد. اطلاعات جمعیتی کاربر جدید را استخراج میکنیم و کاربرانی را که با کاربر جدید تطابق دارند را پیدا میکنیم. در نهایت با روشهای پیشبینی، امتیاز کاربر جدید را تخمین میزند. با توجه به مطالعات انجام شده، مدل ما:
· مسئله شروع سرد کاربر جدید را کنترل میکند،
· نیاز به فرآیند مصاحبه ندارد،
· وابسته به محاسبات پیچیده ندارد. کارهای گذشته در قسمت دوم، مورد بررسی قرار گرقته است. در بخش سوم، روش پیشنهادی ارائه شده است. نتایج تجربی پیاده سازی، در بخش چهارم توصیف میشود و در قسمت پنجم نتیجهگیری بیان میشود.
.2 کارهای گذشته
در [10] برای خوشهبندی کاربر جدید باید اطلاعات رتبهبندی آیتمها، که توسط سایر کاربران امتیاز داده شدهاند، در دسترس باشند، در حالی که در روش پیشنهادی با استفاده از اطلاعات جمعیتی کاربر، که شامل سن و جنسیت میشود، کاربر جدید را خوشهبندی میکند، که این کار با در نظر گرفتن پارامتردما مربوط به الگوریتم تبرید تدریجی، به هنگام اعمال الگوریتم ژنتیک انجام میشود. پس از تعیین خوشهی کاربر جدید، با توجه به آیتمهای کاربران همخوشه، پیشنهادات را انجام میدهد.
روش پالایش مشارکتی به سه دسته - 1 - مبنی بر کاربر، - 2 - مبنی بر آیتم، - - 3 مبنی بر مدل تقسیم میشود. مشکل اصلی در زمان ظهور دادهی ناقص است. روشهای مبنی بر آیتم، شباهتهای آیتمها را دو به دو در نظر میگیرند که نسبت به شباهتهای دو به دوی کاربران، قابل اعتماد بیشتری است. رویکرد مبنی بر مدل، پراکندگی داده را در ماتریس شباهت نشان میدهد.[2] همانطور که گفته شد، سیستمهای مبنی بر محتوا، تلاش میکنند تا پروفایل کاربران را با توصیفات آیتم تطابق دهند.
در مدل مبنی بر محتوا، تکنیکهای مختلفی وجود دارد، از قبیل مدلهای مبنی بر کلمه کلیدی، تکنیکهای معنایی یا مدلهای احتمالی. مدلهای مبنی بر کلمه کلیدی، تمام سند را به عنوان یک بردار بررسی میکند، که هر بعد، یک آیتم خاص را توصیف میکند. تکنیکهای معنایی، میانهای برای استدلال مکانیزمهای پیشنهادات را آماده میکند. آیتمهای مختلف با توجه به هستیشناسی آیتم تعریف میکند. روشهای احتمالی، احتمالات را با استفاده از تحلیل تاریخچه داده و مبتنی بر احتمالات قبلی، در نظر میگیرد.[3]
اتخاذ سیستمهای مبنی بر محتوا، مزایا و معایبی دارند. این رویکردها نیاز به امتیازدهی کاربر دارد. هرچند، در سیستمهای مبتنی بر محتوا، که نیاز به امتیازدهی دارد، مسئله شروع سرد را نمیتوان حل کند. استفاده از الگوریتمهای خوشهبندی سنتی، نمیتواند شروع سرد را به طور مناسب خوشهبندی کند. استفاده از الگوریتم ژنتیک در این مقاله، باعث میشود که اطلاعات جمعیتی کاربر استخراج شود و کاربران مشابه را یافته و کاربر جدید را با الگوریتم ژنتیک در خوشهی مناسب قرار دهد و پیشنهادات مناسب را به کاربر دهد. برای مقابله با مسئله کاربر شروع سرد، از پروفایل کاربر استفاده میکند که در صورتی که پروفایل کاربر در دسترس نباشد، نمیتواند کاربر جدید را در دستهی مناسب خوشهبندی کند. اطلاعات جمعیتی کاربر استخراج میشود و بر اساس آن با استفاده از الگوریتم ژنتیک خوشه بندی را انجام میدهد.[3]
سیستمهای مبتنی بر دانش، بر اساس ادراکی که از نیازهای کاربر و ویژگیهای آیتمها پیدا کردهاند، توصیه ارائه میدهند. به عبارتی در این گونه از سیستمهای پیشنهاددهنده، مواد اولیه مورد استفاده برای تولید لیستی از توصیهها، دانش سیستم در مورد کاربر و آیتم است.[ 2] سیستمهای مبتنی بر دانش، از متدهای مختلفی که برای تحلیل دانش، قابل استفاده هستند، بهره میبرند که متدهای رایج در الگوریتمهای ژنتیک، فازی، شبکههای عصبی و ... از جمله آنهاست.
.3 روش پیشنهادی
الگوریتم ژنتیک با یک مجموعه از جوابها، که از طریق کروموزومها نشان داده میشوند، شروع میشود. این مجموعه جوابها جمعیت اولیه نام دارند. در این الگوریتم جوابهای حاصل از یک جمعیت، برای تولید جمعیت بعدی استفاده میشوند. در خوشهبندی که با استفاده از الگوریتم ژنتیک انجام میشود، امید است که جمعیت جدید یا خوشهبندی جدید نسبت به قبلی بهتر باشد. طبیعی است که جوابهای مناسبتر شانس بیشتری برای تولید مجدد داشته باشند. این فرآیند تا یافتن بهترین خوشه ادامه پیدا میکند.[7] در رویکرد پیشنهادی به هنگام خوشهبندی، الگوریتم ژنتیک با الگوریتم تبرید تدریجی ترکیب شده است و در زمان خوشهبندی پارامتر دما در نظر گرفته شده است.