بخشی از مقاله

خلاصه

سیستم های توصیه گر در واقع یک نوع فیلتر اطلاعات میباشند. امروزه به علت افزایش حجم اطلاعات و رشد قابل توجه اینترنت، این سیستمها کاربرد فراوانی پیدا کردهاند، که در حقیقت برای کمک به کاربران اینترنت به منظور یافتن اطلاعات مورد علاقه خود، معرفی شدهاند.

همچنین مشکل سرریز شدن اطلاعات را نیز حل کردهاند. یکی از مهمترین و پرکاربردترین روشهای طراحی سیستم توصیهگر در سالهای اخیر، روش پالایش مشارکتی است. در این مقاله علاوه بر بیان الگوریتمهای این روش و مقایسه و ارزیابی آن با روشهای دیگر، حالت بهینه سازی شدهی آن نیز مورد بررسی قرار گرفته است. در نهایت کارایی این روش نسبت به سایر روشها در سیستمهای توصیهگر به ویژه در زمینه تجارت الکترونیک مطرح میشود.

1.    مقدمه

روز به روز به تعداد مقالات, فایلهای موسیقی و فیلمها در دنیای اطراف ما افزوده میشود. بنابراین ناچار به تصمیمگیری و انتخاب کالای مورد علاقه خود از بین کالاهای انبوه هستیم. در این مواقع علاوه بر تجربه خود شخص، پیشنهادهای افراد قابل اعتماد و فروشندگان کالاها نیز کمک کننده است. فروشندگان میتوانند با تشخیص سلیقهی مشتریان خود، آنها را در انتخاب کالا راهنمایی کنند.

در دنیای اینترنت نیز با حجم عظیمی از اطلاعات و کالاها روبه رو می-شویم که باعث سردرگمی در انتخاب میشود. بنابراین برای حل مشکل تصمیمگیری و سرریز شدن اطلاعات از راهکارهایی استفاده میشود. مهمترین راه کار مورد استفاده تا امروز سیستمهای توصیهگر هستند، این سیستمها میتوانند با کشف سلایق کاربران پیشنهادات مناسبی را برای آنها ایجاد کنند.[1] در واقع هدف اصلی این سیستمها, توصیه با معنی به کاربرانی است که به آن محصولات علاقه دارند.

سیستمهای توصیهگر در زمینه های مختلفی از جمله پزشکی[4][3]، گردشگری[6][5]، تجارت الکترونیک[9][8][7] و غیره کاربرد فراوانی دارد. در زمینه تجارت الکترونیک سیستم های توصیه گر نقش بسیار مهمی دارند زیرا باعث افزایش مشتریان و در نهایت باعث افزایش فروش میشود.

پالایش مشارکتی بطور گسترده در تجارت الکترونیک مورد استفاده قرار گرفته است .مشتری ها میتوانند کتاب ها , آهنگها, فیلم ها را رتبه بندی کنند و توصیه ها را با توجه به موضوعات آنها در آینده بگیرند. علاوه بر آن پالایش مشارکتی در مرور کردن اسناد معین - همچون سندهای بین اعمال مشخص , مقالات و روزنامه ها - بکار رفته است.[10] بسیاری از این سیستمها از روش پالایش مشارکتی استفاده میکنند و آنها را مورد بررسی قرار میدهند

به عنوان مثال در یک سیستم توصیه پزشکی ابتدا سیستم توصیهگر، شباهت بین بیماران را محاسبه میکند و یک لیست رتبهبندی از پزشکان و بیمارستانهای مناسب برای مشخصه بیمار میدهد سپس بیمار پیشنهادهایی برای حل مشکل خود دریافت میکند.

سیستم توصیه دیگری از که از پالایش مشارکتی استفاده میکند سیستم توصیه ای است که با استفاده از روش توصیه مبتنی بر پالایش مشارکتی و با در نظر گرفتن یکسری معیارهای شاخص در سرمایهگذاری پیشنهاداتی را برای سرمایه گذاران جهت خرید از بورس فراهم میکند تا یک خرید امن از بورس را تجربه کنند.[7] در سیستم های توصیه گردشگری نیز از پالایش مشارکتی استفاده میکنند.

گردشگران نیاز به توصیه برای مکانی هستند که میخواهند بروند و ببینند. بنابراین یک سیستم توصیهگر با آسان کردن انتخاب-های شخصی و جلوگیری از غوطه ور شدن در دادههای بسیاری که نا مربوط به سلایق کاربران است ,در انتخاب مکان مورد علاقه به آنها کمک میکند.

در ادامه ابتدا در بخش 2 توضیحی در رابطه با سیستمهای توصیهگر و روش پالایش مشارکتی داده میشود سپس در بخش 3 الگوریتمهای آن شرح داده می-شود. در قسمت 4 روشهای بهینهسازی روش پالایش مشارکتی مطرح می شود و در نهایت ارزیابی و مقایسه این روش در بخش 5 بیان میشود در بخش 6 نیز نتیجهگیری و ایدهای برای کارهای آینده آورده شده است.

2.    سیستم های توصیه گر

سیستمهای هوشمندی هستند که با تحلیل و ارزیابی اطلاعات کاربران، پیشنهادات مناسبی را برای هر شخص مطرح میکنند.[1] این سیستمها در واقع ابزارهایی برای پالایش و مرتب سازی اطلاعات هستند. آنها از ایدههای یک گروه از کاربران برای کمک به آن جامعه و نیز برای بازدهی بیشتر و شناسایی محتوای مورد علاقه از یک ارزیابی درونی انتخاب ها استفاده میکنند .[10] از الگوریتم ها و روشهای مختلفی برای ایجاد توصیه های شخصی سازی شده کمک گرفته میشود. که از بین آنها پالایش مشارکتی و پالایش محتوا محور بهعنوان اساس سیستمهای توصیهگر مورد استفاده قرار گرفتهاند. سیستم های توصیه گر به دو دسته سنتی و مدرن تقسیم بندی میشوند:

-1-2 روشهای توصیه کننده سنتی

1-1-2 فیلترینگ محتوا محور

سیستم های توصیه گر محتوا محور, با ویژگی هایی از کاربران که در ابتدا ایجاد شده اند کار میکند. این ویژگیها، اطلاعاتی در مورد کاربر و سلیقه او دارد. سلیقه کاربر براساس چگونگی رتبهبندی آیتمها است. در فرایند توصیه, موتور آیتم هایی را که قبلا توسط کاربر رتبه بندی شده بود را با آیتمهایی که رتبهبندی نکرده مقایسه میکند و به دنبال وجه تشابه میگردد. سپس آیتمهایی را که به رتبهبندی شبیه است به کاربر توصیه می کند

2-1-2 پالایش مشارکتی

پالایش مشارکتی یکی از بیشترین تکنیک های مطالعه شدهی سیستم های توصیه گر از سال 1997 میباشد. ایدهی پالایش مشارکتی در کشف گروه کاربران، درون یک جامعه است. بدین منظور اگر دو کاربر آیتم های رتبه بندی شدهیتقریباً مشابهی داشته باشتد, معمولا دارای سلیقههای مشابهی بود بنابراین چنین کاربرانی یک گروه و یا همسایگی ایجاد میکنند

این سیستم نظرات کاربران را در زمینه های مختلف جمع آوری کرده و از شباهت ها و تفاوت های بین آنها برای ایجاد توصیه جدید استفاده میکند. در سیستم پالایش مشارکتی پروفایل کاربر شامل جدولی از آیتم ها و رتبههاست که همزمان با تعامل کاربر با سیستم جدول کامل میشود.[2][1] تفاوت اصلی پالایش مشارکتی با فیلترینگ محتوا محور در این است که در این سیستم یک مدل بر اساس ارزیابی مجموعه ای از کاربران ایجاد میشود.

-2-2 روش های توصیه کننده مدرن

1-2-2  روشهای اگاه به متن

متن اطلاعاتی در مورد محیط یک کاربر و جزئیات موقعیت او در آن می دهد. برخی از توصیه ها میتوانند برای یک کاربر در عصر مناسب بوده در حالی که این انتخاب ها در صبح مناسب نیستند. سیستم های توصیه گری که به این اطلاعات توجه میکنند و آنها را به کار میگیرند سیستم های توصیه گر اگاه به متن خوانده میشوند.

2-2-2 روشهای مبتنی بر معنا

این سیستم براساس درکی که از کاربر و ویژگی های کالا پیدا کرده است توصیه هایی را به کاربر فعلی ارائه میدهد.

.3  الگوریتمهای سیستم توصیهگر

فرض میشود که C مجموعهی همه کاربران و S مجموعهی همهی آیتمهای قابل پیشنهاد مثل کتاب , فیلم و غیره باشد، که این مجموعهها میتوانند بسیار بزرگ باشند.U تابع سودمندی است که میزان سودمندی آیتم s برای کاربرc را بیان میکند:

R یک مجموعه از اعداد صحیح و غیر منفی بر اساس میزان اهمیت است. R رتبه بندی کاربر c به آیتم را انتخاب کرد به طوری که تابع سودمندی کاربر بیشینه شود.به عبارت دیگر :

در سیستم های توصیه گر میزان سودمندی هر آیتم که با یک رتبه مشخص میشود بیان کننده این است که که هر کاربر خاص به چه اندازه یک آیتم خاص را دوست دارد.

1-3 الگوریتم فیلترینگ مبتنی بر محتوا

در این روش ویژگیهای آیتم های مورد علاقه کاربر از روی خریدهای قبلی به دست آمده و یک لیستی از آنها تهیه میشود. فرض کنید که Content - s - مجموعه ای از ویژگی های آیتم s است که با استخراج صفات از محتوای آیتم s به دست آمده است و برای تشخیص مناسب بودن یک آیتم برای توصیه به کار میرود.

2-3  الگوریتم پالایش مشارکتی

در سیستم های پالایش مشارکتی سودمندی برای یک کاربر خاص، بر اساس آیتمهای که قبلا توسط دیگر کاربران ارزشگذاری شده پیش بینی میشود. در این روش سودمندی u - c,s - از آیتم s برای کاربر c توسط سودمندی u - cj,s - متعلق به آیتم s توسط دیگر کاربران cj که مشابه کاربر cهستند, تخمین زده میشود.

پالایش مشارکتی به طور کلی از دو جنبه بررسی میشود.جنبه اول مربوط به استخراج اطلاعات و دیدگاه دوم مربوط به جمعآوری دادهها میباشد.در دیدگاه اول چگونگی ارائه توصیهها به کاربران بررسی میشود که از دو نوع الگوریتم بسته به شرایط استفاده میشود. الگوریتمهای مبتنی برحافظه1 و الگوریتمهای مبتنی بر مدل2، که این الگوریتمها برای ارائه توصیه از ماتریس کامل رتبهبندی استفاده میکنند.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید