بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

ارائه ي يک سيستم توصيه گر مبتني بر اعتماد با استفاده از شبکه عصبي
چکيده
سيستمهاي توصيه گر، با استفاده از ابزارهاي داده کاوي ميتوانند پيشنهادهاي مناسبي ، براي انتخاب از بين حجم وسيعي از داده براي ما فراهم سازند. اکثر اين سيستمها بر اساس روش پالايش گروهي کار ميکنند. در اين روش به کمک معيارهاي شباهت ، همسايه هاي مشابه براي يک فرد، انتخاب شده سپس بر اساس براورد نظرات آنها، پيشنهاد مورد نظر ارائه ميگردد. معيار شباهت تاثير بسيار زيادي بر عملکرد اينگونه سيستمها ميگذارد. انتخاب معيار مناسب يکي از چالشها در اين زمينه است . در اين مقاله ، سيستمي پيشنهاد شده ، که بدون نياز به يافتن کاربران مشابه و به کمک نظرات افراد ديگر واعتمادي که نسبت به آنها کسب کرده، ميتواند پيشنهادهاي مناسبي را ارائه دهد. در اين سيستم ، از شبکه عصبي پس انتشار خطا، براي کشف روابط و اعتماد استفاده شده است . آزمايشها نشان ميدهد که روش پيشنهادي کارايي را بالاتر برده است .
کلمات کليدي
سيستمهاي توصيه گر، پالايش گروهي ، اعتماد، شبکه عصبي پس انتشار خطا


١- مقدمه
امروزه به علت افزايش روز افزون حجم دادها، يافتن اطلاعات درست و مناسب تبديل به يکي از مسائل مهم و شايان توجه شده که بدون استفاده از سيستمهاي کامپيوتري امکان پذير نميباشد. اينترنت به ابزاري تبديل گشته که داده ها را به راحتي در دسترس ما قرار ميدهد اما در دسترس بودن به معني يافتن اطلاعات درست نيست .
همواره نيازمند سيستمي هستيم که بتواند در زماني کم از بين حجم وسيعي از داده، اطلاعات مناسب را براي ما پيدا کند. راهکار اين مشکل سيستمهاي توصيه گر١ ميباشد. سيستمهاي توصيه گر سعي ميکنند به کمک بررسي رفتار کاربران در گذشته ، علايق آنها را تشخيص داده و با توجه به آن، از بين حجم وسيعي از داده، پيشنهادهاي مناسبي را به آنها ارائه دهند.
سيســتمهاي توصــيه گــر بــه دو دســته مهــم تقســيم ميشــوند.
سيســتمهاي مبتنــي بــر محتــوا٢ و سيســتمهاي مبتنــي بــر پــالايش گروهي ٣[١].
سيستمهاي مبتني بر محتوا، بدون در نظر گرفتن نظر ساير کاربران و تنها بر اساس مشخصات خود کاربر، سابقه انتخابهاي او و مشخصات اقلام . ميتواند پيشنهاداتي ارائه نمايد.
سيستمهاي پالايش گروهي ، پيشنهادهاي خود را بر اساس اطلاعاتي که توسط کاربران مشابه ، به دست می ايد توليد ميکنند. در نتيجه محتواي آيتمها در نظر گرفته نميشود. در اين شيوه ابتدا کاربران به گروههايي تقسيم ميشوند به طوري که افراد هر گروه داراي علائق و اهداف مشترکي باشند. براي پيش بيني نظر يک کاربر در مورد يک آيتم خاص، ميتوان از برآورد نظر افراد هم گروهش که در مورد ان آيتم نظر دادهاند، استفاده کرد. در اين شيوه، فرض اوليه اين است که افرادي که تاکنون رفتاري مشابه داشته اند، به احتمال زياد در آينده نيز سلايق مشابه خواهند داشت . در نتيجه ، يافتن کاربران مشابه ، کليدي ترين مسئله در اين روش ميباشد. با توجه به اينکه کاربران در مورد تعداد متفاوتي از اقلام اظهار نظر کردهاند و نظرات آنها نيز متفاوت است و همچنين همپوشاني کاربران مختلف با هم نيز متفاوت است ؛ يافتن معيار تشابهي که بتواند همه اين ويژگيها ها را به درستي در نظر بگيرد کار مشکلي است . سيستمهاي پالايش گروهي به خاطر همين مشکل نميتوانند کارايي بهينه را به دست آورند[٢].
يک ديدگاه جديد در روش پالايش گروهي استفاده از معيار اعتماد٤ ميباشد. اعتماد به دو شکل صريح و ضمني وجود دارد. در حالت صريح کاربران مورد اعتماد يک فرد را ميتوان به صورت دستي وارد سيستم کرد و يا از طريق لينکهايي ، از شبکه هاي اجتماعي به دست آورد. در روش ضمني با توجه به سابقه راي هاي کاربران ميتوان به اين اعتماد دست يافت [٢].
در روش پيشنهادي توانسته ايم بدون در نظر گرفتن تشابه افراد و با دخالت دادن فاکتور اعتماد، کارايي الگوريتم پالايش گروهي را بالا ببريم . در حقيقت در اين شيوه، افرادي که نظراتي متضاد يکديگر دارند نيز، ميتوانند در پيش بيني راي هم کمک کنند. در اين روش از شبکه عصبي استفاده شده است .
در ادامه اين مقاله ، در بخش ٢ کارهاي انجام شده قبلي بررسي ميگردد، بخش ٣ الگوريتم پيشنهادي را معرفي ميکند. نتايج آزمايشها در بخش ٤ نشان داده شده و در نهايت بخش ٥ شامل نتيجه گيري ميباشد.
٢- مرور ادبيات مرتبط
٢-١- سيستم توصيه گر مبتني بر پالايش گروهي
همانطور که بيان شد، اين سيستمها دو مرحله اصلي دارند. اول يافتن همسايه هاي مشابه ، براي کاربر مورد نظر و دوم پيش بيني رأي وي به کمک تجميع آراء همسايه ها. براي تشخيص سلايق کاربران و در نتيجه شباهت آنها، نياز به داشتن رأيهاي هر کاربر است . اين رأيها، يا به صورت صريح و با پرسيدن از کاربر به دست مي آيد و يا با استنتاج از واکنشهاي کاربر. رأيها در ماتريسي به نام ماتريس راي کاربر- کالا٦ ذخيره ميشوند [٣] .
٢-١-١- يافتن همسايه ها
ابتدا به کمک معياري مناسب ، کاربران را رتبه بندي ميکنيم . توابع فاصله متعددي تاکنون پيشنهاد شده که به کمک آنها ميتوان شباهت دو کاربر را مشخص کرد. يکي از پرکاربردترين اين توابع ، فرمول پيرسون ٧ است . اين روش به کمک فرمول ١ ميتواند فاصله بين دو کاربر ux و u y را به دست آورد.

در اين فرمول مجموعه اقلامي است که هر دو کارير ux و به آنها رأي داده اند و mx و ميانگين کل رأيهاي
کاربران ux و uy ميباشد.
براي مشخص کردن همسايگان هر کاربر، از بين کاربران رتبه بندي شده، دو روش وجود دارد. راهکار اول، انتخاب يک حد آستانه براي شباهت است . به عبارت ديگر تمام کاربراني که ميزان شباهتشان از حد آستانه بيشتر باشد به عنوان همسايه در نظر گرفته ميشوند.
مشکل اين روش انتخاب حد آستانه مناسب است .
راهکار دوم، انتخاب k تا شبيه ترين همسايه است . به عبارت ديگر کاربران به کمک رابطه پيرسون رتبه بندي شده و سپس k تاي اول، به عنوان همسايه انتخاب ميشوند.
٢-١-٢- پيش بيني رأي کاربر
در اين مرحله به کمک مجموعه همسايه هاي کاربر ux، ميتوان رأي او، prx j، را براي کالاي j به کمک فرمول ٢ پيش بيني کرد.

که mx ، ميانگين کل آراء کاربر ux و C مجموعه همسايگان اين کاربر است . ضريب k فاکتور نرمال کننده است که معمولا به
صورت در نظر گرفته ميشود. mc نيز ميانگين رأيهاي کاربر است و به کمک فرمول ٣ محاسبه ميشود.

Sc مجموعه اقلامي است کاربر uc به آنها رأي داده است .
٢-٢- مشکلات روش پالايش گروهي
با وجود موفقيتهاي روش پالايش گروهي ، اين روش از مشکلاتي رنج ميبرد از جمله مقياس پذيري ٨، خلوت بودن ماتريس رأيها و 9 شروع سرد١٠[١].
مقياس پذيري: در اين روش محاسبه شباهت بين کاربران به تعداد کاربران و تعداد اقلام وابسته است . با توجه به رشد نمايي دادههاي واقعي ، انتظار ميرود رشد محاسبات نيز زياد باشد.
خلوت بودن ماتريس رأيها: کاربران معمولا به درصد پاييني از اقلام رأي ميدهند. که سبب مي شود ماتريس رأيها بسيار خلوت باشد و در نتيجه نميتوان تخمين قابل اعتمادي از شباهت بين کاربران بدست آورد. روشهاي متعددي براي مقابله با اين مشکل وجود دارد از جمله کاهش بعد ماتريس کاربر-کالا[٣] ، پالايش گروهي مبتني بر کالا[٤] و پالايش گروهي مبتني بر اعتماد [٥].
شروع سرد: دو نوع شروع سرد وجود دارد. شروع سرد کاربر زماني اتفاق ميافتد، که کاربري وارد سيستم ميشود که تا به حال رأيي نداده و يا داراي تعداد رأي کمي است . از آنجاييکه سيستم نميتواند همسايگان اين فرد را بيابد امکان پيشنهاد را نيز ندارد. و شروع سرد کالا، به حالتي گفته ميشود که کالاي جديدي وارد سيستم ميشود.
سيستم توصيه گر نميتواند آن کالا را به کسي پيشنهاد کند تا زماني که ، تعداد کافي کاربر به آن رأي دهند.
٢-٣- سيستم توصيه گر مبتني بر اعتماد
در روشهاي قديمي پالايش گروهي ، سيستم توصيه گر، به کمک همسايه هاي کاربر مورد نظر، پيشنهادهايي را توليد ميکرد. در روش پالايش گروهي مبتني بر اعتماد، مقوله اعتماد نيز در اين پروسه به کار گرفته ميشود. اعتماد يا از طريق ماتريس رأيها به دست می اید و يا از طريق شبکه هاي اجتمايي اعتماد.
گلبک و هنلر[٦] سيستم توصيه گري معرفي کرده اند که با پرسيدن از کاربران، ميزان اعتماد آنها از يکديگر را به دست آورده و سپس به کمک اين معيار، پيشنهاد مناسب را توليد ميکنند. پپاگليس و همکارانش [٥] نشان دادند در روش پيشنهادي آنها، با دخالت دادن معيار اعتماد ميتوان تاثير منفي خلوتي ماتريس رأي ها را کاهش داد.

در روش پیشنهادی ان ها میزان اعتماد بین دو کاربر از تعاملات بین ان ها به دست می اید . ان ها تعامل را ، همان رای ها نیز در نظر گرفته اند . در نتیجه نیز به کمک ماتريس رأيها شبکه ارتباطي بين کاربران را توليد کرده و با استفاده از آن، اعتماد موجود بين کاربران را پيدا مي کنند.
ماسا و اوساني [٧] سيستمي ارائه کرده اند که ماتريس رأي ها و ماتريس اعتماد را به عنوان ورودي دريافت مي کند.
آنها نشان دادند به کمک پس انتشار اعتماد و استفاده از آن ميتوان با حفظ مقدار ١١ MAE، مقدار "پوشش "١٢ را افزايش داد.
لاتيا و همکارانش سيستم توصيه گري پيشنهاد کردند[٢] که به جاي استفاده از روش KNN13 از روش KNR14 استفاده ميکنند.در اين روش، کاربران با معيار اعتماد رتبه بندي شده، k تاي اول به عنوان توصيه گر١٥ انتخاب ميشوند. آنها با ارائه فرمولي اعتماد را از ماتريس رأي ها به دست مي آورند. دوناوان و اسميت [٨] نيز با ارائه دو مدل محاسباتي براي اعتماد نشان دادند که استفاده از اين معيار کارايي سيستم توصيه گر را بالاتر برده است .
٣- الگوريتم پيشنهادي
در سيستم هاي پالايش گروهي قبلي ، يافتن معيار شباهت يکي از تاثيرگذارترين موارد در کارايي الگوريتم است . همانطور که گفته شد، به علت خلوت بودن ماتريس رأيها، نميتوان شباهت بين کاربران را به درستي تخمين زد. روشهاي پالايش گروهي مبتني

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید