بخشی از مقاله
خلاصه
در سالهای اخیر، شبکههای اجتماعی آنلاین برای طیفی از فعالیت ها همانند بررسی بالقوه و پیگیری بهکارگیری توصیههای مربوط به خدمات با کیفیت بالا و فراهمکنندگان خدمات مورد استفاده قرار گرفتهاند. در چنین فعالیتهایی، اعتماد یکی از عوامل بسیار مهم برای تصمیمگیری کاربران میباشد. در مطالعات موجود، پیشرفتهترین رویکردهای پیش بینی اعتماد بر روی تمایل جهت مند اعتماد و یا اعتماد منتشر شده روابط اعتماد جفتی در امتداد یک مسیر یا شباهت مقادیر رتبهبندی اعتماد متمرکز گردیدهاند. ما در این مقاله یک مدل پیشبینی اعتماد جدید را بر مبنای تجزیه اعتماد و فاکتوربندی ماتریس ارائه دادهایم که همه عوامل اثرگذار بر اعتماد را مد نظر قرار داده و ویژگیهای شخصی و بین اشخاص را متمایز میسازد.
ما در این مدل در ابتدا اعتماد را به دو مدل تمایل به اعتماد و اعتمادی که تمایل به آن کاهش یافته است تجزیه نموده ایم. سپس بر مبنای رتبههای اعتمادی که تمایل به آن کاهش یافته است، فاکتورگیری ماتریس با یک عبارت منظم سازی برای پیشبینی مقادیر تمایل کاهش یافته رتبههای از دست رفته اعتماد با دربرگیری هر دو مورد اعتماد منتشر شده و شباهت عادات رتبهبندی کاربران بکار گرفته شده است. در انتها، رتبههای از دست رفته اعتماد با مقادیر پیشبینی شده تمایل کاهش یافته و مقادیر تمایل اعتماد، ترکیب میگردند. آزمایشاتی که بر روی مجموعه دادههای دنیای واقعی انجام شده، نشاندهنده برتری رویکرد ما در مقایسه با جدیدترین پیشرفتها در زمینه دقت پیشبینی اعتماد می باشند.
-1 مقدمه
در سالهای اخیر، دامنهای متنوع از شبکههای اجتماعی آنلاین - OSNs - همانند فیسبوک، MySpace، توئیتر، LinkedIn و Google+، توجه تعداد عظیمی از کاربران را به خود جلب نمودهاند. شبکههای اجتماعی آنلاین همچنین در راستای فعالیتهایی همانند بررسی کارمندان بالقوه و پیگیری توصیههای مربوط به کیفیت خدمات و فراهم کنندگان خدمات قرار گرفتهاند. به عنوان مثال، بر اساس نظرسنجی انجام شده از 2600 مدیر استخدام در سال 2009 توسط موسسه ایجاد شغل بیانگر این است که 45 درصد از آن مدیران از سایتهای شبکه اجتماعی برای بررسی کارمندان استفاده کرده که این رقم در سال 2013 به 92 درصد افزایش یافته است.
اعتماد در زمینه چنین فعالیتهایی، یعنی تعهد به عملی در آینده بر مبنای یک عقیده که این میتواند به نتیجهای خوب منجر گردد که یکی از عوامل اساسی برای تصمیمگیری کاربران میباشد. این امر نیاز به رویکردها و ساز و کارهایی کارآمد برای پیشبینی اعتماد بین دو کاربر بدون هر گونه تماس مستقیم دارد. پیشبینی اعتماد، فرآیندی از تخمین یک رابطه اعتماد جفتی بین دو کاربری بوده که بر مبنای مشاهدات موجود به صورت مستقیم به یکدیگر متصل نیستند. در مطالعات موجود،اساساً دو گروه از رویکردهای پیشبینی اعتماد وجود دارند: پیشبینی اعتماد بر مبنای انتشار - یعنی، انتشار / استنتاج اعتماد - و پیشبینی اعتماد بر مبنای شباهت. انتشار / استنتاج اعتماد، فرآیندی از ارزیابی اعتماد از یک کاربر منبع برای یک کاربر هدف در امتداد مسیری بین آنها بوده که متشکل از لینکها و مقادیر اعتماد میباشد.[1]
به عنوان مثال همانطور که در تصویر 1 - ای - نشان داده شده، اگر که کاربر A به کاربر B و کاربر B به کاربر C اعتماد داشته باشد، پس کاربر A تا حدی به کاربر C هم اعتماد دارد 3]،.[2 انتشار اعتماد در بسیاری از حوزههای برنامه وب همانند تجارت الکترونیک [4] ؛ سیستمهای همتا به همتا [ 5] و شبکههای اجتماعی [3] مورد مطالعه قرار گرفتهاند. از سوی دیگر، یک کاربر به این تمایل داشته تا به کاربرانی اعتماد کند که به او شبیه هستند.[6] به صورت کلی، پیشبینی اعتماد بر مبنای شباهت، در پی تخمین زدن اعماد بین دو کاربر بر اساس عادات، زمینه و پروفایل های مشابه آنها میباشد.
تصویر :1 مثالی از رتبه بندی اعتماد
در مطالعات موجود، شباهت مقادیر رتبهبندی اعتماد مشترک دو کاربر که به دیگران داده شده است، مورد محاسبه قرار میگیرد. چنین شباهتی در این مقاله به عنوان شباهت مقدار رتبهبندی اعتماد نامگذاری شده است. البته این مطلب را باید خاطرنشان گردد که شباهت همچنین میتواند از توزیع رتبهبندیهای اعتماد دو کاربر محاسبه گردیده که به عنوان شباهت توزیع رتبهبندی اعتماد نامگذاری گردیده است. توزیع رتبهبندیهای اعتماد، ارائهدهنده روشی جدید برای تشخیص کاربرانی با رفتارهای متفاوت و ارتقای دقت پیشبینی اعتماد میباشد. به عنوان مثال، همانطور که در تصویر 1 - بخش ب - نشان داده شده، مقدار اعتمادی که توسط D و E به G داده شده، همسان هستند.
با این حال آنها از دو توزیع متفاوت نشأت گرفته و این نشان می دهد که حتی مقدار همسان اعتمادی که به G داده شده است، می تواند در تفکرات D و E متفاوت باشند، چرا که مقدار اعتماد 3 که توسط D داده شده است دارای ارزشی بالاتر میباشد، در حالی که در رتبهبندیهای E، این عدد دارای مقداری پایینتری میباشد. اعتماد منتشر شده و دو نوع از شباهتها، ویژگیهای بین شخصی میباشند. آنها عواملی بوده که بر روی اعتماد بین دو کاربر اثر میگذارند.
در مقابل، تمایل اعتماد - که به عنوان جهتگیری اعتماد نیز نامگذاری شده است - نوعی از عواملی بوده که از همه رتبهبندیهای اعتمادی که یک کاربر داده است و یا دریافت نموده است و همچنین تمایل جهت مند او برای اعتماد به دیگران یا مورد اعتماد قرار گرفتن توسط دیگران - که به ترتیب به عنوان تمایل اعتماد کننده و تمایل مورد اعتماد نامگذاری شده - به صورت میانگین استخراج شده است. تمایل اعتماد به عنوان یک مفهوم بسیار مهم در علوم اجتماعی مد نظر قرار گرفته و به عنوان بخشی جدایی ناپذیر از تصمیم نهایی اعتماد مورد شناسایی قرار گرفته است .
[7] به عنوان مثال، برخی از کاربران تمایل دارند تا رتبهبندیهای اعتمادنسبتاً بالایی را به صورتی دست و دلبازانه در مقایسه با دیگران ارائه دهند، در حالی که برخی از کاربران هم رتبهبندیهای اعتماد بالاتری را در مقایسه با دیگران دریافت میکنند. جزئیات مربوط به تمایل اعتماد در قسمت 4 ارائه شدهاند. در مطالعات موجود، اعتماد یا از طریق انتشار اعتماد 3]،[2، یا با مد نظر قرار دادن اعتماد منتشر شده و تمایل [8] و یا صرفا با استفاده از شباهت مقادیر رتبهبندی [ 9] پیشبینی شدهاند.
به صورت کلی، آنها دارای نواقص زیر هستند.اولاً ، همه موارد تمایل، اعتماد منتشر شده و شباهت بر روی اعتماد بین دو کاربر اثر میگذارند. همه آنها برای پیشبینی اعتماد جفتی، به جای مد نظر قرار دادن یک یا دو عامل اثرگذار به تنهایی، بکار گرفته میشوند. دوما، شباهت توزیعات رتبهبندی اعتماد، شباهت رفتارهای کاربران در رتبهبندیهای اعتماد را توصیف میکنند. بر این اساس، این امر برای پیشبینی اعتماد دارای اهمیت میباشد10]،.[6 اما این مسئله در مطالعات موجود مورد غفلت قرار گرفته است. سوما، همه این عوامل دارای انواع مختلفی بوده که ارائهدهنده ویژگی های شخصی یا بین شخصی هستند.
بر این اساس، آنها باید به صورت مجزا و متفاوت پردازش شده تا بر این اساس دقت بالاتری در پیشبینی اعتماد را ارائه دهند. در این مقاله برای غلبه بر نواقص بالا، ما یک مدل پیشبینی اعتماد جدید را بر مبنای تجزیه رتبهبندی و فاکتورگیری ماتریس ارائه داده که دربرگیرنده هر دو مورد پیشبینی اعتماد مبتنی بر انتشار و پیشبینی اعتماد مبتنی بر شباهت می باشد. سهم پژوهشی مقاله ما در این زمینه به صورت زیر خلاصه شده است:
1. مدل ما، رتبهبندیهای اعتماد را به تمایلات به اعتماد - یعنی تمایل اعتماد کننده و تمایل مورد اعتماد قرار گرفته - تجزیه کرده، و اعتماد را با رتبهبندیهای تمایل کاهش یافته برای کاهش اثر منفی تمایل به اعتماد، پیشبینی میکنند.
2. مدل ما، شباهت توزیعات رتبهبندی اعتماد را برای تمایز بیشتر اعتماد بین کاربران و بهینهسازی فاکتورگیری ماتریس، مد نظر قرار میدهد. این امر به صورتی ویژه، زمانی مهم میباشد که شباهت مقادیر رتبهبندی اعتماد، یکسان میباشد.
3. مدل ما هر دو مورد اعتماد منتشر شده و عوامل شباهت را در نظر گرفته است که متشکل از قاعده مند کردن انتشار و شباهت فاکتورگیری ماتریس به منظور ارتقای دقت پیشبینی اعتماد میباشد.
4. بر مبنای معیارهای ریشه میانگین مربعات خطا - RMSE - و میانگین خطای مطلق - MAE - ، آزمایشاتی بر روی یک مجموعه دادههای جهان واقعی انجام شده و پیشرفتهای قابلتوجه مدل ما در دقت پیشبینی اعتماد را در مقایسه با رویکردهای دیگر نشان میدهند.
-2 آثار مربوطه
ما در این قسمت به صورت خلاصه مروری بر روی آثار مربوطه در سه حوزه، یعنی انتشار، پالایش گروهی و فاکتورگیری ماتریس را انجام میدهیم.
-1-2 انتشار اعتماد
در دهه گذشته، اکثر مدل های پیشبینی اعتماد بر روی انتشار اعتماد در امتداد مسیرهای کاربران متصل به هم تمرکز نمودهاند. گاها و همکاران [1] یک مدل انتشار اعتماد را با مد نظر قرار دادن تعداد گامها در زمان محاسبه مقدار اعتماد منتشر شده بین یک کاربر منبع و کاربر هدف، ارائه داده اند.گُلبک و همکاران [ 2] یک رویکرد انتشار اعتماد را برای ایجاد یک رابطه اعتماد بین دو کاربر که به صورت غیرمستقیم به هم متصل بوده را بر مبنای مقدار میانگین اعتماد در امتداد یک مسیر اجتماعی از کاربر منبع به کاربر هدف، ارائه نمودهاند.
هانگ و همکاران [11] از عملگرهایی همانند الحاق، تراکم و انتخاب برای انتشار اعتماد استفاده کردهاند . لیو و همکاران [3] بر این نظر بوده که روابط اجتماعی و نقشهای توصیه نیز برای انتشار اعتماد دارای اهمیت هستند. این رویکردها، به صورتی قابلتوجه، دقت پیشبینی اعتماد را ارتقا دادهاند. اما بسیاری از عوامل دیگر همانند تمایل و شباهت که بر روی پیشبینی اعتماد اثر گذاشته باید در نظر گرفته شوند.
-2-2 پالایش گروهی
در پیشبینی اعتماد، اگر کاربران مورد اعتماد - یعنی کاربرانی که رتبهبندیهای اعتماد را دریافت کرده - به عنوان آیتمهایی در یک سیستم توصیه گر در نظر گرفته شوند، رویکردهای پالایش گروهی - CF - ، روابط بین اعتماد کنندگان - یعنی کاربرانی که رتبهبندیهای اعتماد را ارائه داده - و اعتماد شوندگان را برای تشخیص ارتباطات جدید اعتماد کننده - اعتماد شونده، تحلیل میکند.[12] آن هاعمدتاً مبتنی بر رفتارهای گذشته کاربر همانند رتبهبندیهای قبلی میباشندمعمولاً. دو نوع از پالایش گروهی وجود دارد که عبارت از روشهای همسایگی و روشهای عامل نهفته میباشند.
مورد اول، رتبهبندیهای از دست رفته را بر مبنای رتبهبندیهای همسایگان مشابه پیشبینی میکند. مورد دوم، رتبهبندیها را بهواسطه مشخص کردن ویژگیهای هر دو مورد اعتماد کنندگان و اعتماد شوندگان بر روی تعدادی از عوامل نهفته که از رتبهبندیها استنتاج گردیده، توضیح می دهد. موفقترین موارد از مدلهای عامل پنهان مبتنی بر بنیان فاکتورگیری ماتریس می باشند. کولر و همکاران [12] در رقابت قیمت نتفیکس نشان داده اند روشهای فاکتورگیری ماتریس، در مقایسه با دیگر روشهای پیش بینی بهویژه در مجموعه دادههای پراکنده، دارای عملکرد بهتری هستند. سالاخودینوف و همکاران [13] نشان دادهاند که روش مبتنی بر فاکتورگیری ماتریس میتواند به خوبی مجموعه دادههای بزرگ را مقیاس بندی کرده چرا که به صورت خطی با تعداد مشاهدات مقیاس بندی کرده به خوبی بر روی مجموعه دادههای بسیار پراکنده و نامتوازن، عمل میکند.
-3-2 بهبودهایی برای فاکتورگیری ماتریس
روشهای فاکتورگیری ماتریس نیز به روشهای مختلفی اصلاح شده است تا دقت پیشبینی را ارتقا دهند. ما و همکاران [9] منظم سازی اجتماعی را در درون فاکتورگیری ماتریس وارد کرده و به دقتی بهتر دست یافتهاند. یائو و همکاران [8] فاکتورگیری ماتریس را با مد نظر قرار دادن تمایل و اعتماد منتشر شده به عنوان برخی از عوامل پنهان فاکتورگیری ماتریس بنیادین به منظور تقویت دقت پیشبینی اعتماد، اصلاح نمودهاند. اما در زمانی که هیچ مسیری وجود نداشته باشد، با مقادیر تمایل و اعتماد منتشر شده به تنهایی، اعتماد نمیتواند پیشبینی شود. ژانگ و همکاران [ 4] نشان دادهاند که توزیع رتبهبندیهای اعتماد کاربران، عاملی مهم بوده که بر روی اعتماد بین کاربر منبع و کاربر هدف اثر میگذارد.
بر این اساس، استفاده از مزیت توزیع برای تقویت بیشتر دقت پیشبینی اعتماد، امری ضروری میباشد. به علاوه روشی که طی آن عوامل اثرگذار مورد استفاده قرار گرفته نیز نیاز به ارتقا دارند. از یک سو، عوامل شخصی همانند تمایلات هر رتبهبندی تکی کاربر، تجزیه شده و بر روی رتبهبندیهای کلی کاربر اثر میگذارند؛ از سوی دیگر، عوامل بین شخصی همانند شباهت و اعتماد منتشر شده از دو رتبهبندی اعتماد کاربر استخراج شده تا ویژگیهای بین آنها را منعکس نمایند. بر این اساس، این دو نوع عامل باید به صورتی متفاوت به منظور ارتقای دقت پیشبینی اعتماد مورد عمل قرار گیرند.