بخشی از مقاله
خلاصه
در چند سال گذشته، به دلیل سهولت در انتشار داده ها در وب و رسانه های اجتماعی، حجم محتوای دیجیتالی بطور قابل توجهی افزایش یافته است. این مقدار زیاد از داده ها بر روی وب و رسانه های مختلف اجتماعی چالش هایی مانند فقدان ابرفضا و اضافه بار اطلاعات را به ارمغان می آورد. یکی از راه حل های امیدوار کننده برای غلبه بر این مشکلات سیستم های توصیه گر هستند. سیستم های پیشنهاد دهنده تاثیر جمع آوری و بهره برداری از اطلاعات مربوط به اشخاص و موارد را بیشتر میکنند.
در ادبیات موضوع، چندین روش برای مدل سازی و غنی سازی پروفایل کاربر ارائه شده است. در این مقاله، ما یک چارچوب مقایسه برای مقایسه و طبقه بندی مدل سازی کاربران و غنی سازی مدل کاربران برای سیستم های توصیهگر را معرفی مینماییم. چارچوب مقایسهای ارائه شده شامل مولفههای زیر میباشد: - الف - روش مدل سازی - ب - روش غنی سازی، - ج - روش ارزیابی، و - د - پیکره مورد استفاده. ما سپس به چالشهای موجود در زمینه سیستم های توصیهگر و گرایشهای نوظهور در این زمینه میپردازیم.
.1 مقدمه
سیستم های توصیه گر در حوزههای متعددی کاربرد دارند، به طور مثال چندین مورد از رشته های تحقیقاتی مثل علوم شناختی2 ، تئوری تخمین3 ، بازیابی اطلاعات 4 و غیره حول محور سیستم های توصیه گر پژوهش هایی را انجام داده اند؛ با توجه به افزایش اهمیت توصیه گری، بحث و تحقیق در این مورد به صورت مستقل از سال 1990 شروع شده است .[1] یک سیستم توصیه گر میتواند به چند بخش تقسیم شود: مدل کاربر، ارتباطات اجتماعی، یک مدل از مورد - محصول، محتوا و ... - ، یک الگوریتم توصیه گر و یک سبک تعامل.[2] 1 مدل کاربر دربردارنده تمام اطلاعات از تجربیات شخصی کاربر است. این اطلاعات تعامل بین کاربر با موارد در پروفایل کاربر ذخیره میشود.
یک سیستم توصیه گر در تلاش است تا اطلاعات موارد مختلف - فیلم ها، موسیقی، کتاب ها، منابع تحقیق، تصاویر، صفحات وب، مقالات و غیره - که مورد علاقه کاربر هستند را پوشش بدهد. این ابزارها اطلاعات مفید و مرتبط با علایق کاربران را از اطلاعات نا مفید و غیر مرتبط جدا میکنند و آنها را به کاربری که به این اطلاعات نیاز دارد میرسانند که این امر برای سازمان های تجاری بسیار مفید است. سیستم های توصیه گر خیلی وسیع و فراگیر در بخش کشف دانش و ارائه موارد شخصی در فعالیت های بسیاری مانند تجارت الکترونیکی، کتابخانه دیجیتال، بازاریابی الکترونیکی و غیره مورد استفاده قرار گرفته است.
ارائه توصیه به سیستمی نیاز دارد که اطلاعاتی در دسترس را در مورد کاربران در اختیار داشته باشد، مثل رتبه بندی صورت گرفته توسط کاربر در مورد محصول مشاهده و یا خریداری شده. لازمه این سیستم که میتواند اطلاعات علاقه مندی های کاربر را نگهداری کند دسترسی به اطلاعات پروفایل کاربران است. [3] دو روش به طور گسترده ای در سیستم های توصیه گر مورد استفاده قرار میگیرد: پالایش مبتنی بر محتوا2 و پالایش مشترک .3 وظیفه سنتی در پالایش مشارکتی، پیش بینی یک آیتم خاص برای کاربر هدف با استفاده از نظرات دیگر کاربران مشابه، و در نتیجه توصیه مناسب است.
پالایش مشارکتی به دلیل این که فرآیند پالایش را، تنها بر اساس اطلاعات تاریخی در مورد حال و هوای یک کاربر هدف انجام میدهد، در تجزیه و تحلیل محتوای زمینه ای دارای یک مزیت نسبت به پالایش محتوا است؛ به عنوان مثال، موسیقی، فیلم، و عکس. با این وجود، پالایش مشترک از یک مشکل اساسی رنج میبرد، یعنی مشکل شروع سرد4، که می تواند به موارد شروع سرد و کاربران با شروع سرد تقسیم شود.
چندی از محققان پیشنهاد ها و چالش های مقابله با این مشکل را ارائه داده اند. در یک سیستم توصیه گر مبتنی بر پالایش مشارکتی، یک آیتم نمی تواند توصیه شود مگر تا زمانی که تعداد زیادی از کاربران قبلا به آن امتیاز داده باشند. این مساله به عنوان یک آیتم شروع سرد شناخته شده است. این مشکل مربوط به موارد جدیدی است که هر چند دقیقه تولید میشوند و می تواند تا حدی توسط فن آوری مبتنی بر محتوا کاهش داده شود. این در حالی است که، پالایش مبتنی بر محتوا نیز برای یک کاربر شروع سرد برخوردی شبیه به یک پالایش مشارکتی دارد. کاربر شروع سرد، یک کاربر جدید را توصیف میکند که یک سیستم توصیه گر را با عقاید مختلف پیوند میدهد؛ با این شرایط، این سیستم به طور کلی قادر به توصیه با کیفیت بالا برای کاربران با شروع سرد نیست .[4]
اولین سیستم توصیه گر خودکار، روش پالایش مشترک را استفاده کرده است، وسیع ترین استفاده در مجموعه اطلاعاتی بزرگ پالایش موضوعات مربوط به چیزهایی مانند فیلم، کتاب، موسیقی، اخبار آنلاین، برنامه های تلویزیونی، و مقالات پژوهشی بوده است؛ با توجه به وجود موفقیت و محبوبیت، پالایش مشارکتی دارای چندین محدودیت است، از جمله؛ کم پشتی5 داده ها، مقیاس پذیری، مشکل شروع سرد، و کاربران غیرقابل اعتماد.
.2 سیستم های توصیه گر
سیستم های توصیه گر، در پاسخ به گرانبار شدن اطلاعات پدید آمده است. این سیستم ها به کاربران محتوایی مناسب با نیاز آنان را توصیه میکند. برای ارائه توصیه مناسب به کاربران، سیستم های توصیه گر شخصی، نیازمند مدل های دقیق از ویژگی ها، ترجیحات و نیازهای کاربران میباشد. شیوع فن آوری و خدمات وب 2، کاربران نهایی را قادر می سازد تا علاوه بر یک مصرف کننده محتوا، تولید کننده آن نیز باشند.
جالب است که حتی به صورت روزانه، مقدار زیادی از محتوای متنی، از جمله اخبار آنلاین، مقالات علمی، ویکی، و مقالات وبلاگ در وب ایجاد می شود. از همین رو است که فرآیند توصیه خودکار به کاربر سخت تر میشود، این سختی نه تنها به دلیل مقدار زیاد اطلاعات است بلکه به دلیل دشواری در فهم خودکار ترجیهات کاربر نیز میباشد. از چالشهای مهم در طراحی یک سیستم توصیه گر، دشواری در فهم خودکار ترجیهات کاربر است.
دو روش به طور گسترده ای در سیستم های توصیه گر مورد استفاده قرار میگیرد که عبارتند از پالایش مبتنی بر محتوا1 و پالایش مشترک.2 وظیفه سنتی در پالایش مشترک، پیش بینی یک مورد خاص برای کاربر هدف با استفاده از نظرات دیگر کاربران مشابه، و در نتیجه توصیه مناسب است. در حال حاضر، استفاده از سیستم های توصیه گر رونق بسیاری پیدا کرده است و بیشتر پژوهش های صورت گرفته در حوزه توصیه فیلم بوده است. [5] البته حوزه های دیگری هم کم و بیش مورد توجه بوده است مثل موسیقی[6] ، تلویزیون[7] ، کتاب[8] ، مقالات[9] و وب گردی. [10] این حوزه ها کمتر از بحث فیلم در پژوهش ها پیگیری شده است.
.1.2 تعاریف سیستم های توصیه گر
امروزه با گسترش بسیار سریع فضای مجازی، حجم گسترده ای از اطلاعات در فضای اینترنت به صورت غیر قابل کنترلی بوجود آمده است. در این حال مشخص است که کاربر نهایی از بین اطلاعات موجود قادر به پیدا کردن موردی خاص از موضوع مورد علاقه خود نمی باشد؛ حتی اگر بتواند آن اطلاعات خاص را هم بیابد این کار با دشواری های فراوانی همراه است. یافتن اطلاعات ارزشمند و ساختار یافته از بین حجم زیاد اطلاعات بدون ساختار فعلی، میتواند در موارد زیادی مورد استفاده قرار بگیرد. رشد و گسترش شبکههای اجتماعی، فرصتی جدید را برای کاربران ایجاد نموده است تا بتوانند عقاید و علایق خود را با یکدیگر به اشتراک بگذارند.
در این میان سیستم های توصیه گر میتوانند به صورت خودکار وظیفه یافتن اطلاعات مورد علاقه کاربران را پیدا کنند و به آنها توصیه نمایند. این فرآیند میتواند کارایی سیستم را بسیار بالا ببرد و کاربر را از سردرگمی در بین اطلاعات بیش از پیش شده فضای مجازی برهاند. شکل 1 نمایانگر دید کلی از سیستم ها توصیه گر است. شبکه های ارتباطی کمک شایانی به دسترسی آسان اطلاعات مینماید. در عین حال، ازدیاد اطلاعات برخط مشکل " سربار اطلاعاتی" 3 را بوجود آورده است. برای مثال، اگر یک نفر بخواهد یک دوربین دیجیتال خریداری کند؛ اینکار میتواند برای وی یک تجربه خسته کننده باشد زیرا باید تعداد زیادی از انواع دوربین را ببیند و در مورد آنها بخواند و با مقایسه همه ی آنها در آخر بتواند یک خرید خوب داشته باشد.
سیستم های توصیه گر از راه پیشنهاد دادن خودکار به کاربران البته با توجه به علایق آنها؛ با سربار اطلاعاتی مقابله میکنند. مزیت توصیه گر ها این است که کاربر را قادر میسازد تا بدون خسته شدن از مواجهه با اطلاعات تکراری و غیر مفید خیلی سریع مورد مناسب و مورد علاقه خود را در بین موارد موجود پیدا کند. البته این مهم برای فروشندگان هم بسیار جذاب است که میتوانند محصول شان را با توجه به علایق کاربر بفروش میرسانند و مطمئن هستند که کاربر از این خرید راضی میباشد و به بازگشت او برای خرید های بعدی امیدوار هستند. تعجبی هم ندارد که رقابت نت-فلیکس4، برای بهبود 10 درصدی توصیه ها جایزه 1 میلیون دلاری پرداخت کرده است. [11]