بخشی از مقاله

خلاصه

سیستم های توصیه گر، در پاسخ به گرانبار شدن اطلاعات پدید آمده است. این سیستم ها به کاربران محتوایی مناسب با نیاز آنان را توصیه میکند. برای ارائه توصیه مناسب به کاربران، سیستم های توصیه گر شخصی، نیازمند مدل های دقیق از ویژگی ها، ترجیحات و نیازهای کاربران میباشند. از چالشهای مهم در طراحی یک سیستم توصیه گر، دشواری در فهم خودکار ترجیهات کاربر است. دو روش به طور گسترده ای در سیستم های توصیه گر مورد استفاده قرار میگیرد که عبارتند از پالایش مبتنی بر محتوا و پالایش مشترک.

وظیفه سنتی در پالایش مشترک، پیش بینی یک مورد خاص برای کاربر هدف با استفاده از نظرات دیگر کاربران مشابه، و در نتیجه توصیه مناسب است. در این مقاله، برای بهبود توصیه شخصی به کاربران یک رویکرد مشارکتی برای مدل سازی کاربران فارسی زبان در شبکه های اجتماعی پیشنهاد شده است. این رویکرد در اولین گام الگوهای مفید و معنی داری برای کاربر پیدا میکند و بعد از ساختن مدل شخصی، آن را با استفاده از بانک واژه های مترادف فارسی و با مشارکت کاربران مشابه دیگر غنی خواهد کرد و با استفاده از مدل غنی شده به کاربر توصیه مناسب را ارائه مینماید.

.1 مقدمه

امروزه با گسترش بسیار سریع فضای مجازی، حجم گسترده ای از اطلاعات در فضای اینترنت به صورت غیر قابل کنترلی بوجود آمده است. در این حال مشخص است که کاربر نهایی از بین اطلاعات موجود قادر به پیدا کردن موردی خاص از موضوع مورد علاقه خود نمی باشد؛ حتی اگر بتواند آن اطلاعات خاص را هم بیابد این کار با دشواری های فراوانی همراه است. یافتن اطلاعات ارزشمند و ساختار یافته از بین حجم زیاد اطلاعات بدون ساختار فعلی، می تواند در موارد زیادی مورد استفاده قرار بگیرد .

رشد و گسترش شبکه های اجتماعی، فرصتی جدید را برای کاربران ایجاد نموده است تا بتوانند عقاید و علایق خود را با یکدیگر به اشتراک بگذارند. در این میان سیستم های توصیه گر میتوانند به صورت خودکار وظیفه یافتن اطلاعات مورد علاقه کاربران را پیدا کنند و به آنها توصیه نمایند. این فرآیند میتواند کارایی سیستم را بسیار بالا ببرد و کاربر را از سردرگمی در بین اطلاعات بیش از پیش شده فضای مجازی برهاند. مهمترین بحث در سیستم های توصیه گر پوشش درست و کامل داشتن از علایق کاربر است.

برای دانستن علایق کاربر نیاز داریم تا رفتارهای کاربر را رصد کنیم و نتایج این مشاهده از رفتار کاربر را در یک قالب که سیستم بتواند از آن برای ایجاد توصیه های جدید استفاده کند ذخیره میکنیم، این قالب در ادبیات موضوع به مدل کاربر معروف است. کیفیت توصیه های ایجاد شده بوسیله سیستم توصیه گر ارتباط مستقیم با کیفیت مدل کاربر دارد؛ به این معنی که هر مقدار که سیستم از کاربر درک درست تری داشته باشد توصیه های بهتری به کاربر میکند.

سیستم های توصیه گر برای شناسایی خودکار علایق کاربر نیاز به مدلی از کاربر دارند که بیانگر علایق و ترجیهات کاربر باشد. روش های متعددی برای ساختن این مدل وجود دارد اما هر کدام با مشکلاتی روبرو هستند

.2 ساختن مدل شخصی کاربر

توانایی یادگیری ترجیحات کاربر، قلب یک سیستم توصیه گر شخصی است. برای ارائه توصیه مناسب به کاربران، سیستم های توصیه گر شخصی، نیازمند مدل های دقیق از ویژگی ها، ترجیحات و نیازهای کاربران میباشنداین. دانستنی ها معمولاً در ادبیات موضوع به، مدل کاربر - UM - 1 معروف است .[1] بعلاوه هر کاربر میتواند علایق مختص به خود را داشته باشد، از این رو از انتخاب ویژگی ها برای نمایش و خصوصی سازی علایق کاربر بهره میبریم.

در این بخش ما به توضیح رویکردی برای ساخت یک مدل کاربر شخصی که همان محتوای علایق کاربر را در برمیگیرد، میپردازیم. این روش در پژوهش های مختلفی مورد استفاده قرار گرفته است. اما برای اولین بار توسط کیم و همکاران ایشان در سال 2011 معرفی شده است

قبل از پرداختن به جزئیات بیشتر، لازم است نماد ها و تعاریفی که برای فهمیدن این روش نیاز داریم را توضیح دهیم. ما = {  1, 2, … } را مجموعه تمام متن ها در نظر میگیریم، = { 1, 2, … } را مجموعه تمام اصطلاحات شاخص و = { 1, 2, … } را مجموعه کاربران متمایز در نظر میگیریم. محتوای یک مجموعه از اصطلاحات است، هر کدام از آنها میتوانند در چندین متن با وزن های متفاوت که نشانگر اهمیت آن اصطلاح در توصیف آن متن است، ظاهر شوند. در این مطالعه، یک وزن , مرتبط است با یک جفت - ، - که بوسیله یک نوع معروف از طرح وزن دهی، TF-IDF محاسبه میشوند

برای ساختن یک مدل شخصی کاربر، که به طور بالقوه علایق کاربر را نمایش دهد، ما به صورت پیش نیاز به مقداری دانستنی از کاربر نیاز داریم که باید بدست آوریم؛ این دانستنی ها، به بازخورد1معروف است. معمول ترین راه ها برای بدست آوردن بازخورد، گرفتن دانستنی ها به صورت صریح2 یا بصورت ضمنی3 در هنگام تعامل با کاربر است.

تهیه بازخورد به صورت صریح، نیازمند این است که کاربر محتوا - متن، فیلم، موسیقی، خبر و غیره - را ارزیابی کند و با استفاده از اندازه گیری های معمول میزان رضایت مندی خود را از محتوای مورد نظر اعلام کند؛ به طور مثال برای مسائل مختلف مورد علاقه وی یک ارزش گذاری عددی وجود داشته باشد - دودویی یا یک ارزش گذاری کسری - . اگرچه بازخورد صریح و روشن به ما برای بدست آوردن دقیق تر ترجیحات کاربر کمک می کند، اما یک نقطه ضعف جدی وجود دارد و آن هم این است که کاربران به اندازه کافی تمایل به ارائه بازخورد و اطلاعات شخصی در مورد علاقه مندی خود ندارند.

کاربران به طور کلی انگیزه ای برای ارائه بازخورد ندارند چون در حین دادن اطلاعات، منافع فوری دریافت نمی کنند، حتی با علم بر اینکه در دراز مدت سود خواهند برد، باز هم تمایلی به دادن اطلاعات ندارند. [5] بنابراین، در این مطالعه، ما از بازخورد ضمنی استفاده میکنیم، به این معنا که سیستم به طور خودکار علایق کاربر را از روی رفتارهای کاربر استنتاج میکند

در کل، شاخص اولویت4 در بازخورد ضمنی می تواند به شکل یک جفت به نمایش درآید - ، ℎ - ، که در آن ℎє U یک کاربر است و є C یک محتوای مخصوص است. این جفت دلالت بر این دارد که کاربر ℎ ، بر روی محتوای کلیک کرده، آنرا جمع آوری کرده و یا آنرا نشانه گذاری کرده است . در حالی که بازخورد ضمنی برای یک محتوای خاص توسط یک کاربر لزوما به این معنی نیست که او آن محتوا را دوست دارد، ما فرض میکنیم که جفت بالا به طور ضمنی نشان دهنده علاقه کاربر میباشد.

.3 ساخت مدل علاقه مندی کاربر با استفاده از استخراج متن

رویکرد ما برای مدل سازی علایق کاربر به طور عمده از سه مرحله تشکیل شده است: - 1 - شرایط استخراج و - 2 - استخراج الگوهای پر تکرار. در این بخش، ما گام های ابتدایی برای ساخت یک مدل شخصی کاربر را به جزئیات ارائه می دهیم.

گام اول در مدل سازی کاربر، استخراج واژه ها از یک محتوای مورد علاقه است که با حذف کلمات توقف 5 و کلمات ریشه ای 6 یک پیش پردازش شده است این آماده سازی اطلاعات در ابتدای این بخش به تشریح بیان شد. پس از استخراج واژه ها، هر محتوای مورد علاقه به عنوان یک بردار از جفت صفت-مقدار به شرح زیر نشان داده میشود

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید