بخشی از مقاله
در این مقاله یک سیستم توصیه گر خدمات گردشگری معرفی گردیده است که با ترکیب داده های اولیه ی موجود و داده های ثانویه ی حاصل از تعامل مستقیم و غیر مستقیم با کاربران، توصیه هایی هدفمند و با قابلیت بهبود مداوم دقت و تناسب آنها با هر کاربر را ارائه می نماید. در این سیستم، بر اساس پروفایل کاربر و تعاملات وی درون سیستم، میزان تعلق کاربر با گروه های گردشگری استاندارد، پیش بینی می شود که در هر گروه نیز، وزن علاقمندی ها و جاذبه های گردشگری، متفاوت و متناسب با حداکثر کاربران آن گروه می باشد.در ادامه، بر اساس موقعیت جغرافیایی کاربر، از طریق داده های جی پی اس، متناسب ترین توصیه ها - بر اساس زمان، فاصله، هزینه و ... - ارائه می گردد. در هر مرحله از فرآیند جمع آوری اطلاعات با هدف کاهش شروع سرد، گسترش پروفایل کاربر و دریافت بازخورد از کاربر، وزن دهی متغیرهای مختلف، از جمله وزن کاربر در گروه و وزن جاذبه ها و علاقمندی ها برای کاربر، مبتنی بر مفاهیم هستان شناسی، اصلاح می گردد.
کلمات کلیدی: سیستم های توصیه گر، توصیه گر گردشگری، ماتریس وزن دهی، شروع سرد.
-1 مقدمه
هدف، ارائه یک سیستم توصیه گر خدمات گردشگری بر اساس تحلیل مکان است. به این ترتیب که ابتدا اطلاعات بصورت مستقیم و غیر مستقیم بدست می آیند، برای هر دسته از این اطلاعات تصمیمی تعریف می شود و این تصمیمات به تدریج برای رسیدن به پیشنهاد بهینه اصلاح می شوند. در این تحقیق فرض می شود که سیستم توصیه گر، یک سیستم مستقل سرویس محور است و کاربرانی که عضو این سیستم می شوند، هدف های توصیه هستند. در قدم اول اطلاعات سیستم از داده های ایجاد شده توسط کاربر بدست می آید . برای مثال زمانیکه کاربر برای اولین بار وارد سیستم می شود از روشی بر اساس داده های جمعیتی استفاده می شود. داده های جمعیتی کاربراطلاعاتی نظیر ملیت، سن و ... هستند . در این مرحله در صورتیکه سیستم نتواند اطلاعات کافی از کاربر دریافت کند با مسئله شروع سرد1 روبرو می شود.
کاهش شروع سرد، نیاز به استفاده ی بهینه از مراحل اولیه ی ثبت نام و ورود به سیستم داریم . و از سوی دیگر، برای جلوگیری از ریزش کاربران در زمان ثبت نام، باید فرآیند ثبت نام را تا جای ممکن کوتاه و تعاملی کنیم. برای مثال، در تابع کشف علاقمندی در جهت بهره وری زمان، بجای متغیر محل تولد / سکونت ، از آی پی او برای رسیدن به ملیت احتمالی اش استفاده می شود و یا به جای گرفتن مستقیم اطلاعاتی که ممکن است کاربر بنا به دلایلی از جمله بی حوصلگی علاقه ای به پر کردن آن ها نداشته باشد، از تصاویر برای این کار استفاده کنیم.به تدریج و با ورود کاربران دیگر به سیستم، اگر کاربران مشابهی پیدا شوند، توصیه های مبتنی بر پالایش گروهی ارائه می شود. در غیر اینصورت روش محتوایی مورد استفاده قرار می گیرد. در این تحقیق از GPS برای تشخیص موقعیت کاربر استفاده می شود.
-2 سیستم های توصیه گر
در سال های اخیر سیستم های توصیه گر متعددی ایجاد شده اند که برخی از آنها در حوزه سیار و به ویژه گردشگری مورد استفاده قرار می گیرند. هدف اصلی این سیستم ها راحت تر کردن فرایند جستجوی اطلاعات برای مسافران و جلب رضایت آن ها از خدمات ارائه شده است.
-1-2 عناصر اصلی سیستم های توصیه گر سیار
عناصر اصلی یک سیستم توصیه گر سیار مبتنی بر موقعیت عبارتند از: داده هایی که می توانند جهت آگاهی کاربران مورد استفاده قرار بگیرند، پروفایلی برای مدیریت این داده ها، الگوریتم هایی که برای سیستم های توصیه گر به کار گرفته می شوند، و تکنیک هایی که محققان برای ارزیابی کیفیت این توصیه گرها استفاده می کنند. در ادامه این چهار خصوصیت سیستم های توصیه گر سیار معرفی می شوند:
-1-1-2 داده
سیگنال های رفتاری ضبط شده که اولویت کاربران را نتیجه می دهد، اساس هر مکانیزمی است که مکان ها، فعالیت ها و دوستان جدید را توصیه می کنند. برخی از روش های جمع آوری داده ها در ادامه تشریح شده است:
-1-1-1-2 روش های مبتنی بر مدارات GPS
یکی از ابزارهای جمع آوری داده، GPS است که به کمک آن کاربر قادر خواهد بود که موقعیت های فعلی را بدست آورد، اطلاعات پیرامون موقعیت را جستجو کند و مسیرهای موجود به یک مقصد را طراحی کند. در سال های اخیر، بسیاری از کاربران شروع به ضبط جابجایی هایشان با استفاده از مدارهای GPS کرده اند؛ از جمله دلایل این کار می توان به به اشتراک گذاشتن تجربیات سفر، ورود به زندگی، تحلیل فعالیت های ورزشی و مدیریت محتوای چندرسانه ای اشاره کرد. [1]روش های مبتنی بر مدارات GPS عمدتا در مراحل ابتدایی توصیه سفر استفاده می شوند. در برخی تحقیقات از داده هایGPS برای استخراج مکان های جالب و ترتیب سفر استفاده شد. مشکل اصلی در رابطه با این روش بحث امنیت داده هایی است که از تعداد زیادی کاربر دریافت می شود.
-2-1-1-2 روش های مبتنی بر سفرنامه
روش های مبتنی بر سفرنامه ها - وبلاگ ها - روی استخراج اطلاعات سفر از وبلاگ ها تمرکز می کنند. الگوهای سفر در یک منطقه با تحلیل متن وبلاگ و ادغام اطلاعات سفر بدست می آید. همچنین روشی برای استخراج تجربیات سفر در یک مکان از وبلاگ ها نیز ارائه شده است. از مشکلات اصلی در این روش می توان به دو مورد اشاره کرد : - 1 - تشخیص اینکه آیا وبلاگ نویس خودش آن مکان را ملاقات کرده است مشکل است، - 2 - تشخیص موقعیت واقعی وبلاگ نویس مشکل است زیرا وبلاگ ها شامل اطلاعات غیر مفید نیز می شوند.
-3-1-1-2 روش های مبتنی بر عکسهایی با برچسب جغرافیایی
استخراج مکان های سفر و ترتیب بازدید از آن ها، و همچنین توصیه بر اساس عکس هایی با برچسب جغرافیایی، قابل تقسیم به دو بخش است: روش های توصیه آگاه به متن و مستقل از متن. روش های مستقل از متن ابتدا موقعیت های سفر و ترتیبشان را از GPS استخراج، خوشه بندی، برچسب گذاری و سپس توصیه می کنند. برخی کارهای انجام شده در این زمینه روی الگوهای سفر، ترتیب شهرهای ملاقات شده، مدت سفر و هزینه سفر تمرکز می کنند و نه به اطلاعات متنی کاربران در زمان توصیه. در این زمینه علاوه بر اطلاعات متنی - فصل، آب و هوا - ، شباهت بین کاربران بر اساس تاریخجه سفرشان نیز در نظر گرفته می شود که می توان از این طریق N کاربری که بیشترین شباهت را به کاربر فعلی دارند پیدا کرده و علائق کاربر را استخراج کرد. در کنار این اطلاعات از عکس های برچسب گذاری شده نیز برای توصیه استفاده می شود. [2]
-2-1-2 پروفایل کاربری
یک عنصر کلیدی در سیستم های توصیه گر، پروفایل کاربری است که اطلاعات مربوط به علائق کاربران را ذخیره کرده و امکان ارائه توصیه های شخصی را می دهد. در ساده ترین مدل به هرکدام از کاربران لیستی از کلمات کلیدی و طبقه بندی هایی از علائقشان اختصاص داده می شود. اگرچه در بیشتر موارد اطلاعات موجود عمومی تر از آن هستند که بتوانند توصیه درست و دقیقی ارائه دهند. یک روش جامع تر شامل ذخیره سازی یک بردار از ویژگی های یک آیتم است. این امتیاز میزان علاقه کاربر به هر کدام از این ویژگی ها را نشان می دهد.این مدل های پایه با استفاده از برخی تکنیک های هوش مصنوعی قابل گسترش هستند. یک راه ممکن، استفاده از مدل های معنایی است که دامنه دانش آن ها به شکل هستان شناسی انجام می شود.. [3]
برای اینکه توصیه های ارائه شده به یک کاربر به روز باشد، مدل کاربر حتما باید به روز باشد. با تشخیص هر تغییری در علائق کاربر، پروفایل کاربری بر اساس اطلاعات فیدبک اصلاح می شود. این اطلاعات می تواند صریح یا ضمنی باشد. اطلاعات صریح از تعامل مستقیم با کاربر به دست می آید. تکنیک های مبتنی بر اطلاعات ضمنی عموما با تحلیل رفتار کاربران در سیستم به وجود می آید. ابزارهای پیچیده تر به مطالعه ترتیب فعالیت های انجام شده توسط کاربر روی یک جایگزین خاص، و یا حتی مقدار زمان صرف شده روی هر کدام می پردازند. مزیت اصلی این روش این است که تلاش اضافه ای از کاربر مورد نیاز نیست. [4]
-3-1-2 الگوریتم ها
الگوریتم های سیستم های توصیه گر، اغلب از یک روش "جعبه سیاه " برای محاسبه اولویت کاربر استفاده می کنند؛ به این معنی که نیازی به دانستن فاصله فیزیکی بین مکان ها وجود ندارد. [5]
-4-1-2 ارزیابی سیستم
یکی از گام های حیاتی در تمامی تحقیقات مربوط به سیستم های توصیه گر، به کارگیری یک متدولوژی جهت ارزیابی کیفیت توصیه هاست و سیستم های توصیه گر موبایل نیز از این قاعده مستثنی نیستند. ارزیابی سیستم های توصیه گر موبایل، همانند زمینه وب می توانند با روش های کمی و کیفی پیش بروند. روش های کمی بازتاب دقیقی از آنچه با داده های وب انجام می شود را نشان می دهد : مجموعه داده به داده های آموزشی و آزمایشی تقسیم می شوند و بعد از اعمال مجموعه آموزشی روی مجموعه آزمایشی، قدرت پیشگویی الگوریتم های آموزشی اندازه گرفته می شود.
-2-2 انواع سیستم های توصیه گر
سیستم های توصیه گر در واقع سیستم هایی برای پالایش اطلاعات هستند با هدف پیش بینی امتیازی که یک کاربر به یک آیتم اطلاعاتی نظیر یک کتاب یا فایل موسیقی می دهد. سیستم های توصیه گر آن دسته از آیتم ها را به کاربر پیشنهاد می دهندکه بیشترین تطابق را با علائقش دارد و در عین حال کمترین سربار اطلاعاتی را تولید می کند. توصیه ها می توانند به صورت ضمنی - اگر کسی این محصول را خرید می تواند آن را هم بخرد - و صریح - درخواست مستقیم یک محصول - باشند. امروزه سیستم های توصیه گر بر اساس برنامه کاربردی هدف، دانش مورد استفاده، نحوه تنظیم توصیه و الگوریتم های پیاده سازیشان به چندین نوع دسته بندی می شوند. در ادامه 5 نوع از این دسته بندی ها آورده شده است.
-1-2-2 پالایش گروهی
این نوع سیستم های توصیه گر بیشترین استفاده را در شبکه های اجتماعی و گردشگری دارند. در این سیستم ها آیتم هایی که به کاربران هدف توصیه می شود مشابه است با آیتم هایی که پیش تر توسط کاربرانی با علائق مشترک انتخاب شده بود و به این شکل ارتباطی بین کاربران به وجود می آید. ارتباط بین کاربران بر اساس انتخاب ها و امتیازدهی گذشته آن ها شکل می گیرد. [6] ایده اصلی سیستم های پالایش گروهی این است که کاربرانی که در گذشته سلیقه ای شبیه به شما داشتند به احتمال زیادی در آینده نیز نظری مشابه شما خواهند داشت. تکنیک گروهی محض، یک ماتریس کاربر به همراه امتیازات را به عنوان ورودی گرفته و یک مقدار پیش بینی برای نشان دادن شباهت با سایر کاربران تولید می کند. یک روش دیگر در پالایش گروهی، روش مبتنی بر آیتم است که از شباهت بین آیتم ها - و نه کاربران - برای پیش بینی امتیازات استفاده می کند.
-2-2-2 پالایش مبتنی بر محتوا
توصیه این سیستم ها مبتنی بر آیتم هایی است که کاربر در تعاملات گذشته آن ها را انتخاب کرده است. به عبارت دیگر، آیتم های کاندید با آیتم هایی که قبلا توسط کاربر امتیازدهی شده اند مقایسه می شوند و در نهایت آیتم هایی که بیشترین مطابقت را دارند مجددا توصیه می شوند. تکنیک توصیه مبتنی بر محتوا یک توصیه پایدار بوده و پایگاه داده دائما بر اساس علائق کاربر به روز می شود. از این تکنیک بیشتر در زمانی که امتیازات کافی برای بکارگیری تکنیک گروهی وجود ندارد استفاده می شود.
-3-2-2 پالایش مبتنی بر دانش
این سیستم ها با استدلال بر اینکه کدام آیتم ها نیازمندی های کاربران را برطرف می کنند از یک رویکرد دانش محور برای