بخشی از مقاله
چکیده
سسیستم های توصیه گر برای مواجهه با سرریز شدن اطلاعات در وب، پدیدار شدند. این سیستمها گرایش به شخصی سازی اطلاعات بر اساس علائق و نیازمندیهای کاربران دارند. در سالهای اخیر تکنیکهای وب معنایی نیز با هدف افزودن معنا به محتوای وب رواج یافتهندا . نتیجتاً سیستمهای توصیه گر معنایی بعنوان پدیده ای نوظهور توانستهاند موفقیتهایی فراتر از تکنیکهای سنتی مبتنی بر نحو بدست آورند. اما نقطه اوج تکنیکهای وب معنایی، استدلال مبتنی بر معنا است که در تحقیقات به روشهای گوناگونی انجام گرفته است و هرکدام دارای نقاط قوت و ضعف هستند.
هدف ما در این مقاله ارائه تجمیعی از روشهای استدلال معنایی در توصیه گرهاست که با استفاده از تکنیکهایی نظیر پیوندهای معنایی، تئوریهای گراف، روابط سلسله مراتبی هستان شناسی، روشهای گسترش فعالیت در گراف انجام گرفتهاند. این روشها با غلبه بر مشکلات تکنیکهای نحوی، امکان استفاده از مشابهت و تطابق معنایی را بین آیتمها، کاربران و یا هستان شناسی ها فراهم میآورند. نتایج این تحقیق میتواند زمینه ساز توسعه کاربردهای جدید توصیه گرهای معنایی مبتنی بر دانش در حوزههای گوناگون گردد.
.1 مقدمه
امروزه رشد روز افزون اطلاعات و غرق شدن کاربران در آن، بازیابی اطلاعات از طریق موتورهای جستجوی عمومی را بسیار سخت و ملال آورکرده است. چرا که موتورهای جستجو زمانی مناسب هستند که کاربر از دامنه گزینههای دسترس بخوبی آگاه بوده و قدرت و زمان تحلیل و جمع بندی نتایج بسیار زیاد را داشته باشد. برای رفع این مشکلات محققین راهکارهای شخصی سازی را پیشنهاد کردهاند که بهترین آن در قالب سیستمهای توصیه گر ارائه شدهاند. این سیستمها تلاش میکنند پیشنهاداتی متناسب با نیازها و علائق هر کاربر ارائه کنند.
اساس کار این سیتسمها مبتنی بر پیش بینی علائق و نیازمندیهای کاربران است. بعضی از آنها با محور قرار دادن آیتمها سعی میکنند آیتمهایی مشابه با آنهایی که کاربربلاًق به آنها علاقه مند بوده، پیشنهاد کنند و برخی با محوریت کاربر اقلامی را به کاربر جاری پیشنهاد میکنند که کاربران مشابه با کاربر جاری، به آنها علاقه نشان دادهاند.اما روشهای سنتی متریکهای مشابهت که عمدتاً مبتنی بر تطابق نحوی ویژگیهای آیتمهای مورد مقایسه عمل میکنند باعث بوجود آمدن مشکلات جدیدی در توصیه گرها شدهاند.
این مهم با عنوان پیشنهادات خیلی خاص شده در مقالات اشاره شده است. چرا که آیتمهایی که از لحاظ ویژگیهای نحوی مشابه با قبلیها هستند بصورت مداوم ارائه میشوند در حالیکه ممکن است آیتمهای دیگری نیز مورد علاقه کاربر باشند اما لزوماً دارای مشخصات نحوی مشابه با آیتمهای موجود در پروفایل کاربر نباشند.
از اینرو پژوهشگران به تکنیکهای معیارهای مشابهت معنایی به امانت گرفته شده از پارادایم وب معنایی متوسل شدند. وب معنایی با یک گام فراتر از تکنیکهای قبل از آن، با هدف بازنمایی محتوای وب فعلی در قالب پایگاههای دانش معنایی سعی در فهم محتوای وب توسط ماشینها علاوه بر انسانها دارد.
در سالهای اخیر بسیاری از سیستمهای توصیه گر از تکنیکهای وب معنایی استفاده کردهاند که در فکر پروردن معنا به عنوان یک فاکتور کلیدی برای یافتن راهی برای توسعه فضای وب کنونی هستند، جاییکه بیشتر منابع وب فقط میتوانند از طریق تطابق نحوی مبتنی بر کلمات کلیدی کشف شوند. در واقع، هدف اتصال معنایی تکههای جدا از هم اطلاعات به منظور تسکین بار کاربران در جستجو، با فهم و استفاده منابع اطلاعاتی مرتبط معنایی، میباشد.
به این منظور، توصیفات معنایی منابع در دسترس - متاداده - در هستان شناسی ها فرمولبندی میشوند؛ که یک واژگان مشترک شامل مفاهیم و ارتباطات در یک حوزه مشخص هستند.استفاده از پایگاه دانش معنایی در قالب هستان شناسی ها، امکان استفاده از تکنیکهای استدلال هوشمند را فراهم آورده است. بکارگیری تکنیکهای استدلال مبتنی بر معنا در محاسبه مشابهت، روشهای گوناگونی دارد که در این مقاله روی آنها بحث میشود.
سایر بخشهای این مقاله بصورت زیر سازماندهی شدهاند: در بخش 2 مفاهیم پایه ای مورد نیاز برای فهم بهتر بخشهای بعدی این مقاله ارائه میشود. در بخش 3 تطابق و معیارهای مشابهت معنایی بحث میشود. در بخش 4 استدلال معنایی را میخوانید که بدنه اصلی این مقاله میباشد.بخش 5 و 6 هم به جمع بندی و نتیجه گیری اختصاص دارند.
.2 مفاهیم پایه
در این بخش به توصیف اصول مهم سیستمهای توصیه گر و وب معنایی بعنوان مبنای موضوع اصلی مقاله میپردازیم.
.1-2 سیستمهای توصیه گر
سیستمهای توصیه گر سعی میکنند تا آیتم مناسب کاربر را بر اساس ترجیحات و محدودیتهای او پیش بینی کنند. برای این شخصی سازی نیاز به سه جزء اصلی میباشد:
- 1 دیتابیسی که مشخصات آیتمها را ذخیره میکند.
- 2 پروفایلهایی که ترجیحات کاربر را مدل میکنند.
- 3 استراتژی شخصی سازی توصیه.
از آنجا که یک سیستم توصیه گر نمیتواند کار کند تا اینکه پروفایل کاربر ایجاد شود، این ابزارها باید اطلاعات زیادی را درباره علائق شخصی هر کاربر داشته باشند. رویکردهای گوناگونی برای مدلسازی پروفایلهای اولیه وجود دارند در محدوده آنهایی که با ورود دستی توسط کاربر تغذیه میشوند تا رویههای شبه اتوماتیک مبتنی بر مجموعههای آموزشی - یعنی پرسش از کاربران برای رتبه بندی یک مجموعه بازنمایی شده از آیتمها - و کلیشه سازی - یعنی گروه بندی کاربران به داخل یکی از کلیشههای از پیش مشخص شده بر اساس خوشه بندی مشخصات دموگرافیک کاربران -
در مقالات انواع مختلفی از رویکردهای سیستمهای توصیه گر معرفی شدهاند. رویکرد مبتنی بر محتوا، مبتنی بر مشابهت ویژگیهای آیتمها عمل میکند - [3]شکل - 1 و رویکرد مبتنی بر فیلتر سازی تجمعی مبتنی بر شباهت ذائقههای کاربران پیشنهاد میکنند - [4][3]شکل . - 2 اما مدلهای هوشمند مبتنی بر دانش در سطحی بالاتر، آیتمهایی را مبتنی بر استنتاج در شبکه دانش پیشنهاد میدهند.
شکل -1 استراتژی مبتنی بر محتوا
شکل -2 استراتژی فیلتر سازی تجمعی
.2-2 وب معنایی، هستان شناسی، قوانین، استدلال معنایی
بیشتر اطلاعات روی وب به فرم قابل خواندن توسط انسان بازنمایی شدهاند، بنابراین ماشینها نمیتوانند معنای اطلاعات را تفسیر کنند. اما در رویکرد وب معنایی، محتواها میتوانند بدون دخالت انسان دستکاری شوند. برای نیل به سمت این هدف، محتوای وب باید به فرم قابل خواندن توسط ماشینها تبدیل شود. این امر توسط هستان شناسی ها انجام میشود.
هستان شناسی ها یک مشخصات توافقی و رسمی مفهوم سازی ها هستند که یک فهم اشتراکی را از حوزه برای ماشینها فراهم میکنند. با استفاده از هستان شناسی که شامل یکسری از مفاهیم و ارتباطات مابین و ویژگیهای آنها در یک حوزه بخصوص میباشد، ماشین بصورت اتوماتیک میتواند فرآیندهای استدلال را درباره داده روی صفحات وب مختلف یا منابع وب بکار بگیرد. در شکل 3 نمونه ای از هستان شناسی محتوای تلویزیونی ارائه شده است که در سلسله مراتبی از مفاهیم و ارتباطات نمایه شدهاند.
شکل -3 هستان شناسی محتوای تلویزیونی
در وب معنایی دانش از قبیل هستان شناسیها و داده معنایی به فرم ساختار سه تایی Predicate - Subject,Object - بازنمایی میشود. بعنوان مثال در جمله 'علی در دانشگاه فردوسی مشهد تحصیل میکند 'علی Subject، دانشگاه فردوسی مشهد Object و تحصیل کردن بصورت Predicate میباشد.