بخشی از مقاله

چکیده

یافتن نشریه مناسب براي ارسال یک مقاله یکی از مهمترین مراحل در جریان انتشار مقاله است. براي اکثر نویسندگان این کار به سادگی امکان پذیر نمی باشد، زیرا بسیاري از نشریات داراي موضوعات با تنوع بسیار گستردهاي هستند و بسیاري از مقالات را میتوان مقالات بین ر شتهاي دان ست که شامل چندین ر شته تخ ص صی بوده و میتوان در ن شریات مختلفی در حوزههاي مربوطه به چاپ رساند. لذا یافتن نشریات مطابق با موضوع مقاله به عنوان یکی از چالشها در امر چاپ مقاله مطرح میباشد.

در این مقاله، وﯾﮋﮔﯽﻫﺎي سامانه ژورنال یاب مرکز منطقهاي اطلاع رسانی علوم و فناوري1، به عنوان یک سامانه جامع جهت یافتن نشریه مورد نظر کاربرشرح داده میشود. در سامانه ژورنال یاب همهي حوزههاي مهم علمی و بیش از 1500 نشریه بررسی شده تا به نویسندگان کمک نماید تا نشریات مربوط به حوزه تخصصی مقاله را جهت ارسال مقاله خود پیدا کنند. در این تحقیق از الگوریتم ترکیبی سامانههاي توصیهگر که یکی از شاخههاي یادگیري توسط ماشین است استفاده شده ا ست.

ضریب همب ستگی پیر سون را براي دادههاي آزمون و پا سخهایی که سامانه ژورنال یاب براي مجموعهي آزمون بدست آورده نشان میدهد که سامانهي توصیهگر ژورنال یاب با همبستگی بالا - 0,81 - با جوابهاي واقعی توانسته است پاسخ صحیح را توصیه کند. همچنین با استفاده از معیار میانگین امتیاز متقابل نیز آزمون انجام شده و نهایتا میانگین امتیاز متقابل براي سامانهي توصیهگر ژورنال یاب برابر 0,53 بدست آمد. بنابراین، نتایج مکتسب نشان میدهد که سامانه ژورنال یاب میتواند از نظر دقت پاسخهاي ارائه شده و همچنین رتبهي پاسخهاي مرتبط امتیاز قابل قبولی را کسب نماید.

.1 مقدمه

در ع صري که با انفجار بیش از حد اطلاعات مواجه ه ستیم، از ا ستراتژيهاي مختلفی براي ت صمیم گیريهاي گوناگون از جمله انتخابهاي انجام شده در حوزه علمی مانند انتخاب نشریه مورد مطالعه استفاده میشود. سامانههاي توصیه گر برخی از این ا ستراتژيها را با هدف ارائه تو صیههاي خودکار که مقرون به صرفه و با کیفیت بالا با شد را ارائه میدهند. سامانههاي تو صیه گر برنامههاي کامپیوتري هستند که "بهترین انتخاب" را به کاربران در زمینههاي مختلف توصیه میکنند.

رویکردهاي متفاوتی جهت تو سعه سامانه تو صیه گر پی شرفته وجود دارد. از جمله میتوان به رویکردهاي الگوریتمی موجود جهت ارائه پی شنهادات خرید شخصی مانند فیلترینگ مبتنی بر محتوا، و همچنین روشهاي همکاري و دانش محور اشاره کرد. الگوریتمهاي طراحی شده براي توصیف و ارائه پیشنهادات به کاربران به یک امر چالش برانگیز در برنامههاي کاربردي وب تبدیل شده است. مسئله اصلی، رتبه بندي موارد بازیابی شده بر اساس پاسخ کاربران به منظور بهینه سازي سامانه است.

به طور کلی، در الگوریتم یک سامانه توصیه گر موارد زیر در نظر گرفته میشود:

درك محتوا و فیلتر کردن آن: باید از تکنیک هایی براي فیلتر کردن محتواي کم کیفیت از استخر دادههاي موجود استفاده کرد. توصیه به محتواي کم کیفیت باعث آسیب به سامانه توصیه گر میشود. در هر سامانه توصیه گر، تعریف کم کیفیت، بستگی به ویژگی آن سامانه دارد.

مدل سازي پروفایل کاربر: باید پروفایلهاي کاربري ایجاد کرد که منعکس کننده مواردي باشد که کاربران احتمالا مورد استفاده قرار میدهند. این پروفایلها میتوانند براساس جمعیت شناسی، اطلاعات ارائه شده هویت کاربر در زمان ثبت، اطلاعات شبکههاي اجتماعی یا اطلاعات رفتاري در مورد کاربران باشد.

نمره دهی: بر اساس پروفایل کاربري و پروفایل اقلام، باید تابع امتیازدهی براي تخمین احتمال مقادیر و ارزشهاي آینده براي نمایش اقلام به کاربر با توجه به زمینه مورد علاقه وي بوجود آورد.

رتبه بندي: در نهایت، نیاز به مکانی سمی براي انتخاب یک لی ست رتبه بندي شده از اقلام در جهت تو صیه نمودن آنها به کاربر است. در ساده ترین سناریو، رتبه بندي ممکن است شامل موارد مرتب سازي بر اساس یک امتیاز واحد براي هر مورد باشد.

به طور خلا صه الگوریتم فوق را میتوان به شرح زیر بیان نمود. سیگنالهاي ورودي بر ا ساس اطلاعات کاربر، اطلاعات آیتم مورد نظر و تاریخچه دادههاي تعاملی کاربر- آیتم، توسط مدلهاي آماري یادگیري ماشین براي تولید نمرات استفاده شده که میزان وابستگی کاربران به اقلام را تعیین میکند. نمرهها توسط ماژول رتبه بندي ترکیب شده تا یک لیست مرتب شدهاي از اقلام را بر اساس ترتیب نزولی از اولویت به دست آمده تولید نماید.

در این قسمت به دسته بتدي کلاسیک سامانههاي توصیه گر پرداخته میشود:

سامانههاي تو صیه گر مبتنی بر محتوا:2 در این سامانه شباهت اقلام بر ا ساس ویژگیهاي مرتبط با موارد مقای سه شده محاسبه میشود .در واقع، فرآیند اصلی انجام شده توسط یک توصیه گر مبتنی بر محتوا، شامل تطبیق ویژگیهاي پروفایل کاربر است که در آن موارد مورد علاقه کاربر با ویژگیهاي محتواي یک شیء - آیتم - ، به منظور توصیه موارد جدید به کاربر ذخیره میشود.

فیلترینگ همکاري:  این روش به عنوان ساده ترین و اصلی ترین پیاده سازيهاي سامانههاي ﺗﻮﺻﯿﻪ گر محسوب شده که در آن به کاربر جاري و فعال مواردي را که سایر کاربران با سلیقههاي مشابه در گذشته علاقه داشتهاند را پیشنهاد میدهد.برخلاف سامانههاي تو صیه گر مبتنی بر محتوا، فیلترینگهاي همکاري میتوانند مواردي با محتواي ب سیار متفاوت را در صورتیکه پیش از این سایر کاربران علاقهاي به این آیتمهاي مختلف نشان داده باشند، توصیه کنند.

سامانههاي محدودیت گرا: 4 این سامانه ها، به عنوان نوع دیگري از سامانههاي توصیه گر داﻧﺶ محور محسوب میشوند. از نظر دانش مورد استفاده، هر دو سامانه مشابه میباشند، تفاوت عمده این دو سامانه در راه حل محاسبه است

سامانههاي توصیه گر مبتنی بر مورد:  در این سامانهها که نوع دیگري از سامانههاي دانش محور شناخته میشود، توصیههاي مبتنی بر معیارهاي تشابه مشخص میگردد. در حالی که در سامانه توصیه گر محدودیت گرا عمدتا از پایگاههاي اطلاعاتی از پیش تعریف شده استفاده می شود که حاوي قوانین صریح در مورد نحوه ارتباط نیازهاي مشتري با ویژگیهاي مورد استفاده است.

سامانههاي توصیه گر ترکیبی:  این سامانه ها بر اساس ترکیبی از تکنیکهاي ذکر ﺷﺪه فوق ساخته می شود. یک سامانه ترکیبی تلاش میکند که از مزایاي یک سامانه براي رفع معایب سامانه دیگر استفاده کن

سامانههاي توصیه گر جمعیت شناسی: در این نوع سامانه، اقلام مبتنی بر ﺟﻤﻌﯿﺖ شناسی توصیه میشود. فرض بر این است که باید تو صیههاي مختلف براي مدلهاي جمعیتی مختلف تولید شود. ب سیاري از وب سایتها به راحتی راه حلهاي شخ صی سازي موثر بر اساس جمعیت شناسی را میپذیرند. به عنوان مثال، کاربران به وب سایتهاي خاصی بر اساس زبان یا کشورشان هدایت میشوند. یا پیشنهادات ممکن است با توجه به سن کاربر سفارشی شود.

سامانههاي تو صیه گر دانش محور: در این سامانه ها، اقلام بر ا ساس دانش حوزه خاص و انطباق ویژگیهاي آیتم خاص با نیازهاي کاربران تو صیه می شود. در این سامانه، یک تابع شباهت مقدار نیاز کاربر - شرح م سئله - و تطابق تو صیهها - راه حلهاي مسئله - را تخمین میزند. در اینجا نمره تشابه میتواند به طور مستقیم به عنوان ابزار توصیه براي کاربر تفسیر شود. سامانههاي مبتنی بر دانش در ابتداي پیاده سازي بهتر از سایر سامانههاي توصیه گر عمل میکنند، اما اگر این سامانهها با اجزاي یادگیري مجهز نباشند، ممکن است نتایج مطلوبی در اثر گذشت زمان ارائه ندهند.

سامانههاي تو صیه گر جامعه گرا: این نوع سامانههاي تو صیه گر اطلاعات مربوط به روابط اجتماعی کاربران و ترجیحات دوستان کاربر را به دست میآورد. توصیهها بر اساس رتبه بندي هایی است که توسط دوستان کاربر ارائه شده است. در واقع این سامانههاي تو صیه گر در پی افزایش شبکههاي اجتماعی ه ستند و امکان د ستیابی ساده و جامع از اطلاعات مربوط به روابط اجتماعی کاربران را فراهم میکنند.

در ادامه، مروري بر پژوهشهاي انجام شده در این حوزه ارائه میگردد:

سامانهي ن شریاب الزویر10 از جمله سامانههاي شبیه به سامانه ژورنال یاب میبا شد. در ﺳﺎﻣﺎﻧﻪي ن شریاب الزویر از الگوریتم سامانههاي توصیهگر استفاده میشود .[10] الگوریتم رتبه بندي توصیه گر نشریه به دو بخش تقسیم میشود. بخش اول مطابق با پرس و جو شده ارسال شده به مقالات موجود در پایگاه داده است. براي این منظور از الگوریتم Okapi BM25 استفاده شده است

Okapi BM25 . الگوریتمی است که به طور گستردهاي در زمینه بازیابی اطلاعات مورد استفاده قرار میگیرد. این الگوریتم، ا ﺳﻨﺎد را مطابق با ارتباط آنها با یک پرس و جو، ج ستجو و رتبه بندي مینماید. به طور معمول، ورودي کی سهاي از کلمات11 و خروجی مجموعهاي از اسناد با نمرات و رتبه بر اساس کلمات پرس و جو در هر سند، بدون در نظر گرفتن رابطه بین اصطلاحات پرس و جو در یک سند، میباشد. بخش دوم الگوریتم رتبه بندي توصیه گر نشریات، نمرات هر یک از مقالات را به نمرات مجلات منتقل میکند. این مرحله به زیر مراحل زیر تقسیم میشود:

1.    یک میلیون مقاله با بالاترین نمره BM25 را از فهرست مقاله رتبه بندي نگه داشته و نشریه و حوزههاي علمی نشریه را که هر مقاله به آن تعلق دارد را، پیدا شود.

2.    اگر کاربر نهایی قبلا یک دامنه را انتخاب کرده است، تمام اسنادي را که به این دامنه تعلق ندارند حذف میشود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید