بخشی از مقاله
چکیده:
یکی از چالشهای پیش روی کاربران وب، به دست آوردن اطلاعات موردنظر خود در وب است. به دلیل حجم بالای اسناد در وب، یک کاربر، بدون ابزار نمی تواند اطلاعات موردنظر خود را از میان این حجم انبوه پیدا کند. از بهترین ابزارهای بازیابی اطلاعات وب، موتورهای جستجو است. با توجه به اینکه تصاویر نیز ازجمله اسناد مورد جستجوی کاربران وب است، اکثر موتورهای جستجو، امکان جستجوی تصویر را نیز در اختیار کاربر قرار می دهند. به همین دلیل، رقابت شدیدی بین موتورهای جستجو، برای ارائه تصاویر بیشتر مرتبط تر به کاربران در جریان است. در این مقاله روش های مهم بازخورد کاربر که باعث بهبود رتبه بندی نتایج بازگردانده شده از موتور جستجو است بررسی می شود. هدف این مقاله، شناخت نقاط ضعف و قوت روش های مشهور بازیابی تصاویر وب بر اساس بازخورد کاربر است. زیرا شناسایی این نقاط کمک خوبی به پژوهشگران این حوزه در بهبود این روش ها و یا ارائه روش های جدید با کارایی بهتر میکند.
کلمات کلیدی:موتور جستجو، رتبهبندی، بازیابی تصویر مبتنی بر متن، بازیابی تصویر مبتنی بر محتوا، بازخورد کاربر، بازخورد ضمنی، بازخورد صریح
1 -مقدمه
تقرباًی اکثر کاربران برای پیدا کردن اطلاعات خود در وب از موتورهای جستجو استفاده میکنند. در این میان، تصاویر در فهم موضوع جستجو شده اهمیت بالایی دارند و یک تصویر مناسب میتواند گویاتر از چندین صفحه متن درباره یک موضوع باشد. یکی از پایه های قدرت موتور جستجو در وب، نمایش بیشتر اطلاعات مرتبط با عبارت جستجو شده توسط کاربر است. هرچه اطلاعات نمایش داده شده به منظور کاربر، مرتبط تر باشد موتور جستجو قویتر محسوب میشود.مرتبط بودن تصاویر بازیافت شده از وب توسط موتور جستجو برای نمایش آن به کاربر، کاری بسیار دشوار است و هیچ موتور جستجویی نمیتواند تصاویر %100 مرتبط با عبارت جستجو را بیابد. برای رفع این مشکل و بالا بردن ارتباط تصویر بازیابی شده با عبارت مورد جستجوی کاربر، رقابت شدیدی بین موتورهای جستجو وجود دارد و تمام آنها سعی میکنند با به کار گرفتن شیوههای جدید و بهتر، این ارتباط را افزایش دهند.
2 -سه روش مشهور بازیابی تصویر وب
جستجوی تصویر، فرآیند یا تابعی است که قسمتی از یک سامانهمعمولاً - موتور جستجو - بوده و در آن پرس وجوی کاربر گرفته میشود و با تصاویر ویژه به او پاسخ داده می شود. این تصاویر بامعنا هستند و شباهت بصری با پرس وجوی کاربر را دارند .[3] در بازیابی تصویر، میزان ارتباط تصویر با پرس وجوی کاربر با وزن دادن به آن به وسیله برخی الگوریتم ها مشخص می شود. سپس تصاویر بر اساس وزنشان مرتب می شوند و به ترتیب نزولی به کاربر نشان داده میشوند. سه روش مشهور بازیابی تصویر عبارت است از:
الف - روش بازیابی تصویر مبتنی بر متن:1 این روش برای پیدا کردن تصویرهای مرتبط با پرس وجوی کاربر از متن اطراف تصویر یا برخی ویژگی های سند HTML استفاده می کند. برخی از این ویژگی ها شامل: برچسب تصویر، نام فایل تصویر و متنهای اطراف تصویر هست 3-1]، .[4
ب - روش بازیابی مبتنی بر محتوا:2 در این روش ویژگیهای بصری به دست آمده از تصویر چون هیستوگرامها، رنگ، بافت، ابعاد تصویر، شکل و جهت تصویر، به منظور وزن دادن به تصویر برای مشخص کردن میزان ارتباط آن با پرسوجوی کاربر استفاده میشود 3]، .[7-5
ج - مجموعههای حاشیهنویسی شده:3 چندین شرکت مثل getty Image و Corbis هستند که تصاویر را از وب گرفته و با حاشیهنویسی آنها و استفاده از الگوریتمهای خاص، مجموعههایی را درست میکنند و آن را در اختیار کاربران می گذارند. این مجموعه ها قابلیت جستجو دارند و مرتب به روزرسانی میشوند .[3] سه روش مشهور بازیابی تصاویر در شکل - 1 - نشان داده شده است.
بزرگ ترین چالش در بازیابی تصویر، میزان ربط تصویر بازیابی شده با پرس وجوی کاربر هست. در بازیابی مبتنی بر متن تصاویر وب که موضوع بحث این تحقیق است، شباهت بین پرس و جوی کاربر و متن موجود در سند وب، باعث انتخاب تصویر موجود در آن سند به عنوان تصویر مرتبط با پرسوجوی کاربر میشود.در اینجا دو سؤال مهم مطرح میشود :[6]
سؤال یکم: آیا شباهت بین متن در پایگاه داده موتور جستجو و پرس و جوی کاربر، دلالت بر شباهت تصویر مرتبط با آن متن با پرس و جوی کاربر دارد؟ جواب این سؤال همیشه مثبت نیست، زیرا همیشه شباهت بین پرسوجو و متن باعث شباهت بین پرسوجو و تصویر نمیشود؛ چون ممکن است تصویر تزیینی باشد.
سؤال دوم: اگر همیشه اینطور نیست تحت کدام شرایط این شباهت نقض میشود؟ ارتباط موردنظر بسیار به خصوصیات دادهها بستگی دارد. اگر تصویرها هرکدام چند معنی داشته باشند یا مفهوم متن ارتباط ضعیفی با تصویر داشته باشد، ارتباط موردنظر برقرار نیست.
3 -روشهای بازخورد کاربر
از ضعف های شناخته شده روش بازیابی بر اساس متن، عدم ارتباط تصویر موجود در یک صفحه وب با متن اطراف آن است. برای کاهش اثر این مشکل از بازخورد کاربر استفاده می شود. گونه های بازخورد کاربر نیز به دو گروه بازخورد ضمنی 4 و بازخورد صریح5 تقسیم می شوند. این گونه ها در شکل - 2 - نشان دادهشده است.در بازخورد ضمنی رفتار کاربر در یک صفحه وب موردبررسی قرار می گیرد ولی در بازخورد صریح مستقیماً از کاربر نظرسنجی میشود و از نظرات کاربر برای بهبود نتایج استفاده میشود. برای آغاز بحث بازخورد ابتدا باید با بازخورد مرتبط6 آشنا شویم؛ زیرا فهم آن کمک زیادی در درک روشهایی که در ادامه میآیند خواهد داشت.
در بازخورد مرتبط؛ هدف، تطبیق سامانه با درخواستهایی از کاربر است که وزن بیشتری را در جستجو دارند، یا آن درخواستها ویژگیهایی دارند که نشاندهنده احتیاجات واقعی کاربر است. این کار باعث می شود تا در ارائه نتایج جستجو برای کاربر، به دقت بالاتری رسید. برای رسیدن به این منظور، از بازخوردهای کاربر استفاده می شود تا پرس وجوی کاربر تکمیل شود و با استفاده از پرسوجوی جدید ساختهشده، بتوان نتایج بهتری گرفت.روش های مختلفی برای استفاده از بازخورد کاربر در بازیابی تصاویر وب وجود دارد. این مقاله، هشت روش مهم را موردبررسی قرار می دهد. استفاده از بازخورد صریح و یا ضمنی جزو شاخصههای این روشها است و با مقایسه آنها می توان تأثیرات مثبت و منفی استفاده از بازخورد صریح، ضمنی و یا هردو را در بازیابی تصاویر وب مطالعه کرد.
1- 3 -روش عمومی بازخورد
در این روش کاربر نتایج مرتبط7 و غیر مرتبط8 را مشخص و آن ها را به سامانه ارسال می کند تا در گام بعدی استفاده شود. این روش معروف ترین روش بازخورد کاربر است. در این روش به کاربر نتایج محدودی نشان داده میشود. کاربر نتایج مرتبط و غیر مرتبط را مشخص میکند و به سیستم ارجاع میدهد تا برای بهتر شدن نتیجه جستجو استفاده شود. .[3]
2- 3 -روش بازخورد عبارت9 کاربر بهصورت فعال:10
در این شیوه کاربر پرس و جوی خود را مطرح میکند. موتور جستجو تعداد محدودی نتایج مرتبط با پرس و جوی کاربر را طبق الگوریتم رتبهبندی خود به وی نشان می دهد. همچنین تعدادی از توصیفات متنی که به پرس وجوی کاربر مربوط هستند را به کاربر نشان میدهد و از کاربر میخواهد، برای کمک به بهبود پرس وجوی خود، یک یا چند نمونه از این توصیفات را انتخاب کند. درصورتی که کاربر این کار را انجام دهد و دوباره جستجو کند، موتور جستجو با استفاده از پرسوجوی کاربر و بازخورد کاربر، یعنی همان گزینههایی که کاربر انتخاب کرده، نتایج بهتری را به او نشان میدهد .[8]
3- 3 -روش شخصیسازی بازیابی عکس با استفاده از
بازخورد کاربر11
این شیوه با استفاده از یادگیری روی علاقه مندی های کاربران بر اساس موارد زیر کار میکند .[9]
الف - اعمال کاربر روی تصویر: مثل کلیک تصویر، داونلود تصویر.بازیابی تاریخچه آن اعمال که با استفاده از فایلهای log روی سرور می توان به این تاریخچه دستیافت.
ب - یادگیری درخواستهای کاربر: با استفاده از شبکههای عصبی، الگوریتم ژنتیک و یاSVM12، با بررسی پیوسته درخواستهای کاربر میتوان تا حدی شاخه اصلی نیازمندی های کاربر را شناخت و حتی وارد زیرشاخه های آن شد. ج - اطلاعات تصویر: منظور اطلاعاتی ازجمله نام فایل تصویر، برچسب تصویر و محتویات تگ <img> و یا لینک تصویر است که ممکن است اطلاعات مفیدی در مورد تصویر داشته باشند. استفاده از این مجموعه اطلاعات میتواند اثرات مثبتی را در ارائه نتایج مرتبطتر به کاربر داشته باشد.
4- 3 -روش انباشتگی معنایی13
در این روش با استفاده از پرس وجوی کاربر جستجو انجام می شود و شامل پنج گام است. مهم ترین بخش این روش استفاده از زنجیر واژهها14 است. اینها کلمات کلیدی هستند که مرتبط با تصویر انتخاب شده توسط کاربر بوده و توسط الگوریتم، شناسایی و جمع آوری می شوند. مراحل این روش در شکل - 3 - نشان دادهشده است.
6- 3 -روش بازخوردهای مرتبط مارس یا - روش روی-هوانگ - 17
در این روش کاربر هر یک از نتایج جستجو را دریکی از 5 طبقه زیر دستهبندی میکند
-بسیار مرتبط با امتیاز 3
-مرتبط با امتیاز 1
-نظری ندارم با امتیاز 0
-غیر مرتبط با امتیاز -1
-بسیار غیر مرتبط با امتیاز -3
با محاسبه امتیازاتی که کاربر می دهد، مشخص می شود که چه ویژگی هایی بیشتر مدنظر کاربر است. البته در انتخاب تصاویر مرتبط، با استفاده از روش CBIR خطایابی هم صورت می گیردمثلاً. اگر هیستوگرام رنگ تمام تصاویری که به عنوان مرتبط انتخابشدهاند شبیه به هم بود معلوم می شود که شاخص های خوبی انتخاب شده است. ولی اگر خیلی متفاوت بود مشخص است که شاخص ها خوب انتخاب نشده اند و امتیازدهی ها باید از نو مرتب شود .[3]عیب روش انباشتگی معنایی این است که با ارسال پرس وجوهای پی درپی، انباشتگی معنایی در درخواست کاربر به وجود می آید و باعث می شود تا پرسوجو از موردنظر کاربر دور شود و همچنین باعث میشود تا پرسوجوی کاربر غنی سازی15 شود و تصاویر جدید در هر بار غنی سازی به نتایج اضافه شود که بهمنظور کاربر ربطی ندارد.[3]
5- 3 -روش تفاوت اجتماع معنا16
درروش انباشتگی معنایی چون غنی شدن پرسوجو میتواند نتیجه عکس داشته باشد و آن قدر عبارات مختلف به پرس وجوی اولیه اضافه کند که دیگر پرس و جوی فعلی شباهتی با پرس و جوی اولیه نداشته باشد، از این روش برای کاهش دادن اثر منفی انباشتگی معنایی استفاده می شود. شکل - 4 - این روش را نشان میدهد.[3]
7- 3 -روش فالکون18
این روش بر اساس نقاط خوب19 کار می کند. نقاط خوب تصاویری هستند که ازنظر کاربر به پرسوجو مرتبطاند. روش فالکون هفت گام دارد:
گام اول - کاربر مجموعهای از تصاویر مرتبط را انتخاب میکند. گام دوم - بر اساس مرحله قبل »نقاط خوب« ایجاد میشوند.
گام سوم - برای تمام تصاویر، فاصله بین آن ها و »نقاط خوب« محاسبه میشود.
گام چهارم - عدم شباهت نیز برای تمام تصاویر محاسبه میشود. گام پنجم - نتایج نمایش داده میشود.
گام ششم - کاربر تصاویر دیگری را به مجموعه - برای افزایش نقاط خوب - اضافه میکند یا خارج میشود.
گام هفتم – بازگشت به گام دوم .[3]