بخشی از مقاله
چکیده : در این مقاله با هدف دسته بندي تصاویر شبیه به یکدیگر در کاربرد آرشیو وب ، روشی مبتنی بر طراحی درخت تصمیم گیر معرفی می شود که می تواند بدون نیاز به بررسی محتواي تصاویر و تنها از روي اطلاعات جانبی تصاویر،دسته بندي را با سرعت و دقت بسیار بالا انجام دهد. دسته بندي تصاویر یکسان یا بسیار شبیه به یکدیگر این امکان را فراهم می کند که در کاربرد آرشیو وب به ازاي هر دسته از تصاویر تنها یک تصویر در حافظه ذخیره شده و حجم حافظه مورد نیاز براي ذخیره سازي تصاویر بسیار کاهش یابد.
از بین روشهاي متنوعی که براي دسته بندي تصاویر وجود دارد، در این مقاله از درخت تصمیم گیر استفاده شده است . براي ارزیابی روش پیشنهادي در یک آزمای ش واقعی روي شبکه وب پایگاه داده بسیار بزرگی از تصاویر تهیه شده است و درخت تصمیم گیر طراحی شده در این مجموعه بکار گرفته شده است . نتایج بدست آمده نشان می دهد که دسته بندي با استفاده از این روش دقت و سرعت بسیار مناسبی را به همراه دارد و خطاي دسته بندي تصاویر را می توان در مصالحه با میزان شباهت مورد نیاز در تصاویر هر کلاس تنظیم نمود.
-1مقدمه
وب این امکان را به افراد میدهد که اطلاعات را در دسترس عموم قرار دهند. هر روز میلیونها اطلاعات از انواع مختلف متنی، تصویر و ویدئو در وب قرار میگیرد. بسیاري از این اطلاعات فقط به صورت برخط در دسترس قرار دارند و در صورت از بین رفتن، غیرقابل بازگشت هستند. آرشیو وب سامانه اي است که وظیفه جمعآوري و نگه داري اطلاعات موجود در اینترنت را به عهده دارد.
در ایران اکثر وقایعی که رخ میدهد به سختی در وب قابل ردیابی و پیگیري هستند و حفظ اطلاعات موجود در وب توسط هیچ سازمانی تضمین نمی شود، به همین دلیل وجود این سامانه در کشور ایران بسیار ضروري تر از کشورهاي دیگري است که در آنها تمام وقایع و اتفاقات توسط ارگانها و سازمانهاي زیادي به خوبی مستند میشوند.
اگر مجموعهاي از تصاویر که هر یک حاوي اطلاعات زیادي هستند وجود داشته باشد، استخراج ساختارهاي مفید براي کاربر ساده نخواهد بود. براي سهولت در این کار میتوان از دستهبندي تصاویر استفاده کرد. در دستهبندي، تصاویري که از لحاظ معیارهاي مورد نظر کاربر شبیه یکدیگر هستند در یک دسته قرار میگیرند. به علاوه از ذخیرهي تصاویر تکراري جلوگیري میشود و در نتیجه حجم حافظهي مورد نیاز براي آرشیو وب کاهش مییابد. بنابراین باید از روشهایی استفاده کرد که در زمان مناسب، دقت خوبی ارائه دهند. در بخش دوم به درخت تصمیم پرداخته میشود. در بخش سوم نحوة استخراج ویژگیها از تصاویر و پیادهسازي الگوریتم مورد بررسی قرار میگیرد و در بخش پایانی خلاصه و نتیجهاي از مقاله ذکر میشود.
-2 مرور کارهاي انجام شده:
در این بخش کارهاي مشابهی که تاکنون انجام شده است در زمینههاي سامانه آرشیو وب، دسته بندي تصاویر بر مبناي محتواي تصویر و دسته بندي تصاویر بر مبناي سایر اطلاعات تصویر و استفاده از درخت تصمیمگیري مرور میشود.
1-2 آرشیو وب
امروزه در چندین کشور براي نگهداري اطلاعات تولید شده در سطح ملی فعالیتهایی انجام شده است که در آنها سعی در حفظ اطلاعات موجود در وب در آن زمینهها دارند. این فعالیت ها در حوزههاي متنوعی مانند پیادهسازي سیستمها و قوانین بوده است. بهعنوان نمونه کتابخانه ملی استرالیا در سال 1996 سامانه آرشیو وب را به کار گرفته است و سیستم آرشیو دیجیتال خود را با نام PANDORA1 توسعه داده است که امروزه به مرکز نگهداري اطلاعات کتابخانه ها و مراکز فرهنگی استرالیا تبدیل شده است . - pandora -
2-2 دسته بندي تصاویر مبتنی بر محتواي تصویر
کارهایی که در زمینهي تطبیق تصویر در سالهاي اخیر صورت گرفته است، به تطبیق تصویر بر اساس تفسیر محتواي آن یا بر اساس کلمههاي کلیدي بصري در آن پرداختهاند. - Yuan et al. 2012 - ، - Strecha et al. 2012 - ، - Rivera et al.2011 - ، - Johns et al.2011 - ، - Brahmachari et al. 2011 - ، - Doubek et al. 2010 - ، - Li-mei 2010 - ، - Yu et al. 2009 - ، - Aldrighi et al.2009 - ، . - Murthy et al. 2009 - سایر کارهایی که در زمینهي دستهبندي تصویر انجام شده است به شرح زیر است:
- Heath et al. 2010 - در کار خود یک گراف روي مجموعه بزرگی از تصاویر ساختهاند. با این تفاوت که در اینجا پیوندهاي میان زیرناحیههایی از تصاویر بررسی میشوند نه پیوندهاي میان اجزاي کل تصویر. - Li et al. 2012 - کار خود را با مجموعهي بزرگی از تصاویر که دسته بندي شدهاند آغاز کردهاند. سپس تصاویر مورد نظر که در دستهها وجود دارند، انتخاب شدهاند.
این کار نیاز به یک مرحلهي training دارد تا فقط زیرمجموعههایی که با یکدیگر شباهت دارند براي تطبیق در نظر گرفته شوند. - - Aigrain et al. 1996 در کار خود براي دسته بندي تصاویر از سه گشتاور اول توزیع رنگی تصویر استفاده کردهاند. - - Flickner et al. 1995 براي جستجوي تصویر، هیستوگرام تصویر را مورد توجه قرار دادند.
3-2درخت تصمیم
درخت تصمیم یک ساختار سلسله مراتی تصمیمگیري است که فرایند تصمیم گیري براي تعیین دستهي یک مثال ورودي را نشان میدهد.درخت تصمیم در مسائلی به کار میرود که:
- بتوان آنها را به صورتی مطرح کرد که پاسخ واحدي به صورت نام یک دسته یا کلاس ارائه دهند.
- مثالهاي آموزشی به صورت زوج مقدار و ویژگی مشخص شده باشد.
- براي دادههاي با حجم بالا بسیار کارامد است و میتوان با الگوریتم هاي ابتکاري و مکاشفه اي بسیار ساده اي سرعت تصمیمگیري بالایی را بدست آورد. از این رو رد این مقاله که ذاتاً حجم داده هایی که باید دسته بندي شوند بسیار بالا است، روش مناسبی به شمار می رود. درخت تصمیم روشی براي تقریب توابع هدف با مقادیر گسسته است. این روش نسبت به نویز دادهها مقاوم بوده و قادر است ترکیب فصلی گزارههاي عطفی را اجرا کند.