بخشی از مقاله
خلاصه
در این مقاله، رویکرد جدیدی برای بازیابی محتوامحور تصاویر ارائهشده است. روش پیشنهادی از هیستوگرام در فضای رنگ HSV و یک ویژگی بر مبنای بافت با استفاده از الگوی باینری محلی استفاده میکند.همچنین با استفاده از ویژگی آماری رنگ مربوط به کانال های مختلف در نقاط لبهی اصلی تصویر و استفاده از فیلتر گابور دقت بازیابی تصاویر بهصورت چشمگیری افزایش می یابد. دلیل استفاده از فضای رنگ HSV بهجای فضای RGB، نزدیکتر بودن آن به ادراک انسان است. جهت تشکیل هیستوگرام رنگ در فضای HSV، به دلیل اهمیتی که فضای H نسبت به سایر مؤلفهها دارد، این مؤلفه به 8 بازه و دو مؤلفه دیگر هرکدام به 2 بازه کوانتیزه میشوند.
پس از استخراج ویژگی از فاصله کانبرا برای ویژگی هیستوگرام و ویژگیهای آماری رنگ مربوط به کانالهای مختلف تصویر در نقاط لبهی اصلی تصویر و از فاصله اقلیدسی برای ویژگیهای حاصل از فیلتر گابور بهعنوان معیار تطابق استفاده میشود . فاصله کانبرا در ارزیابی شباهت برای بردارهایی که صفرهای زیادی دارند بهتر عمل میکند. بر اساس آزمایشهای انجامشده روی پایگاه داده Corel-1k که شامل 1000 تصویر در 10 کلاس معنایی میباشد؛ دقت بازیابی نسبت به کارهای مشابه و محبوب پیشین بهبود یافته است.
.1 مقدمه
تصویر از نخستین وسایل ارتباطی میان انسانها بوده است. آدمیزاد، از هزاران سال پیش میدانسته که میتواند به کمک تصویر، بسیاری از مفاهیم را به نحو بهتری منتقل کند، مفاهیمی که واژههایی برای آنها وجود نداشته و اگر داشته بهاندازه کافی رسا نبودهاند. قدیمیترین خطها، تصویرهایی بوده که انسانها برای ارسال پیام و بیان مقاصد و اهداف و نظرات، یا بیان عواطف و احساسات خود، بر دیوارههای غارها، تنهی درختان، یا بر سنگها و سنگسانها حک نمودهاند .
دانشجوی مقطع کارشناسی ارشد دانشگاه کاشان،زمینه تحقیقاتی مورد علاقه ایشان پردازش تصویر در حوزهی 1 Corresponding author: ×بازیابی تصاویر و تشخیص چهره می باشد. خرفی و همکاران در مقاله خود کاربردهای تصویر را بررسی کردهاند. به نظر آنها متن نمیتواند در شرح یک رویداد، تصاویر پزشکی، توصیف یک مکان و غیره، بهخوبی اطلاعات را منتقل نماید. تصاویر در زمینه پزشکی برای تشخیص، آموزش و پژوهش کاربرد زیادی دارند.
در تحقیقات تاریخی و هنری عکسها و تصاویر بهعنوان شاهد مورداستفاده قرار میگیرند و درنهایت در مهندسی معماری برای شبیهسازی و ثبت مراحل مختلف یک پروژه از نمای بیرونی و درونی استفاده از عکس و تصویر رایج است .[1] سابقهی بازیابی متن به سال 1970 بازمیگردد[2] .در این قبیل سیستمها، تصاویر بهصورت دستی و با توصیف گرهای متنی حاشیهنویسی میشوند، سپس بهوسیلهی سیستم مدیریت پایگاه داده برای اجرای بازیابی تصویر استفاده میگردند. اما حاشیهنویسی بهوسیلهی انسان کاری بسیار سخت ، وقتگیر و مستلزم هزینه بسیار است . همچنین اطلاعات موجود در مضمون یک تصویر خیلی بیشتر از این است که بهوسیله یک سری کلمات کلیدی بتوان آن را بیان کرد. [3 ]
در اوایل سال 1990 افزایش سریع تصاویر با حجم بالا نظیر شبکه اینترنت و همچنین معایب مذکور، سیستم بازیابی مبتنی بر متن را ناکارآمد کرد و باعث معرفی سیستمهای بازیابی مبتنی بر محتوا تصویر - CBIR - شد. تکنیکهای بازیابی تصویر مبتنی بر محتوا بجای یادداشتگذاری دستی بهصورت متن، از خصوصیتهای بصری برای تفسیر مفاد تصاویر بهره میگیرند. در سالهای اخیر، CBIR بهعنوان گزینه مناسبتر نسبت به بازیابی تصویر مبتنی بر متن مورداستفاده قرارگرفته است.[4]
با پیشرفت حوزهی بینایی ماشین، اخذ اطلاعات از محتوای تصاویر در اولویت قرار گرفت.این امر هرچند باعث افزایش نسبی سرعت سیستمهای مزبور شد، اما همچنان مسئلهی شکاف معنایی پابرجا بود. دلیل آنهم استفاده از ویژگی سطح پائین جهت نمایهسازی تصاویر است. تحقیقات گستردهای درزمینهی ارتقاء کارایی ویژگیهای سطح پائین [5]، مدلهای معنایی [6]، سیستمهای بازخورد ربط از کاربر [6] صورت گرفته است.
در بحث بازیابی محتوا محور تصاویر، الگوریتمهای مختلفی برای استخراج ویژگیهای اعم از رنگ، بافت و لبه طراحیشده است. مهمترین نمایش رنگی مورداستفاده در بازیابی تصاویر، هیستوگرام رنگی میباشد. مهمترین تکنیکهایی که از این نمایش رنگی استفاده میکنند عبارتند از: اشتراک هیستوگرامها[7] 1، مقایسه هیستوگرامها[8] و هیستوگرام رنگ تجمیعی - 2جهت کاهش اثرات نویز - . [9 ] نمایشهای دیگری نیز برای ویژگیهای رنگی جهت بازیابی تصاویر مورداستفاده قرارگرفته است. مثلاً میتوان به گشتاورهای رنگی[9] 3و مجموعههای رنگی[10] 4 و [11] اشاره نمود.
هیستوگرام رنگ یکی از ویژگیهایی است که به چرخش تصویر و اندازهی آن وابسته نیست. لیکن، همیشه کارایی مناسبی ندارد و در برخی مواقع از ویژگیهای آماری مربوط به رنگ نیز استفاده میگردد. برای نمونه، از بین این ویژگی-های آماری میتوان به میانگین، میانه و چولگی مقدار رنگ در هر پیکسل اشاره کرد. برای تاثیر بهتر و افزایش دقت این ویژگیها، معمولا تصاویر را به بخشهایی تقسیم میکنند و عملیات محاسبهی ویژگیهای آماری برای پیکسلهای تصویر در هر بخش از تصویر انجام میشود .[12]
بافت به الگوهای بصریای گفته میشود که توسط نمایش رنگی قابل ارائه نیستند. مدلهای مختلفی برای نمایش و استفاده بافتها ارائهشده است. بازیابی بر اساس بافت بهتنهایی کاربرد چندانی ندارد. اما استفاده از شباهت بافت بین نقاطی که دارای رنگ همسانی هستند - نظیر آسمان و دریا و یا برگها و علف - بسیار مفید میباشد. تکنیکهای مختلفی جهت شناخت بافت پیشنهادشده است . استفاده از ماتریس هم وقوعی1 جزو اولین تلاشها در این زمینه بوده است[13]، که سابقه آن به خیلی قبل از مبحث بازیابی تصویر برمیگردد.
از مهمترین روشهای این زمینه میتوان به روش Tamura که بر پایه مطالعات روانشناسانه و استخراج ویژگیهای بافتی دارای مفهوم میباشد، اشاره نمود.[14] به جهت استخراج ویژگی لبه و بازیابی محتوامحور تصاویر الگوریتمهای مختلفی پیادهسازی شده است. با استخراج ویژگی هیستوگرام جهت لبه - EDH - 2، ویژگیهای مربوط به لبه استخراج میشود تا برای بازیابی تصویر استفاده شود .[15]
لیو و همکارانش به استخراج ساختارهای ریز3 مربوط به لبهها پرداخته تا با کنار هم قراردادن این ساختارها، روند بازیابی کامل گردد [16] و در تلاشی دیگر، با استفاده از تبدیل فضای رنگ RGB به فضای رنگ L*a*b* و همچنین استخراج زاویهی لبهها در هر پیکسل و نرمال کردن زاویهها، ویژگیهایی برای بازیابی محتوامحور تصاویر ایجاد کردهاند .[17]
لازم به ذکر است که برای اندازهگیری مقدار شباهت بین تصویر مورد جستوجو و تصاویر موجود در پایگاه داده، فرمولهای مختلفی وجود دارد که بسته به نوع ویژگیها از معیارهای شباهت مناسبی استفاده میشوند .[18] اکثر سیستمهای CBIR برای تشخیص تصاویر مشابه، از اطلاعات رنگ در تصاویر بهره میبرند. این سیستمها غالباً برای تصاویر مشابه، اما حاوی اشیاء با ترکیب رنگ متفاوت دقت مطلوبی ندارند .
لیکن سیستم بینایی انسان در تشخیص تصاویر مختلف، بیشتر به گرایش کلی شکل تصاویر حساس است تا به ترکیب رنگ آنها [19] ؛ لذا الگوریتم پیشنهادی در این مقاله قبل از مرحله شاخصگذاری، تصاویر را به فرمت سطح خاکستری نیز تبدیل مینماید و برخی ویژگیها در سطح خاکستری از تصویر استخراج میشوند. همانگونه که نتایج آورده شده در بخش - 5 - نشان میدهد، این الگوریتم قادر به بازیابی اشیاء با رنگهای متفاوت - نظیر گل و اتوبوس - نیز خواهد بود.
در این مقاله از چهار ویژگی سطح پایین هیستوگرام رنگ در فضای رنگ HSV، استخراج ویژگی بافت با استفاده از الگوی باینری محلی - LBP - 4 ، ویژگی آماری رنگ مربوط به کانال های مختلف تصویر در نقاط لبهی اصلی تصویر و استخراج ویژگیهای انرژی محلی5 و میانگین دامنه6 از اعمال بانک موجکهای گابور روی تصویر، برای بازیابی محتوامحور تصاویر استفاده شده است. بخشهای 2 و 3 به ترتیب، به جزئیات کامل روش پیشنهادی و استخراج ویژگیها اختصاص دارد.در بخش 4 به وزندهی بردارهای ویژگی استخراج شده و محاسبه شباهت پرداخته شده ونتایج و نتیجهگیری و کارهای آیندهای که در ادامهی این پژوهش میتوان انجام داد به ترتیب در بخشهای 5 و 6 آمده است.
.2 روش پیشنهادی
در این مقاله از چهار ویژگی سطح پایین هیستوگرام رنگ در فضای HSV ، بافت با استفاده از الگوی باینری محلی، ویژگی آماری رنگ مربوط به کانال های مختلف در نقاط لبهی اصلی تصویر و استخراج ویژگیهای انرژی محلی و میانگین دامنه از اعمال بانک موجکهای گابور برای بازیابی محتوامحور تصاویر استفاده شده است. در ادامه چگونگی استخراج ویژگیها شرح داده میشود. سپس، به روند کلاسهبندی ویژگیهای استخراجشده میپردازیم.