بخشی از مقاله

چکیده

استخراج ویژگی و دستهبندی تصویرها موضوعی مهم درحوزهی بینایی ماشین است. تکنیکهای استخراج ویژگی، ویژگیهای متمایز تصویر را که برای تطبیق تشابه بین تصویرها مورد استفاده قرارمیگیرند، استخراج میکنند. امروزه با افزایش میزان اطلاعات تصویرهای دیجیتال، پردازش و استخراج ویژگی تصویرها تبدیل به یک فرآیند بسیار وقتگیر شده است. یک روش مقابله با این چالش استفاده از پردازش بزرگداده و ظرفیت ذخیرهسازی بالا با استفاده از چارچوب منبع باز مدل محاسبههای موازی نگاشتکاهش و سیستم فایل توزیعشده هدوپ، میباشد.

در حالحاضر MATLAB به ابزار پر قدرتی برای پردازش و آنالیز بزرگدادهها، بیناییماشین، و انجام محاسبات مهندسی و پژوهشی تبدیل شده است. در این نوشتار، ابتدا روش استخراج ویژگیهایSIFT و SURF، و ایجاد BoVW معرفی شده است. سپس روش دستهبندی تصویرها بر اساس BoVW با استفاده از جعبهابزار بیناییماشین MATLAB بررسی شده است. در ادامه روش استفاده از MapReduce و HDFS در MATLAB معرفی شده است. تکنیکهای ارائه شده در این پژوهش میتواند بهمنظور توسعه محاسبات گسترده با کارایی بالا در کلاستر، یا در ابر و استقرار در پایگاههای داده هدوپ و در نتیجه تسریع دستهبندی تصویرها استفاده شود.

.1 مقدمه

هرتصویر با توجه به محتوای آن دستهبندی میشود. برای مثال آیا شیئی از یک دسته خاص - مثل صفحهکلید - در تصویر وجود دارد یا خیر. یا اینکه تصویر متعلق به صحنه فرودگاه است یا خیابان. به مثال اول دستهبندی شیء و به مثال دوم دستهبندی صحنه گفته میشود. در دسته بندی شیء، مسئله »بازشناسی شیء« کاربرد دارد. در بازشناسی شیء، ابتدا باید با استفاده از تصاویری که به سامانه داده شده به یادگیری دستههای اشیا پرداخت، سپس باید در تصاویر جدید تشخیص داد که نمونهای از گروههای یادگرفته شده در تصویر وجود دارد یا خیر. در حالت کلی این سامانهها بر پایهی چارچوب یادگیری ماشین کار میکنند.

بدین معنی که با داشتن تعدادی نمونهی مثبت و تعدادی نمونه منفی، برای یک تصویر جدید بتواند دستهبندی را انجام دهد. نظر به اینکه یکی از ویژگیهای اصلی دنیای معاصر، حجم عظیم دادهای است که دنیا را دربرگرفته است و با توجه به اینکه هدف نهایی هوش تجاری بهبود بههنگامی و کیفیت اطلاعات است، حال کشف فناوریهایی که در حوزهی بزرگداده موثر باشند و بتوانند راهکارهایی را در راستای دسترسی به اطلاعات با کیفیت ارائه دهند و همچنین توانایی پردازش و تجزیهوتحلیل بههنگام این اطلاعات را داشته باشند، گام بزرگی را در نوآوری سازمان در بر خواهد داشت، به همین دلیل تحقیق و بررسی در این زمینه بسیار حائز اهمیت است.[1]

بازیابی تصویر مبتنی بر محتوا، تکنیکی است که با توجه به تصویر منتخب کاربر و براساس محتوای بصری تصاویر، موارد مشابه را از پایگاهدادههای بزرگ جستجو میکند. بطور کلی، سیستمهای بازیابی تصویر مبتنی بر محتوا را میتوان به دو گروه تقسیم کرد: سیستمهای بازیابی تصویرمعنایی که به دنبال تصاویر مشابه با تصویر منتخب هستند، و سیستمهای بازیابی تصویر تکراری-جزئی، که هدفشان جستجو و بازیابی تصاویری است که شیء خاصی از تصویر منتخب در آنها تکرار شده باشد.[2]

استخراج ویژگی از مهمترین قسمتهای یک سیستم بازیابی تصویر براساس محتوا است. در تحقیقات گذشته روشهای زیادی برای استخراج ویژگی بافت در بازیابی تصویر پیشنهاد شده است.[3] استخراج ویژگیهای تصویر یکی از مهمترین و سادهترین روشهای بیان و اندیسگذاری تصویر در سیستمهای بازیابی شئ مبتنی بر محتوا است. در سالهای اخیر افزایش بازدهی و سرعت سیستمهای بازیابی مهمترین هدف تحقیقات بوده است.[4]

از چالشهای محیط واقعی، تغییرات ظاهری مانند تغییرشدت روشنایی با گذشت زمان و تغییر مقیاس و زاویه تصاویر با جابهجایی مکان دوربین است. برای مقابله با این چالشها، نیاز است تا با بهکارگیری روشی مناسب به استخراج ویژگیهایی مقاوم نسبت به این تغییرات پرداخته و تصویر دریافتی، علیرغم این خصلتها نیز دستهبندی شوند. یافتن ویژگیهای محلی تصویر یکی از راهکارهای پیدا کردن یک سری نقاط کلیدی در تصویر میباشد، که توصیفگر SURF از این راهکار استفاده میکند. با بررسی روشهای موجود از توصیفگر SURF برای بازنمایی تصویر شیء استفاده شد. این روش هم دقت خوب و هم سرعت مناسبی دارد.[5]

گام اول در تطبیق ویژگیهای، مرحلهی پیشپردازش و استخراج ویژگیهای درست در تصاویر می باشد. سپس توصیفگر SURF اعمال میشود، و در ادامهی رویکرد، کیسه کلمات بصری - Bag Of visual Words - در دسته بندی اشیاء برای ایجاد کلمات بصری انجام میگیرد.[6] در بازشناسی اشیاء به صورت عمومی یکی از سادهترین الگوریتمها برای مشخص کردن یک دسته خاص از اشیاء روش کیسه کلمات می باشد که تصاویر و اشیاء را به صورت مجموعهای غیرترتیبی از توصیفکنندههای ویژگیها در نظر میگیرد. [7] و [8]

در کاربردهای مختلف، دستهبندی تصاویر معمولا به صورت یک مسأله با چند برچسب در نظر گرفته میشود که هر تصویر میتواند به چند دسته تعلق داشته باشد. هر تصویر به چندین بلوک تقسیم میشود و بلوکها برچسب میخورند . سپس از مجموعه بلوکهای برچسبگذاری شده، برای توصیف یک تصویر استفاده میشود. [9] هدوپ1 یک چارچوب نرمافزاری است که کاربردهای توزیع شده با دادههای فراوان را تحت یک مجوز آزاد، پشتیبانی میکند.

این چارچوب به برنامهها امکان میدهد که با هزاران نود و دادههایی در اندازههای پتابایت کار کنند. استفاده از هدوپ برای موقعیتهایی مناسب است که انجام تجزیه وتحلیل عمیق و محاسباتی گسترده در حجم داده زیاد، مانند خوشهبندی و هدفگذاری، نیاز باشد. [10] Map Reduce یک چارچوب نرمافزاری است که در سال 2004 توسط گوگل عرضه شد تا محاسبات توزیع شده روی مجموعه عظیمی از دادههای ذخیره شده روی کلاسترهای کامپیوتری را پشتیبانی کند. این چارچوب از توابع map و reduceکه به صورت معمول در برنامهنویسی رویهای مورد استفاده قرار میگیرند، الهام گرفته است.[11]

نسخههای جدید R2014b - MATLAB به بعد - ، قابلیتهای جدیدی ارائه میدهند که تجزیهوتحلیل بزرگدادهها، و همچنین پردازش موازی دادهها با استفاده از هستههای پردازندههای متعدد را برای افزایش توان محاسباتی ارائه میدهند. جعبهابزار بینایی ماشین MATLAB اجرای عملیات مربوطه را بسیار تسهیل و تسریع نموده است. شتاب GPU می تواند سطوح بالاتر عملکرد را فراهم کند. ویژگیهای جعبه ابزار محاسبات موازی، همراه با سرور محاسبات توزیعشده MATLAB میتواند دادهها را به صورت موازی در خوشههای هزاران ماشین پردازش کند.

ماتریس و آرایههای چندبعدی میتواند در سراسر یک خوشه از کامپیوترها توزیع شود. [12] در ادامه ابتدا روش استخراج ویژگیهای SIFT و SURF ازتصاویر و دستهبندی تصاویر بر اساس BoVW با استفاده از جعبهابزار بیناییماشین معرفی شدهاند. سپس پشتیبانی از Hadoop ، MapReduce و HDFS در MATLAB بحث میشود. بیشک استفاده از چارچوب هدوپ در اجرای عملیات مربوط به بیناییماشین مزیت افزایش سرعت و ظرفیت ذخیرهسازی را در پی دارد.

.2 الگوریتمهای استخراج ویژگی از تصویر

خصوصیات اصلی ویژگیهای مناسب عبارتند از :

•    بسیار مشخص و متمایز باشند.

•    به آسانی استخراج شوند.

•    مستقل از مقیاس، دوران، تغییرات در دید سهبعدی، تغییرات در روشنایی تصویر و میزان نویز تصویر باشند.

.1 .2 الگوریتم SIFT

الگوریتم - Scale Invariant Feature Transform - SIFT دارای قابلیت استخراج ویژگیهای مستقل از مقیاس، دوران، تغییر در روشنایی تصویر و همچنین نویز است. مراحل اصلی آشکار کردن و استخراج ویژگیهای SIFT در چهار مرحله خلاصه میشود:

.1 .1 .2 آشکار کردن نقاط کمینه و بیشینه در فضای مقیاس

اصلیترین مرحله در این روش میباشد که با استفاده از مفاهیم هرم تصویری و فضای مقیاس انجام میپذیرد. بوسیله هرم تصویری یک تصویر در قدرت تفکیکهای متفاوت نمایش داده میشود و با توجه به مفهوم فضای مقیاس، تصویر در مقیاسهای مختلف ساخته میشود. شکل - 1 - هرم تصویری با تابع گوسین را نشان میدهد. میتوان ابتدا تصویر را در چند مقیاس مختلف تشکیل داد و سپس برای هر مقیاس تصویری، پنج تصویر - اوکتاو - با انحراف معیار مختلف بهوجود آورد که در نتیجه به تعداد مقیاسهای مختلف دستههای پنج تصویری خواهیم داشت. با توجه به اینکه از خصوصیات اصلی تصاویر هرمی کاهش نویز تصویر در اثر نرمکردن در قدرت تفکیکهای پایینتر میباشد، لذا در این روش از فیلتر گوسین استفاده میشود و دستههای پنجتایی با انحراف معیارهای مختلف توسط فیلتر گوسین و ضرب هسته گوسین در تصویر اصلی با انحرافمعیارهای متفاوت بوجود میآید.

سپس هر دو تصویر مجاور در داخل دستههای پنجتایی را با اختلاف تفاضلی بر اساس جبر ماتریسی از هم کم کرده و تصاویر جدید را بر اساس فیلتر اختلاف تفاضلی - DoG - ایجاد مینماییم. این مشتقگیری ثانویه در واقع جهت پیدا کردن نقاط کمینه و بیشینه در فضای مقیاس صورت میپذیرد و در نتیجه مقادیر کمینه و بیشینه در تصاویر بطور خاص در مقیاسهای مختلف ایجاد میشود و دراین مرحله ویژگیها، مستقل از مقیاس میگردند. در ذیل معادلات انجام این مرحله آورده شده است که در آن I تصویر اصلی میباشد وG تابع هسته گوسین میباشد که با ضرب تلفیقی - کانولوشن - تصویر نرم شده L را تولید مینماید و سپس با کسر کردن دو تصویر حاصل شده L در هر دسته پنج تایی با تصویر مجاورش که اختلاف آنها درانحراف معیار میباشد ، تصویرD بر اساس اختلاف تفاضلی گوسین ایجاد میگردد.

.2 .1 .2 انتخاب نقاط کلیدی از بین نقاط کمینه و بیشینه اصلی

در این مرحله مقادیر شدت درجه خاکستری هر پیکسل با 8 پیکسل مجاور آن مقایسه میگردد و همچنین با 9 پیکسل درتصاویر مجاور بالایی و پایینی - که از لحاظ با هم اختلاف داشتند و از تابع اختلاف تفاضلی گوسین حاصل شده بود - مقایسه میگردد اگر مقدار این پیکسل از تمام 26 پیکسل همسایه بیشتر یا کمتر بود آن را به عنوان یک ویژگی کاندیدا انتخاب میکند و آن را به نام نقطه کلیدی مینامیم.

.3 .1 .2     تعیین موقعیت مکانی هر نقطه اصلی

در این مرحله به طور دقیق موقعیت هر نقطه اصلی از لحاظ مختصات تعیین میگردد و نقاطی که دارای کنتراست کم هستند حذف می شوند، سپس مقدار شیب - ضریب زاویهای - و همچنین زاویه شیب هر نقطه اصلی تعیین می گردد .

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید