بخشی از مقاله

بررسی روشها و تکنیکهای مختلف در تصویر کاوی


خلاصه

تصــویر کــاوی یــک حــوزه میــانرشــتهای اســت کــه بــر روی تخصــصهــای چــون بینــایی ماشــین، پــردازش تصــویر، بازیــابی تصــویر، دادهکــاوی، یــادگیری ماشــین، پایگــاه داده و هــوش مصــنوعی بناشــده اســت. علــی رقــم ایــنکــه در هرکــدام از حــوزههــای فــوق تحقیقــات فراوانــی صــورت گرفتــه اســت، پــژوهش در مــورد تصــویر کــاوی مســئلهای نوپــا و در ابتــدای راه اســت. فنــونی نظیــر دادهکــاوی مــیتواننــد بــهطــور خودکــار، اطلاعــات مفیــدی را از میــان ایــن مقــادیر حجــیم داده اســــتخراج نماینــد. در ایــن مقالــه، مــا ابتــدا بــا اشــارهای بــه ویژگــیهــای منحصــربهفــرد تصــویر کــاوی، بــه رونــد کلــی تجزیــهوتحلیــل و بحــث در مــورد تکنیــکهــای اصــلی تصــویر کــاوی پرداختــه و درنهایــت، بــه بررسی برخی از سیستمهای مختلف تصویر کاوی و استخراج دانش از تصاویر جهت پیشرفت و توسعه در این زمینه میپردازیم.

کلمات کلیدی: تصویر کاوی، دستهبندی تصویر، خوشهبندی تصویر، دادهکاوی


1. مقدمه

دادهکاوی مفهومی است که با پایگاه داده های بزرگی مانند Data repository ها و Data warehouse ها عجین شده است [1] و به دنبال استخراج اطلاعات مفید و ناشناخته از داده های خام است .[2,3] اگرچه دادهکاوی هم چون دیگر مفاهیم فنآوری اطلاعات معانی متعددی را برای افراد مختلف تداعی میکند، اما اگر بهطور دقیق استفاده شود به ابزار تحلیلی پیچیدهای که بهطور خودکار الگوهای مفیدی را در میان دادههای یک مخزن داده کشف میکند اشاره دارد. درواقع دادهکاوی شکل پیشرفتهی پشتیبانی از تصمیم است و برخلاف ابزارهای پرسوجوی غیرفعال (Passive) بدون الزام به طرح سؤال از طرف کاربر به تولید الگو، روندها و قواعد برنامهریزیشده می پردازد [1]، بهعبارتدیگر قدرت دادهکاوی در این است که میتواند الگوهایی را که در جستجوی کاربر موردتوجه قرار نگرفته است، افشا کند و پاسخهایی را برای سؤالاتی که هرگز درخواست نشده بود، تولید نماید .[4] بنابراین هدف دادهکاوی، استخراج اطلاعات باارزش از دادهها باهدف غایی کشف دانش است [2,5]، لذا برخی از افراد اصطلاح کشف دانش از دادهها (Knowledge discovery from data)را بهجای دادهکاوی به کار میبرند و برعکس عدهی زیادی دادهکاوی را هستهی فرایند کشف دانش از دادهها و گامی اساسی در آن دانسته [6,7,8] و آن را یکی از مهمترین زیرشاخههای مدیریت دانش معرفی میکنند .[9]


تصویر کاوی درمجموع های بزرگ تصویری، رویکردی نوین در حوزه پژوهشهای مربوط به بانکهای اطلاعاتی تصویری از یکسو و تحقیقات دادهکاوی از دیگر سو محسوب میشود .[10] اگرچه تازگی این بحث موجب شده است که مفهوم دقیق تصویر کاوی همچنان مورد چالش باشد [11] لیکن محققین بهویژه در سال های اخیر ضمن ارائه تعاریف مختلف از تصویر کاوی، روشهای متنوعی را تحت این عنوان مطرح نمودهاند.

تأکید تصویر کاوی بر استخراج الگوها از مجموعهای بزرگ از تصاویر است. درصورتیکه تأکید بینایی ماشین و پردازش تصویر بر استخراج یا فهم ویژگی مشخصی از یک تصویر مشخص است. حجم بسیار بالایی از تصاویر، مانند تصاویر ماهوارهای، تصاویر پزشکی و عکس های دیجیتال بهصورت روزانه تولید میشود. اگر این تصاویر تحلیل شوند اطلاعات بسیار مفیدی را در اختیار انسان قرار میدهند. نحوه پیکسلهای نمایش دادهشده در یک تصویر خام یا یکرشته از تصویر، بهمنظور تشخیص اشیاء و رابطه بین آنها اساسیترین چالش در بحث تصویر کاوی است .[12]

یکی از موانع اصلی بر سر راه پیشرفت سریع تصویر کاوی عدم درک موضوعات و نتایج تحقیقاتی در خصوص تصویر کاوی است. بسیاری از محققین این ذهنیت اشتباه را بهجای گذاشتهاند که تصویر کاوی تنها یک توسعه ساده از کاربردهای دادهکاوی است، درحالیکه برخی دیگر، تصویر کاوی را نام دیگری برای تشخیص الگو میدانند و آن را با توجه به ماهیت متفاوت پایگاههای داده رابطهای و پایگاههای داده تصاویر، متفاوت میدانند، یعنی تصویر کاوی فقط بهکارگیری الگوریتمهای دادهکاوی در حوزه تصویر نیست .[12]

تصویر کاوی تکنیکی است که کار کاوش اطلاعات، وابستگی داده های تصاویر و الگوهای غیرمبهم ذخیرهشده در تصاویر را انجام میدهد .(Zangjiet2001) دو تکنیک اساسی در این زمینه وجود دارد، تکنیک اول کاوش را در حجم وسیعی از تصاویر مستقل انجام میدهد. تکنیک دوم کاوش را در یک مجموعه تصاویر یکپارچهشده و به هم مرتبط انجام میدهد .[13]

هدف اصلی تصویر کاوی تولید همهی الگوهای قابلتوجه از تصاویر، بدون دانستن اطلاعاتی از محتوای تصاویر است؛ یعنی بدون اینکه یک دانش اولیه از محتوای تصاویر داشته باشد بهصورت هوشمندانه از یک مجموعه تصاویر دادهشده بهعنوان ورودی، بتوانید الگوهای مهم را استخراجکنید.


2. بازیابی تصاویر مبتنی بر محتوا (Content-Based Image Retrieval)

تصویر کاوی میتواند بهصورت دستی با بریدن و تکهتکه کردن دادهها انجام شود تا به یک الگوی مشخص دستیابیم یا اینکه میتوان آن را با استفاده از برنامههایی که دادهها را بهصورت خودکار تحلیل میکنند انجام داد. رنگ، بافت و شکلهای موجود در تصویر، توصیف گرهای اولیه در یک سیستم بازیابی تصویر بر اساس محتوا میباشند. توصیفگرهای اولیه برای مشخص نمودن و بازیابی تصاویر مشابه از یک پایگاه داده تصاویر استفاده میشود، بسیار مشکل است که تصاویر را بهصورت دستی از یک پایگاه داده تصاویر استخراجکنیم، چراکه این پایگاه دادههای بسیار بزرگ هستند .[14]

CBIRهمچنین بهعنوان پرسوجو بر مبنای محتوای تصاویر (QBIC) و بازیابی اطلاعات بصری بر اساس محتوا (CBVIR) مشهور است و عبارت است از بهرهگیری از بینایی ماشین برای مسائل جستجو و بازیابی تصاویر دیجیتال از پایگاه داده های بزرگ از تصاویر [14]، ثابتشده است که روشهای قدیمی بازیابی تصویر مانند اندیس گذاری، بسیار زمانبر و غیر کارآمد هستند، در این روشها یک تصویر اندیس گذاری میشود و در پایگاه داده ذخیره میگردد و به یک کلمه کلیدی یا یک عدد که مربوط با توصیفات طبقهبندیشده بود متصل میگردد که این روشها مبتنی بر محتوا CBIR نبودند. درروش CBIR هر تصویر که در پایگاه داده ذخیره میشود دارای ویژگی خود بوده که استخراج میشود و با ویژگیهای تصویر مورد پرسوجو مقایسه میگردد. این روش ترکیبی از دانش در حوزههای متفاوت مانند تشخیص الگو، تطبیق اشیاء، یادگیری ماشین، فیلترینگ ریزموج و امثال اینها میباشند. CBIR قصد دارد ویژگیهای بصری تصاویر را بدون داشتن هیچ متن توصیفی در خصوص آنها دریافت و درک نماید.

CBIRقصد دارد که در پایگاه دادهها تصاویر به دنبال تصاویری بگردد که مشابه تصویر پرسوجو باشد. همچنین بر توسعه تکنیکهایی متمرکز است که بتواند بهطور مؤثر در کتابخانههای دیجیتالی از تصاویر بر اساس ویژگیها، تصویری که بهطور خودکار استخراج میکند پرسوجو کند. CBIR همچنین بر ویژگیهای تصاویر تمرکز دارد، این ویژگیها میتوانند بهصورت ویژگیهای سطح پایین یا ویژگیهای سطح بالا دستهبندی شوند. CBIRتصاویر را از پایگاههای داده تصاویر بر اساس ویژگیهایی مانند رنگ، بافت، لبه و شکل بازیابی میکنند .[16] در یک سیستم بازیابی تصاویر مبتنی بر متن (TBIR) تصاویر بر اساس توضیحات، شاخص گذاری و بازیابی میشوند مانند اندازه، نوع، تاریخ، زمان گرفتن تصویر، مشخص نمودن مالک تصویر، کلمات کلیدی یا برخی متون توضیحی دیگر در خصوص تصویر .[16]

در شکل (1) یک سیستم عمومی CBIRنمایش دادهشده است. در چنین سیستمی مفاهیم بصری تصاویر از پایگاه های داده استخراجشده و بهصورت بردارهای چندبعدی از ویژگیها توصیف میشوند. بردار ویژگیها به شکل یک پایگاه داده ویژگیها درمیآیند. برای بازیابی یک تصویر، کاربران یک تصویر نمونه را بهعنوان ورودی فراهم میسازند. سیستم این درخواست را شکل درونی خودش که همان بردار ویژگی است تبدیل میکند. مشابهت ببین تصویر ورودی و تصاویر موجود در پایگاه داده بررسی و محاسبه میشود و بازیابی با کمک الگوهای اندیس گذاری انجام میشود .[15]



شکل (1) معماری یک نمونه سیستم تصویر کاوی بر اساس محتوا (CBIR)


3. تصویر کاوی

در یـــک سیســـتم تصـــویر کـــاوی فعالیـــتهـــای مختلفـــی انجـــام مـــیشـــود تـــا بـــه تصـــاویر مـــوردنظر دسترســـی پیـــدا کنـــیم. بســـیاری از ایـــن فعالیـــتهـــا بـــر اســـاس تکنیـــکهـــای پـــردازش تصـــویر و تشـــخیص الگـــو اســـتوار اســـت. در ایـــن قســـمت بـــه معرفـــی برخـــی از فراینـــدهایی کـــه در طـــول فراینـــد تصـــویر کـــاوی رخ مـــیدهنـــد اشـــاره مـــیکنـــیم و برخـــی از تکنیـــکهـــایی کـــه در هـــر فراینـــد اســـتفاده مـــیشـــود را بیـــان مـــیداریـــم. لازم بـــه ذکـــر اســـت کـــه تقـــدم و تـــأخر برخـــی از ایـــن فراینـــدها بســـتگی بـــه مـــدلی دارد کـــه بـــرای تصـــویر کاوی طراحی میکنیم.

.1 .3 پیشپردازش و حذف نویز

لازم اســــت کــــه کیفیــــت تصــــاویر را قبــــل از هرگونــــه پــــردازش بهبــــود بخشــــیم تــــا فــــاز اســــتخراج مشخصــــات را راحــــتتــــر و قابـــلاعتمـــادتر کـــرد. پـــیشپـــردازش تصـــاویر بـــهمنظـــور ایجـــاد تصـــاویر باکیفیـــت جهـــت دســـتهبنـــدی شـــفافتـــر انجـــام مـــیشـــود. هـــدف اصـــلی پـــیشپـــردازش بهبـــود تصـــاویری اســـت کـــه در معـــرض اعوجـــاجهـــای نـــامطلوب قرارگرفتـــهانـــد و بهبـــود برخـــی ویژگـــیهـــای تصـــویر اســـت کـــه در پـــردازشهـــای آتـــی اهمیـــت دارنـــد. ایـــن مرحلـــه بـــر روی ویژگـــیهـــای تصـــویر تمرکـــز دارد. فیلترینـــگ یکـــی از تکنیـــکهـــایی اســـت کـــه بـــرای تغییـــر یـــا بهبـــود یـــک تصـــویر بـــه کـــار مـــیرود. بـــرای اینکـــه بخـــواهیم در یـــک تصـــویر برخـــی از ویژگـــیهـــای آن برجســـته شـــوند یـــا حـــذف شـــوند از فیلترینـــگ اســـتفاده مـــیکنـــیم. نویزهـــای موجـــود در یـــک تصـــویر از طریـــق روشهـــای فیلترینـــگ خطـــی یـــا غیرخطـــی حـــذف مـــیشـــوند. فیلترهـــای پـــایین گـــذر، بـــالا گـــذر و میـــانگـــذر ازجملـــه روشهـــای اســـت که جهت حذف نویز از تصاویر استفاده میشود .[17]

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید