بخشی از مقاله
*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***
تصویرکاوی مبتنی بر محتوا به کمک شبکه بیزین
چکیده
یکی از موضوعات مهم در عصر حاضر که توسط انسان به راحتی انجام میشود ولی برای کامپیوتر در مراحل اولیه انجام و به اصطلاح نابالغ است تصویرکاوی مبتنی بر محتوا میباشد. چالش اصلی در این زمینه نحوه ی برخورد با عدم قطعیت ذاتی موجود در پدیده های طبیعی می باشد. از آنجا که شبکه بیزین دارای بنیاد ریاضی قوی بوده و یکی از تکنیک های مناسب برای برخورد با عدم قطعیت برپایه روابط احتمالی می باشد در این مقاله دقت این مدل از شبکه ها در تصویرکاوی مبتنی بر محتوا بررسی میشود. در روش پیشنهادی بعد از انجام پیش پردازش و استخراج ویژگی های لازم از تصاویر آموزش، عمل یادگیری محتوای تصاویر ورودی، توسط شبکه بیزین مدل سازی شده و از آن برای شناسایی محتوای تصاویر آزمایش استفاده شود.
واژههای کلیدی: تصویرکاوی (Image Mining)، بازیابی تصویر مبتنی بر محتوا (CBIR)، شبکه بیزین(Bayesian Network) ، عدم قطعیت(Uncertainty)
مقدمه
یکی از موضوعات مهم در عصر حاضر کـه توسـط انسـان بـه راحتـی انجام میشود ولی برای کامپیوتر در مراحل اولیه انجام و به اصطلاح نابالغ است تصویرکاوی مبتنی بر محتوا میباشد. با توجه به اینکه سیستم هـای طبیعی از نوعی عـدم قطعیـت برخوردارنـد لـذا چـالش اصـلی در زمینـه تصویرکاوی مبتنی بر محتوا نحوه ی برخورد با عدم قطعیت ذاتـی موجـود در پدیده های طبیعی می باشـد. از آنجـا کـه شـبکه بیـزین دارای بنیـاد ریاضی قوی بوده و یکی از تکنیک هـای مناسـب بـرای برخـورد بـا عـدم قطعیت برپایه روابط احتمالی می باشد[1] در این مقاله بعد از انجام پیش پردازش و استخراج ویژگی هـای لازم از تصـاویر آمـوزش، بـا اسـتفاده از شبکه بیزین، عمل یادگیری محتوای تصاویر آموزش مدل سازی شـده و از آن برای شناسایی محتوای تصاویر آزمایش استفاده شود.در ادامــه ابتــدا شــبکه بیــزین معرفــی مــی شــود. در بخــش ســوم تصویرکاوی مبتنی بر محتوا و در بخش چهارم طراحی سیستم پیشنهادی و در بخش پنجم نتیجه گیری ارایه می گردد.
شبکه بیزین
شبکه بیزین [1,2,4] که بر اساس بنیاد ریاضی قوی پایه ریزی شـده است یکی از تکنیک های مناسب برای برخورد با عدم قطعیت مـی باشـد. شبکه بیزین ابزاری برای شناسایی روابط احتمالی به منظور پیشـگویی یـا ارزیابی کـلاس عضـویت اسـت . شـبکه هـای بیـزین در زمینـه اسـتدلال
احتمالی به طور گسترده مورد استفاده قرار گرفته اند و در مسـائل دنیـای واقعی بسیار کاربرد دارند. شبکه بیزین یک مدل گرافیکـی بـرای نمـایش احتمالات ما بین متغیرهای مورد نظر می باشـد و بـه اسـتدلالهای تحـت شرایط نامشخص (احتمالی ، عدم قطعیت ) بسیارکمک می کنند. از طرفی شبکه های بیزین روشی برای نمایش توزیع احتمـالی پیوسـته بـزرگ بـه صورت فشرده می باشند که اجازه محاسبات احتمالی به طور موثر را مـی دهند . آنها از ساختار مدل گرافیکی برای ضوابط مسـتقل مـا بـین متغیـر های تصادفی استفاده می کنند. شبکه بیـزین یـک گـراف جهـت دار غیـر حلقوی است که شامل موارد زیر می باشد:
▪ نودها ( دوایر کوچک ) : برای نمایش متغیرهای تصادفی ،
▪ کمانها ( پیکانهای نوک تیز ) برای نمـایش روابـط احتمـالی مـا بـین متغیرها
▪ برای هر نود توزیع احتمال محلی وجود دارد که به نود وابسته است و از وضعیت والدین مستقل می باشد .
سنگ بنای یادگیری بیزی را تئوری بیز تشکیل میدهد. این تئـوری امکان محاسبه احتمال ثانویه را بر مبنای احتمالات اولیه میدهد:
در فرمول : 1
▪ = P(h) احتمال اولیهای (prior probablity) که فرضیه h قبـل از مشاهده مثال آموزشی D داشته است. اگر چنـین احتمـالی موجـود نباشد میتوان به تمامی فرضیهها احتمال یکسانی نسبت داد.
▪ = P(D) احتمال اولیهای که داده آموزشی D مشاهده میشود.
▪ = P(D|h) احتمال مشاهده داده آموزشی D به فرض آنکه فرضیه h صادق باشد.
در یادگیری ماشین علاقمند به دانستن P(h|D) یعنی احتمال اینکه با مشاهده داده آموزشی D فرضیه h صـادق باشـد، هسـتیم. ایـن رابطـه احتمال ثانویه (posterior probablity) نامیده میشـود. احتمـال اولیـه مستقل از داده آموزشی است ولی احتمـال ثانویـه تـاثیر داده آموزشـی را منعکس میکند
شبکه های بیزی وابستگی های شـرطی بـین متغیرهـا( ویژگیهـا )را شرح میدهند. با استفاده از این شبکه ها دانش قبلی در زمینـه وابسـتگی بین متغیرها با داده های آموزش مدل طبقه بندی، ترکیب میشوند.
به طور خلاصه می توان گفت شبکه بیزین ، نمـایش بـامعنی روابـط نامشخص ما بین پارامتر ها در یک حوزه می باشد . شـبکه بیـزین گـراف جهت دار غیر حلقوی از نودها برای نمایش متغیرهـای تصـادفی و کمانهـا برای نمایش روابط احتمالی ما بـین متغیرهـا اسـت . ایـن توزیـع بـا یـک مجموعه از جدول احتمال شرطی مشخص می شود . هـر نـود بـه جـدول احتمال شرطی منتسب شده و توسط اطلاعات احتمالی کمی مشخص می گردد. همانند جدول احتمالات هر وضعیت ممکن از نود در ترکیب ممکن از والدینش مشخص میگردد . برای نودهای بدون والد احتمالات بـر روی نودهای دیگر بدون قید و شرط میباشند که این نودها احتمالات اولیه بـر روی متغیرها نامیده می شوند. درشـکل 1 شـبکه بیـزین سـاده بـا توزیـع احتمال شرطی برای متغیرها نمایش داده شده است.[4]
شکل :1یک مثال از شبکه بیزین با جدول احتمال شرطی متناظر[4]
شبکه بیزین را میتوان دربسیاری از کاربردهـائی کـه سیسـتم هـای مبتنی بر دانش متداول مورد استفاده هستند بکار بـرد. خواسـتگاه شـبکه بیزین به ترکیب احتمال با سیستم های خبره بر میگردد و این زمینه یکی از کاربردهای مهم آنرا تشکیل میدهد. شبکه بیزین استقلال شـرطی زیـر مجموعه ای ازمتغیرها راقابل توصیف کرده و امکان ترکیـب دانـش قبلـی درباره وابستگی متغیرها را با داده های آموزشی فراهم میاورد. بطور کلی و آنچنانکه در شکل 2 مشخص است شبکه بیزین می تواند برای تشـخیص، پیش بینی، دسته بندی و تصمیم گیری در سیستم های مبتنی بر دانـش استفاده شود.
▪ تشخیص P(cause|symptom)=?
▪ پیش بینی P(symptom|cause)=?
▪ دسته بندی Max P(Class|Data)=?
▪ تصمیم گیری ( در صورت وجود تابع ارزش)
شکل :2 شبکه بیزین و کاربردها
تعدادی از موارد که در آنها از شبکه بیـزین اسـتفاده شـده اسـت بـه صورت ذیل می باشند: [1,2, 3,4,5,6 ,7,8,9]
▪ پردازش سیگنال دستگاه نوار قلب
▪ تشخیص سرطان سینه
▪ کاوش اطلاعات ساختاریافته ویدیویی، تصویری و ...
▪ تجزیه و تحلیل اتصال ژنتیک
▪ مدلسازی سیستم عصبی مغز
▪ کشف دانش در پایگاه داده و داده کاوی
▪ معناشناسی
▪ موقعیت حرکت ربات
▪ نرم افزارهای اشکال زدایی مثلا عیب یابی مشکلات چاپگر
▪ دستهبندی متن جهت:
o تعیین مقالههای مورد علاقه یک شخص
o دستهبندی صفحات وب بر اساس موضوع
▪ بطور گسترده برای ساخت سیستم های تصمیم یار
2 تصویرکاوی مبتنی بر محتوا
پیشرفتهای ایجاد شده در تکنولوژی تصـویربرداری و ذخیـره سـازی تصاویر منجر به رشد بسیار زیاد درپایگاههای داده خیلی بزرگ از تصاویر و جزئیات مربوط به آنها شده است. حجم بسـیار بـالایی از تصـاویر ، ماننـد تصاویر ماهواره ای، تصاویر پزشکی و عکس های دیجیتال بصـورت روزانـه تولید می شود، اگر این تصاویر تحلیل شوند اطلاعات بسـیار مفیـدی را در اختیار انسان قرار می دهند.تصویرکاوی درمجموعه های بزرگ تصویری ، رویکردی نوین درحوزه پژوهشهای مربوط به بانکهای اطلاعاتی تصویری ازیک سو و تحقیقات داده کاوی ازدیگرسومحسوب می شود .اگر چه جوانی این بحـث موجـب شـده است کـه مفهـوم دقیـق تصـویرکاوی همچنـان موردچـالش باشـد لـیکن محققین بویژه درسالهای اخیرضمن ارائه تعـاریف مختلـف ازتصـویرکاوی، روشهای متنوعی را تحت این عنوان مطرح نمـوده انـد. بررسـی مجموعـه روشهای ارائه شده دراین زمینه نشانگر وجود رویکردهـای متنـوع در ایـن روشها جهت معناشناسی ودرک مفاهیم موجـود درمجموعـه هـای بـزرگ تصویری است. وجودچنین تنوعی دررویکردهـای مختلـف معناشناسـی در روشهای تصویرکاوی ازیک طرف وفقدان معیارهای مشخص جهت ارزیابی وتحلیل مقوله معناشناسی درایـن روشـها ازطـرف دیگـر، امکـان مطالعـه، مقایسه و ارزیابی دقیق این روشها را از پژوهشگران سلب نموده است.
-1-3 مفهوم تصویرکاوی
بطورکلی تصویرکاوی به استخراج دانش ضـمنی ، روابـط داده هـای تصویری وسایر الگوهایی که بصورت صـریح در بانـک اطلاعـاتی تصـویری ذخیره نشده اند اطلاق می شود. به عبارت دقیق تـر هـدف اصـلی تصـویر کاوی تولید همه الگوهای قابل توجه از تصاویر بدون دانسـتن اطلاعـاتی از محتوای تصاویر می باشد. یعنی بدون اینکه یک دانـش اولیـه از محتـوای تصاویر داشته باشد بصورت هوشمندانه از یک مجموعه تصـاویر داده شـده به عنوان ورودی، بتواند الگوهای مهم را استخراج کند.
تصویر کاوی چیزی فراتر از فقط توسعه داده کاوی در حـوزه تصـویر است. تصویر کاوی یک حوزه میان رشته ای است که بر روی تخصص های بینایی ماشـین، پـردازش تصـویر، بازیـابی تصـویر، داده کـاوی، یـادگیری ماشین، پایگاه داده و هوش مصنوعی بنـا شـده اسـت بـراین اسـاس یـک سیستم تصویرکاوی برای انجام وظایف خود ازروشهای مطرح درحوزه های بینایی ماشـین، پـردازش تصـویر، بازیـابی تصـویر، داده کـاوی، یـادگیری ماشین، پایگاه داده وهوش مصنوعی بهره می برد. با وجود آنکـه روشـهای مطرح در برخی ازاین حوزه ها به بلوغ فنی رسیده اند لـیکن تصـویرکاوی همچنان مراحل ابتدایی و آزمایشی خود را سپری می نماید.
بررسی تحقیقات متعدد انجام گرفته در حوزه تصویرکاوی نشانگراین مطلب است که مفهوم دقیق تصویرکاوی همچنان مورد چالش است. برخی ازمحققین تصویرکاوی را نه مفهومی جدیـد، بلکـه عنـوان جدیـدی بـرای روشهای تشخیص الگو معرفی میکننـد. درحالیکـه در برخـی دیگرکـاوش درداده های چندرسانه ای ازجمله تصویرکاوی را به عنوان زیرمجموعـه ای از مباحث داده کاوی معرفی می نمایند و گروهی دیگر تصـویرکاوی را بـه عنوان مفهومی فراتر ازیک توسعه ساده داده کاوی مطرح مـی کننـد . بـر اســاس نظــر ایــن گــروه از پژوهشــگران پیچیــدگی داده هــای تصــویری وتفاوتهای ماهوی آنها با داده های متنی بیانگر لزوم اعمال تحولات بنیادی در روشهای داده کاوی جهت تبدیل آنها به روشهای تصویرکاوی می باشد
.دربرخی منابع تصویرکاوی به عنوان ترکیبی از مباحـث پـردازش تصـویر، داده کاوی، پایگاه داده و بازیابی تصویر