بخشی از مقاله
چکیده- بخشبندي تصویر فرآیند تفکیک تصویر به ناحیههاي همگن و مرتبط است. ازجمله جدیدترین روشها در بخشبندي تصاویر میتوان به روشهاي احتمالاتی به- خصوص دیریکله پنهان اشاره نمود. دو چالش مهم پیش روي این روشها، تشخیص مرزهاي نامشخص و دخیل نمودن مکان پنجره است. از اینرو در این مقاله با افزودن یک لایه اضافه به توزیع دیریکله پنهان و استفاده از دانش موجود در پنجرههاي کناري هر پنجره، سعی در برطرف نمودن این دو چالش شده است. موفقیت روش پیشنهادي در بخشبندي موثر تصاویر با استفاده از شبیهسازيهاي انجام شده، معیارهاي کمی دقت، فراخوانی و معیار F و همچنین با روابط ریاضی بیان شده، اثبات میشود.
مقدمه
به تفکیک تصویر به عناصر و اجزاي تشکیل دهندهي آن، بخشبندي تصویر گفته میشود. در بخش بندي یکی روشهاي با سرپرست و دیگر روشهاي بدون سرپرست مطرح هستند. روش- هاي باسرپرست به مجموعه آموزش اولیه نیاز دارند که ایجاد مجموعه اولیه آموزش کار زمانبر و پر هزینهاي است. از طرف دیگر روشهاي بدون سرپرست به مجموعه آموزش اولیه نیاز ندارند و براي بخشبندي تصویر از مباحث احتمالاتی کمک میگیرند .[1] دیریکله پنهان[2] - LDA - 1 یکی از جدیدترین و کاراترین روشهاي این حوزه است. توزیع LDA بر مبناي توزیع دیریکله در سال 2003 براي اولین بار روي متن اجرا شد .[2] ورودي این توزیع یک سري سند و خروجی، موضوعات تشکیل دهنده سندها هستند. شکل 1 نشان- دهندهي نمونهاي از اجراي LDA روي متن است. توضیح دقیق تابع دیریکله و روش LDA در بخشهاي 1-2 و 2-2 بیان خواهد شد.
تعبیر مفاهیم موضوع، سند و کلمه براي استفاده از روش LDA
در بخشبندي تصویر نیاز است. مفهوم موضوع در تصویر به معناي هر بخش یا شی مجزا در یک تصویر است. سند به یک تصویر گفته میشود و یا حتی میتواند هر تصویر چند سند باشد. پیکسل یا پنجرهاي از تصویر و یا کل تصویر مفهوم کلمه را دارد. براي بخش- بندي تصویر با استفاده از LDA روشهاي متفاوتی ارائه شده است. در دستهاي از این روشها هر پیکسل به عنوان یک کلمه و هر تصویر یک سند در نظر گرفته میشود که مطابق با این تعابیر، روش LDA بر روي تصویر اعمال میگردد. این روش تحت عنوان LDA ساده [3] شناخته شده و ضعف آن، عملکرد نامناسب در بخشبندي تصاویر با مرز نامشخص است.
در دسته دیگر هر بخش یک کلمه و هر تصویر یک سند در نظر گرفته میشود که براي ایجاد هر بخش اولیه از پیشپردازشهاي ساده، استفاده میشود. نقطه ضعف این روشهاي مبتنی بر پیش پردازش [4] وابستگی بالاي نتایج نهایی به پیشپردازش اولیه و دشواري یافتن بخشهاي اولیه است. دسته سوم روشهاي مبتنی بر پنجره [5] هستند که هر پنجره از عکس یک کلمه است و وابسته به روش، هر تصویر یک یا چند سند تعبیر میشود. نقطه ضعف این روشها، عدم توجه به اهمیت مکان پنجره است.
واضح است که مکان پنجره نیز در دقت و سهولت بخشبندي تاثیر بالایی دارد، به عنوان مثال احتمال اینکه دو پنجره کناري مرتبط به یک بخش خاص باشند بسیار بیشتر از دو پنجره در گوشههاي مختلف تصویر است. در مقالات مختلفی سعی در برطرف کردن این چالشها یعنی عملکرد نامناسب در مواجهه با مرزهاي نامشخص و نادیده گرفتن مکان پنجره وجود دارد. براي مثال در[5] PMLDA2 تلاش شده است با افزودن یک لایه اضافه به روش LDA ساده، میزان عضویت نسبی هر پیکسل در موضوع تعیین گردد و بهاین ترتیب مشکل تصاویر با مرز نامشخص برطرف شود.
همچنین در [6] باOLDA3 موضوع هر پیکسل نه فقط از پنجرهاي که در آن قرار دارد، بلکه با استفاده از میانگینگیري از پنجرههاي همسایه تعیین میشود، بدین ترتیب مکان قرارگیري هر پنجره و پنجرههاي کناري در تعیین موضوع نیز اهمیت مییابد. هرچند در این دو روش و سایر روشهاي مشابه، گامهاي موثري در بهبود بخشبندي تصویر برداشته شده است ولی تاکنون به برطرف کردن هر دو چالش بیان شده به طور همزمان، کمتر توجه شده است. از این رو در این مقاله با ترکیب روشهاي PMLDA و OLDA و ایده برداري از هر دو، سعی در برطرف نمودن دو چالش شده است. دستاوردها و نوآوري- هاي این مقاله به شرح زیر است:
• ارائه روشی مبتنی بر توزیع احتمالاتی دیریکله در بخشبندي تصویر
• توجه به تعیین مرزها در تصاویر، به خصوص در تصاویر با مرز بندي نامشخص
• دخیل نمودن مکان پنجره در بخشبندي تصویر
• ترکیب اهمیت مکان پنجره و نسبت عضویت هر پیکسل در
بخشبندي تصویر در ادامه و در بخش دوم روش پیشنهادي ارائه میشود که بهاین منظور ابتدا در زیربخش 1-2 معرفی مختصري از توزیع دیریکله، در زیربخش 2-2 معرفی روش دیریکله پنهان و در زیربخش 3-2 چارچوب کلی روش پیشنهادي آمده است. در بخش سوم ارزیابی و نتایج حاصل از شبیهسازي روش ارائه شده، بیان شده است و نهایتا در بخش چهارم جمعبندي و نتیجهگیري مقاله آمده است. معرفی کامل روش پیشنهادي در این بخش پس از معرفی کوتاهی از توزیع دیریکله به تعیین احتمال هر کلمه به شرط هر بخش، با استفاده از این توزیع پرداخته میشود. سپس استفاده از این احتمال براي بخشبندي تصویر بهکار میرود.
معرفی توزیع دیریکله
دیریکله توزیعی ماوراي توزیع دیگر است، یعنی خروجی توزیع دیریکله، خود یک توزیع احتمال است. براي درك بهتر این موضوع مثالی بیان میشود. فرض کنید تعدادي تاس موجود است که هر کدام از این تاسها نامتقارن هستند. یعنی احتمال رخداد هر وجه آن متفاوت است، ولی مسلم است که مجموع احتمال رخداد همه وجهها برابر یک میشود. حال همهي این تاسها را در ظرفی ریخته و با توزیعی هربار یک تاس انتخاب میشود.
این حالت دقیًقا مثل این است که با احتمالی به جاي اینکه یک حالت مشخص برداشته شود یک توزیع انتخاب گردد .[7] در رابطه - 1 - توزیع دیریکله آمده است. در توزیع دیریکله، q برداري است که احتمال رخداد آن محاسبه میشود و α برداري است که به عنوان پارامتر اولیه به توزیع داده میشود. طول بردار α به اندازهي q تعریف میشود و هر αi یک درایهي این بردار است. البته معمولاً جهت سادگی تمام اعداد بردار α یکسان فرض میشوند. Γ تابع گاما است و α0 مجموع همه عناصر بردار α است.
معرفی توزیع دیریکله پنهان
روش دیریکله پنهان برمبناي توزیع دیریکله که در قسمت قبلی معرفی شد، تعریف میشود. روش کار LDA به این صورت است که از ذهن الهام میگیرد. براي مثال در ذهن انسان، هنگام نوشتن یک متن، در گام اول موضوعاتی که قرار است راجع به آن در متن بحث شود، انتخاب میشوند و در گام دوم براي هر موضوع، از کلمات مرتبط به آن موضوع براي نوشتن متن استفاده میگردد. پس دو گام روش دیریکله پنهان در کل بهصورت زیر است:
الف - انتخاب توزیع موضوع یعنی انتخاب یک توزیع از موضوع-هاي موجود توسط نویسنده بر طبق توزیع θr,t ~ Dir - α -
ب - انتخاب یک موضوع مشخص از توزیع انتخاب شده بر حسب و سپس انتخاب یک کلمه w از توزیع استخراجی
روش پیشنهادي
در روش پیشنهادي براي بخشبندي تصویر از روش دیریکله پنهان و الهام گرفتن از ایدههاي مطرح شده در [5]، [6] و [8] استفاده میشود. به اینصورت که هر تصویر مجموعه اي از چند سند و هر کلمه معادل یک پنجره از تصویر تعریف میشود. فرض کنید، تصویر با C = - r1 , r2, …, rn - نشان داده میشود که هر ri یک سند است، همچنین هر سند از n کلمه - پنجره - طبق r = - w1,w2, ..., wn - تشکیل شده است و در کل V کلمه در تصویر موجود است و همچنین |T| نماینده تعداد موضوعات - بخش - است.