بخشی از مقاله
چکیده
قطعه بندی تصویر را میتوان بهعنوان یک مسئله ی کلاسهبندی که باید روی پیکسلها اعمال گردد، در نظر گرفت. بنابراین، این مسئله با استفاده از محاسبهی ویژگیهای مناسب و اعمال یک کلاسهبند قابلحل شدن است. روشی که در این مقاله موردبررسی قرار میگیرد، محاسبهی سه ویژگی برای هر پیکسل و استفاده از کلاسهبند نزدیکترین همسایگی است.
به عبارت دقیقتر؛ هرکدام از پیکسلهای عکس بهصورت یک بردار سهتایی در فضایی جدید مدل میشوند. پس از محاسبهی این بردارها برای تمام پیکسلهای عکس، از الگوریتم نزدیکترین همسایگی به جهت کلاسهبندی این بردارها در فضایی سهبعدی استفاده میشود. نتایج بهدستآمده روی دو دیتاست معتبر در حوزهی قطعه بندی تصویر، حاکی از آن است که این روش قابلیت استفاده برای انواع مختلف عکس را دارا است.
-1 مقدمه
قطعهبندی یک تصویر، گامی اساسی در تجزیهوتحلیل تصویر به شمار میرود. بهعنوانمثال، شناسایی اشیاء و جداسازی آنها در تصاویر بهطور مستقیم با روشهای قطعهبندی تصویر در ارتباطاند. قطعهبندی کامل یک تصویر به این معناست که هر پیکسل به یک قسمت از شیء بهطور صحیح اختصاص داشته باشد که البته تاکنون روشها نتوانستهانداین خواسته را دقیقاً برآورده کنند.
درواقع، تمامی روشها سعی بر آن دارند تا یک پیکسل را بهطور صحیح به یک بخش اختصاص دهند و دقتشان نسبت به سایر روشها بیشتر باشد .[1] بهعلاوه؛ ازآنجاکه روشهای قطعه-بندی، اغلب بهصورت دیداری مورد ارزیابی قرار میگیرند؛ ارزیابی و مقایسهی روشها نیز سخت است. به همین دلیل، بهمنظور استفاده از یک روش قطعهبندی در یک کاربرد خاص، باید در کنار اطلاع از انواع روشهای موجود به این نکته نیز توجه داشت که هر روش مزایا و معایب خاص خود را دارد. انواع زیادی از روشهای قطعهبندی از دههی گذشته تاکنون مطرحشدهاند که علاوه بر خواص مشترکی که برخی روشها با هم دارند؛ تفاوتهای بسیاری نیز با هم دارند. در ادامه برخی از این روشها بهاختصار توضیح داده میشوند :[2]
1. قطعهبندی بر اساس آستانه گیری: در این نوع قطعهبندی، از روش آستانه گیری هیستوگرام و همچنین تکنیکهای برش استفاده می-شود. این روشها میتوانند هم بهصورت مستقیم و هم بهصورت ترکیبی از روشهای قبل و بعد از پردازش4 اعمال شوند .[3]
2. تقسیمبندی بر اساس لبه: در این روشها با استفاده از تکنیکهای شناسایی لبه در یک تصویر، مرز بین اشیاء را میتوان مشخص نمود و عکس را به قسمتهای مختلف تقسیم کرد .[4]
3. قطعهبندی بر اساس ناحیه: در روشهای مبتنی بر لبه، بر اساس شناسایی لبه مرزهای اشیاء را شناسایی میکنیم و با پر کردن آن ناحیه، قطعهبندی انجام میشود. اما در روشهای مبتنی بر ناحیه برخلاف روشهای مبتنی بر لبه، از وسط تصویر شروع به پر کردن نواحی می-کنیم؛ تا جایی که به مرزها میرسیم و مرزهای شیء مشخص میشود .[5]
4. روشهای مبتنی بر خوشه: اگرچه گاهی اوقات از روشهای خوشهبندی بهعنوان یک روش مترادف برای روشهای قطعهبندی یاد میشود؛ اما اغلب از این روشها بهعنوان تکنیکهای اصلی استفاده میشود و شامل تکنیکهایی است که قادرند دادههایی با ابعاد بالا را تجزیهوتحلیل نمایند. روشهای خوشهبندی سعی در ساختن الگوهایی دارند که در بعضی جهات به یکدیگر مشابه باشند. این هدف خوشهبندی، بسیار شبیه هدفی است که ما برای تقسیم یک تصویر در نظر داریم .[6]
5. تطبیق: در این دسته از روشها، هدف یافتن شیایی است که مشابه شیء موردنظرمان است. هنگامیکه از دانش شیء موردنظرمان آگاهی داشته باشیم؛ از این دانش میتوان در جهت یافتن موقعیت یک شیء در تصویر استفاده کرد. این دسته از روشهای قطعهبندی را روشهای تطبیق مینامند .[7] روش ارائهشده در این مقاله در دستهی 4 قرار میگیرد که سعی بر آن دارد تا با مدل کردن یک عکس اندازه-خاکستری در فضایی سهبعدی و استفاده از الگوریتم کلاسهبندی نزدیکترین همسایگی، عکس را به قطعات و ناحیههای مناسب تقسیم کند.
-2 دیتاست مورداستفاده
قبل از ورود به توضیح جزئیات روش ارائهشده، لازم است تا در مورد دیتاستهای بهکاررفته اطلاعاتی داشته باشیم. عکسهایی که بهعنوان دادهی ورودی استفادهشدهاند؛ از دیتاستهای کورل5 و سوربی6 هستند. دیتاست کورل حاوی عکسهایی از حیوانات است که در طبیعت گرفتهشدهاند. تمامی عکسهای این دیتاست در اندازه 180 × 120 پیکسل هستند و دارای چهار کلاس کلی میباشند.
کلاسهای این دیتاست عبارتاند از: حیوان - کرگدن، اسب آبی و خرس سفید - ، آب، گیاهان، زمین، برف و آسمان. دیتاست سوربی از جادههای شهری و روستایی تشکیلشده است که تولید سازمان فضایی انگلیس است. عکسهای این دیتاست در اندازهی × 64 96 پیکسل هستند و کلاسهای آسمان، گیاهان، جاده، المانهای مخصوص جاده7، ساختمان، ماشینها و اشیاء نامعلوم را شامل میشوند. دیتاست-های کورل و سوربی از دیتاستهای معتبر در حوزهی قطعهبندی تصویر هستند .[8] دیتاستهای کورل8 و سوربی9 بهصورت رایگان در اختیار عموم محققان وجود دارد.
-3 روش ارائهشده
در این بخش، به توضیح کلیات و جزئیات روش ارائهشده به جهت قطعهبندی تصویر پرداخته میشود. همانطور که در بخش 1 اشاره گردید؛ هدف اصلی قطعهبندی تصویر، تقسیم یک عکس به قسمتهای معنادار است. روشی که این مقاله به آن پرداخته است با الگو گرفتن از روشهای خوشه-بندی میباشد. به عبارت دقیقتر، سعی بر آن دارد تا پیکسلهای عکس را به فضایی با ابعاد بالاتر برده و با استفاده از یک الگوریتم با نظارت، به دستهبندی پیکسلها بپردازد.
فضایی که پیکسلها به آن انتقال مییابند، فضایی سهبعدی است. لکن، این امکان نیز وجود دارد که با بررسیهای بیشتر، بتوان به ویژگیهای مفیدتری به جهت بالا بردن ابعاد دست یافت تا دقت این روش افزایش بیابد. انتقال داده به فضایی با ابعاد بالاتر، به تشخیص توزیع دادهها کمک شایانی میکند. با بالا رفتن ابعاد دادهها میتوان دادههایی که بهسختی از یکدیگر متمایز میگردند را از یکدیگر تمیز داد.
بهعنوانمثال شکل - 1 - را در نظر گرفته و فرض کنید دادههایی دو کلاسه داریم که در دو بعد توصیفشدهاند. اگر این دادهها را بخواهیم از یکدیگر تفکیک کنیم نیاز به یک خط در این فضای دوبعدی است. لکن، اگر این دادهها همانند شکل - 2 - به فضایی سهبعدی منتقل شوند راحتتر میتوان آنها را بهوسیلهی یک صفحه10 از یکدیگر تمیز داد.
روش ارائهشده در این مقاله، هر پیکسل عکس که مقدار شدت11 خاص خود را دارد در نظر میگیرد. حال این مقدار به همراه مکان این پیکسل که دو مقدار سطر و ستون را شامل میشود بهصورت یک بردار سهتایی در نظر گرفته میشود تا یک فضایی سهبعدی را به وجود آورده و عمل کلاسه-بندی را در این فضا انجام دهیم . به عبارت دقیقتر؛ اگر عکس I را بهعنوان ورودی در نظر گرفته و پیکسل واقع در سطر x و ستون y را ixy بنامیم؛ بردار سهبعدی برای این پیکسل بهصورت:
شدت مربوط به پیکسل ixy y x خواهد بود.
دلایل استفاده از این سه ویژگی تلاش در جهت ایجاد خصوصیات مفید روشهای موجود در قطعهبندی در یک روش است. بهطور دقیقتر، همانطور که در بخش 1 بهطور اجمالی اشاره شد؛ روشهای آستانه گذاری از مقدار شدت، روشهای مبتنی بر ناحیه از مکان پیکسلها و روش-های مبتنی بر خوشه از الگوریتمهای کلاسهبندی استفاده میکنند. روش ارائهشده در این مقاله سعی در تجمیع این خصوصیات و قطعهبندی بهتر دارد. پس از تجمیع این سه خصوصیت در یک بردار برای هر پیکسل، فضایی سهبعدی پدید میآید که بعد اول و دوم نمایانگر مکان پیکسل و بعد سوم بیانگر شدت روشنایی پیکسل مربوطه است.
بهعنوانمثال، [14 03] را بهعنوان یک عکس اندازه-خاکستری در نظر بگیرید. انتقال دادهشدهی پیکسلهای این عکس به فضایی سهبعدی بهصورت شکل - 3 - خواهد بود. پسازاین که تمام پیکسلهای عکس بهوسیلهی این بردارهای سهبعدی مدل شده و به فضایی با ابعاد بالاتر انتقال داده شدند؛ از الگوریتم نزدیک-ترین همسایگی به جهت کلاسهبندی این بردارها استفاده میشود.