بخشی از مقاله
*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***
طبقه بندي تصاویر ماهواره اي بر اساس تلفیق مدل هاي مبتنی بر بافت با استفاده از شبکه عصبیMLP
چکیده
هدف از ارائه این مقاله، شناسایی اتوماتیک ناحیه هاي گوناگون در تصاویر ماهواره اي با استفاده از ویژگی بافت می باشد که در دو روش GLCM وطیف فوریـه با هم مقایسه می شوند. با ترکیب ویولت گسسته و GLCM یک روش جدید براي شناسایی مناطق شهري ارائه شده است که بعنوان معیـاري بـراي انـدازه گیـري میزان توسعه یافتگی در مناطق شهري بکمک تصاویر ماهواره اي بکار می رود.در این مقاله با ترکیب GLCM و ویژگیهاي فضایی الگوریتمی بیان شده اسـت کـه در آن % 9 بهبود راندمان نسبت به حالتی که تنها از ویژگیهاي فضایی استفاده کنیم ، بدست می آید. 26 ویژگی از GLCM براي شناسایی مناطق زیستی بکار بـرده شده است. مشکل تشخیص مناطق مختلف با یک روش جدید مورد بررسی قرار گرفته و منجر به نتایج مطلوب شده است. نتایج شبیه سـازي بـا اسـتفاده از نـرم افزار MATLAB/IMAGE PROCESSING بر روي یک پایگاه داده اي که تصاویر از آنجا گردآوري شده اند و IKONOS نام دارد ، صحت عملکرد سیستم مذکور را تایید میکند.
واژه هاي کلیدي: ویژگی بافت، ماتریس GLCM ،شبکه عصبی MLP ، بردار ویژگی، تصاویر ماهواره اي.
-1 مقدمه
تصاویر ماهواره اي کاربرد زیادي در قسمت هاي مختلف تکنولوژي دارند. به دلیل عظیم بودن داده هاي موجود در این قسمت تصاویر نیاز به روشهاي پیشرفته اتوماتیکی می باشد که اطلاعات مورد نیاز را از این تصاویر استخراج کندودر اختیار کاربر قرار دهد.کمیته تکنیکی استخراج داده DFT یکی از زیر بخش هاي گروه حسگر هاي راه دور وزمین است. سازمان بین المللی مهندسین برق دنیا IEEE سالیان سال است که در حال کار بر روي این زمینه می باشد و انتشارات متعددي داشته است و جدیدترین دستاوردهاي محققین را در این زمینه را منتشر می کند. مساله مورد بررسی در این مقاله شناسایی اتوماتیک ناحیه هاي گوناگون در تصاویر ماهواره اي می باشد . انتخاب نوع این ناحیه ها بنا به کاربرد این مقاله مشخص می شود. ماتریس GLCM یکی از المان هاي اصلی در این تحقیق است.ماتریس GLCM
یک ماتریس دو بعدي است، که عنصر (i,j) آن تعداد دفعاتی است که i و j با هم رخ می دهند.
تاکنون کارهاي زیادي در این زمینه انجام شده است و محققین روشهاي گوناگونی این زمینه ارائه کرده اند. تمرکز این تحقیق بر روي استفاده از ویژگی بافت در شناسایی اتوماتیک می باشد است.
-2 بیان مسئله
محققین علم جغرافی زمان طولانی است که در زمینه ناحیه هاي مختلف شهر از روي نقشه کار کرده اند. نیاز به یک سیستم هوشمند و قدرتمند با پیشرفتها و توسعه شهرها بیش از پیش ضروري به نظر می رسد. تکنیکهایی که بتوانند نواحی وسیع را با سرعت زیاد و دقت بالا پردازش کنند بسیار مورد نیاز می باشند لذا محققین دارند بر روي این تکنیکها کار می کنند.
در طول دهه گذشته ، پیشرفتهایی در ابزارهاي تصویر برداري دیجیتال بوقع پیوسته است که مشاهده سطح یک ناحیه را با جزئیات فضایی و طیفی امکان پذیر شده است. استفاده از Spectrometer پیشرفته تصویر برداري هوایی در کابردهاي متنوعی مورد استفاده قرار می گیرند و این استفاده هر روز در حال افزایش است.[2]
البته هزینه داده هاي بدست آمده از این حسگرهاي چند طیفی خیلی گران می باشد. محققینی که منابع مالی کمی برخوردار هستند، قادر نیستند اطلاعات از فرکانسهاي بالا را که مورد نیاز هستند را مشاهده کنند. مشکل بعدي داده هاي چند طیفی هوایی رزولوشن بالاي آنها می باشد که کار شناسایی ویژگی ، پردازش داده و استخراج اطلاعات و دسته بندي اشیا موجود در تصویر را بسیار سخت می کند 2].،[3 در این فصل به بررسی روش پیشنهادي این مقاله می پردازیم و نقاط ضعف و قوت آنرا بر روي تصاویر مختلف می بینیم.
ورودي این سیستم تصاویر ماهواره اي می باشد که از مرجع [11] گردآورش شده است و به عنوان یک مرجع در اکثر کارهاي دسته بندي مناطق مختلف شهري مورد استفاده قرار می گیرد. این تصاویر مرجع به کلاسهاي زیر دسته بندي شدند : فضاي سبز ، خیابان ، بزرگراه ، منازل مسکونی . بنابراین ما چهار کلاس داریم که بایستی تصویر ورودي خوانده شده و نواحی که این کلاسها بر روي آنها قرار دارد، مشخص شوند.
تصاویر موجود براي آموزش شبکه عصبی استفاده می شوند، بنابراین تا جایی که ممکن بود این نمونه ها متفاوت انتخاب شدند. شبکه هاي عصبی را می توان با اغماض زیاد، مدل هاي الکترونیکی از ساختار عصبی مغز انسان نامید .مکانیسمفراگیري و آموزش مغز اساسا ًبرتجربه استواراست.یک شبکه عصبی مصنوع ایده اي است براي پردازش اطلاعات که از سیستم عصبی زیستی الهام گرفته شده و مانند مغز به پردازش اطلاعات می پردازد استفاده از این تصاویر بدین صورت است که از تصاویر هر کلاس بردار ویژگی استخراج می شوند و این بردار ویژگی براي آموزش شبکه عصبی استفاده می شوند . به عبارت دیگر، به شبکه عصبی آموزش داده می شود که اگر بردار ویژگی کلاس بزرگراه در ورودي آن قرار گرفت در خروجی این کلاس را نشان دهد. ن براي هر تصویر یک بردار ویژگی بدست می آید که متناظر با همان تصویر می باشد. برنامه در هر تکرار یک تصویر را می خواند و کار پردازش را بر روي آن انجام می دهد و بردار ویژگی آن را استخراج می کند. نکته دیگري که در جمع آوري پایگاه داده تصاویر آموزش شبکه عصبی در نظر گرفته شد، تعداد زیاد آن می باشد زیرا هر چه تعداد نمونه هاي آموزش بیشتر باشد، قدرت تعمیم پذیري شبکه عصبی بیشتر می شود. نکته بعدي متفاوت بودن اندازه تصاویر است و سیستم طوري طراحی گردیده است که بتواند با هر اندازه تصویري کار کند و در هنگام جمع آوري کلاسها سعی شد اندازه تمامی تصاویر با هم متفاوت باشد
سیستم طراحی شده قابلیت این را دارد که بتوانید تعداد کلاسها را به راحتی افزایش دهیم، در اینجا ما 4 کلاس در نظر گرفتیم، اما می توانید براي هر تعداد کلاس هم این سیستم را استفاده نمود.[5]
-3 ارائه روش پیشنهادي
الف) الگوریتم کلی برنامه
در کارهاي پردازش تصویر و شناسایی الگو یک روند کلی وجود دارد. آموزش شبکه عصبی با بردار ویژگیهاي بدست آمده. در این تحقیق هم یک روند متشابهی مورد استفاده قرار گرفته است که در این قسمت با آن آشنا می شویم.
(1 خواندن تصویر موجود در پایگاه داده آموزش شبکه عصبی
(2 تبدیل تصویر از RGB به Gray Level
(3 اعمال فیلتر میانگین . 3 × 3
(4 تشکیل بردار ویژگی تصویر ورودي
(5 کنار هم قرار دادن کل بردار ویژگیها در کنار هم و تشکیل بردار ویژگی نهایی
(6 تشکیل بردار هدف
(7 ساخت شبکه عصبی
(8 آموزش شبکه عصبی با بردار ویژگی نهایی و بردار هدف
در ادامه به توضیح تمامی این مراحل جهت استخراج تصویر می پردازیم.
براي کار با تصویرهاي موجود باید تصویرها را یکی یکی بخوانیم و آنرا مورد پردازش قرار دهیم.
تصویر ورودي ، تصویري رنگی می باشد یا به عبارت دیگر داراي سه بعد R و G وB می باشد. ویژگیهاي مورد استفاده در این تحقیق ، همانطور که در قسمتهاي بعدي توضیح آنها خواهد آمد، ماتریس ورودي انها داراي دوبعد می باشد، بنابراین در این مرحله، تصویر رنگی ورودي به یک تصویر خاکستري تبدیل می شود. اعمال فیلتر میانگین 3 × 3 از نظر بصري باعث مات شدن تصویر می شود و از نظر دقیق تر یک میانگیري از پیکسلهاي همسایه انجام می دهد.
الف) حذف نویزهاي خیلی ریز که به صورت ضربه اي بر روي تصویر خروجی ظاهر می شوند و متمایز کردن لبه ها ب) گاهی ناحیه مورد پردازش ، تغییراتی در شدت نور آن وجود دارد و یا تعدادي پیکسل تغییرات کمی در مقدار آنها وجود دارد، با اعمال فیلتر میانگین یک هموار سازي بر روي مقدار پیسکلها انجام می شود ، که در راندمان کلی سیستم بسیار مهم می باشد و درصد دسته بندي کلی سیستم را افزایش می دهد.
براي هر تصویر یک بردار ویژگی بدست می آید که متناظر با همان تصویر می باشد. برنامه در هر تکرار یک تصویر را می خواند و کار پردازش را بر روي آن انجام می دهد و بردار ویژگی آن را استخراج می کند. بنابراین براي هر تصویر یک بردار ویژگی داریم، لذا بایستی تمامی این بردار ویژگیها در کنار هم قرار گیرند و تشکیل یک بردار کلی تر را بدهند. در این مرحله بردار ویژگی که از هر تصویر بدست آمده ، تشکیل بردار کلی را می دهند. این بردار کلی در قسمت آموزش شبکه عصبی مورد استفاده قرار می گیرد.[6]
براي آموزش شبکه عصبی نیاز به برداري است که هدف هر بردار ویژگی را مشخص کند. به عبارت دیگر، اگر یک بردار ویژگی مربوط به کلاس بزرگراه می باشد، بردار هدف کلاس مربوط به آن را مشخص می کند. الگوریتم آموزشی که براي اکثر شبکه هاي عصبی مورد استفاده قرار می گیرد، آموزش با ناظر می باشد. در این آموزش باید بردار هدف مشخص شود.
در مرحله ساخت شبکه عصبی ، یک شبکه عصبی بر اساس بردار ورودي و هدف ساخته می شود. در این مرحله مقادیر پیش فرض براي شبکه عصبی درنظر گرفته می شوند.
یکی از مسائلی که در این مرحله بسیار حائض اهمیت می باشد، انتخاب تعداد نرونهاي لایه مخفی و تعداد لایه ها می باشد. در این تحقیق از روش سعی و خطا براي یافتن بهترین ساختار استفاده شد. ابتدا با یک شبکه عصبی کوچک شروع کرده و درصد شناسایی بدست آمد و همینطور شبکه عصبی بزرگتر شد تا درصد شناسایی به مقدار قابل قبولی برسد. این مرحله یکی از مهم ترین بخشهاي این الگوریتم می باشد، زیرا دسته بندي کننده اصلی (شبکه عصبی ) را تنظیم می کند. آموزش شبکه عصبی در حقیقت مقدار وزنهاي بین نرونها را تنظیم می کند. الگوریتم مورد استفاده در مورد شبکه عصبی MLP، الگوریتم Back-propagation می باشد.
شبکه MLP همانطور که از اسمش بر می آید مجموعه اي از نرونها است که در لایه هاي مختلفی پشت سر هم قرار گرفته اند . مقادیر ورودي پس از ضرب در وزنهاي موجود در گذر گاههاي بین لایه هابه نرونبعدي رسیده ودرآنجا باهم جمعشده وپس از عبور از تابع شبکه مربوطه خروجی نرون را تشکیل می دهند.در پایان خروجی بدست آمده با خروجی مورد نظر مقایسه شده و خطاي بدست آمده جهت اصلاح وزنهاي شبکه به کار می رود،که این امر اصطلاحا آموزش شبکه عصبی نامیده می شود. ایده جدیدي که در این تحقیق به آن پرداخته شده است، استفاده از ماتریس GLCM1 می باشد. در ابتدا تعریف ماتریس GLCM را با هم می بینیم.
ب) تعریف ماتریس : GLCM
ماتریس یک ماتریس است که بر روي یک تصویر تعریف می شود چنانکه توزیع مقادیر 2 co-occurrenceدر
یک offset مشخص قرار داشته باشند. ماتریس بر روي یک
تصویر و با پارامترهاي بدین صورت تعریف می شود. یک روش آماري که می تواند به خوبی آمار مرتبه دوم در یک تصویر بافت را استخراج کند، ماتریس co-occurrence می باشد. یک تعریف دیگر که می توان از GLCM ارائه داد، بدین صورت می باشد که ماتریس GLCM هیستوگرام دو بعدي است که عنصر بیان کننده تعداد اتفاق i همزمان با اتفاق j می باشد. ماتریس co-occurrence بوسیله فرکانسهاي نسبی در دو پیکسل مشخص می شود چنانکه در فاصله d و جهت ، یکی با شدت روشنایی i و دیگري با شدت روشنایی j قرار داشته باشد. بنابراین ماتریس GLCM تابعی از فاصله و زاویه و شدت روشنایی هاي i و j می باشد. در دنبال و شناسایی حروف بایستی بایستی مناسب باشیم.
بعد از محاسبه ماتریس GLCM حال بایستی استخراج ویژگی از این ماتریس کنیم. چون خود این ماتریس را نمی توان به طور مستقیم به عنوان بردار ویژگی به دسته بندي کننده شبکه عصبی داد، بنابراین لازم است که یک سري عملیات ریاضی بر روي ماتریس GLCM انجام شود. این عملیات ریاضی به استخراج ویژگی از ماتریس GLCM مشهور هستند.در این قسمت تعدادي از این ویژگیها را می بینیم.
این ویژگیها همانطور که از روابط آنها مشهود است، یک عدد را از یک ماتریس GLCM بدست می آورند و براي تولید بردار ویژگی مناسب می باشند.
ماتریس GLCM هم همانطور که در قسمتهاي قبلی گفته شد، با انتخاب مناسب و می تواند نحوه توزیع مقادیر پیکسلهاي تصویر را بیان کند. در کارهاي GLCM مرسوم تر است که به جاي و ، فرم برداري آن بکار می رود. مثلا به جاي و ، می نویسیم .offset=[1 1] شکل 1 این مفهوم را به صورت شماتیک نشان می دهد.
شکل .1 بیان برداري و در تعریف ماتریس GLCM
بنابراین انتخاب پارامتر offset تاثیر بسزایی در نتایج حاصل استفاده از GLCM دارد، زیرا نحوه تشکیل آن را مشخص می کند.
در این تحقیق ابتدا تصویر به پنجره هاي 7 × 7 تقسیم می شود. به عبارت دیگر، ما ماتریس تصویر ورودي را به ماتریسهاي 7 در 7 تبدیل می کنیم. سپس براي چهار d=2,3,4,5 و زاویه هاي θ=0 , 45, 90 ، دوازده ماتریس GLCM محاسبه می شود. کل offset ها در جدول 1-5 نشان داده شده است.