بخشی از مقاله
چکیده :
یکی از منابع اطلاعاتی ارزشمند جهت استخراج اطلاعات از پوشش سطح زمین استفاده از تصاویر ابرطیفی است. این تصاویر به علت تعداد باندهای زیادی که دارند داده هایی با حجم بسیار بالا را در اختیار میگذارند. در روش های مرسوم جهت طبقه بندی نظارت شده این تصاویر مانند ماشین بردار پشتیبان - - SVM1، بیشترین احتمال1 و K نزدیکترین همسایگی - - KNN1 با استفاده از الگوریتمهایی تعدادی از باندهای بهینه جهت انجام طبقه بندی انتخاب میشوند و دلیل این امر سرعت بخشیدن به روند طبقه بندی تصویر است.
گاهی انتخاب باند ها باعث کاهش دقت در طبقه بندی تصاویر ابرطیفی به ویژه برای کلاس هایی که شباهت طیفی زیادی به هم دارند میشود، به همین منظور در این مقاله الگوریتم دو مرحله ای برای بهبود دقت طبقه بندی تصاویر ابرطیفی ارائه شده است. الگوریتم ارائه شده بر روی یک تصویر ابر طیفی دارای 102 باند و با استفاده از روش SVM اعمال شده و نتایج آن با نتایج به دست آمده قبل از اعمال این الگوریتم مقایسه شده است. نتایج حاصل برای استفاده از این روش نشان دهنده افزایش در دقت طبقه بندی کلاسهایی که دارای تشابه طیفی زیادی هستند میباشد.
-1 مقدمه
یکی از روشهای استخراج اطلاعات پوشش زمین ، استفاده از داده های سنجش از دور است. سرعت بالا ، صرفهجویی در زمان، پوشش وسیع ، ثبت اطلاعات طیفی و خصوصیات پدیده ها در باند های مختلف و دقت مناسب از ویژگی های مثبت این داده ها هستند. از داده های سنجش از دوری می توان به تصاویر ابرطیفی اشاره کرد که دقت هندسی بالا و جزئیات زیادی از سطح زمین ارائه میدهند.[1]
طبقه بندی یکی از روش های استخراج اطلاعات میباشد که براساس شباهت طیفی پیکسل های تصویر، آن ها را در یک کلاس مشخص قرار می دهد. طبقه بندی به دو روش کلی نظارت شده و نظارت نشده قابل تقسیم است. یکی از مشکلات طبقه بندی تصاویر ابرطیفی حجم زیاد دادهها می باشد که استفاده از تمامی این داده ها علاوه بر صرف زمان زیاد ممکن است باعث ایجاد بیش برازش1 نیز شود.[2]
در سالهای گذشته به علت عملکرد مناسب طبقه بندی مبتنی بر هسته2، این روش مورد توجه قرار گرفته است که از میان طبقهبندی کنندههای مبتنی بر هسته میتوان به طبقهبندی کننده ی SVM اشاره نمود3]،4و.[5 بسیاری از مطالعات در زمینه سنجش از دور بیانگر این واقعیت است که SVM در مقایسه با طبقه بندی بر اساس KNN ، بیشترین شباهت و شبکه های عصبی در داده های فراطیفی نتایج بهتری ارائه نموده است6]،7،8و.[9 در این پژوهش نیز از طبقهبندی کننده SVM استفاده شده است که در مورد آن توضیح مختصری داده خواهد شد.
-1-1طبقه بندی نظارت شده
در این روش از برخی پیکسل ها که نوع عارضه آن ها در واقعیت مشخص هستند، به عنوان نمونه آموزشی مورد استفاده قرار میگیرد. از این پیکسل ها و ویژگی های طیفی آن ها جهت طبقه بندی پیکسل های ناشناخته استفاده میگردد و هر پیکسل به کلاسی منتسب می شود که از نظر طیفی به نمونه های آموزشی آن کلاس نزدیکتر است.[10]
-2-1طبقه بندی نظارت نشده
در این نوع طبقه بندی ، پیکسلها صرفا به دلیل نزدیک بودن ویژگی های طیفی در یک طبقه قرار می گیرند و به دلیل عدم استفاده از دادههای آموزشی و آگاهی در روند طبقهبندی، خوشهها برچسب نخواهند خورد. در حقیقت مشخص می شود کدام پیکسل ها به هم شباهت دارند اما نمی توان مشخص کرد که این پیکسل ها مرتبط به کدام عارضه هستند. این طبقه بندی به سبب عدم آگاهی از منطقه انجام میگیرد.[11]
-3-1طبقه بندی کننده SVM
SVM یکی از روش های طبقه بندی غیر پارامتریک میباشد. مبنای یادگیری این الگوریتم، دادههای آموزشی مربوط به بردار های پشتیبان3 هستند. به همین دلیل برای آموزش به داده های زیادی نیازمند نبوده و فرایند یادگیری در زمان کوتاهی انجام می شود. این الگوریتم می کوشد ابر صفحاتی در فضا رسم کند که حاصل آنها تمایز بهینه نمونههای کلاس های مختلف می باشد. SVM در ابتدا یک ابر صفحه به صورت f - x - =w.x+b تعریف می نماید، سپس پارامترهای آن را با حل یک مساله بهینه سازی قید دار به گونه ای تعیین میکند که کلاس ها بیشترین جدایی را از یکدیگر داشته باشند.
در این تحقیق از یک تصویر با 102 باند استفاده شده است . از میان این تعداد باند، با یک الگوریتم 5 باند که ترکیب آن ها دقت بهتری جهت طبقه بندی ارائه می کنند انتخاب میگردد. تصویر مورد نظر با استفاده ازطبقه بندی طبقه بندی نظارت شده تصاویر ابرطیفی به وسیله… کننده SVM طبقه بندی شده و در گام نهایی جهت بهبود دقت طبقه بندی روش پیشنهادی ارائه شده و نتایج حاصل از آن مورد ارزیابی قرار میگیرد.
-2طبقه بندی تصویر با استفاده از الگوریتم دو مرحله ای
روند استفاده از الگوریتم دو مرحله ای به این ترتیب است که ابتدا با استفاده از یک الگوریتم انتخاب باند های بهینه1، تعدادی از باند های بهینه از تصویر فراطیفی مورد نظر انتخاب و سپس میانگین داده های آموزشی در این باند ها محاسبه می شود. کلاس هایی که دارای میانگین نزدیکی به هم هستند بر اساس یک حد استانه که وابسته به دقت مورد نظر از این روش است مشخص می شوند و تصویر فراطیفی مورد نظر با یکی از روش های ذکر شده در قسمت مقدمه طبقه بندی می شود. سپس دقت کلی طبقه بندی به همراه دقت هر کدام از کلاس ها با استفاده از داده های آزمایشی تعیین خواهد شد. کلاس هایی که در باند های انتخاب شده دارای میانگین طیفی نزدیک به هم هستند دقتهای کمتری را در این طبقه بندی به دست خواهند اورد.
در مرحله دوم پیکسل هایی که در فضای طیفی انتخاب شده دارای میانگین های نزدیک به هم بودند به طور مجدد وارد الگوریتم انتخاب باند های بهینه میشوند. این الگوریتم در این مرحله باند های متفاوتی را استخراج می کند و دلیل این امر این است که در مرحله قبل باید باند های مناسب برای تمام کلاس ها انتخاب می شدند اما این بار باند های مناسب فقط برای کلاس هایی که در مرحله اول میانگین نزدیک به هم داشتند انتخاب می شوند و ترکیب باندی جدید باعث ایجاد فاصله بیشتر بین میانگین این کلاس ها می شود. اکنون پیکسل های کلاس های نزدیک به هم، در فضای طیفی جدید ایجاد شده طبقه بندی میشوند و نتایج طبقه بندی این پیکسل ها در طبقه بندی مرحله اول جایگزین میشود.
-3داده های مورد استفاده
در این مقاله الگوریتم دو مرحله ای شرح داده شده بر روی یک تصویر ابرطیفی از منطقه پاویا2 پیاده سازی و نتایج آن بررسی شده است. این تصویر دارای 1096 *490 پیکسل بوده و 102 باند دارد. جهت طبقه بندی این تصویر که دارای 9 کلاس است، 1400 داده آموزشی مورد استفاده قرار گرفته است. تعداد داده های آموزشی برای هر کلاس در جدول - 1 - آورده شده است.