بخشی از مقاله

چکیده - یکی از پردازش های مهم روی داده های ابرطیفی ، طبقه بندی آنها می باشد. به دلیل زیادبودن تعدادباندها و کمبود نمونه های آموزشی در دسترس، پدیده نفرین ابعاد امری اجتناب ناپذیر است. بنابراین برای افزایش دقت طبقه بندی استفاده از الگوریتم های کاهش ویژگی - شامل تکنیک های انتخاب و استخراج ویژگی - به عنوان گام پیش پردازش امری ضروری است. در این مقاله یک روش استخراج ویژگی پیشنهاد شده که بر منحنی پاسخ طیفی پیکسل ها تمرکز دارد.

با استفاده از طول موج های جذب و نقاطی از منحنی که در آن نقاط تغییرات شدت روشنایی شدید است، نقاط شکست طیف بازتابی را تعیین و با میانگین گیری از شدت روشنایی در فواصل بین این نقاط، ویژگیهای جدید را استخراج می نماییم. همچنین روش جدیدی برای طبقه بندی ارائه می شود که برمبنای تفکیک پذیری کلاسها از روی نقاط شکست می باشد. روش پیشنهادی روی دو داده ابرطیفی مورد آزمایش قرار می گیرد. درنهایت مقادیر صحت حاصل از طبقه بند پیشنهادی با طبقه بند حداکثراحتمال مقایسه می گردد. نتایج بدست آمده نشان می دهد این روش می تواند در تفکیک برخی پوشش ها ی زمینی کاربرد داشته باشد.

مقدمه

سنجش از دور، فن جمع آوری و ثبت همزمان تصاویر با بیش از صدها باند کم عرض و پیوسته از طیف الکترو مغناطیسی است. تصاویر بدست آمده از سنجنده های ابرطیفی بصورت داده های سه بعدی نمایش داده می شوند که با جمعآوری اطلاعات مکانی در جهات برداری x,y و اطلاعات طیفی در جهت z صورت میگیرد. یک مکعب ابرطیفی مجموعهای از تعداد زیادی تصویر است که همگی از یک منظره زمینی واحد اما در طولموجهای متفاوت و مجاور هم وغالباً در تمام یا بخشی از بازه طولموجهای 400 تا 2500 نانومتر اخذشدهاند. ابعاد این مکعب برابر تعداد سطرها، ستونها و باندهای اخذ تصویر است. هر تصویر نشان دهنده یک محدوده از طیف الکترومغناطیسی و نیز به عنوان یک باند طیفی شناخته شده است.

تصاویرابرطیفی عموماً ترکیبی از 100 تا200 باند طیفی با پهنای نازک باند بین 5 - 10 نانومتر هستند.[ Chi et al,2008 ] پوشش طیفی و زیاد بودن تعداد باندها ، موجب بالا بودن قدرت تفکیک طیفی آنها شده است. این تصاویر قادرند برخی از باندهاکه شباهت طیفی بسیار بالایی نسبت به هم دارند را تا حد زیادی از هم تفکیک کنند. برای هر پیکسل از یک تصویر ابرطیفی، نمودار حاصل از رسم مقادیر شدت روشنایی در باندهای مختلف برحسب شماره باند را امضای طیفی1 یا نمودار پاسخ طیفی2 پیکسل - SRC - مینامند. امضای طیفی×برای هر پدیده منحصربفرد می باشد .

[shippert,2003] تصاویر چند طیفی به دلیل داشتن تعداد باندهای محدود توان تفکیک پایینی در جداسازی کلاسها و عوارض نزدیک به هم دارند، این مساله در مورد کلاسهایی که شباهت طیفی بالایی دارند بارزتر میشود، درحالیکه تصاویر ابرطیفی دارای قدرت تفکیک طیفی بسیار بالایی بوده و این ویژگی این امکان را برای این نوع تصاویر ایجاد میکندکه از مزایای اطلاعات یک طیف الکترومغناطیس تقریباً پیوسته برای اهداف و پدیدههای مختلف استفاده کنند. البته لازم به ذکر است که قدرت تفکیک طیفی و مکانی با یکدیگر رابطه عکس دارند، بنابراین تصاویر ابرطیفی دارای قدرت تفکیک طیفی بالا و در عوض قدرت تفکیک مکانی متوسط هستند.

این امر باعث به وجود آمدن پیکسلهای آمیخته در تصویر ابرطیفی میشود. پیکسل آمیخته به پیکسلی گفته می شود که بیش از یک شیء منفرد در تشکیل آن حضورداشته باشد. بنابر این مزیت عمده تصاویر ابرطیفی نسبت به تصاویر چند طیفی در این است که دارای قابلیت بالایی در تمییز کلاسهای زمینی از یکدیگر میباشند. البته این ویژگی که تعداد باندهای دادههای ابرطیفی زیاد است باعث افزایش چشمگیر حجم دادههای ابرطیفی نسبت به دادههای چند طیفی میشود و درنتیجه روشهای ذخیرهسازی، فشردهسازی و نمایش آنها متفاوت خواهد بود. طبقه بندی نیز به عنوان یکی از مهمترین مراحل پردازش مطرح میشود که طی این فرآیند تصمیم گیری هر پیکسل از تصویر به یک کلاس نسبت داده می شود.

یک مجموعه کامل از کلاسها باید به گونه ای تعیین شود که یک کلاس منطقی برای نسبت دادن به هر پیکسل ازمجموعه داده ها وجود داشته باشد. یکی از مشکلات اساسی در طبقه بندی تصاویر ابرطیفی، افزونگی دادهها میباشد. از طرفی بالا بودن تعداد ویژگیها نیاز به دادههای آموزشی را بیشازپیش نمایان میسازد. وجود ویژگیهای همبسته و گاه زائد موجب کاهش دقت طبقهبندی در هنگام استفاده از تمامی این ویژگی ها میشود.

بدین صورت که در ابتدا با افزایش تعداد باندها دقت طبقهبندی تا یک نقطهای افزایشمی یابد که این به خاطر افزایش تمایز بین کلاسها است، اما ازآن نقطه به بعد به علت دقت پایین برآورد پارامترهای آماری دقت طبقهبندی کاهش مییابد. از این موضوع تحت عنوان نفرین ابعاد یا پدیده هیوز3 یاد میشود [Jia et al,2012/ برای مقابله با پدیده هیوز، چهار راهبرد اساسی موجود است: - 1استفاده از دادههای نیمه آموزشی، - 2 بهکارگیری اطلاعات مکانی در کنار اطلاعات طیفی، - 3 بهرهگیری از طبقهبندهایی نظیر ماشین بردار پشتیبان که حساسیت کمتری به تعداد نمونههای آموزشی دارند، - 4 کاهش تعداد ویژگیها .[Hosseini and Ghassemian,2016] روش پیشنهادی ما در این مقاله بر اساس کاهش تعداد ویژگی ها می باشد.

کاهش ویژگی داده ابرطیفی، اثرات مثبتی در تحلیل و طبقه بندی آنهاخواهد داشت که از آن جمله می توان به درک بهتر داده ، کاهش پیچیدگی محاسبات و افزایش دقت طبقه بندی اشاره نمود. الگوریتمهای کاهش بعد را می توان به دوگروه کلی انتخاب ویژگی و استخراج ویژگی تقسیم کرد. در الگوریتم های انتخاب ویژگی بعضی باند ها با استفاده از یک معیار خاص انتخاب شده و بقیه باند ها کنار گذاشته می شوند .روشهایی مانند انتخاب روبه جلوی متوالی - SFS - و انتخاب روبه عقب متوالی - - SBS در این گروه قرار دارند [Jensen,2007/Sinduja and .Sumathi,2015] الگوریتم های استخراج ویژگی، روشهایی هستندکه معمولا در آنها از یک نگاشت استفاده می شود و با استفاده از این نگاشت داده ها از فضای مشاهده به فضای جدید با ابعادکمتر منتقل می شوند.

[Liao,2012] استخراج ویژگی می تواند به صورت با نظارت مانند تحلیل ممیزخطی - - LDA و یا بدون نظارت مانند تحلیل مؤلفههای اساسی - - PCA انجام شود - البته می توان دسته سوم نیمه نظارتی را نیز به آنها اضافه نمود که یا از ترکیب روشهای نظارت شده و بدون نظارت حاصل می شود یا از نمونه های آموزشی نیمه برچسب دار علاوه بر نمونه های آموزشی اصلی برای کاهش ویژگی استفاده می کنند - . روش PCA از مقادیرویژه وبردارهای ویژه ماتریس کوواریانس استفاده میکند و بر اساس معیارهایی مانند حداقل کردن مربع خطای بازسازی داده عمل میکند.گرچه این روش اقدام به تولیدویژگیهای جدید با محتوای اطلاعاتی بالا در مولفه های نخستین می نماید اما به دلیل درنظر نگرفتن تمایزبین کلاسها ممکن است برای کاربردهای طبقه بندی مفید واقع نشود.

LDA به دلیل مشکل منفرد بودن ماتریس پراکندگی درون کلاسی، دارای کارایی خوبی درنمونههای آموزشی محدود نمی باشد. به علاوه تعداد ویژگیهای استخراج شده توسط آن،حداکثر برابر تعداد کلاسها منهای یک است. استخراج ویژگی غیر پارامتریک وزندار NWFE این مشکلات را حل کرده، ولی دارای پیچیدگی محاسباتی بالایی است. روشهای متعدددیگری نظیر استخراج ویژگی مرز تصمیم - DBFE - ، استخراج ویژگی تحلیل ممیز - DAFE - و نیز تحلیل مؤلفههای مستقل - ICA - بهعنوان روشهای استخراج ویژگی معرفیشدهاند.[Hosseini and Ghassemian ,2016/ Liao,2012] روشهای طبقه بندی نیز به طور مرسوم به دو گروه با نظارت و بی نظارت تقسیم می گردد.

روشهای با نظارت را نیز می توان به دو گروه پارامتریک مانند حداکثراحتمال - ML - و غیر پارامتریک مانند نزدیکترین K همسایگی - - KNN تقسیم نمود.در روش ML بردارمیانگین و ماتریس کوواریانس کلاس ها از نظر نمونه های آموزشی تخمین زده می شود و استفاده گسترده در بهینه سازی دارد.[Khodadadzadeh and Ghassemian,2014/Bendiktsson et al,2008] حساسیت این روش به دادههای آموزشی ازلحاظ کمی و کیفی بهمراتب بالا می باشد.

روش پیشنهادی ما در این مقاله شامل 2بخش می باشد: دربخش اول یک روش استخراج ویژگی غیر خطی بر مبنای استفاده از طول موج های جذب مواد و نیز نقاطی از منحنی پاسخ طیفی که تغییرات شدت روشنایی درآنها شدید است - نقاط شکست - ، ارائه می شود که به نظر می رسد در تفکیک برخی پوشش های زمینی کاربرد داشته باشد. در بخش دوم یک روش طبقه بندی معرفی می شود که مبتنی برتفکیک پذیری کلاسهای داده بر اساس نقاط شکست پیکسل ها می باشد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید