بخشی از مقاله

چکیده :

با پیشرفتهاي نوین در سنجش از دور و تولید دادههاي فراطیفی با اطلاعات طیفی فراوان، امید زیادي به استفاده از این دادهها جهت مطالعه دقیق پدیدهها و طبقهبندي موفق کلاسهاي پوشش زمینی ایجاد شدهاست. علیرغم این ویژگی مفید و مهم، تعدد باندها یا به عبارت دیگر اطلاعات طیفی با ابعاد زیاد، چالشی جدي در پردازش و تجزیه تحلیل این دادهها در برابر پژوهشگران قرار دادهاست.

این دشواري، به ویژه، در طبقهبندي تصاویر در مرحله جمعآوري دادههاي آموزشی و آموزش طبقهبندي کنندهها، خودنمایی میکند. لذا، براي حل این مشکل، مطالعه و پژوهش بر روي روشهایی که براي طبقهبندي نیاز به دادههاي آموزشی کمتري دارند، مورد توجه قرار گرفته است. یکی از این روشها که در سالهاي اخیر بسیار موفقیت آمیز بوده است، الگوریتمی بر پایه ماشینهاي بردار پشتیبان 1 - SVM - است که از تئوري یادگیري آماري استخراج شدهاست.

در این مقاله، کارایی روش ماشینهاي بردار پشتیبان در طبقهبندي تصاویر فراطیفی مورد بررسی قرار گرفته است. ویژگی اصلی این روش، توانایی آن در بکارگیري دادههایی با ابعاد طیفی زیاد و عدم نیاز به مرحله انتخاب ویژگیها و یا کاهش ابعاد میباشد. ماشینهاي بردار پشتیبان، از لحاظ فرمول بندي، داراي دو فرم یگانه و دوگانه هستند. در اغلب موارد، این دو فرم معادل یکدیگرند. ولی براي بهینهسازي فرم یگانه، که یک رابطه بدون قید است، از هر روشی می توان براي بهینهسازي استفاده کرد. در حالی که براي بهینهسازي فرم دوگانه، بایستی از روش ضرائب نامعین لاگرانژ استفاده کرد.

در این پژوهش، در گام اول، الگوریتمی جهت طبقهبندي دادههاي فراطیفی با استفاده از ماشینهاي بردار پشتیبان به فرم دوگانه، پیادهسازي شدهاست. در گام بعد، آنالیز دقت و ارزیابی حساسیت این الگوریتم نسبت به تعداد نمونههاي آموزشی مختلف، پارامترهاي کنترل کننده الگوریتم و توابع هسته، که نقش مهمی در فرآیند بهینهسازي الگوریتم دارند، انجام شدهاست. این روش بر روي دادههاي تصویري فراطیفی سنجندة Hyperion شامل 242 باند با قدرت تفکیک مکانی 30 متر از یک منطقه کشاورزي، پیادهسازي شدهاست.

.1 مقدمه

با پیشرفت فنآوري سنجش از دور، سنجندههایی طراحی و ساختهشدهاند که داراي توان تفکیک طیفی بالایی هستند. سنجندههاي فراطیفی نوع ویژهاي از طیفسنجها میباشند که گسترة مشخصی از طیف الکترومغناطیس را در صدها باند باریک، مجاور هم و پیوسته تصویربرداري میکنند. با توجه به بالا بودن توان تفکیک طیفی تصاویر فرا طیفی، به نظر میرسد که از طبقهبندي این تصاویر بتوان به نتایج مناسبی دست یافت.

اما وجود برخی از مشکلات، مانع از انجام این امر است. هنگامی که تعداد نمونههاي آموزشی نسبت به بعد بردار نمونهها - باندهاي طیفی - ، نسبتاً کوچک باشد، با مشکلی که به پدیده هیوز2 معروف است، مواجه هستیم. این پدیده بیانگر رفتار کاهشی تابع دقت طبقهبندي بر حسب تعداد باندهاست. به عبارت دیگر، براي دادههاي آموزشی با تعداد ثابت، دقت طبقهبندي به صورت تابعی از تعداد باندها، ابتدا به حالت بیشنه خود میرسد و سپس کاهش مییابد.

علت این امر آنست که از دادههاي آموزشی محدودي جهت تخمین تعداد زیادي پارامتر استفاده شده است .[1] مشکل دیگر در استفاده از تصاویر فرا طیفی، زیاد بودن تعداد باندها و حجم بالاي اطلاعات میباشد که منجر به افزایش زمان طبقهبندي این تصاویر میشود. براي برطرف کردن این مشکل روشهاي متعددي پیشنهاد شده است.

برخی از روشهاي مرسوم شامل: - 1 مرتب کردن3 ماتریس کوریانس نمونهها، - 2 برآورد قابلیت انطباق4 آماري بوسیله استخراج نمونههاي طبقهبندي شده، - 3 روشهاي پیش پردازش مبتنی بر استخراج و یا انتخاب ویژگی، به منظور کاهش و یا تبدیل فضاي ویژگی اولیه به فضایی با ابعاد کمتر و - 4 آنالیز امضاي طیفی براي مدل کردن کلاسها، ازجمله مهمترین روشهاي ارائه شده هستند.

در روشهاي پیش پردازش مبتنی بر انتخاب ویژگی، تعدادي باند مناسب به کمک یک سري معیار انتخاب شده و بقیه باندها کنار گذاشته میشوند. اگرچه استفاده از این الگوریتمها تعداد باندها را کاهش میدهد، ولی دو مشکل اساسی در استفاده از این الگوریتم ها وجود دارد. اولین مشکل این است که مجموعه باندهاي انتخابی، لزوماً بهترین باندها براي طبقهبندي نیستند. در نتیجه نمیتوان تضمین کرد که با استفاده از باندهاي انتخابی، بهترین دقت طبقهبندي حاصل شود.

مشکل دوم این است که با کنار گذاشتن برخی از باندها، عملاً اطلاعات موجود در این باندها را از دست میرود. گروه دوم الگوریتمهاي کاهش باند، با استفاده از یک تبدیل، دادهها را از فضاي اولیه به فضاي ویژگی میبرند، سپس با استفاده از یک معیار، برخی از ویژگیها را انتخاب میکنند. در این روشها، دقت حاصل از طبقهبندي، وابستگی زیادي به الگوریتم استخراج ویژگی دارد .[2]

با این وجود، نتایج این روشها براي دادههاي تصویري فراطیفی دقت قابل قبولی را حاصل نکردهاست. به همین منظور، روشهاي جدیدي مورد توجه محققان قرار گرفتهاست که با در نظر گرفتن تمامی باندها و اطلاعات طیفی و با کمترین نیاز به دادههاي آموزشی، بتواند به دقت قابل قبولی در طبقهبندي دادههاي فراطیفی دست یابد. یکی از این روشها، ماشینهاي بردار پشتیبان است که تحت تاثیر محدودیت دادههاي آموزشی براي دادههاي سنجش از دوري با ابعاد طیفی زیاد نیست .[3] این روش به طور مستقیم از طریق یک فرآیند بهینهسازي، به دنبال سطح جدا کننده - فراصفحه - بین کلاسهاي طیفی میپردازد.

این سطح جدا کننده یا مرز بین کلاسها، با استفاده از نمونههاي آموزشی محدودي که نزدیکترین فاصله تا فراصفحه را دارند و به بردارهاي پشتیبان معروف هستند، مشخص میشود. در روشهاي مبتنی بر شبکههاي عصبی، جهت آموزش شبکه عصبی به تنظیم پارامترهاي زیادي چون تابع تبدیل، تابع هزینه، الگوریتم آموزش، معماري شبکه، پارامترهاي یادگیري از جمله نرخ یادگیري، تعداد تکرار ها و تعیین معیار پایان یافتن برنامه نیاز است. در حالی که در روش SVM تنها کافی است که تابع هسته انتخاب شده و پارامترهاي آزاد و مقدار قید تنظیم گردد.

این تحقیق با مطالعه روش ماشینهاي بردار پشتیبان، الگوریتمی جهت طبقهبندي دادههاي تصویري فراطیفی پیشنهاد میکند. پس از معرفی مفاهیم پایه SVM، فرآیند بکارگیري آن در الگوریتم طبقهبندي تشریح میشود. سپس این الگوریتم بر روي یک تصویر فراطیفی سنجنده Hyperion با 242 باند، پیادهسازي میشود. گام بعدي، ارزیابی حساسیت این الگوریتم نسبت به تعداد نمونههاي آموزشی و تابع هسته مورد استفاده در مرحله بهینهسازي است. در آخر با بررسی دقت روش طبقهبندي به کمک دادههاي آزمایشی یک ارزیابی از الگوریتم ارائه خواهد شد.

.2 ماشینهاي بردار پشتیبان

روشهاي طبقهبندي با نظارت به دو گروه پارامتریک و غیر پارامتریک تقسیم میشوند. مشکل اصلی روشهاي طبقهبندي پارامتریک، وابستگی آنها به توزیع آماري دادهها و تأثیر تعداد نمونههاي آموزشی در برآورد این توزیع است. به همین دلیل روشهاي غیر پارامتریک، از جمله روشهاي مبتنی بر شبکههاي عصبی و درخت تصمیمگیري، براي طبقهبندي تصاویر فراطیفی بکار گرفته میشوند.

شبکههاي عصبی علیرغم توانایی پردازش دادههاي پیچیده مانند دادههاي فراطیفی، در مرحله آموزشی کند هستند. علاوه بر آن به صورت یک جعبه سیاه عمل کرده و فرآیند داخلی آنها مشخص نیست .[3] الگوریتم SVM، بر پایه تئوري یادگیري آماري که توسط Boser , Guyon , Vapnik ابداع شد، بنا شده است [4]، [5]، [6] و .[7] بر اساس این تئوري میتوان کران نرخ خطاي ماشین یادگیري را براي دادههاي طبقهبندي نشده، به عنوان نرخ خطاي تعمیم یافته، در نظر گرفت.

این کرانها به عنوان تابعی از مجموع نرخ خطاهاي آموزشی هستند که میزان پیچیدگی طبقهبندي کنندهها را نشان میدهند. به منظور کمینهکردن نرخ خطاهاي تعمیم یافته، بایستی نرخ خطاي آموزش و پیچیدگی طبقهبندي کننده کاهش یابد. این کار را میتوان با بیشینهکردن حاشیه جداسازي انجام داد - نگاره .1الف - . نگاره .1 الف - روش حاشیه بیشینه براي    نگاره .1ب - مسئله SVM در حالت    نگاره .1ج - مسئله SVM در حالت تعیین فراصفحه بهینه، براي دادههاي قابل    جداسازي غیرخطی .[8]    جداسازي خطی.[8] جداسازي .[1] بنابراین، از آنجایی که حاشیه جداسازي به بعد دادههاي ورودي بستگی ندارد، این طبقهبندي کننده کارایی مناسبی در دادههاي با بعد زیاد دارد .[6] , [7] ماشین هاي بردار پشتیبان داراي 4 ویژگی اساسی هستند:

- 1 قابلیت تعمیم بالا: SVM براي جداسازي نمونههایی که به دو کلاس مختلف تعلق دارند، از یک فراصفحه با حاشیه بیشینه استفاده میکند که به آن فراصفحه تصمیمگیري بهینه5 گفته میشود [8]، - نگاره .1ب و ج - .

- 2 متغیر کمکی: هنگامی که دادهها به صورت خطی قابل جداسازي نیستند، SVM این قید را با استفاده از متغیر کمکی ξi - خطاي مجاز - براي هر نمونه i، در نظر میگیرد .[9]

- 3 فضاي ویژگی: SVM با تبدیل دادهها از فضاي RN به فضاي ویژگی با ابعاد RH که در آن H>N، یک تابع تصمیمگیري غیرخطی ایجاد میکند که در فضاي ویژگی حاصل از آن، دادهها به صورت خطی قابل جدا شدن هستند [10]،

- 4 بردارهاي پشتیبان: تنها بردارهاي پشتیبان هستند که در ساخت فراصفحه نقش دارند.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید