بخشی از مقاله

چکیده

امروزه تصاویر فرا طیفی به علت غنای اطلاعات طیفی یک ابزار قوی و کارامد در سنجش از دور به حساب میآیند و امکان تمایز بین عوارض مشابه را فراهم میآورند. با توجه به پایداری ماشینهای بردار پشتیبان در فضاهایی با ابعاد بالا، یک گزینه مناسب در طبقه بندی تصاویر فرا طیفی محسوب میشوند.

با این وجود، عملکرد این طبقهبندی کنندهها تحت تأثیر پارامترها و فضای ویژگی ورودی آنها میباشد. به منظور استفاده از ماشینهای بردار پشتیبان با بیشترین کارایی، میبایست مقادیر بهینهی پارامترها و همچنین زیر مجموعه بهینه از ویژگیهای ورودی تعیین گردند. در این تحقیق از توانایی الگوریتم ژنتیک به عنوان یک تکنیک بهینهسازی فرا ابتکاری، در تعیین مقادیر بهینه پارامترهای ماشینهای بردار پشتیبان و همچنین انتخاب زیرمجموعه ویژگیهای بهینه در طبقهبندی تصاویر فرا طیفی استفاده شده است.

نتایج عملی از بهکارگیری روش فوق در خصوص دادههای فرا طیفی سنجنده AVIRIS نشان میدهند، ویژگیهای ورودی و پارامترها هر کدام جداگانه تأثیر بسزایی بر عملکرد ماشینهای بردار پشتیبان دارند ولی بهترین عملکرد طبقهبندی کننده با حل همزمان آن دو بدست میآید. در حل همزمان تعیین پارامتر و انتخاب ویژگی، برای کرنل گوسین و پلی-نومیال به ترتیب %5 و %15 افزایش دقت با حذف بیش از نیمی از باندهای تصویر حاصل شد. همچنین الگوریتم بهینهسازی شبیه-سازی تبرید تدریجی به منظور مقایسه با الگوریتم ژنتیک پیادهسازی شد که نتایج حاکی از برتری الگوریتم ژنتیک به ویژه با بزرگ و پیچیده شدن فضای جستجو در رویکرد حل همزمان تعیین پارامتر و انتخاب ویژگی میباشد.

.1  مقدمه

امروزه با پیشرفتهای اخیر در زمینه تکنولوژی ساخت سنجیدههای فرا طیفی در سنجش از دور، امکان اخذ تصاویر با صدها باند با قدرت تفکیک طیفی بالا فراهم است . افزایش تعداد باندها و در نتیجه افزایش اطلاعات طیفی، امکان استخراج اطلاعات بیشتر در مورد عوارض موجود در تصویر و همچنین تمایز بین عوارض مشابه را فراهم میکند. از سوی دیگر با بالا رفتن ابعاد فضای ورودی، نیاز به پردازشهای خاصی به منظور بهکارگیری این تصاویر در بسیاری از کاربردهای مطرح میباشد

یک مرحله مهم در پردازش تصاویر فرا طیفی به منظور استخراج اطلاعات، طبقهبندی آنها با یکسری کلاسهای از پیش تعیین شده میباشد . در تصاویر فرا طیفی، طبقهبندی کنندههای پارامتریک به علت نیاز به تخمین توزیع آماری کلاسها و عدم توازن بین تعداد باندها و تعداد نمونههای آموزشی، با پدیده هیوز1 مواجه میشوند .[2] در این شرایط به علت بزرگ شدن فضای فرضیه و محدودیت تعداد نمونههای آموزشی، احتمال بیش تطابق نمودن 2 مدل به دادههای آموزشی وجود دارد

به منظور رفع مشکلات روشهای پارامتریک در سالهای اخیر طبقهبندی کنندههای غیر پارامتریک مختلفی به منظور طبقهبندی تصاویر فرا طیفی ارائه شده-اند، از جمله: شبکه عصبی [4]، درخت تصمیمگیری [5]، [6] Random Forest و روشهای کرنل مبنا.

در این خصوص ماشینهای بردار پشتیبان3 به عنوان یک روش کرنل مبنا، توانستهاند به با توجه به عملکردشان بر مبنای ویژگی-های هندسی و عدم نیاز به تخمین ویژگیهای آماری، ابزاری بسیار کارا و قدرتمند برای طبقهبندی تصاویر فرا طیفی به حساب آیند

ایده ماشینهای بردار پشتیبان یافتن یک صفحه تصمیمگیری بهینه برای جداسازی دو کلاس میباشد به صورتی که دو کلاس بیشترین حاشیه جداسازی را در یک طبقهبندی باینری داشته باشند. در صورتی که نمونهها به صورت خطی جدا پذیر نباشند، ابتدا با یک کرنل به فضایی با ابعاد بالاتر منتقل میشود و صفحه جداکننده در آن فضا تعریف میشود

هر چند در سالهای اخیر ماشینهای بردار پشتیبان با موفقیت در طبقهبندی بسیاری از تصاویر فرا طیفی به کار گرفته شدهاند، با این حال میبایست به تأثیر دو عامل که بر عملکرد آنها تأثیرگذار هستند، توجه داشت: پارامترهای ماشینهای بردار پشتیبان و فضای ویژگی ورودی - باندهای ورودی طبقهبندی - . به منظور طراحی یک سیستم بهینه طبقهبندی برای تصاویر فرا طیفی بر مبنای ماشین-های بردار پشتیبان، انتخاب مقادیر بهینه پارامترهای مدل و انتخاب زیر مجموعهای از باندهای بهینه چالشهایی است که در این زمینه وجود دارند. به علت اهمیت موضوع، مطالعات زیادی در سالهای اخیر در این زمینه انجام شده است که میتوان آنها را به سه دسته تقسیم کرد. در دسته اول، از همه ویژگیهای ورودی داده استفاده میشود و پارامترهای مدل بهینه میگردد تا کارایی ماشین-های بردار پشتیبان بالا رود

انتخاب ویژگیهای بهینه با ثابت درنظر گرفتن پارامترها گروه دوم تحقیقات میباشد [16-14] که با حذف ویژگیهای اضافی و وابسته، دقت و سرعت طبقهبندی را بهبود میبخشند. در این دسته از مطالعات، در ابتدا مقادیر پارامترهای مدل با استفاده از یک روش کلاسیک محاسبه شده و یا از مقادیر پیش فرض استفاده میکنند. سپس در پروسه انتخاب ویژگی آن مقادیر ثابت در نظر گرفته میشوند. با توجه به تأثیر فضای ورودی بر مقدار بهینه پارامترها و بالعکس، دسته سوم الگوریتمها به حل همزمان تعیین پارامترها و انتخاب زیر مجموعه ویژگیهای بهینه میپردازند

به منظور حل این مسائل، با توجه به بزرگ بودن فضای مجهولات نیاز به یک الگوریتم بهینهسازی قوی و کارا میباشد تا بتواند جواب بهینه سراسری را بدست آورد. از آنجایی که الگوریتمهای بهینه سازی مرسومعمولاً در فضای جستجوی بزرگ با مشکل مواجه میشوند و به جواب زیر بهینه میرسند، در این تحقیق از الگوریتم فرا ابتکاری4 ژنتیک استفاده گردیده است. الگوریتم ژنتیک به علت جمعیت مبنا بودن و اجرای همزمان جستجوی سراسری1 و جستجوی محلی2 پتانسیل بالایی در حل مسائل پیچیده بهینهسازی دارد

در این تحقیق توانایی الگوریتم ژنتیک در تعیین طبقهبندی کنندههای بردار پشتیبان در سه رویکرد: تعیین مقادیر بهینه پارامترهای ماشینهای بردار پشتیبان، انتخاب زیرمجموعه ویژگیهای بهینه و حل همزمان هر دو مفهوم در طبقه بندی تصاویر فرا طیفی مورد ارزیابی قرار گرفته است.

.2  ماشینهای بردار پشتیبان

ماشینهای بردار پشتیبان یک روش طبقه بندی با نظارت بر مبنای نظریه یادگیری آماری میباشند .[22] ایده اساسی این طبقه-بندی کننده، یافتن یک ابر صفحه بهینه به عنوان سطح تصمیمگیری به گونهای میباشد که حاشیه بین دو کلاس را بیشینه کند. در صورتی که دادهها به صورت خطی جدا پذیر نباشد، دادهها با کرنلی غیرخطی به فضای با ابعاد بالاتر منتقل میشود و ابر صفحه بهینه در آن فضا تعیین میشود.

فرض کنید l دادههای آموزشی موجود میباشد که هر یک با - xi,yi - نشان داده میشود، xi بردار ویژگی n بعدی و yi { 1,1} برچسب آن میباشد. هدف یافتن ابر صفحه است که دو کلاس با برچسب 1 و -1 را با بیشترین حاشیه از هم جدا کند. این ابر صفحه را میتوان با معادله - 1 - بیان کرد.
در این رابطه، بردار وزن w، برداری عمود بر ابر صفحه، b بردار بایاس میباشد که به منظور اندازهگیری فاصله ابر صفحه تا مبدأ استفاده میشود و کرنلی برای انتقال داده به فضای با ابعاد بالاتر میباشد 

شکل -1 طبقه بندی دادههایی که به صورت خطی جدا پذیر نیستند، توسط ماشینهای بردار پشتیبان

بیشینه نمودن حاشیه بین دو کلاس معادل کمینه کردن اندازه w میباشد که منجر به حل مسئله کمینهسازی مقید - 2 - میشود.
که پارامتر C، پارامتر تنظیم در ماشینهای بردار پشتیبان میباشد. به منظور در نظر گرفتن نویز موجود در داده و تداخل بین دادههای آموزشی، از متغیر i 0 استفاده میشود. وجود قید ضمانت میکند که دادهای در حاشیه قرار نمیگیرد. هرچند برای جلوگیری از بیش تطابق نمودن به دادههای نویزی، این قید با متغیرهای i نرم شده است.   سطح تصمیم گیری بهینه با حل مسئله مقید - 2 - بر مبنای روش لاگرانژ طبق معادله - 3 - محاسبه میشود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید