بخشی از مقاله

چکیده

طبقهبندي پوشش اراضی شهري همیشه به علت قابلیت برقراري ارتباط عناصر انسانی با محیطهاي فیزیکی و استفاده در مدیریت بهتر منابع داراي اهمیت بوده و هست.نیاز به دانش بهروز، صحیح و داراي جزئیات از اطلاعات پوشش اراضی شهري حاصل از دادههاي سنجش از دور به طور فزایندهاي در میان بسیاري از جوامع احساس میشود. با پیشرفتهاي اخیر در داده، فنآوري، و نظریههاي سنجش از دور، ضرورت این امر بیشتر نیز میشود. پیشرفت سنجندههاي جدید، پتانسیل بالایی براي طبقهبندي شهري را نشان می دهد. با این وجود، عملکرد روشهاي طبقه بندي مرسوم و قدیمی به علت پیچیدگی تفسیر تصویر، محدود بوده؛ و مطالعه روشهاي جدیدتر براي رفع این محدودیتها بیشتر احساس میشود.

هدف اصلی این مقاله مقایسه نتایج طبقه بندي به دست آمده از طبقه ﺑﻨﺪي کننده مبتنی بر 1RF با نتایج حاصل از طبقه بندي کننده هاي معروف می باشد. در این تحقیق یک صحنه شهري با روشی جدید طبقهبنديRFبراي بهبود طبقهبندي، پیشنهاد شده و مورد بررسی قرار گرفته است. براي مقایسه، روشهاي طبقهبندي مرسوم از جمله روش ماشین بردار پشتیبان و روش هاي رایج درخت دودویی ماشین بردار پشتیبان و همچنین روش کمترین فاصله نیز انجام شده استلنتایج این تحقیق نشان می دهند روش جنگل تصادفی دقت طبقه بندي روش هاي مرسوم و قدیمی طبقه بندي تصاویر ابر طیفی را به طور چشمگیري افزایش می دهد.

.1مقدمه

در زندگی امروزي داشتن اطلاعات به روز، یک برتري بزرگ به شمار می آید که به تصمیم گیري درست و زندگی بهتر در جوامع انسانی منجر می شود. یکی از مهمترین اطلاعات، نقشه هاي به روز پوشش اراضی است که براي تصمیم گیري صحیح و مدیریت و برنامه ریزي آگاهانه براي مدیران - شهري - مورد نیاز است.[1] سنجش از دور یک منبع غنی براي تولید بسیاري از اطلاعات مکانی و محیطی است و یکی از بنیادي ترین اطلاعاتی که تولید می کند نقشه هاي پوشش اراضی است. اطلاعات پوشش اراضی براي تولید نقشه هاي کاربري اراضی، مطالعه تغییرات محیطی و برقراري ارتباط بین عوامل انسانی مختلف و متغیرهاي فیزیکی محیط مورد استفاده قرار می گیرد.

تفسیر بصري و الگوریتم هاي یادگیري ماشینی دو روش متداول، براي استخراج اطلاعات از تصاویر ماهواره اي و داده هاي سنجش از دور است، که هر یک داراي مزایا و معایبی می باشند . در برخی موارد استخراج اطلاعات از تصاویر ماهواره اي و هوایی توسط عامل انسانی نتایج مطلوب تري نسبت به روش هاي خودکار یا نیمه خودکار تولید می کند. اما در جوامع امروزي تولید اطلاعات توسط عامل انسانی و به روش هاي سنتی دیگر پاسخ گوي نیازهاي موجود نیست و لازم است روش هاي خودکار و عاري از دخالت انسان توسعه داده شود.

در این راستا پیوسته الگوریتم هاي یادگیري جدیدتري توسعه داده می شود تا این نیاز را برطرف سازد .در زمینه استخراج اطلاعات از تصاویر سنجش از دور به روش سنتی، مسائلی که بایستی مورد توجه واقع شود عبارتند از:-1حجم زیاد و رشد سریع داده ها و تصاویر در سنجش از دور، -2 زمان بر بودن استخراج اطلاعات توسط انسان و از طرف دیگر-3 پیچیدگی عوارض براي تفسیر بصري و استخراج به وسیله چشم ممکن است باعث خطا گردد و در برخی موارد نیز استخراج اطلاعات به این روش غیرممکن میشود .[1]

راه حل این مسئله استفاده از الگوریتم هاي یادگیري ماشینی است که هدف نهایی آنها استخراج اطلاعات بدون دخالت انسان است. مهمترین کاري که الگوریتمهاي یادگیري ماشینی در سنجش از دور انجام می دهند طبقه بندي داده ها به کلاس هاي اطلاعاتی است .الگوریتم هاي یادگیري ماشینی ﻣﺘﺪاول در سنجش از دور مثل روشهاي طبقه بندي بیشینه شباهت - , - MLC2 ماشین بردار پشتیبان - - SVM3 و شبکه هاي عصبی مصنوعی - - ANN4 داراي ﻣﺸﮑﻼﺗﯽ مثل -1 نیازمندي به داده هاي آﻣﻮزﺷﯽ زیاد و بدون خطا، -2 نیازمندي به تعیین بهینه و صحیح پارامترهاي آغازکننده، -3 محاسبات زیاد و -4 دقت پایین در استخراج اطلاعات هستند .[1]

جنگل تصادفی - RF - یک الگوریتم یادگیري ماشینی جدید است که با ترکیب طبقه بندي کننده هاي درختی نتایج رضایت بخشی را در طبقه بندي تولید می کند همچنین استفاده از این روش می تواند برخی از مشکلات مطرح در الگوریتم هاي قبلی را رفع کند. سنجش از دور تصاویري با اطلاعات گوناگون از محیط را در اختیار ما قرار می دهد. همان طور که گفته شد می توان با طبقه بندي تصاویر به این اطلاعات دست یافت.

در بیشتر موارد در طبقه بندي تصاویر از روشهاي پیکسل-مبنا استفاده میشود. این روش ها پیکسل هاي تصویر را بر اساس اطلاعات عددي آنها طبقه بندي می کنند. در این مقاله تعدادي از تکنیک هاي کلیدي براي طبقه بندي تصاویر ابرطیفی سنجش از دوري بیان می شود . و در ادامه کلیه ي این روش ها بر روي یک تصویر ابر طیفی سنجش از دوري پیاده می شوند و دقت هاي حاصل شده از هر کدام از این روش ها باهمدیگر مقایسه می شوند.

.2روشهاي رایج طبقه بندي کننده تصاویر ابرطیفی

:2,1 ماشین بردار پشتیبان:

SVM  یکی از کارآمدترین الگوریتم هاي یادگیري ساختاري می باشد که از معیار حداقل سازي ریسک ساختاري - SRM5 - استفاده می کند در حالی که سایر الگوریتم هاي یادگیري از معیار حداقل سازي ریسک تجربی - ERM6 - استفاده می کنند.به این دلیل که روش SVM برخی از مشکلات موجود در طبقه بندي ، همانند کوچک بودن ابعاد نمونه ها ، بزرگ بودن ابعاد تصویر، تعمیم پذیري کم و وجود اثرات نامشخص در تصاویر ابرطیفی را کاهش می دهد یکی از روشهاي مورد استفاده براي طبقه بندي تصاویر ابرطیفی در چند دهه ي اخیر به حساب می آید.[6,5,4]

:2.1.1یک کلاس در مقابل کلاس دیگر - : - OAO7

در این روش بین همه ي کلاسها به صورت جفت جفت پروسه ي طبقه بندي کننده ي SVM انجام می شود. بنابراین اگر N کلاس داشته باشیم به تعداد N* - N-1 - /2طبقه بنديSVM بین کلاسها باید انجام شود و در نهایت هر کدام از کلاسها که بیشتر بار برنده شده باشد نمونه متعلق به آن کلاس می شود.[4,3]

:2.1.2روش یک کلاس در مقابل سایر کلاسها - : - OAA8

روش یک کلاس در مقابل همه یکی از ساده ترین روشهاي توسعه ي SVM براي کاربردهاي چند کلاسه در مسائل تشخیص الگو می باشد.در این روش به تعداد N تا طبقه بندي کننده ي SVM تعریف می شود که در آن N تعداد کلاسها می باشد و در هر بار طبقه بندي بین دو کلاس ، یکی کلاس مورد نظر و دیگري کل کلاسهاي باقیمانده درنظر گرفته می شود و مقدار تابع تفکیک کننده براي هر کلاس محاسبه می شود و در آخر هر کلاس که بیشترین مقدار تابع تفکیک را داشت نمونه به آن کلاس تعلق می گیرد.[4,3]

:2,2درخت دودویی - : - BT9

روش درخت دودویی ، کل مجموعه ي طبقه بندي کلاسها را به چندین زیرمجموعه تقسیم می کند و سپس بر روي این زیرمجموعه ها پردازش می کند.اگر در بار اول همه ي کلاسها - زیرمجموعه ها - در یک سمت قرار گرفتند صفحه ي جداک ننده آنقدر جابه جا می شود تا زیرمجموعه ها از هم جدا بشوند. این صفحه آنقدر جا به جا می شود تا درنهایت تنها یک کلاس در یک سمت باقی بماند.[4]شکل الف دو حالت طبقه بندي کننده ي درخت دودویی SVM را نشان می دهد. شکل سمت چپ حالت درخت دودویی شیب دار - 10SBTSVM -  و شکل سمت راست حالت درخت دودویی متعادل - BBTSVM11 -   را نشان می دهد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید