بخشی از مقاله

چکیده

با توجه به نقش تصاویر سنجش از دور در استخراج اطلاعات از جمله پوشش و کاربري زمین، روش هاي بسیاري براي طبقه بندي تصاویر و تهیه ي نقشه هاي موضوعی، تا به امروز مطرح شده است. یکی از این روش ها، ماشین هاي بردار پشتیبان است. در این مقاله، ماشین هاي بردار پشتیبان و توابع کرنل - توابع شعاعی واحد و پلی نومیال - ، و روش هاي طبقه بندي چند کلاسی - یکی در مقابل یکی، یکی در مقابل بقیه، همه با هم، گراف غیرحلقوي مستقیم - مبتنی بر ماشین هاي بردار پشتیبان، معرفی شده و با استفاده از تحقیقات انجام شده در این زمینه، نتایج مقایسه ي این توابع و روش ها در طبقه بندي پوشش زمین، ارائه گردیده است. همچنین استفاده از گراف لاپلاسین، به عنوان روش طبقه بندي نیمه نظارت شده، معرفی شده است.

با استناد به نتایج به دست آمده در این مطالعات، نشان داده شده است که استفاده از توابع شعاعی واحد و روش طبقه بندي یکی در مقابل یکی، صحت طبقه بندي بالاتري دارد. اما به طور کلی انتخاب هر روشی وابسته به نوع کاربرد و پارامترهاي دیگري است که به آن اشاره شده است.

-1مقدمه

نقشه برداري زمینی و استفاده از تصاویر سنجش از دور، از مهمترین روش ها در بدست آوردن اطلاعات پوشش زمین1 می باشند. از آن جا که روش هاي مبتنی بر نقشه برداري زمینی اغلب پر هزینه و زمان بر هستند، از تصاویر سنجش از دور براي این منظور استفاده می شود. تصاویر سنجش از دور با استفاده از سنسورها با قابلیت هاي طیفی، رادیو متریکی و مکانی متفاوت در اختیار کاربران قرار می گیرد، پس کاربران با حجم وسیعی از داده رو به رو می شوند، به خصوص در مورد تصاویر چند طیفی و ابرطیفی.

یکی از روش هاي مدیریت داده، طبقه بندي داده ها است که به عنوان فاز مهمی در استخراج اطلاعات پوشش زمینی، مطرح می شود. در این مقاله بعد از توضیح مختصري در مورد پوشش زمین و روش هاي طبقه بندي، به معرفی ماشین هاي بردار پشتیبان2 و توابع کرنل3، روش هاي طبقه بندي چند کلاسی پرداخته، و نتایج مقایسه ي الگوریتم هاي معرفی شده بیان می گردد.

-1-1 پوشش زمین

پوشش زمین، پوشش طبیعی یا فیزیکی سطح زمین است که شناخت آن در کاربردهاي منابع طبیعی، علوم زمینی و تحقیقات علمی مهم است. چمن، آسفالت، درخت، زمین بایر، آب، محصولات کشاورزي،... از انواع پوشش هاي زمینی اند.

-2-1 طبقه بندي

در طبقه بندي تصاویر دیجیتال، با استفاده از اطلاعات طیفی هر پیکسل، پیکسل هاي تصویر در کلاس ها یا دسته هاي خاص قرار می گیرند به طوریکه ویژگی هاي پیکسل هاي یک کلاس، مشابه هم و با پیکسل هاي کلاس مجاور غیر مشابه هستند .[2] طبقه بندي را می توان یک فرایند تصمیم گیري دانست که در آن داده هاي تصویري به فضاي کلاس هاي مشخص انتقال می یابند .[1] طبقه بندي از مهمترین روش هاي استخراج اطلاعات به خصوص اطلاعات پوشش هاي مختلف زمین به شمار می رود.

-1-2-1 انواع روش هاي طبقه بندي:

طبقه بندي را از دیدگاه هاي مختلف، می توان به چند روش کلی تقسیم نمود، که عبارتند از: طبقه بندي نظارت شده- طبقه بندي نظارت نشده: طبقه بندي نظارت شده نیاز به نمونه هاي آموزشی، تعداد و نوع کلاس ها دارد. در طبقه بندي نظارت نشده نیازي به تعیین این پارامترها نیست اما تعداد کلاس ها و یک معیار تفکیک پذیري باید مشخص شود.

طبقه بندي سخت-4 طبقه بندي نرم:5 در طبقه بندي سخت، خروجی براي یک پیکسل تنها برچسب یک کلاس خواهد بود، اما در طبقه بندي نرم خروجی براي یک پیکسل لیستی از برچسب کلاس ها خواهد بود که معمولا با روش هاي فازي این خروجی به دست می آید. طبقه بندي پارامتریک- طبقه بندي غیر پارامتریک: تمام روش هاي این دو دیدگاه جز طبقه بند نظارت شده محسوب می شوند.

در طبقه بندي پارامتریک براي چگونگی توزیع احتمال نمونه ها یک پیش فرض در نظر گرفته می شود. بر اساس پیکسل هاي معلوم معرفی شده، پارامترهاي مختلفی را محاسبه کرده و بر اساس آن ها در مورد مابقی پیکسل ها تصمیم گیري می کند.

در طبقه بندي غیر پارامتریک هیچ فرضی براي آن، لحاظ نمی شود. تنها بر اساس معیارهایی که از مقادیر پیکسل هاي معلوم به دست می آیند تصمیم گیري می کند .[1] طبقه بندي پیکسل مبنا- طبقه بندي شی مبنا: در طبقه بندي پیکسل مبنا پردازش بر روي تصویر به صورت پیکسل به پیکسل اعمال می شود، اما در طبقه بندي شی مبنا ابتدا تصویر به چندین شی قطعه بندي شده سپس از الگوریتم هاي طبقه بندي استفاده می شود.

با توجه به هریک از دیدگاه ها، مراحل طبقه بندي متفاوت خواهد بود اما به طور کلی مراحل آن عبارت است از:
ورود دادها: در این مرحله لایه هاي ورودي، اطلاعات کلاس ها، کیفیت داده هاي ورودي مشخص می شود. پردازش و انجام طبقه بندي: با توجه به آنکه از کدام روش طبقه بندي استفاده شود، یک مدل طبقه بندي به داده هاي ورودي اعمال می شود. خروجی: خروجی یک طبقه بندي می تواند نقشه هاي موضوعی، جداول آماري یا فایل هاي حاوي اطلاعات باشد. ارزیابی صحت: صحت خروجی به صحت داده هاي ورودي، پیش پردازش ها، و صحت مدل مورد استفاده بستگی دارد. براي ارزیابی صحت، می توان از دو روش کلی اعتباریابی و نمونه برداري استفاده نمود.

-2-2-1 خطاي طبقه بندي

خطاهاي کلی که در طبقه بندي مطرح است، خطاي "حذف کردن" و "اختصاص دادن" است، در مورد اول پیکسل به اشتباه از یک کلاس حذف می شود و در مورد دوم یک پیکسل به اشتباه به کلاسی تعلق می گیرد. براي محاسبه ي خطا، دو روش معمول ماتریس خطا و ضریب کاپا وجود دارد. ماتریس خطا: بعد از انجام طبقه بندي، چون براي هر کلاس، پیکسل هاي طبقه بندي شده و پیکسل هاي واقعیت زمین موجود است، می توان ماتریسی تشکیل داد که آرایه ي ij ام آن تعداد پیکسل هایی است که متعلق به کلاس j ام در واقعیت زمین بوده و در کلاس i ام طبقه بندي شده است. با استفاده از این ماتریس پارامتر صحت کلی به دست می آید که n تعداد کل پیکسل هاي تصویر و m تعداد کلاس

ضریب کاپا: پیکسل ها می توانند بر اساس شانس و به طور تصادفی و نه بر اساس قوانین طبقه بندي، به درستی طبقه بندي شوند. این ضریب صحت طبقه بندي را با در نظر گرفتن این موضوع محاسبه می کند.

-2 ماشین بردار پشتیبان

یک گروه از الگوریتم هاي طبقه بندي نظارت شده هستند، که پیش بینی می کند یک نمونه در کدام کلاس یا گروه قرار می گیرد. این الگوریتم براي تفکیک دو کلاس از هم، از یک صفحه استفاده می کند به طوریکه این صفحه از هر طرف بیشترین فاصله را تا هر دو کلاس داشته باشد. نزدیک ترین نمونه هاي آموزشی به این صفحه "بردارهاي پشتیبان"نام دارند

شکل .1 بردارهاي پشتیبان، نزدیکترین نمونه ها به صفحه .

به عنوان مثال، صفحه ي H1 و H2 دو کلاس را از هم تفکیک کرده اند، اما کلاس H2 در شرایط این الگوریتم صدق می کند.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید