بخشی از مقاله
چکیده :
استفاده از ترکیب نتایج چند طبقهبندی کنندهیکی از روشهای مرسوم جهت افزایش کارایی سیستمهای تشخیص الگو میباشد که در سالهای اخیر موردتوجه محققین قرارگرفته است. برای اینکه ترکیب منجر به افزایش دقت طبقهبندی شود لازم است که طبقهبندی کنندههای منفرد صحیح و متنوع باشند. همچنین قواعد ترکیب باید بهگونهای باشد که نقاط ضعف طبقه بندی کنندهها را بپوشاند. در این مقاله یک روش جدید ترکیب پیشنهادشده است که بر اساس آنالیز عدم قطعیت، نتایج طبقه بندی کنندههای منفرد باهم ترکیب میشوند. در این روش برای انجام آنالیز عدم قطعیت از معیار حداکثر انحراف نسبی استفاده شد.
با اجرای طبقه بندی کنندههای منفرد بیشترین شباهت، ماشین بردار پشتیبان، شبکههای عصبی و جنگل تصادفی، خروجی نتایج بر اساس آنالیز عدم قطعیت در ترکیبات مختلف طبقهبندی کنندهها - ترکیبات دوتایی، سهتایی، چهارتایی - ، باهم ترکیب شدند. دراینبین ترکیب چهارتایی - ML, SVM, NN, RF - ، نسبت به ترکییات دوتایی و سهتایی طبقهبندی کنندههای مختلف و نیز طبقهبندی کنندههای منفرد دارای دقت بهتری میباشد بطوریکه برای طبقه بندی کنندههای بیشترین شباهت، ماشین بردار پشتیبان، شبکههای عصبی، جنگل تصادفی و روش پیشنهادی ترکیب در حالت ترکیب چهارتایی، به ترتیب دقت کلی برابر %77.95، %80.01، %79.70، %80.56 و %83.98 حاصل شد.
در پایان روش پیشنهادی ترکیب - حالت چهارتایی - با روشهای ترکیب سنتی ماکزیمم، مینیمم، میانگین هندسی، میانگین حسابی، رأی اکثریت و نیز ترکیب بر اساس دقت تولیدکننده مقایسه شد؛ بطوریکه به ترتیب دقت کلی معادل %80.11، %80.94، %82.14، %81.14، %81.92 و %79.94 به دست آمد. مقایسه دقت روش پیشنهادی بیانگر برتری این روش نسبت به روشهای دیگر میباشد. با توجه به نتایج، روش پیشنهادی ترکیب میتواند منجر به افزایش دقت طبقهبندی کنندهها شود.
-1 مقدمه
استخراج اطلاعات از تصاویر سنجش ازدور در حال حاضر بر عامل انسانی و بهصورت دستی متکی میباشد که با توجه به حجم زیاد داده ها، زمان بر و هزینه بر هستند. لذا باید روش هایی قوی و اتوماتیکی برای استخراج اطلاعات از تصاویر ماهواره ای وجود داشته باشد تا بتوان به طور سریع به این اطلاعات دست پیدا کرد. یکی از روشهای مرسوم برای استخراج اطلاعات استفاده از روشهای مختلف طبقهبندی تصاویر میباشد
طبقه بندی تصاویر ماهوارهای، به جداسازی مجموعههای طیفی مشابه و تقسیمبندی طبقاتی آنها که دارای رفتار طیفی یکسانی باشد گفته میشود و میتواند بهعنوان یک اقدام مشترک از پردازش تصاویر و تکنیکهای طبقهبندی تلقی نمود که با توجه به انتخاب تکنیکهای مناسب، میتوان نتایج قابلقبولی را انتظار داشت
طبقه بندی تصاویر، از مهم ترین مراحل از فرآیند سنجش ازدور هست که در بحث عدم قطعیت موردتوجه می باشد . به طورکلی فرآیند سنجش ازدور شامل سه مرحله جمعآوری داده، تولید تصویر و تفسیر میباشد که در هرکدام از این مراحل عوامل مختلفی باعث ایجاد خطا و عدم قطعیت می شود. در مرحله جمع آوری داده، عواملی نظیر تأثیرات اتمسفر، حرکت سکو، چرخش زمین، اثر پانورامیک، در مرحله تولید تصویر، عواملی نظیر دیجیتالی کردن تصویر، انتقال تصویر به ایستگاه زمینی و در مرحله تفسیر، استخراج اطلاعات از تصویر که مستلزم استفاده از یک سری الگوریتمهای طبقهبندی میباشد. نتیجه نهایی این مراحل، شکلگیری یک فضای دادهای همراه با عدم قطعیت میباشد
بررسی تحقیقات انجام شده در حوزه ی طبقه بندی تصاویر ماهواره ای نشان می دهد که اکثر موارد از یک روش برای طبقه بندی کل تصویر استفاده شده است. هرچند که این روش ها نتایج قابل قبولی دارند اما نمی توان ادعا کرد که یک روش برای طبقه بندی کل تصویر مناسب است زیرا همهی روشهای طبقهبن دی با دادهی آموزشی یکسان نتایج متفاوتی را ارائه می دهند. لذا هیچ طبقه بندی کنندهای کامل و بدون نقص نیست
به عبارت یدیگر طبقهبندی کننده ها ممکن اند در برخی موارد نسبت به بقیه نتایج بهتری تولید کنند ولی هیچ یک از آنها بر سایرین برتری نداشته و هرکدام نقاط قوت و ضعف های خاص خود رادارند و نمی توانند تمام دادهها را بدون هیچ خطایی طبقهبندی کند؛ بنابراین ترکیب مناسب طبقه بندی کننده ها، می تواند نتایج طبقه بندی بهتری نسبت به هر طبقه بندی کننده و حتی بهترین آنها را تولید کند
با توجه به مطالب ذکرشده، این انگیزه می تواند شکل بگیرد؛ که بجای استفاده از یک طبقهبندی کننده از چندین طبقه بندی کننده استفاده شود؛ بطوریکه نتایج روش های تکی با یکدیگر ترکیب شوند. ترکیب طبقه بندی کننده ها سعی بر این هستند که آن قسمتی از عدم قطعیت که در فرآیند طبقهبندی ایجاد میشود را کاهش دهند. برای این منظور از ترکیب نتایج طبقه بندی کننده های اولیه استفاده می شود تا با ترکیب عدم قطعیتهای محلی تولیدشده در طبقه بندی کننده های اولیه، عدم قطعیت نهایی درنتیجه طبقه بندی کاهش داده شود. این نحوهی عمل کرد میتواند تا حد زیادی اثر غیردقیق بودن مدلهای استفادهشده در طبقهبندی کنندههای اولیه را جبران کند.
مطالعه بر روی ترکیب طبقه بندی کننده ها از اوایل دهه 90 آغاز شد و محققین مختلف بانامهای مختلفی از آن استفاده نموده اند. طرح ترکیب طبقه بندی کننده ها اولین بار توسط Hansen و Salamon در سال 1990 ارائه گردید. آن ها ثابت کردند درصورتی که هر یک از طبقه بندی کننده های اولیه مستقل باشند و نرخ خطای آن کمتر از %50 باشد در این صورت ترکیب طبقهبندی کنندهها دارای دقت بالاتری نسبت به هر یک از طبقهبندی کنندههای منفرد خواهد بود
تحقیقات گسترده ای در حوزه ترکیب طبقه بندی کننده ها با روش های مختلف در داخل و خارج کشور انجام گرفته است که در ادامه به مواردی چند اشارهشده است.
در [8] دو رویکرد چندگانه در سطح مفهوم - رأی اکثریت به صورت وزن دار - و سطح اندازه گیری - میانگین حسابی - بر روی تصویر لندست TM مورد آزمایش قرار گرفت. با ترکیب خروجی طبقه بندی کنندههای اولیهی SEDC1, 2SMDC, MLC, 3FCMC, NNC نتایج نشان داد که ترکیب خروجی طبقهبندی کنندهها، افزایش دقت طبقهبندی را به همراه دارد.
در [9] به منظور طبقه بندی تصاویر ابر طیفی سنجنده ی آویریس با 224 باند طیفی از یک منطقه ی شهری، با استفاده از سیستم های طبقه بندی چندگانه را انجام گرفته است. در این مطالعه یک سیستم مجمعی مبتنی بر ماشین های بردار پشتیبان معرفی شد. درروش پیشنهادی تحقیق، ابتدا دو زیرمجموعه از بهترین زیرمجموعه های ویژگی های باارزش و مفید از کل ویژگی ها استخراج شدند. سپس زیرمجموعه های استخراج شده با دو روش جداساز SVM چند کلاسه به 3 کلاس موردنظر طبقه بندی شدند. همچنین با استفاده از سیستم طبقه بندی چندگانه مبتنی بر SVM چند کلاسه این طبقه بندی انجام گرفت.
نتایج دقت کلی طبقهبندی حاصل از استراتژی پیشنهادی، با نتایج به دست آمده از SVM های تکی و همچنین مجمع های طبقه بندی دیگر، از قبیل Bagging, Boosting و Random Forests مقایسه گردید. نتایج حاصل از روشهای پیاده شده روی آن نشان از توانایی کمنظیر این روشها در طبقهبندی تصاویر ابر طیفی را دارد.
در [10] به منظور شناسایی دقیق انواع پوشش اراضی و کاربری زمین4، از سه سیستمهای طبقهبندی چندگانه استفاده شد. در این تحقیق با بهکارگیری طبقهبندی کنندههای پایه ML, SVM, NN, FCM, MID اقدام به ترکیب خروجی ها در سطح اندازهگیری - میانگین بیزین - 5، سطح مفهوم - رأی اکثریت نسبی - 6 و نیز یک روش جدید بنام میانگین وزندار بر اساس آنالیز سلسله مراتبی - WA-AHP - 7 شد. نتایج نشان داد که سه سیستم های طبقه بندی چندگانه توانایی بهبود دقت نتایج طبقه بندی در مقایسه با طبقه بندی کنندههای منفرد رادارند. در این میان روش جدید WA-AHP ازنظر آماری و بصری نسبت به بقیه روشهای ترکیبی و منفرد برتری قابل ملاحظه ای داشت.
همچنین در [11] یک روش نوین برای طبقهبندی دادههای فرا طیفی با بهکارگیری یک سیستم چندگانه ماشینهای بردار پشتیبان8 که شامل گروهبندی باندهای طیفی است، معرفی شد. در اولین گام برای گروهبندی باندهای طیفی از روشی بر اساس اطلاعات دوطرفه یا متقابل9 استفاده کرد.
در دومین گام، از ماشین بردار پشتیبان بهمنظور طبقهبندی هر گروه از باندهای طیفی استفاده شد تا مجموعه ای از طبقهبندی کنندهها حاصل شود. سرانجام یک الگوریتم ادغام طبقهبندی کنندهها بر اساس تئوری بیز با نام Naive Bayes - NB - را بکار برد.
نتایج حاصل از روش پیشنهادی برای دو نمونه از دادههای فرا طیفی نشان میدهد که روش پیشنهادی در مقایسه با SVMاستاندارد طبقهبندی کننده ای که همه باندها را در یکزمان طبقهبندی میکند نتایج بهتری را ایجاد میکند. این نتایج همچنین کارایی مفهوم گروهبندی باندها و سیستمهای طبقهبندی کننده چندگانه را در مقایسه با روشهای معمول پیشین نشان میدهد.