بخشی از مقاله
چکیده
طبقهبندی تصویر همواره یکی از مسائل مهم جامعه سنجشازدور بوده و اطلاعات حاصل از این روش از پرکاربردترین اطلاعات در این حوزه و در سایر زمینهها نظیر برنامهریزی شهری, مدیریت منابع طبیعی و ... به شمار میآید. از طرف دیگر با افزایش روشهای مختلف طبقهبندی تصویر, مثل روشهای آماری و روشهای یادگیری ماشین ضروری است که هریک از روشهای فوق, با توجه به نوع تصویر مورد ارزیابی و تحلیل قرار گیرند. هدف از این تحقیق مقایسه و ارزیابی دو روش شبکههای عصبی و ماشینهای بردار پشتیبان از روشهای یادگیری ماشین, برای طبقهبندی تصویر آیکونوس - منطقه شهریار در استان البرز - باقدرت تفکیک مکانی بالا میباشد. در این تحقیق برای ارزیابی از شبکههای عصبی پرسپترون چندلایه - MLP”و ماشینهای بردار پشتیبان با تابع کرنل گوسین که از پرکاربردترین ساختارها برای طبقهبندی میباشند, استفادهشده است. نتایج نشان میدهد که روش شبکههای عصبی در بهترین حالت دارای دقت 87 /06درصد و روش ماشینهای بردار پشتیبان دارای دقت 85/26 میباشد
واژههای کلیدی: طبقهبندی تصویر, شبکههای عصبی, ماشینهای بردار پشتیبان
-1 مقدمه
روشهای طبقهبندی به دو روش کلی نظارتشده ٍو نظارتنشدهَ تقسیمبندی میشوند, روشهای نظارتشده نیز به دو گروه پارامتریک و غیر پارامتریک تقسیم میشوند .مشکل اصلی روشهای طبقهبندی پارامتریک، وابستگی آنها به توزیع آماری دادهها و تأثیر تعداد نمونههای آموزشی در برآورد این توزیع است . به همین دلیل روشهای غیر پارامتریک، ازجمله روشهای مبتنی بر شبکههای عصبی, ماشینهای بردار پشتیبان و درخت تصمیمگیری، برای طبقهبندی تصاویر بکار گرفته میشوند.چندین تحقیق نشان میدهد که الگوریتمهای یادگیری ماشین دقت بهتری نسبت به روشهای طبقهبندی سنتی مثل بیشترین احتمال که بیشتر بر پایه آماری میباشند,دارند. .[4]
در سالهای اخیر تعداد زیادی از روشهای یادگیری ماشین برای تولید نقشههای موضوعی استفادهشدهاند.در بین آنها میتوان به روشهای شبکههای عصبی [5]ماشینهای بردار پشتیبان,[6]طبقهبندی کنندههای ترکیبی مثل روش جنگل تصادفی[6] اشاره کرد.هدف اصلی پژوهش حاضر، تهیه نقشه پوشش اراضی و طبقهبندی تصویر سنجنده آیکونوس با بهکارگیری دو روش شبکه عصبی پرسپترون سه لایه و ماشینهای بردار پشتیبان و مقایسه کارایی این دو روش در طبقهبندی پوشش اراضی منطقه موردمطالعه میباشد.
-2 شبکههای عصبی
شبکه عصبی یکی از روشهای یادگیری ماشین میباشد که با الهام از سیستم عصبی انسان به آنالیز و مدلسازی سیستمها و الگوهای پیچیده میپردازد. و میتواند برای مسائل طبقهبندی یا مسائل رگرسیون استفاده شود.شبکههای عصبی را میتوان مجموعهای از واحدهای پردازشی ساده به نام نرون دانست که با یکدیگر در ارتباط میباشند.از مهمترین نوع شبکههای عصبی میتوان به شبکه عصبی پرسپترون چندلایهٌ اشاره کرد که از چندین لایه شامل لایه ورودی،لایه میانی و لایه خروجی تشکیلشده است .این لایهها نیز هرکدام شامل نرون هایی میباشد. شکل زیر نحوه پردازش و عملکرد یک نرون را نشان میدهد. هر نرون، مقدار هر ورودی را به وزن خاصی ضرب کرده و حاصل این ضربها با بایاس هر نرون جمع میکند وارد یک تابع از پیش تعیینشده بانام تابع فعالسازی میکند که با توجه به مسئلهای که قرار است توسط شبکه عصبی حل شود, انتخاب میشود و میتواند خطی یا غیرخطی باشد . خروجی این تابع بهعنوان ورودی برای لایه بعدی فرستاده میشود.اجزا و نحوه عملکرد یک نرون در شکل - 1 - و رابطه - 1 - آورده شده است.
1 -2آموزش شبکههای عصبی
آموزش شبکه عصبی یعنی تعیین مقادیر مناسب برای بردارهای وزن w و b که با استفاده از دادههای آموزشی و الگوریتمهای آموزشی مثل الگوریتم پس انتشار خطاٍ تعیین میشوند.این الگوریتم بهصورت تصادفی وزنهای اولیه را انتخاب میکند و خروجی محاسبهشده را با خروجی واقعی مورد مقایسه قرار میدهد . تفاوت بین خروجی محاسبهشده با شبکه خروجی واقعی، با استفاده از خطای مجذور میانگین مربعات برآورد میگردد .پسازآنکه تمام مشاهدات در شبکه مورداستفاده قرار گرفت، میزان خطای مشاهدهشده در بین نودهای مختلف توزیع میگردد تا میزان خطای شبکه در حد پایین ثابت بماند.
-3 ماشینهای بردار پشتیبانٌ
روش ماشینهای بردار پشتیبان جزو روشهای طبقهبندی کننده هستهای ٍو نظارتشده میباشد که در سال 1995 توسط ریاضیدان روسی به نام وپنیک ارائه شد و اصول آن بر پایه نظریه یادگیری آماری است . ماشینهای بردار پشتیبان برای اولین بار جهت حل مسائلی با دو کلاس طراحیشده بود , ولی بعدها برای حل مسائل چند کلاسه نیز بهبودیافته و مطرح شد.در حالت دو کلاسه تعداد N نمونه آموزشی { 1, 1} … … … … . { , } در نظر گرفته میشود که در آن ∈ ، یعنی هر دارای یک بردار ویژگی m بعدی و ∈ {−1,1} میباشد. آنگاه هدف از طبقهبندی ماشینهای بردار پشتیبان پیدا کردن یک ابر صفحه َ در فضای ویژگی بهصورت رابطه - - 2 میباشد که بتواند دادههای آموزشی را به دو کلاس جداگانه طبقهبندی نماید.
در معادله فوق w بردار نرمال بر, ابر صفحه موردنظر و b بایاس ابر صفحهیا فاصله از مرکز فضای بردارهای ویژگی میباشد.به هنگام انتخاب دادههای آموزشی برای طبقهبندی ممکن است تعدادی از نمونهها از دو کلاس مختلف با یکدیگر ترکیب شوند. SVM برای جلوگیری از تأثیر این نویز در فرآیند طبقهبندی از یک متغیر کمکی >0 استفاده میکند که وظیفه کمینه کردن خطا را بر عهده دارد. معادله فرا صفحه برای دو کلاس، در این حالت، با رابطه - 3 - مشخص میگردد.بنابراین ابر صفحهی مناسب ، ابر صفحهای است که حاشیه بین دو کلاس را بیشینه و مقدار خطا را کمینه کند.جهت پیدا کردن این ابر صفحه از بهینهسازی قید دار لاگرانژ استفاده میگردد. پس از حل مسئله بهینهسازی بالا و یافتن ضرایب لاگرانژ w, با استفاده از رابطه - 4 - محاسبه میشود :
پس از محاسبه ,W با جایگذاری در معادله زیرb طبق رابطه - 5 - بدست میآید :
بنابراین تابع تمایز بهصورت رابطه - 6 - محاسبه میشود:
درصورتیکه دادههای آموزشی بهصورت غیرخطی قابلتفکیک نباشد, از روش نگاشت تابع تمایز به یک فضای ویژگی جدید با استفاده از تابع کرنل که بهصورت رابطه - 7 - تعریف میشود, استفاده میشود.