بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

تهیه نقشه جنگل با استفاده از الگوریتم ماشین بردار پشتیبان با تصاویر ماهوارهای ETM+ سال 2014 (مطالعه موردی: شهرستانهای شیروان و چرداول-استان ایلام)
چکیده
در اختیار داشتن نقشه های کاربری اراضی در بسیاری از زمینه ها از جمله مدیریت منابع طبیعی و برنامه ریزی ها برای سرزمین از اهمیت بسیاری برخوردار است. جنگلهای زاگرس از مهمترین سرمایههای اکولوژیکی کشور ما به شمار می روند. از این رو اطلاع به هنگام از وضعیت آن ها نقش اساسی در کیفیت مدیریت این مناطق دارد. داده های سنجش از دور یکی از مهم ترین و بهترین منابع در تولید و به روزرسانی نقشه های جنگل به شمار می روند. در این پژوهش به منظور تهیه نقشه جنگل شهرستان های شیروان و چرداول در استان ایلام از تصاویر سنجنده ETM+ ماهواره لندست مربوط به سال 2014 استفاده شد. برای طبقه بندی تصویر از الگوریتم ماشین بردار پشتیبان که از روشهای نظارت شده یادگیری ماشینی هست که اخیراً در زمینه طبقه بندی داده های سنجش از دور مورد استفاده قرار گرفته است، تعریف و اجرا شد.صحت کلی 88/65 درصد و صحت های بالای کاربر و تولیدکننده حاکی از قابلیت بالای الگوریتم ماشین بردار پشتیبان در تهیه نقشه جنگل منطقه مورد مطالعه میباشد. در نتیجه استفاده از این الگوریتم میتوان دقت طبقه بندی تصاویر ماهواره ای در این منطقه و مناطق شبیه به آن را تا حد زیادی افزایش داد و نقشههای پوشش جنگلی باکیفیت بهتری تولید نمود.

کلمات کلیدی
نقشه جنگل، سنجش از دور، ماشین بردار پشتیبان، تصاویرETM+ ،طبقه بندی تصاویر، استان ایلام.

مقدمه
تهیه برنامه استفاده از سرزمین و تعیین توان و استعداد اراضی ضروری است و به عنوان یکی از منابع اصلی در تدوین برنامههای توسعه محسوب میشوند.]22[ تهیه نقشه جنگل، به خصوص در آن بخش از حوضههای آبخیز که دسترسی زمینی به آن ها به سختی میسر می شود، بسیار مشکل بوده و در بیشتر پروژه ها با محدودیت های مالی و زمانی همراه می باشد.]5[ برای کشف و ارزیابی پوشش جنگلی، سنجش از دور1 به عنوان علم و فن اطلاعات مکانی و سیستم اطلاعات جغرافیایی2 به خاطر برخورداری از امکانات تحلیلی میتوانند نقش اساسی داشته باشند با استفاده از تصاویر سنجش از دور می توان داده های متنوع، ارزان تر، به هنگام، باکیفیت بهتر و البته با تکرار زیاد را برای اهداف مختلف به دست آورد .]22[ تجزیه و تحلیل این داده ها میتواند بینشهای صحیح جهت تعامل انسان با محیط طبیعی فراهم کند به خصوص استفاده از تجزیه و تحلیل تصاویر چند طیفی میتواند به انسان جهت شناسایی پوشش زمین کمک کند. از جمله کاربردهای داده های سنجش از دور تهیه نقشه های کاربری و پوششی است .]21[ تصاویر رقومی دارای آرایه ای دو بعدی از عناصر تصویری3 هستند. در هر آرایه از این تصاویر، انرژی بازتابیده یا گسیل شده از محدوده متناظر آن در سطح زمین ثبت و ذخیره می گردد. این ارزش های عددی پدیده های متفاوت زمینی را در روی تصاویر رقومی سنجش از دور توصیف می کند، بنابراین می توان نسبت به طبقه بندی آن ها اقدام نموده و اطلاعات مربوط به پدیدههای زمینی را در کلاسهای مشخص استخراج نمود. بسیاری از روش های طبقه بندی، عموماً اطلاعات طیفی موجود در باندهای تصویر را استفاده می کنند. در این روش ها انتظار آن است که پیکسلها با درجه روشنایی بیشتر یا کمتر در فضای چند طیفی در خوشههای متناسب با انواع پوشش زمین گروهبندی شوند .]3[در حقیقت فرآیند طبقه بندی تصویر، تبدیل داده ها به اطلاعات قابل درک است .]26[ در گذشته، تکنیک های طبقه بندی تصاویر بر مبنای تفسیر بصری کاربر بود که اغلب باعث به وجود آمدن خطاهای سیستماتیک میگردید که این امر ناشی از تجربه و توانایی مفسر در تفسیر تصاویر بود .]23[ طبقه بندی رقومی تصاویر کمک می کند تا فرآیند طبقه بندی به واقعیت نزدیک تر باشد .]26[ در روش های طبقه بندی نظارت شده از نمونه های تعلیمی به عنوان کلیدی که اثر طیفی مربوط به یک عارضه خاص و مورد نظر کاربر را نشان می دهد، برای طبقه بندی استفاده می شود ]23[ .در طبقه بندیهای نظارت شده پس از انجام نمونه برداری های صحرایی از طبقات موجود در طبیعت و معرفی خصوصیات طیفی هر یک از آنها بر روی تصاویر ماهواره ای به نرم افزار، عمل طبقه بندی بر روی تمامی تصاویر انجام میگیرد. روشهای طبقه بندی با نظارت به دو گروه پارامتریک و غیر پارامتریک تقسیم میشوند. مشکل اصلی روشهای طبقه بندی پارامتریک (مثل حداکثر احتمال، حداقل فاصله و غیره)، وابستگی آن ها به توزیع آماری دادهها (مثل توزیع نرمال گوسن) میباشد. به همین دلیل روش های غیر پارامتریک، از جمله این روشهای ماشین بردار پشتیبان4 می باشد که برای طبقه بندی تصاویر ماهوارهای بکار گرفته شده است. Su et al( 2009) در مطالعهای با استفاده از داده های ماهوارهای MISR نشان دادند که با استفاده از روش های ماشین بردار پشتیبان و حداکثر احتمال می توان حتی با دو سوم مجموعه دادهها به دقتی رسید که با کل دادهها قابل دستیابی است. Konrn et al (2009) برای طبقه بندی جنگل از روش ماشین بردار پشتیبان استفاده کردند. هدف آنها از این تحقیق، ارزیابی دقت طبقه بندی در مجموعه از تصاویر متوالی بود. این تحقیق نشان داد که این روش زمانی که سطح زمین از چندین عارضه پوشیده شده باشد، نیز کارآمد خواهد بود.(Lardeux et al (2009 برای طبقه بندی تراکم پوشش گیاهان گرمسیری، از روش ماشین بردار پشتیبان بهره گرفتند. نتایج این تحقیق نشان داد که طبقه بندی به روش SVM به میزان 20 درصد افزایش دقت نسبت به روش طبقه بندی ویشارت1 گشته است. آنها خاطرنشان کردند زمانی که داده های رادار از توزیع ویشارت پیروی نمی کنند، روش SVM میتواند بسیار مناسب تر باشد Knudby et al (2010) در پژوهشی پیرامون تنوع و بیوماس، از تصاویر آیکنوس برای مدلسازی و پیشبینی این پدیده استفاده کردند آن ها 6 روش مختلف طبقه بندی را باهم دیگر مقایسه کردند و به این نتیجه رسیدند که روش ماشین بردار پشتیبان بالاترین رتبه را میان سایر الگوریتمهای بهکاررفته دارا است. Wang et al (2011) برای تهیه نقشه واحدهای لیتولوژیک و کاهش مشکل حضور پوشش گیاهی در تصویر، از ترکیب روش ماشین بردار پشتیبان با ACA2 بر روی سنجنده های TM و ETM+ استفاده کردند و روش SVM-ACA را به عنوان روشی کارامد در نواحی دارای پوشش گیاهی معرفی نمودند.. Mountrakis et al (2011) در پژوهشی به بررسی روش SVM پرداختند و تحقیقات انجام گرفته در این حوزه را در قالب هدف استفاده، آشکارسازی اهداف ایستا و پویا، قدرت تفکیک مکانی و طیفی تصاویر، نوع تصاویر و حیطه های کاربرد این روش، طبقه بندی کردند. از دیگر مطالعات انجامشده در این زمینه میتوان به سفیانیان و همکاران Perumal and Bhaskaran (2010) (1390) اشاره نمود.

1. مواد و روشها
1.1. منطقه مورد مطالعه
این منطقه دارای 2298 کیلومتر مربع مساحت است و 11/9 درصد از مساحت کل استان ایلام را تشکیل می دهد از نظر موقعیت جغرافیایی به طور تقریبی بین 47 درجه و31 دقیقه تا 46 درجه و 18 دقیقه طول شرقی و 34درجه و 5دقیقه عرض شمالی قرار دارد این منطقه از شمال به استان کرمانشاه ، از شرق و جنوب شرق به استان لرستان ، از جنوب و جنوب غربی ، به شهرستان دره شهر و از غرب وجنوب غربی به شهرستانهای ایلام وایوان محدود می شود. جنگلهای منطقه عمدتاً جز جوامع جنگلی مناطق خشک و نیمه خشک سلسله جبال زاگرس بوده و تیپ غالب جوامع جنگلی در اکثر مناطق گونه بلوط ایرانی است. پسته وحشی (بنه)، زالزالک، بادام کوهی، داغداغان و کیکم سایر گونه های جنگلی را تشکیل میدهند.

2.1. داده های مورد استفاده
در این تحقیق از داده های تصاویر سنجنده ETM+ ماهواره لندست مربوط به سال 2014 میلادی استفاده شد. همچنین نقشه توپوگرافی با مقیاس 1:50000 منطقه مورد مطالعه نیز استفاده گردید.
• پیشپردازش تصاویر ماهوارهای
مرحله پیش پردازش دادهها یکی از مهمترین مراحل در پردازش تصاویر است؛ چرا که تمامی محاسبات بعدی بر اساس تصویر تولیدی در این مرحله انجام میگیرد. نوع و نحوه انجام این عملیات بسته به عوامل مختلفی چون نوع داده های مورد استفاده و هدف تحقیق، متغیر خواهد بود. برای اعمال تصحیح هندسی بر روی تصاویر با استفاده از روش نقشه به تصویر، از تعدادی نقطه با پراکندگی مناسب در سطح تصویر و نقشه مختصات دار استفاده گردید. پس از بهکارگیری روش ناپارامتری چندجمله ای و حذف نقاط نامناسب، تصحیح هندسی با نقاط باقیمانده و میزان خطای ریشه مربعات 0/21 پیکسل صورت گرفت.

3.1. تهیه نمونه های تعلیمی
اساساً طبقه بندی تصاویر سنجش از دور فرآیند مشکلی است، چرا که بیشتر روش های طبقه بندی نظارت شده نیازمند داده های تعلیمی به اندازه کافی بزرگ هستند .]4[از طرف دیگر، نحوه انتخاب نمونههای تعلیمی نیز یکی از مهمترین عوامل در طبقه بندی پیکسل ها است .]21[ برای رسیدن به دقت بهتر، این عامل می تواند حتی از انتخاب الگوریتم طبقه بندی نیز مهم تر باشد .]6[
در این تحقیق برای تهیه نقشه جنگل در منطقه با استفاده از بازدیدهای میدانی و دستگاه موقعیتیاب جهانی نمونههای تعلیمی برای دو کلاسه جنگل و غیر جنگل در منطقه تهیه گردید. نمونه های تعلیمی به دو دسته تقسیم بندی گردید، یک دسته جهت استفاده در طبقه بندی و دسته دوم جهت بررسی صحت طبقه بندی استفاده شد (جدول(1 لازم به ذکر است که در منطقه از نمونههای تعلیمی ثابتی جهت طبقه بندی استفاده شد و در نمونههای تعلیمی تغییر ایجاد نگردید. همین شرایط برای نمونه های تعلیمی جهت ارزیابی نیز رعایت گردید. پس از اعمال تصحیحات تصاویر با توجه به الگوریتممورد مطالعه با استفاده از نرمافزار ENVI4.5 به کمک نمونههای تعلیمی، نقشه جنگل برای منطقه مورد مطالعه تهیه گردید.

4.1. ماشین بردار پشتیبان((Support Vector Machine
ماشین بردار پشتیبان یک روش آماری غیر پارامتریک نظارت شده است و از روشهای جدیدی است که جهت طبقه بندی تصاویر ماهواره ای به منظور استخراج نقشه کاربری اراضی استفاده می شود .]1[ این روش براساس این فرض عمل می کند که هیچ گونه اطلاعی از چگونگی توزیع مجموع داده وجود نداشته باشد.به علت توانایی در به کارگیری بهینه از داده های تعلیمی، در اغلب موارد توانسته است طبقه بندی را از بسیاری روش های رایج با دقت مطلوب تری انجام دهد .]26[این مزیت سبب کاهش هزینهها و افزایش سرعت کار میشود .]6[
ماشین بردار پشتیبان در واقع یک طبقه بندی کننده دو دویی است که دو کلاس را با استفاده از یک مرز خطی از هم جدا میکند و وابسته به خانواده طبقه بندیهای خطی تعمیم یافته است .]22[ ماشین بردار پشتیبان، دادهها را با عبور یک صفحه (مرز خطی) و با استفاده از تمامی باندها و به کارگیری یک الگوریتم بهینه سازی طبقه بندی می کند. بدین گونه که ابتدا نمونه هایی که مرز کلاس ها را تشکیل می دهند به دست میآیند. به عبارت دیگر تعدادی از نقاط آموزشی که کمترین فاصله تا مرز تصمیم گیری را دارند می توانند به عنوان بردار پشتیبان در نظر گرفته شوند. در این روش با افزایش بعد داده ها نتایج مطلوب تری حاصل میگردد. در واقع در صورتی که در فضای طیفی، کلاسها تداخل داشته باشند، دادهها به فضایی با ابعاد بیشتر برده می شوند، به گونه ای که تمایز آن ها میسر گردد. هدف اصلی این الگوریتم یافتن بیشترین فاصله بین دو کلاس و در نتیجه افزایش دقت طبقه بندی است درحالیکه تعمیم نیز تا حد امکان کاهش یابد .]26[
مؤلفه اساسی که ماشین بردار پشتیبان را متمایز میکند، پیروی روند پردازش این الگوریتم از قاعدهای است که به عنوان کاهش ریسک ساختاری (SRM1) شناخته می شود. در واقع ماشین بردار پشتیبان خطاهای کلاس بندی را در داده های مشاهده نشده بدون فرضیه قبلی از احتمال تخریب داده به حداقل می رساند، درحالی که تکنیک های آماری مانند حداکثر احتمال مشابهت تخریب داده را شناختهشده در نظر میگیرد .]26[

5.1. صحت طبقه بندی
لازمه استفاده از نوع اطلاعات موضوعی، آگاهی از درستی و صحت آن است. بعد از طبقه بندی تصاویر ماهوارهای با استفاده از نمونههای تعلیمی که در روند طبقه بندی دخالت داده نشدهاند، اقدام به ارزیابی صحت طبقه بندی شده میگردد. در تحقیق حاضر از ضرایب صحت کلی (Overall accuracy)، ضریب کاپا (Kappa coefficient)، صحت تولیدکننده، صحت کاربر، خطای کمیسیون2 (ردیف هر طبقه در ماتریس خطا) و خطای امیسیون3 (ستون هر طبقه در ماتریس خطا) جهت بررسی صحت طبقه بندی استفاده گردید.
صحت کلی برابر است با نسبت تعداد پیکسلهای درست طبقه بندی شده یک طبقه به کل پیکسلهای درست طبقه بندی شده در تمامی طبقات می باشد. طبق رابطه زیر به دست میآید:

در این رابطه؛ OA صحت کلی، N تعداد پیکسل های آزمایشی،∑pii جمع عناصر قطر اصلی ماتریس خطا می باشد. به دلیل ایرادات وارده به صحت کلی، غالباً در کارهای اجرایی که مقایسه دقت طبقه بندی مورد توجه است، از شاخص ضریب کاپا استفاده می شود. ضریب کاپا تشریح کننده میزان تطابق بین نتایج طبقه بندی و واقعیت زمینی می باشد با توجه به این نکته که تطابقهای اتفاقی به وجود آمده، از ملاحظات حذف میشوند .]20[ ضریب کاپا از رابطه 2 محاسبه میشود:

که در رابطه بالا؛ p0 درستی مشاهدهشده، pc توافق مورد انتظار است.
دقت تولیدکننده، احتمال اینکه یک کلاس در تصویر کلاسه بندی در همان کلاس در روی زمین قرار بگیرد و دقت کاربر، احتمال اینکه یک کلاس مشخص در روی زمین در همان کلاس بر روی تصویر طبقه بندی شده قرار بگیرد میباشد که از روابط زیر محاسبه میگردند:

که در این رابطه؛ PA درصد دقت کلاس a برای دقت تولیدکننده، ta تعداد پیکسلهای صحیح طبقه بندی شده به عنوان کلاس a، ga تعداد پیکسلهای کلاس a در واقعیت زمینی، UA درصد دقت کلاس a برای دقت کاربر، n1 تعداد پیکسلهای کلاس a میباشد.
ماتریس خطا میزان تطابق هر کلاس طبقه بندی شده را با واقعیت زمینی نشان میدهد و در آن میتوان میزان قرار گرفتن اشتباهی یک طبقه را در طبقات دیگر مشاهده کرد. قطر ماتریس خطا درصد کلاسهای درست طبقه بندی شده و سایر سلولهای آن میزان خطای کمیسیون (ردیف هر طبقه در ماتریس خطا) و خطای امیسیون (ستون هر طبقه در ماتریس خطا) را نشان میدهد .]23[ به صورت زیر تعریف میشوند:

خطای کمیسیون (Ce) که براساس دقت کاربر محاسبه می گردد، معادل آن درصد از پیکسلهایی است که در واقع متعلق به

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید