بخشی از مقاله
چکیده
انتخاب روش طبقه بندي چالشی است که در آنالیز تصاویر سنجش از دوري با آن روبه رو هستیم . در صورت نداشتن اطلاعات اولیه, تابع توزیع و رفتار مشخص در داده هاي آموزشی از روش هاي غیر پارامتریک براي طبقه بندي استفاده می کنیم. در این مقاله طبقه بندي k همسایگی نزدیک روي تصویر ماهواره اي شیراز انجام شده و k همسایگی بهینه در چندین بار تکرار به دست آمده است . از آنجایی که روش k همسایگی نزدیک وزن یکسانی را براي تمام همسایگی هاي انتخابی در نظر می گیرد,نتایج حاصله از صحت کافی برخوردار نیستند.
به منظور اینکه به همسایگی ها نسبت به فاصله ي آنها تا نقاط مجهول وزن دهیم , این مقاله یک روش جدید تلفیق فازي با k همسایگی نزدیک براي طبقه بندي تصاویر سنجش از دور ارائه می دهد. با بهره گیري از روش فازي در تصمیم گیري در مورد کلاس نمونه هاي مجهول میزان تعلق نمونه ها به کلاس مورد نظر تعیین شده و تمام همسایگی ها وزن یکسانی در تصمیم گیري ما ندارند. پس از تعیین k همسایگی بهینه در روش تلفیق فازي با kهمسایگی نزدیک, نتایج این دو روش از لحاظ تفکیک پذیري کلاسها و دقت با یکدیگر مقایسه می شود.
-1 مقدمه
تصاویر رقومی داراي آرایه اي از عناصر تصویري هستند که در هر آرایه از این تصاویر، مجموع انرژي بازتابیده وگسیل شده از محدوده متناظر آن در سطح زمین، پس از تاثیر عوامل خطا، ثبت و ذخیره می گردد . این ارزشهاي عددي پدیده هاي مختلف را توصیف می کند . بنابراین می توان نسبت به طبقه بندي آنها اقدام نموده و اطلاعات مربوطه را در کلاسهاي مشخص استخراج نمود. با استفاده از طبقه بندي تصاویر عضویت یک پیکسل به یک کلاس تعیین می شود.
طبقه بندي تصاویر یک چالش مهم در بسیاري از کاربردهاي تصاویر سنجش از دوري از جمله آنالیز کاربري زمین,کنترل آلودگی وارزیابی مناطق آتش گرفته ي جنگل و... [1]-[3] می باشد. به طور کلی طبقه بندي شامل دو روش کلی طبقه بندي نظارت شده و طبقه بندي نظارت نشده می باشد . در روش طبقه بندي نظارت شده، نوع و مکان برخی از انواع پوشش هاي زمین مثل منطقه شهري، کشاورزي، آب و از قبیل آن شناخته شده هستند .
این شناخت ترکیبی از کار میدانی، تفسیر عکس هاي هوایی، تجزیه و تحلیل نقشه ها و تجربه ي فرد متخصص قابل حصول است . لازم است کاربر مکانهاي مخصوصی را در داده هاي تصویري که نماینده مناطق همگنی از پوششهاي زمین شناخته شده هستند را معین کند . این مکان ها را به دلیل خصوصیات طیفی آنها در آموزش الگوریتم طبقه بندي براي تهیه نقشه نهایی، معمولا مناطق آموزشی می نامند . در طبقه بندي بدون نظارت، نوع و مکان انواع پوششهاي زمین که قرار است به عنوان کلاس تعیین شوند، معمولا از قبل شناخته شده نیستند.
روشهاي طبقه بندي نظارت شده با ورودي عددي به سه گروه تقسیم می شوند.پارامتریک، نیمه پارامتریک، غیر پارامتریک. [4 ] در هر سه این روشها از یک مجموعه داده ي آموزشی استفاده کرده که داراي برچسب کلاسی مشخص می باشند. روشها ي پارامتریک و نیمه پارامتریک به اطلاعات اولیه در مورد ساختار داده ها در مجموعه ي داده هاي آموزشی نیاز دارند. در بسیاري از موارد بدست آوردن این اطلاعات دشوار است. بنابراین در این مواقع از روشها ي غیر پارامتریک مانند روش k همسایگی نزدیک[5] استفاده شده که نیازي به این اطلاعات اولیه ندارند. روش k همسایگی نزدیک بر مبناي فاصله ي k همسایگی تا نمونه ي مجهول تصمیم گیري می کند. مزیت این روش این است که الف - ساده است. ب - تنها به تعیین یک پارامترk نیاز دارد.
پ - احتیاجی به اطلاعات اولیه نداشته و براي مجموعه هاي کوچک به سرعت جواب می دهد. سه مورد از مشکلات این روش به این صورت است: الف - به انتخاب k حساس بوده و نتایج طبقه بندي با k هاي متفاوت,یکسان نخواهد بود. - شکل - شکل - 2 الگوریتم KNN برای k=1 نمونه ي مجهول y را به کلاس مثبت - - + اختصاص می دهد. ولی اگر k= 5 باشد به کلاس منفی تعلق پیدا می کند.
ب - انتخاب نزدیکترین همسایگی ها در بعضی مواقع باعث همپوشانی کلاسها شده به خصوص زمانی که در تصاویر ماهواره اي پیکسلهاي مخلوط داریم. پ - وزن تمام همسایگی ها را بدون توجه به فاصله ي آنها یکسان در نظر می گیرد. براي حل این مشکلات روشهایی مانند روش k همسایگی وزندار [6] ارائه شده که وزن هر نزدیکترین همسایگی را با توجه به فاصله ي آن تا نقطه ي مجهول محاسبه کرده و برچسبی که به کلاسها اختصاص می دهد براساس بیشترین مجموع این وزنها می باشد. روش دیگر الگوریتم فازي k همسایگی نزدیک[7] ، [8]که توسط کلر - - 1985 پیشنهاد شد.
-2روش انجام کار
ابتدا به شرح روش طبقه بندي k همسایگی نزدیک و تلفیق این روش با فازي پرداخته، سپس نتایج را با یکدیگر مقایسه می کنیم.
1-2 طبقه بندي به روش k همسایگی نزدیک
یکی از روشهاي طبقه بندي نظارت شده ي تصاویر است،که توسط فیکس و هوگس - 1952 - بررسی شده است. در این روش پیکسل هاي مجهول با توجه به بیشترین داده آموزشی نزدیک در فضاي ویژگی طبقه بندي می شوند. مزیتی که این روش نسبت به روشهاي دیگر دارد، این است که به توزیع کلاسها در داده هاي آموزشی وابسته نیست. اما به دلیل اینکه براي تعیین kتا از نزدیک ترین همسایه ها، نیازمند محاسبه فاصله هر پیکسل از تمام نمونه هاي آموزشی هستیم، محاسبات این روش سنگین میباشد.
2-2 روش تلفیق KNN با فازي
ایده اي این روش این بود که چون k همسایگی نزدیک وزن یکسانی را براي تمامی همسایگی هاي انتخابی بدون توجه به فاصله ي آنها از نقاط در نظر می گیرد، با اشکالاتی مواجه می شود.بنابراین با در نظر گرفتن منطق فازي می توان براي نمونه هاي کلاس درجه ي عضویتی در نظر گرفت که این درجه عضویت بر مبناي فاصله ي k همسایگی نزدیک بدست می آید. براساس این درجات عضویت تصمیم گیري نرم تر انجام می شود. این ایده توسط Keller مطرح گردید.