بخشی از مقاله
چکیده
در میان روش هاي طبقهبندي نظارت نشده، روش هاي جزءبندي خوشهبندي از اهمیت ویژهاي برخوردارند. یکی از پرکاربردترین روش هاي خوشه بندي جزءبندي، روش خوشه بندي c-means است. تا کنون مدلهاي متنوعی از این روش ارائه شده است که مدل هاي FCM، PCM، FPCM و PFCM از جمله معروفترین آنها هستند. مدل FCMبه دادههاي داراي خطاحساس است و تحت تاثیر آنها قرار میگیرد. براي رفع این مشکل مدل PCM پیشنهاد شد که آن هم به خوشه هاي منطبق بر هم منجر میشد. از این رو، مدل FPCMارائه گردید که این مسئله را مرتفع نماید، اما وقتی تعداد دادهها زیاد باشد این مدلکارایی خود را از دست میدهد. برايحل این مشکل مدل PFCMمعرفی گردید که داراي انعطاف بیشتري نسبت به بقیه مدلها بود . در این تحقیق از مدل هاي FCM و PFCMجهت خوشهبندي داده هاي تصویري فراطیفی واقعی استفاده شده است. آزمونه اي انجامشده نشان داد که مدل PFCM، ضریب کاپا را حدود 3/5% افزایش میدهد.
واژههاي کلیدي:خوشهبندي، FCM، PFCM، تصاویر فراطیفی
-1 مقدمه
روش خوشه بندي c-means براي اولین بار توسط MacQueen در سال 1967 ارائه گردید که به تدریج به یکی از مشهورترین شیوه هاي خوشه بندي در آنالیز دادهها تبدیل شد. در زمینه سنجش از دور، محققین بسیاري از این شیوه جهت طبقه بندي تصاویر ماهواره اي استفاده کرده اند، از جمله - 1983 - Schowengerdt و . - 1999 - Richards and Jia در سال 1973، Dunnمدل - FCM - Fuzzy c -means را ارائه داداینو مدل در سال 1981 توسط [1]Bezdek توسعه داده شد.به تدریج از همین خانواده، مدلهاي دیگري نیز ارائه شد.در سال 1993، Krishnapuram و Keller جهت رفع مشکل حساسیت به دادههاي داراي خطا و پرت1 مدل FCM، شرط مجموع عضویت ها را حذف کردند و یک مدل تعمیم یافته به نام Possibilisticc-means - PCM - معرفی نمودند .[2]
آنها با تست این مدل بر روي چندین مجموعه داده، ﻣﺰاﯾﺎي مدل Possibilistic را روشن ساختند . اما Barniet al. در سال 1996 نشان دادند که مدل PCMبه مقداردهی اولیه خیلی حساس است و اغلب خوشههاي منطبق بر هم تولید میکند .[3]در سال 1997، Pal et al. براي رفع مشکل مدلPCM مدل دیگري ﺑﻪ نام - FPCM - Fuzzy Possibilistic c-means پیشنهاد نمودند .[4] این مدل، ترکیبی از دو مدل FCM و PCM است که از مزایاي هر دو مدل برخوردار است.در سال 2004، Pal et al. بیان کردند زمانی که مدل FPCM براي یک مجموعه دادة بزرگ استفاده میشود، کارایی خود را از دست میدهد .[5] به همین دلیل یک مدل جدید دیگر به نام Possibilistic - PFCM - Fuzzy c-means معرفی کردند. این مدل از ویژگیهاي خوب هر دو مدل FCM و PCM برخوردار میباشد و با مجموعه دادههاي بزرگ نیز دچار مشکل نمیشود.
در پژوهشهاي سنجش از دوري در بسیاري از موارد از مدل FCMجهت طبقهبندي تصاویر ماهوارهاي استفاده شده است [6]،[7]،[.8]اما در زمینه طبقهبندي تصاویر سنجش از دوري ﺑﺎ استفاده از مدلهاي PCM، FPCM و PFCMتحقیقات زیادي یافت نمیشود.از آنجایی که مدل PCM به خوشههاي منطبق بر هم منجر می شود و مدل FPCM نیز براي مجموعه دادهھایحجیم - مانند، دادههاي سنجش از دوري - مناسب نمیباشد؛ در این تحقیق، از مدل خوشهبندي PFCMجهت خوشهبندي تصاویر فراطیفی استفاده شده است ونتایج حاصل از آن، بانقشه کاربري تولید شده توسط مدل خوشهبندي FCMمقایسه شده است.این مقاله شامل چهار بخش است. در بخش اول، به مقدمهاي کوتاه دربارهیتحقیقات انجام گرفته، انگیزه و هدف تحقیق و روش کار پرداخته شده است. در بخش دوم، مبانی نظري دو مدل خوشهبنديFCM وPFCMبیان میشود. بخش سوم، در برگیرندهي پیادهسازي مدلهاي خوشه بندي و ارزیابی آنها خواهد بود. در آخر، در بخش چهارم، نتیجهگیريها ارائه می شود.
-2 خوشهبندي جزءبندي
خوشهبندي، یکی از روشهاي طبقهبندي نظارتنشده و فرآیند ي است خودکار که در طی آن،یک مجموعه دادة معین به یک مجموعه از کلاسها یا خوشه ها تقسیم میشود . هدف از طبقهبندي دادهها در چنین فرآیندي، جداسازي آنها به قسمی است که دو داده در یک خوشه تا حد امکان به هم شبیه و دو داده در دو خوشه متفاوت تا حد امکان از یکدیگر متمایز باشند .[9]روشهاي خوشه بندي به دو گروه سلسله مراتبی و جزءبندي تقسیم میشوند.روش هاي خوشه بندي سلسله مراتبی بر مبناي طبقهبندي متوالی دادهها در سطوح مختلف هستند و اغلب به حافظه و زمان محاسباتی زیادي نیاز دارند. روشهاي خوشهبندي جزءبندي، اغلب بر مبناي تابع هدف هستند و از الگوریتم هاي بهینه سازي تناوبی، جهت تشکیل خوشه ها استفاده می کنند. این الگوریتمها با کمینه کردن یک تابع هدف، در پی برآورد یک طبقه بندي بهینه هستند.[9] در خوشه بندي مبتنی بر تابع هدف هر خوشه، میانگین داده هاي مربوط به آن خوشه خواهد بود. این نوع خوشه بندي را می توان به صورتزیر ارائه کرد:
میزان فازي بودن5 خوشه بندي را تعیین میکند. m میتواند هر عدد حقیقی بزرگتر مساوي با 1 باشد که در ازاي مقادیر بالاي m مرز بین خوشه ها غیردقیقتر، و در ازاي مقادیر پایین m مرز بین خوشهها مشخص تر میشود. معمولاً m=2 انتخاب میشود .[9]شرط اولمجموعه Mfcn - ﻣﺠﻤﻮع ستونی - ، ضمانت میکند که هیچ خوشه اي خالی نباشد و از طرف دیگر، شرط دوم مجموعه Mfcn،تضمین میکند که مجموع عضویت ها براي هر داده برابر 1 باشد.تابع هدف Jm را نمیتوان به طور مستقیم کمینه کرد. از این رو، کمینهسازي تقریبی Jm توسط الگوریتمتکراري [10]6FCM-AO انجام می شود. این الگوریتم بر مبنایتکرار شرایط لازم براي ﮐﺮانهاي محلی Jmاست.کمینه کردن Jm تحت شرط مجموع ستونی، از طریق نظریه ضرایب لاگرانژانجام دادن گرادیان تابع هدف نسبت به پارامترهايuik، ومیشود.به عبارت دیگر، از طریق مساوي با صفر قرار= ضرایب لاگرانژ،شرایط لازم براي کرانهاي محلی Jm را بدست میآید. این شرایط عبارتند از: