بخشی از مقاله

چکیده:

امروزه سنجشازدور در محدوده طیفی مادون قرمز با هدف شناسایی کانیها و مواد معدنی و توزیع آنها روي سطوح زمینی و نجومی یک فعالیت مداوم و روبهپیشرفت محسوب میشود. حجم وسیعی از دادههاي طیفی که در حال حاضر موجود و قابل دستیابی هستند و یا در ماموریتهاي فضایی آینده اخذ خواهندشد نشان از چالشی بزرگ براي دانشمندان و    محققان دارد تا بتوانند از این دادهها اطلاعاتی مفید و کاربردي استخراج نمایند. نیاز به روشهاي اتوماتیک براي تسهیل در این فرایند به وضوح احساس میشود. تفکیک و سازماندادن این دادهها در قطعههاي معنیدار، یک مرحله حیاتی از آنالیز دادههاي سنجشازدور به حساب میرود که می توان آن را تکنیک خوشهبندي یا قطعهبندي نامید.

در این مقاله یک طرح طبقهبندي و قطعهبندي اتوماتیک بر مبناي نقشههاي خودسامانده - SOM - ارائه شدهاست. SOM یک نوع از شبکه هاي عصبی غیرنظارتشده است که تابحال در موارد بسیاري از آنها به منظور قطعهبندي دادههاي سنجشازدور و شناسایی آنومالیها استفاده شدهاست. شکل بسطیافتهاي از شاخص اعتبارسنجی Davies-Bouldin، جهت تعیین تعداد بهینه قطعهها به صورت خودکار مورد استفاده قرار گرفتهاست. این طرح با کتابخانههاي طیفی کانیها و    مواد معدنی که در دانشگاه آریزونا - ASU - و جان هاپکینز - JHU - تهیه شده و نمونههایشان به شکل درختی با نامهاي کلاس، زیر کلاس، و گروه برچسبگذاري شدهبودند، آموزش دادهشده و تست شد.

این برچسبها براي سنجش میزان خلوص طیفی قطعههاي بدستآمده و دقت طبقهبندي بکار رفتهاند. جزئیات روش SOM، روند تست ها، و سنجش کارآمدي روش پیشنهادي، به تفصیل توضیح داده شدهاست. نتایج آزمایشات و تست ها نشان میدهد که روش SOM میتواند عنصر مهمی در سیستمهاي خودکار طراحیشده براي شناسایی و پی جویی کانیها از دادههاي بازتابی سطح زمین در محدوده طیفی مادون قرمز باشد.

مقدمه:

در سالهاي اخیر حجم وسیعی از داده هاي طیفی از سطح زمین و دیگر احجام آسمانی جمع آوري شدهاست [1] و .[2] فعالیتهاي فضایی حال و آینده حتی حجم وسیعتري از مجموعه دادههاي طیفی مهیا خواهند کرد که سازماندهی و تفسیر اطلاعات موجود در آنها بدون شک نیاز به صرف زمان زیادي دارد.[2] یک روش طبقهبندي اتوماتیک قدرتمند و از نظر علمی هائز اهمیت، می تواند به شکل قابل ملاحظهاي در تسهیل فرآیندهاي آنالیزي و تفسیري داده هاي سنجشازدور موثر باشد.

این چنین روشی همچنین جزئی ضروري از سیستم سنجش از دور خواهد بود که بر رو یا نزدیک سیارههاي دوردست، ماه و یا سیارکها کار میکند [3] و .[4] اینگونه سیستمها براي هفتهها قادرند بدون دخالت انسان کار کنند. در این مقاله یک روش طبقهبندي غیرنظارتشده بر مبناي نقشههاي خودسامانده - - SOM ارائه شدهاست. SOM در بسیاري از کاربردهاي صنعتی جهت اتوماتیکسازي فرایندهاي حیاتی براي تولید و کارآمد کردن آن مورد استفاده قرار گرفتهاست .[4]

روش کار:

یک قطعه از بردار N بعدي را میتوان مجموعهاي از بردارها در فضاي VN تعریف کرد که از نظر مجاورت به هم نزدیکند و    همچنین همبستگی بسیار بالایی دارند.[1] روش - KM - K-means یک الگوریتم محبوب براي پیدا کردن قطعهها در مجموعه دادههاي بزرگ و حجیم است. در این روش ابتدا تعداد k قطعه به صورت رندوم از بردارهاي اولیه تولید میشوند، و سپس میانگین حسابی آرایههاي هر قطعه به عنوان مرکز آن قطعه در نظر گرفتهمیشود. در حین قطعهبندي بردارهاي اولیه با بردارهایی که نماینده مرکز قطعه هستند جایگزین شده و بهنگام میشوند. به طور کلی، تعداد قطعهها معلوم نیست.

تعداد بردارهاي اولیه به صورت افزایشی تنظیم میشود - که هر بار نیاز به انجام مجدد مرحله آموزش دارد - ، و    سپس معیارهایی براي ارزیابی کیفیت قطعهبندي اعمال می شوند. فرایند آموزش/ارزیابی آنقدر ادامه مییابد تا در نهایت قطعهبندي بهینه را بیابیم. این روش افزایشی توسط [12] Marzoبراي یافتن تعداد بهینه قطعهها، در آنالیزهاي طیفی سطح مریخ اعمال شدهاست. در این مطالعه بواقع یافتن قطعهبندي بهینه هرگز به طور کامل محقق نشد چرا که تست کردن تمام مقادیر بالقوه براي تعداد قطعهها در چنین مجموعه دادههاي بزرگی عملا غیر ممکن بود .[7]

آموزش SOM

نوع دیگري از الگوریتم قطعهبندي، مبتنی بر شبکههاي عصبی است که با استفاده از آموزش غیرنظارتشده آموزش داده میشود تا یک نمایش گسسته از فضاي ورودي نمونه هاي آموزش ایجاد کند که آن را نقشه مینامند. تفاوت SOM با دیگر شبکه هاي عصبی در این است که از یک تابع همسایگی براي حفظ مشخصات توپولوژي و مکان شناسی در فضاي ورودي استفاده میکند، یعنی طوري طراحی شدهاند که لایه خروجیشان را به طور خودکار همسایگیهاي مرتبط با قطعههاي فضاي ورودي در نظر میگیرند. الگوریتم SOM توسط [8] Kohonen طراحی شدهاست.

SOM مانند دیگر شبکههاي عصبی داراي لایه ورودي و لایه خروجی است. لایه ورودي، آرایهاي خطی از نرون ها است، به طوري که براي هر آرایه از بردار ورودي Nبعدي، یک نرون در نظر گرفته میشود.[8] لایه خروجی SOM شامل نرون ها یا سلولهایی است که معمولا در آرایههاي یکبعدي یا دوبعدي مرتب شدهاند. در واقع SOM بیانگر نگاشتی از فضاي ورودي با ابعاد بالا به نقشه خروجی با ابعاد پایین است.[8]

ابتدائاً به هر سلول یک بردار از VN به شکل رندوم اختصاص مییابد. بردار ورودي به شبکه عصبی ارائه می شود و سپس بردار سلولی که کمترین فاصله اقلیدسی از بردار ورودي را دارد انتخاب شده و »فعال« میشود. این عملیات را مجاورت مینامیم. عملیات همبستگی نیز سلولی را انتخاب و »فعال« میکند که بیشترین همبستگی را با بردار ورودي دارد.

معیار سنجش همبستگی مورد استفاده در این مقاله ضریب همبستگی [13] Pearson است. قطعهبندي SOM در دو فاز انجام میشود؛ آموزش و قسمتبندي. در فاز آموزش مجموعه بردارهاي ورودي - بردارهاي آموزشی - چندین مرتبه و به شکل چرخهاي به شبکه ارائه میشوند. هر مرتبه بردارهایی که با نرون هاي فعالشده و همسایههایشان مرتبطند به شکل زیر اصلاح میشوند.

قسمت بندي :SOM

پس از اینکه فاز آموزش کامل شد همسایگیهاي لایه خروجی میتوانند با - 1 نشان دادن آن نرون هاي خروجیاي که توسط مجموعه آموزشی فعال شدهاند یا - 2 نشاندادن میزان نزدیکی بردارهایی که با نرونهاي مجاور در ارتباطند، تصویر شوند. حالت دوم توسط کشیدن دیوارهایی بین نرون هایی که ضخامتشان، درجه خاکستریشان، یا رنگشان با همسایگیشان همبستگی دارد انجام می شود. برچسب هاي بردارهاي آموزشی نیز میتواند به منظور تسهیل در تفسیر همسایگی اضافه شود.

فاز قسمتبندي، لایه خروجی را به ناحیه هاي منفصل از هم تقسیم میکند. ناحیه به عنوان مجموعهاي از نرون ها تعریف میشود که توسط حدآستانهاي بزرگتر از بعضی از مقادیر مشخصشده - که دیواره نامیده میشوند - احاطه شدهاست، تا حدي که لااقل یک نرون با استفاده از بردار آموزش فعال شود. الگوریتمی براي تعیین محل ناحیهها در زیر میآید:

- 1 یافتن یک نرون فعال شده و علامتگذاري آن

- 2 انتقال به شمال تا جایی که به دیواره برسیم، علامتگذاري هر نرونی که حرکت کرده

- 3 تکرار - 2 براي همه امتدادها

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید