بخشی از مقاله
چکیده
خوشه بندی فضایی یکی از روشهای خوشه بندی است که میتواند بر مبنای مولفه های فضایی نتایج مطلوبتری را در ارتباط با آشکارسازی خوشه های همگون ارائه نماید. این روش در مطالعات زمینشناسی اکتشافی میتواند به عنوان ابزاری سودمند در تعیین نقاط امیدبخش اکتشافی مورد استفاده قرار گیرد. در این مقاله با معرفی الگوریتم های یک و چند متغیره و استفاده از معیار خود همبستگی -Gعمومی و بهبود الگوریتم خوشه بندی k-means ، خوشه بندی فضایی انجام گردید.
تعمیم این روش بااستفاده از مولفه های عمق و فاصله تا نزدیکترین گسل به عنوان مولفه های اصلی و الگوریتم های حاصل از آن در معدن بوکسیت جاجرم نشان میدهد تغییرات عیار و مدول به شدت تحت تاثیر این دو مولفه است. انتخاب بهترین مولفه های فضایی در مناطق اکتشافی و ورود آن به الگوریتم معرفی شده در این مقاله میتواند منجر به تعیین نقط امیدبخش اکتشافی گردد.
واژههای کلیدی: داده های فضایی ،خود همبستگی فضایی -Gعمومی، خوشهبندی k-means
مقدمه :
خوشه بندی ابزاری است که بر پایه آن میتوان داده های چندمتغیره را به گروه هایی با بیشترین شباهت درونگروه ی تفکیک نمود که هر یک از گروه ها دارای بیشترین اختلاف با سایر گروه ها می باشد. خوشه بندی به دو روش سلسلهمراتبی و غیرسلسله مراتبی انجام میگیرد. در روش سلسله مراتبی مشاهدات برحسب میزان شباهت، در سطوح پایینتر به یکدیگر متصل میگردند و سرانجام در بالاترین سطح به یک گروه واحد تبدیل میشوند. این روند در نموداری به نام دندروگرام به نمایش در میآید.
در خوشهبندی غیر سلسله مراتبی - k-means - ، مشاهدات به k گروه مجزا تقسیم میشوند که این تقسیم بندی بر اساس یک الگوریتم بازگشتی صورت میگیرد. در این الگوریتم مشاهدات آنقدر جابه جا میشوند تا مراکز گروه ها به بیشترین فاصله ممکن برسند و دیگر امکان هیچ گونه جابجایی در گروه ها مقدور نباشد. برای یافتن تعداد خوشه بهینه در این روش از آماره Gap استفاده میشود - بن هار و الیسف، . - 2002
به کارگیری روش های معمول خوشه بندی بر روی داده های فضایی به دلیل عدم استفاده از مولفه های فضایی نمیتواند منجر به ارائه نتیجه گیری قطعی و دقیق گردد. در این مقاله، قابلیت خوشه بندی فضایی به عنوان یکی از ابزارهای سودمند در تعیین نقاط امیدبخش اکتشافی که همواره از دغدغه های زمینشناسان اکتشافی است به عنوان یک رویکرد جدید مورد بررسی قرار گرفته و منجر به ارائه یک الگوریتم فضایی چند-متغیره شده است.
به منظور کنترل کارآیی این الگوریتم، مطالعه موردی بر روی کانسار بوکسیت جاجرم و مولفه های فضایی آن از قبیل، فاصله بین داده ها، فاصله تا نزدیکترین گسل و عمق نمونه برداری انجام گردید.
تعاریف و مفاهیم :
همبستگی بر پایه تابع تغییرنگار
از آنجا که مشاهدات صورت گرفته از دو مکان مجاور هم، دارای مقادیر مشابه تری نسبت مشاهدات از دو مکان دورتر از هم میباشند بنابراین، متوسط اختلاف بین مقادیر X - s - و X - s+h - که به فاصله h از یکدیگر قرار گرفتهاند، میتواند معیار خوبی برای بیان اندازه این تشابه و وابستگی متقابل مقادیر در دو موقعیت s و s+h باشد. هرچه متوسط این تفاضلها و در نتیجه واریانس آنها کمتر باشد، میتوان گفت X - s - و X - s+h - به یکدیگر نزدیکتر و شباهت آنها بیشتر است.
واریانس اختلاف بین مقادیر در دو موقعیت s و s+h تغییرنگار1 نامیده میشود . نیمتغییر نگار نامیده میشود. کوچک بودن تغییرنگار در یک فاصله h نشانگر وابستگی زیاد داده های مورد بررسی در این فاصله است و آن را میتوان به عنوان معیاری برای نشان دادن تأثیرگذاری یا تأثیرپذیری کمیت یک موقعیت بر روی کمیت موقعیت های دیگر در فضای مورد مطالعه به کار برد.
نمایش نموداری تابع تغییرنگار در شکل - 1 - نشان داده شده است . اگر تغییرنگار برای تمام مقادیر h تقریباً ثابت باشد ساختار فضایی بین داده ها وجود ندارد. برعکس وجود روند نمودار بیانگر همبستگی فضایی داده ها و وجود ساختار فضایی است.
در حالتی که میانگین داده ها ثابت و واریانس آنها تابعی از فاصله باشد، می توان از برآوردگر تغییرنگار ارائه شده توسط ماترون - 1963 - استفاده کرد.این مجموعه شامل تمام زوج موقعیت هایی است که در فاصله از یکدیگر قرار دارند و ୦ تعداد اعضای مجموعه ୦ میباشد.
تابع تغییرنگار چندمتغیره:2
تابع تغییرنگار چندمتغیره اولین بار توسط بورگالت - 1992 - به صورت زیر معرفی شده است:
که دراین رابطه M ماتریس متقارن مثبت قطعی و X - s - مقادیر p مشخصه قابل اندازه گیری با مولفه فضایی در سطح s است. در حالتی که M ماتریس واحد در نظر گرفته شود، تابع تغییرنگار چند متغیره Γ - h - به صورت مجموع توابع یک متغیره تغییرنگارهای γ୧ Ǣ ൌ ǡǥǡ تبدیل می شود.
ماتریس وزن٣
ماتریس وزن یکی از مهمترین ابزارهای آمار فضایی میباشد، زیرا میزان ارتباط فضایی بین دادهها به وسیله ماتریس وزن در نظر گرفته میشود که با توجه به ساختار فضایی داده ها میتوان ماتریس متناسب را بر روی داده ها اعمال نمود. ماتریس معکوس فاصله، زمان گردش، فاصله ثابت و K همسایگی مجاور از متداولترین حالتهای ماتریس وزن میباشند.
دراین مطالعه، یکی از ماتریسهای وزن مورد استفاده، ماتریس وزن براساس معکوس فاصله است. در این ماتریس، فاصله داده ها براساس مختصات آنها محاسبه و معکوس آنها به عنوان درایه های ماتریس در نظر گرفته میشود. به این ترتیب، با دور شدن داده ها از یکدیگر وزن آنها کمتر میشود. این نوع ماتریس یکی از متداولترین شکل های ماتریس وزن میباشد.
آماره -Gعمومی:4
آماره -Gعمومی یکی از شاخصهای موضعی خودهمبستگی فضایی است - گتیس و اُرد، . - 1992 آماره -G عمومی موضعی، برای هر واحد ناحیه ای محاسبه میشود و بر ارتباط بین ارزش واحد ناحیه مورد مطالعه و ارزش های واحدهای ناحیه ای مجاور از طریق فاصله دلالت دارد. بهتراست این آماره، به صورت آماره استاندارد شده مورد استفاده قرار گیرد . - 7 - در الگوریتم خوشه بندی ارائه شده در این مطالعه از این آماره استفاده گردید.