بخشی از مقاله
چکیده:
خوشه بندی فضایی یکی از روش های خوشه بندی است که میتواند بر مبنای مولفه های فضایی نتایج مطلوبتری را در ارتباط با آشکارسازی خوشه های همگون ارائه نماید. این روش در مطالعات زمینشناسی اکتشافی میتواند به عنوان ابزاری سودمند در تعیین نقاط امیدبخش اکتشافی مورد استفاده قرار گیرد. در این مقاله با معرفی الگوریتمهای یک و چند متغیره و استفاده از معیار خود همبستگی -Gعمومی و بهبود الگوریتم خوشه بندی k-means ، خوشه بندی فضایی انجام گردید.
تعمیم این روش بااستفاده از مولفه های عمق و فاصله تا نزدیکترین گسل به عنوان مولفه های اصلی و الگوریتم های حاصل از آن در معدن بوکسیت جاجرم نشان میدهد تغییرات عیار و مدول به شدت تحت تاثیر این دو مولفه است. انتخاب بهترین مولفه های فضایی در مناطق اکتشافی و ورود آن به الگوریتم معرفی شده در این مقاله میتواند منجر به تعیین نقط امیدبخش اکتشافی گردد.
واژه های کلیدی: داده های فضایی ،خودهمبستگیفضایی -Gعمومی، خوشهبندی k-means
مقدمه :
خوشه بندی ابزاری است که بر پایه آن میتوان داده های چندمتغیره را به گروه هایی با بیشترین شباهت درونگروه ی تفکیک نمود که هر یک از گروه ها دارای بیشترین اختلاف با سایر گروه ها می باشد. خوشه بندی به دو روش سلسله مراتبی و غیرسلسله مراتبی انجام میگیرد. در روش سلسله مراتبی مشاهدات برحسب میزان شباهت، در سطوح پایینتر به یکدیگر متصل میگردند و سرانجام در بالاترین سطح به یک گروه واحد تبدیل میشوند.
این روند در نموداری به نام دندروگرام به نمایش در میآید. در خوه بندی غیر سلسله مراتبی - k-means - ، مشاهدات به k گروه مجزا تقسیم میشوند که این تقسیمبندی بر اساس یک الگوریتم بازگشتی صورت میگیرد. در این الگوریتم مشاهدات آنقدر جابه جا میشوند تا مراکز گروه ها به بیشترین فاصله ممکن برسند و دیگر امکان هیچ گونه جابجایی در گروه ها مقدور نباشد. برای یافتن تعداد خوشه بهینه در این روش از آماره Gap استفاده میشود - بن هار و الیسف، .2002 -
به کارگیری روش های معمول خوشه بندی بر روی داده های فضایی به دلیل عدم استفاده از مولفه های فضایی نمیتواند منجر به ارائه نتیجه گیری قطعی و دقیق گردد. در این مقاله، قابلیت خوشه بندی فضایی به عنوان یکی از ابزارهای سودمند در تعیین نقاط امیدبخش اکتشافی که همواره از دغدغه های زمینشناسان اکتشافی است به عنوان یک رویکرد جدید مورد بررسی قرار گرفته و منجر به ارائه یک الگوریتم فضایی چند-متغیره شده است.
به منظور کنترل کارآیی این الگوریتم، مطالعه موردی بر روی کانسار بوکسیت جاجرم و مولفه های فضایی آن از قبیل، فاصله بین داده ها، فاصله تا نزدیکترین گسل و عمق نمونه برداری انجام گردید.
تعاریف و مفاهیم :
همبستگی بر پایه تابع تغییرنگار
از آنجا که مشاهدات صورت گرفته از دو مکان مجاور هم، دارای مقادیر مشابه تری نسبت مشاهدات از دو مکان دورتر از هم میباشند بنابراین، متوسط اختلاف بین مقادیر X - s - و X - s+h - که به فاصله h از یکدیگر قرار گرفته اند، میتواند معیار خوبی برای بیان اندازه این تشابه و وابستگی متقابل مقادیر در دو موقعیت s و s+h باشد. هرچه متوسط این تفاضل ها و در نتیجه واریانس آنها کمتر باشد، میتوان گفت X - s - و X - s+h - به یکدیگر نزدیکتر و شباهت آنها بیشتر است.
واریانس اختلاف بین مقادیر در دو موقعیت s و s+h تغییرنگار1 نامیده میشود . نیمتغییرنگار نامیده میشود. کوچک بودن تغییرنگار در یک فاصله h نشانگر وابستگی زیاد داده های مورد بررسی در این فاصله است و آن را میتوان به عنوان معیاری برای نشان دادن تأثیرگذاری یا تأثیرپذیری کمیت یک موقعیت بر روی کمیت موقعیت های دیگر در فضای مورد مطالعه به کار برد. نمایش نموداری تابع تغییرنگار در شکل - 1 - نشان داده شده است .
اگر تغییرنگار برای تمام مقادیر h تقریباً ثابت باشد ساختار فضایی بین داده ها وجود ندارد. برعکس وجود روند نمودار بیانگر همبستگی فضایی دادهها و وجود ساختار فضایی است.
تابع تغییرنگار چندمتغیره:2
تابع تغییرنگار چندمتغیره اولین بار توسط بورگالت - 1992 - به صورت زیر معرفی شده است:
که دراین رابطه M ماتریس متقارن مثبت قطعی و X - s - مقادیر p مشخصه قابل اندازه گیری با مولفه فضایی در سطح s است. در حالتی که M ماتریس واحد در نظر گرفته شود، تابع تغییرنگار چند متغیره Γ - h - به صورت مجموع توابع یک متغیره تغییرنگاره ای تبدیل می شود.
ماتریس وزن٣
ماتریس وزن یکی از مهمترین ابزارهای آمار فضایی میباشد، زیرا میزان ارتباط فضایی بین داده ها به وسیله ماتریس وزن در نظر گرفته میشود که با توجه به ساختار فضایی داده ها میتوان ماتریس متناسب را بر روی داده ها اعمال نمود. ماتریس معکوس فاصله، زمان گردش، فاصله ثابت و K همسایگی مجاور از متداولترین حالت های ماتریس وزن میباشند.
دراین مطالعه، یکی از ماتریس های وزن مورد استفاده، ماتریس وزن براساس معکوس فاصله است. در این ماتریس، فاصله داده ها براساس مختصات آنها محاسبه و معکوس آنها به عنوان درایه های ماتریس در نظر گرفته میشود. به این ترتیب، با دور شدن داده ها از یکدیگر وزن آنها کمتر میشود. این نوع ماتریس یکی از متداولترین شکل های ماتریس وزن میباشد.
آماره -Gعمومی:4
آماره -Gعمومی یکی از شاخصه ای موضعی خودهمبستگی فضایی است - گتیس و اُرد، . - 1992 آماره -G عمومی موضعی، برای هر واحد ناحیه ای محاسبه میشود و بر ارتباط بین ارزش واحد ناحیه مورد مطالعه و ارزش های واحده ای ناحیه ای مجاور از طریق فاصله دلالت دارد .بهتر است این آماره، به صورت آماره استاندارد شده مورد استفاده قرار گیرد . - 7 - در الگوریتم خوشه بندی ارائه شده در این مطالعه از این آماره استفاده گردید.