بخشی از مقاله
چکیده
هر نقطه بر روي زمین در مقیاسهاي مختلف داراي درجه ي شرقیت - غربیت - و یا شمالی بودن - جنوبی بودن - میباشد. تاکنون این مسئله به طور واضح مورد کنکاش و بررسی قرار نگرفته است که اگر یک نقطه کاملاً شرقی باشد، نقاط چسبیده به آن تا چه حد در شرق یا شمال قرار دارند. از این رو از مدل فازي در حل این ابهام بایستی کمک گرفته شود. مدل فازي بر اساس توابع عضویت فازي به هر نقطه درجه ي عضویت میبخشد. در این مسئله به کمک مدل فازي به هر نقطه یک درجه ي عضویت بین صفر و یک بخشیده شده است.
در این مقاله در مقیاس جهانی، درجه ي عضویت شرقیت و شمالی بودن براي اولین بار با در نظر گرفتن شرایط مکانی و زمانی و توابع عضویت مخصوص به آنها براي هر نقطه بر روي زمین تعریف گشته است. کاربرد تعریف درجه ي شرقیت و شمالی بودن در خوشه بندي مکانی جدید میتواند مورد استفاده قرار گیرد. خوشه بندي مکانی از روشهاي غیر نظارتی استخراج و آنالیز داده هاي مکانی میباشد که نه تنها به عنوان یک روش شناسایی توزیع الگوها، بلکه ابزاري براي کاهش حجم داده ها و مدیریت اطلاعات مکانی میباشد. ضمناً در این مقاله براي اولین بار جهات جغرافیایی با استفاده از درجه ي شرقیت و شمالی بودن تعریف گشته است.
-1مقدمه
-1-1اهمیت خوشه بندي1 و ارتباط آن با 2GIS
از دیرباز استخراج مفید ترین و مناسب ترین اطلاعات و دانشها از داده هاي خام در علوم مکانی از اهمیت بسزایی برخوردار بوده است. اگر به دلایلی از حجم زیاد داده ها به نحو احسن استخراج اطلاعات صورت نگیرد، هزینه هاي هنگفت جمع آوري اطلاعات، از دست دادن زمان، بدست آوردن نتایج نادرست و ... ضررهاي اجتناب ناپذیر این امر خواهد بود. از طرفی امروزه در GIS، مدیریت حجم اطلاعات و زمان از اهمیت زیادي برخوردار است.
بوسیله ي خوشه بندي، علاوه بر استخراج اطلاعات و آنالیزهاي مکانی، بحث کاهش حجم اطلاعات و همچنین Data Mining استفاده ي بهینه از داده ها نیز مد نظر قرار می گیرد. لازم به ذکر است خوشه بندي مکانی و غیر مکانی از انواع رایج خوشه بندي هاست که در خوشه بندي مکانی، معیارهاي مکانی، عامل خوشه بندي میگردند. از مهمترین معیارها، میتوان به فاصله اشاره نمود. امروزه و روشها و زیر شاخه هاي آن در علوم مکانی، جایگاه خوبی در کنفرانس ها و مقالات به خود اختصاص داده است. در بحث Data Mining، خوشه بندي یکی از مهمترین تکنیکهاي آنالیز و استخراج اطلاعات مکانی میباشد.[5] همچنین بوسیله ي روشهاي خوشه بندي، عملیات شناخت الگوها و مکانیابی بهینه براي کاربریها انجام پذیر است.
-2تعریف خوشه بندي
تاکنون براي خوشه بندي تعاریف مختلفی ارائه شده است که اغلب تعاریف، واژه هایی نظیر شباهت، فاصله و گروه را دربردارند. خوشه بندي روشی جهت دسته بندي داده ها به گروههاي کوچکتر از داده هاي متشابه بر اساس یک یا چند معیار میباشد که دو شرط زیر را دارا باشد:
الف-داده هاي درون یک خوشه از بیشترین شباهت - کمترین فاصله - برخوردار باشند.
ب-داده هاي خوشه هاي مختلف کمترین شباهت - بیشترین فاصله - را داشته باشند. اگر داده ها به صورت بردارهایی در فضاي L بعدي در نظر گرفته شود، خوشه ها به عنوان مناطق پیوسته اي از فضا، شامل نقاطی با چگالی بالا میباشند که از مناطق با چگالی بالاي دیگر بوسیله مناطق کم چگال نقاط جدا شده است. لازم به ذکر است خوشه بندي تحت نامهاي مختلفی مانند: یادگیري غیر نظارتی، افراز، کلاس بندي، طبقه بندي در مقالات دیده می شود.[3,4]
-1-2تعریف ریاضی خوشه بندي
مجموعه ي X را به عنوان مجموعه داده هایمان در نظر بگیرید:
اگر X را به m دسته ي C1, C2,….., Cm تقسیم کنیم و همواره سه شرط ذیل را دارا باشند، گوییم X به m خوشه تقسیم شده است:
به عبارتی تشکیل m افرازي را بدهند که در آن دو شرط تشکیل خوشه اعمال شده باشد. اولاً داده هایی که درون خوشه ي i قرار میگیرند داراي بیشترین شباهت نسبت به هم و ثانیاً کمترین شباهت را نسبت به داده هاي درون خوشه - i≠j - Cjرا دارا باشند. اگر هر داده - بردار داده - فقط متعلق به یک خوشه باشد، به این خوشه بندي، Crisp، سخت و یا انحصاري و در غیر این صورت به این خوشه بندي، خوشه بندي پوشش دار، غیر انحصاري و یا ملایم گویند. مانند روش فازي[1,2]
-2-2کاربرد خوشه بندي
از کاربردهاي آن در علوم مکانی و شاخه هاي آن - GIS - میتوان به موارد زیر اشاره کرد: -1کاهش ابعاد داده
-2در اندکس گذاري مکانی : بوسیله ي سر خوشه ها میتوان این عملیات را بهینه کرد.
-3کاربري زمین: شناسایی مناطق با کاربري مشابه در پایگاه داده
-4برنامه ریزي شهري: مشخص کردن مناطق مسکونی، جاده ها، خیابانها و عناصر شهري بر اساس نوع کاربري، مختصات عارضه و معیارهاي تصمیم گیرندگان
-5مطالعات زمین لرزه: مشاهدات مرکز زلزله در میان گسلها و شکاف ها باید خوشه بندي گردد.
-6شناسایی الگوها
-7آنالیز داده هاي مکانی
-8تهیه ي نقشه هاي موضوعی در GIS
-9خوشه هاي مکانی شناسایی و در استخراج داده هاي مکانی به کار برده میشوند. -10پردازش تصاویر
-11اینترنت
-12رده بندي داده هاي تحت Web
-13پیدا کردن الگو هاي مشابه دسترسی و سایتها در Web
-14ابزاري براي پیدا کردن توزیع داده ها. -15یک مرحله پیش پردازش براي سایر روشها.
-16تعیین مناطق مشابه از لحاظ معیارهاي تصمیم گیرندگان
-17مدیریت ترافیک: در این مورد، میتوان دو بعد زمان و مکان را به عنوان معیارهاي خوشه بندي مناطقپر ترافیک در نظر گرفت.
-18تعریف جهات جغرافیایی
-3خوشه بندي جدید مکانی توسط تعریف درجه ي عضویت شرقی بودن و شمالی بودن در مقیاس جهانی چون مسئله، به صورت Space-Fixed میباشد - اگر از بیرون به زمین نگاه گردد، زمین در حال گردش است - به دلیل چرخش زمین و جابجایی آن در مدار گردش خود، علاوه بر مکان، زمان نیز اهمیت پیدا خواهد نمود و دو پارامتر زمان و مکان در آن دخالت دارد. پس در این مدل، در مقیاس جهانی، عوامل به صورت مکانی3 و زمانی4 دخیل میباشد. در زیر به دو عامل مذکور پرداخته خواهد شد: