بخشی از مقاله
چکیده :
تناظریابی به شناسایی عوارض با ماهیّت یکسان در مجموعه دادههای مختلف گفته میشود. در تحقیق حاضر با تمرکز بر عوارض خطی و انتخاب رودخانهها به عنوان مطالعه موردی، شناسایی عوارض متناظر در دو مجموعه داده با مقیاسهای 1:25000 و 1:50000 و تولید شده از منابع تهیه متفاوت صورت گرفته است. در تحقیق حاضر با در نظر گرفتن معیارهای هندسی نظیر فاصله، جهت، مساحت، شکل و ناحیه مشترک بین حریم و همچنین در نظر گرفتن ادراک مکانی کارشناسان در تعیین درجه اهمیت هریک از معیارها، درجه شباهت عوارض محاسبه میگردد. علاوه بر موارد فوق، در راهکار ارائه شده تمام روابط بین عوارض شامل یک به هیچ، هیچ به یک، یک به یک، یک به چند، چند به یک و چند به چند در نظر گرفته میشود. نتایج نشان میدهد که روش پیشنهادی با محاسبه مقداربرابر 98/61 درصد به خوبی عوارض متناظر را شناسایی میکند.
واژههای کلیدی : تناظریابی، معیارهای هندسی، مجموعه دادههای چندمقیاسی، رودخانهها.
-1 مقدمه
تناظریابی به شناسایی عوارض با ماهیّت یکسان در مجموعه دادههای مختلف گفته میشود .[1] با توجه به انواع مدل دادههای برداری و شبکهای، تناظریابی نیز به انواع مختلفی نظیر تناظریابی بردار-شبکه، بردار-بردار و شبکه-شبکه تقسیم میگردد. منتهی تحقیق حاضر با تمرکز بر تناظریابی بردار- بردار و با تأکید بر دادههای رودخانه ارائه شده است. شناسایی عوارض متناظر در مجموعه دادههای مختلف میتواند کاربردهای مختلفی داشته باشد که ضرورت تناظریابی را نشان میدهد. همچنین تناظریابی کاربردهای مستقیم و غیر مستقیم در تلفیق، ارزیابی کیفیت، یکپارچهسازی دادهها و مدیریت دادهها دارد، منتهی در بسیاری از تحقیقات انجام شده تا به امروز [17-2]، هدف اصلی تناظریابی یکپارچهسازی مجموعه دادههای مختلف ذکر شده است.
در علوم مکانی تمایل به یکپارچهسازی مجموعه دادههای مکانی مختلف در حال افزایش میباشد. در بین مجموعه دادههای مکانی مختلف میتوان به محبوبیت دادههای مکانی داوطلبانه - 1VGI - در کنار مجموعه دادههای رسمی و همچنین گسترش پیادهسازی زیر ساخت اطلاعات مکانی اشاره نمود. در تحقیقات مختلف تناظریابی عوارض را به عنوان هسته مرکزی یکپارچهسازی دادهها در نظر گرفتهاند [.18]مخصوصاً با توجه به افزونگی داده در وضعیت امروزی، برخی از محققین این فرایند را مرتبط با "کلان داده"2 دانستهاند که تناظریابی دستی بین پایگاههای داده مکانی را غیر عملی توصیف کردهاند .[19 ,18] در تحقیقی که توسط Kang و همکاران - 2015 - ، بیان شده است که برای تناظریابی دستی 4000 عارضه خطی به میزان 90 ساعت زمان صرف شده است [.20]از این رو اهمیّت هر چه بیشتر ارائه روشهای تناظریابی نمایان است.
علاوه بر یکپارچهسازی مجموعه دادهها، در تحقیقات دیگری نظیر Saalfeld در سال 1993، Hastings در سال 2008، Li و Goodchild در سال 2011، Song و همکاران - 2011 - ، Pourabdollah و همکاران - 2013 - ، Touya و همکاران - 2013 - ، Tong و همکاران - - 2014، Yang و همکاران - - 2014 و Zhang و همکاران - 2016 - از تناظریابی با هدف غنیسازی مجموعه دادههای مختلف استفاده شده است که منجر به تلفیق مجموعه دادهها گردیده است .[30-21] همچنین تعدادی از تحقیقات از تناظریابی به عنوان ابزاری برای ارزیابی کیفیّت دادهها استفاده کردهاند. Brunz و Egenhofer در سال 1996 و Sheeren و همکاران - 2009 - برای ارزیابی ناسازگاری [32 , 31]، Seo و Ohara در سال 2009، Lendinez و همکاران - 2012 - ، Abdolmajidi و همکاران - 2014 - ، Abdolmajidi و همکاران - 2015 - و Fan و همکاران - 2016 - برای بررسی صحّت مکانی [36- 33 ,12]، Ludwig و همکاران - 2011 - ، Koukolrtsos و همکاران - 2012 - ، Abdolmajidi و همکاران - 2015 - برای ارزیابی کامل بودن [38 ,37 ,35] و Fan و همکاران - 2014 - و Caoهمکاران - 2016 - برای ارزیابی صحت اطلاعات توصیفی استفاده کردند .[40 ,39]
تحقیقاتی نظیر Wingaarden و همکاران - 1997 - ، Haunert و Sester در سال 2005، Mustiere و همکاران - 2008 - ، Wang و - 2009 - Wei و Wang همکاران - 2015 - از تناظریابی برای به روز رسانی دادهها و Mackaness و Mackechine در سال 1999 و McintoshYuan در سال 2005 برای شناسایی تغییرات استفاده نمودند 41 ,8]، 42، 43، 44، 45 و .[46در حالت کلی جهت تناظریابی عوارض سه خصوصیت هندسی، توپولوژیکی و معنایی در نظر گرفته میشود که بر اساس آنها میزان مشابهت عوارض به یکدیگر جهت شناسایی عوارض متناظر سنجیده میشود [41]، اما در برخی مسائل امکان دسترسی به معیارهای معنایی وجود ندارد و یا اینکه در مجموعه دادههای با تعداد عوارض بالا به دلیل زمان بالای محاسبات، نیاز است تا حداقل معیارها در نظر گرفته شود.
از این رو تحقیق حاضر با در نظر گرفتن معیارهای مرتبط با هندسه عوارض به شناسایی عوارض متناظر در مجموعه دادههای خطی با تمرکز بر رودخانهها میپردازد.در راهکار ارائه شده سعی شده است با در نظر گرفتن معیارهایی هندسی نظیر فاصله، جهت،مساحت، شکل و ناحیه مشترک بین حریم درجه شباهت عوارض محاسبه گردد. دلیل استفاده از معیارهای هندسی این است که در تمامی مجموعه دادهها امکان دسترسی به این معیارها وجود دارد و نیاز به داده اضافهای به جز هندسه عارضه مورد نظر نمیباشد.ادامه این تحقیق به شرح ذیل است: پس از مقدمه در بخش 2 چارچوب پیشنهادی ارائه و جزئیات مورد استفاده تشریح میگردد. در بخش 3 ضمن تشریح منطقه مورد مطالعه، چارچوب پیشنهادی بر روی این منطقه اعمال و نتایج مورد بررسی قرار میگیرد. در انتها نیز در بخش 4 نتیجه گیری و پیشنهادات ارائه میگردد.
-2 راهکار پیشنهادی
جهت تناظریابی رودخانهها در مجموعه دادههای با مقیاس و منبع تولید متفاوت راهکاری مطابق با شکل - 1 - ارائه شده است. برای تفسیر هریک از مؤلفههای شکل - 1 - نیاز است تا دو مفهوم " عارضه مرجع" و "عوارض کاندید" تشریح گردد . عارضه مرجع به هر یک از عوارض در مجموعه داده اول گفته میشود که هدف شناسایی عوارض متناظر برای آنها در مجموعه داده دوم میباشد. عوارض کاندید نیز به تعدادی از عوارض در مجموعه داده دوم گفته میشود که هدف استخراج عوارض متناظر با عارضه مرجع از بین آنهاست. در ادامه هریک از مراحل راهکار پیشنهادی تشریح میگردد.
-1-2 پیش پردازش
برای تناظریابی مجموعه دادههای با مقیاس و منابع متفاوت، در ابتدا نیاز است که یک مرحله پیش پردازش بر روی مجموعه دادهها صورت گیرد. از آنجائیکه ممکن است دو مجموعه داده در دو قالب متفاوت باشد، در ابتدا هر دو مجموعه داده تبدیل به قالب یکسان میشوند. همچنین ممکن است دو مجموعه داده دارای سیستم مختصاتهای متفاوتی از یکدیگر باشند، از این رو نیاز است تا هر دو مجموعه به یک سیستم مختصات تبدیل گردند. در انتها نیز برای کاهش خطاهای سیستماتیک در مجموعه دادهها، خطاهای توپولوژیک حذف میگردند.
-2-2 شناسایی عوارض کاندید برای عارضه مرجع
در این مرحله برای عارضهای نظیر PL حریمی به فاصله β در نظر گرفته میشود و در صورتیکه عوارض کاندید در این محدوده شناسایی نگردند فاصله β افزایش مییابد.این الگوریتمی مقادیری را به عنوان بیشترین فاصله رشد و گامهای رشد در نظر میگیرد. برای مثال در شکل - 5-2 - برای عارضه PL در مجموعه داده اول، در ابتدا حریمی به فاصله 10 متر زده میشود. در این فاصله عوارض کاندید در مجموعه داده دوم شناسایی نمیگردد، از این رو فاصله