بخشی از مقاله
چکیده
امروزه سیستمهای حملونقل نقش مهم و حیاتی را در زندگی مردم و اقتصاد کشورها دارند . این سیستمها در طول زمان بر اساس بهرهبرداری و شرایط آبوهوایی فرسوده شده و نیاز به عملیات تعمیر و نگهداری دارد. اطلاعات توصیف یک شی در پایگاه داده روسازی شامل دادههای مکانی و غیرمکانی میشود. بنابراین گفته میشود که داده مکانی بطور کلی شامل دو ویژگی اساسی میشود، خواص هندسی و خواص توپولوژیکی. مشخصات هندسی میتواند موقعیت مکانی - برای مثال مختصات جغرافیایی - ، منطقه یا سطح، محیط یا فضای احاطه کننده، حجم و غیره باشد. در عین حال، مشخصات هندسی میتواند مجاور، داخل، سمت چپ و راست، جهت و خلاف عقربههای ساعت و غیره باشد. یک پایگاه داده مدیریت جاده آسفالته در حقیقت دارای ویژگیهای زیادی است که از آنها برای توضیح ویژگیهای مختلف جاده آسفالته برای کاربردهای مختلف استفاده میشود. این بدان معناست که برخی از ویژگیها در پایگاه داده مدیریت آسفالته در حقیقت در تصمیم برای نوسازی جاده آسفالته مداخله نمیکنند. یعنی این ویژگیها ممکن است به تصمیمگیری برای حفظ و مرمت جاده آسفالته ربطی نداشته باشند. کاربردهای این ویژگیهای بیربط ممکن است باعث اثرات منفی برحمایت از تصمیم جاده آسفالته شوند. یکی از اهداف این پژوهش، حذف ویژگیهای بیربط برای به دست آوردن یک درخت تصمیم قابلتعبیر و صحیح میباشد.
مقدمه
در یک پایگاه داده سنتی - مرسوم - توصیف یک موضوع معمولا فقط با استفاده از دادههای غیرمکانی صورت میگیرد یعنی بدون داده مکانی. دادههای غیرمکانی میتوانند ذخیره و با استفاده از یک پایگاه داده وابسته - رابطهای - مدیریت شوند که یک مشخصه از یک شی ارتباط مکانی ندارد. یک پایگاه داده راه آسفالته یک نوع پایگاه داده فضایی است. روشهای اولیه برای استخراج دادههای فضایی بر پایگاه داده فضایی تمرکز میکنند که اشیاء فضایی ارائه شده توسط دادههای فضایی، دادههای غیرفضایی و روابط فضایی را ذخیره میکند. علاوه بر استخراج دانش نهان، الگوی فضایی و اطلاعات، استخراج دادههای فضایی یا کشف دانش و نیز استخراج رابطههای فضایی نامشخص است که در پایگاههای داده فضایی آشکارا ذخیره نشدهاند. همچنین بیشتر مطالعات استخراج دادههای فضایی بر پایگاههای داده رابطهای و تبادلی تمرکز میکنند. روشها تلاش میکنند تا تکنیکهای کامل را مثل یادگیری ماشین، پایگاههای داده و آمار را ترکیب کنند.[1]
داده اولیه در حملونقل
سیستم اطلاعات جغرافیایی بعنوان یک سیستم سختافزاری کامپیوتر، نرمافزار و روشهای طراحی شده برای پشتیبانی جذب، مدیریت، انجام با مهارت، طراحی، مدلسازی و نمایش دادههای فضایی اشاره شده برای حل طرحهای پیچیده و مدیریت بحران تعریف میشود. مشخصههای اصلی دادههای بدست آمده از ٌGIS، پتانسیل ایجاد ارتباط اطلاعات فضایی با موقعیتهای جغرافیایی برای موارد زیر است:[2]
· مدیریت اطلاعات جغرافیایی مرجع برای ادغام پایگاه داده و نرمافزار نقشهبرداری.
· ارائه ابزاری برای تجزیه و تحلیل روابط فضایی بین رویدادها یا پدیدهها.
· اجازه دیدن، فهمیدن، سوال کردن، تفسیر کردن و تجسم داده در بسیاری از جهات، مشخص کردن روابط، الگوها æ روند آن در قالب نقشهها، گزارشها و نمودارها به ما بدهد.
· با تمامی چهارچوب سیستم اطلاعاتی سازمانی یکپارچه و متحد باشد.
معادلات GIS در ارتباط با دو نوع اساسی از دادهها، دادههای برداری و دادههای شطرنجی میباشد که هر دو نوع به یک سیستم مختصات جغرافیایی اشاره میکند. داده کاوی و معماری آن دادهکاوی فرآیند استخراج اطلاعات مفید پنهان از منابع بزرگ داده به منظور یافتن الگوهای جدید و مفید که ممکن است ناشناخته باقی بمانند میباشد. دادهکاوی به یک ابزار و تکنولوژی قدرتمند تبدیل شده است برای:
· پیدا کردن الگو و اطلاعات پیشبینی شده، روند و رفتار آینده که کارشناسان ممکن است اشتباه کنند.
· به تصمیم گیرنده اجازه میدهد تا تصمیم فعالانهتر و دانش محور را بگیرد.
· ایجاد تجزیه تحلیلهای آیندهنگر و قابل تفسیر که فراتر از ابزارهای ارائه شده در گذشته هستند، مانند
سیستمهای پشتیبانی.
در پاسخ به این مشکل که دادهکاوی بطور سنتی بسیار پر زحمت و زمان بر است، مطابق شکل 1، معماری پایه دادهکاوی شامل جمعآوری دادهها، انتخاب، تبدیل، کاوش، تفسیر و کشف دانش ارائه شده است. نقطه آغاز یک منبع داده است که در آن مشخصه دادهها و یا مختصات دادههای مختلف جمعآوری شده بایگانی میشوند و سیستمهای گوناگون مرتبط پایگاه داده را بیشتر مدیریت میکند. تکنولوژی دادهکاوی برای تحلیل این دادهها در منبع دادهها با استفاده از الگوریتمهای کاوش یکپارچه میشود. دانش کشف شده در آخرین مرحله برای بهبود کل فرآیند ارائه شده است. گزارش، تجسم و دیگر ابزارهای تجزیه و تحلیل میتوانند برای برنامهریزی اقدامات آینده و تایید تاثیر آن برنامه مورد استفاده قرار گیرند. همانطور که در شکل1 دیده میشود، فرآیند تکنولوژی دادهکاوی یک سری دگرگونی مراحل در دادهها از پیشپردازش به پسپردازش نتایج دادهکاوی است. دادههای ورودی میتواند در فرمتهای مختلف باشند - برای مثال، فایلهای مسطح، صفحات گستره و یا جداول مرتبط - و در یک منبع داده ذخیره شود. پیشپردازش، شامل ترکیب دادهها از منابع متعدد، با پیش اطلاعات و حذف مشاهدات تکراری و سوابق انتخاب و ویژگیهایی که مرتبط با وظیفه دادهکاوی هستند میشود، بطوریکه دادههای خام میتوانند در قالب مناسب برای تحلیلهای دادهکاوی بعدی تبدیل شوند. مرحله پسپردازش به منظور حذف نتایج نامعتبر دادهکاوی مورد نیاز است، بطوریکه تنها نتایج معتبر و مفید در سیستم پشتیبانی تصمیمگیری ثبت میشوند. الگوریتم پسپردازش شامل اقدامات آماری، روشهای آزمایش فرضیه و غیره میباشد. برای اصلاح دادهها میتوان از یک مدل مانند »بستن حلقه« برای تصمیم نهایی که بهینه و مطلوب بودن آن امکانپذیر خواهد بود اطمینان حاصل نمود، چون اطلاعات استخراج شده از منابع دادهها میتوانند بصورت بازگشتی بازیافت و اصلاح شوند.[3]
دادهکاوی و یافتن اطلاعات
کشف دانش - - KD2 شامل انبار کردن دادهها، انتخاب داده هدف، اصلاح، پیشپردازش، تبدیل و سادهسازی، دادهکاوی، انتخاب مدل، ارزیابی و تفسیر و استفاده از دانش استخراج شده میباشد. دادهکاوی یک بخش جداییناپذیر کشف دانش در پایگاههای اطلاعاتی است. اهداف دادهکاوی توسعه الگوریتمهایی برای استخراج الگوهای جدید و مفید از پایگاه دادهای که در آن متخصصان ممکن است خطا کنند میباشد، در حالیکه اهداف کشف دانش قادر ساختن یک سیستم اطلاعاتی برای تبدیل اطلاعات به دانش از طریق آزمایش و فرض و شکلگیری نظریه میباشد.[2]