بخشی از مقاله

بررسي کاربرد فنون داده کاوي مکاني در تحليل و استخراج الگوهاي تصادفات جاده اي مبتني بر سيستم اطلاعات مکاني (GIS)

چکيده
امروزه ايمني ترافيک يکي از اولويت هاي اصلي دولت ها است . با توجه به اهميت موضوع ، شناسايي و تشخيص عوامل تصادفات جاده اي به هدف اصلي در جهت کاهش خسارات ناشي از حوادث رانندگي تبديل شده است . از سويي ديگر با رشد نمايي حجم داده ها، تجزيه و تحليل عوامل تأثيرگذار در اين راستا غيرعملي مي گردد. در اين مقاله تقديمي که حاصل نتايج پژوهش ميداني است سعي گرديده تا با بررسي کاربرد و کارايي فنون داده کاوي در پايگاه داده هاي تصادفات جاده اي به شناسايي و کشف الگوهاي پنهان پرداخته شود. نتايج بدست آمده از داده کاوي کمک خواهد کرد تا سازمان هايي نظير راه و ترابري ، حمل و نقل و پايانه ها با کاوش بر روي داده هاي تصادفات ثبت شده در سيستم اطلاعاتي پليس راه ، الگوها و رفتارهاي آينده را کشف و پيش بيني کرده و در جهت کاهش تصادفات تصميمات مؤثري اتخاذ گردد.
کلمات کليدي : تصادف جاده اي ، داده کاوي ، داده کاوي مکاني ، انبارداده ، GIS.

۱. مقدمه
امروزه موضوع تأمين تردد ايمن در سطح شبکه راه هاي درون شهري و برون شهري يکي از اصول اساسي حاکم بر مهندسي راه ، ترافيک و برنامه ريزي حمل و نقل است . عدم وجود ايمني به خصوص در جاده هاي برون شهري باعث بروز حوادث ناگواري مي گردند، هر ساله بيش از ۱ ميليون نفر در سوانح جاده اي کشته مي شوند که ۷۰ درصد آنها مربوط به کشورهاي در حال توسعه مي باشد. آمار تلفات جاده اي در ايران ۲۰ برابر کشورهاي صنعتي و ۵ برابر کشورهاي هم تراز با ايران است و به عبارتي ۲.۵ درصد تصادفات اتفاق افتاده در سطح جهان مربوط به ايران است (۱). همچنين در اين حوادث هزينه هاي بسيار سنگيني به دولت ها تحميل مي شود که اين هزينه ها در کشورهاي در حال توسعه با توجه به درآمد ناخالص ملي اندک اين کشورها باعث ايجاد مشکل در ساير بخش ها مي گردد. تصادفات جاده اي در کشور ما يک تهديد جدي براي حمل و نقل عمومي است ، از سويي ديگر عوامل عملياتي (عملگر) دليل اصلي بيشتر تصادفات هستند و محيط عملياتي جاده نيز در بروز حادثه بي تأثير نيست . مديران سيستم حمل و نقل نيز بايستي در جهت کاهش تصادفات و بهبود وضعيت راه ها، به متوازن کردن نياز ايمني جاده ها با محدوديت هاي منابع مالي موجود نيازمندند.
براي کمک به مديران در انجام تصميم گيري هاي سرمايه گذاري زيرساخت ها مجموعه بزرگي از داده ها جمع آوري مي شوند.از آنجا که اندازه اين پايگاه داده ها از نظر فضايي و زماني به سرعت افزايش مي يابد تحليل و استخراج اطلاعات مفيد از آنها بدون استفاده از ابزارهاي تحليل پيشرفته داده ها به يک چالش تبديل مي شود. داده کاوي يک تکنيک نوظهور در تجزيه و تحليل داده است که در سال هاي اخير به دليل افزايش قابليت جمع آوري و ذخيره داده مورد توجه قرار گرفته است . بين داده ها و اطلاعات همانند خبر و اطلاع رابطه وجود دارد. به بيان ديگر اطلاع حاصل تکامل داده ها است به اين ترتيب بين داده ها و اطلاعات يک شکاف وجود دارد که اندازه اين شکاف با حجم داده ها ارتباط مستقيم دارد. هر چه داده ها حجيمتر باشند، اين شکاف بيشتر خواهد شد و هرچه حجم داده ها کمتر و روش ها و ابزارهاي پردازش داده ها کاراتر باشد، فاصله بين داده ها و اطلاعات کمتر است . امروزه افزايش سريع حجم پايگاه داده ها به شکلي است که توانايي انسان براي درک اين داده ها بدون ابزارهاي پرقدرت ميسر نمي باشد. در اين وضعيت ، تصميم گيري ها به جاي تکيه بر اطلاعات بر درک مديران و کاربران تکيه دارند، چرا که تصميم گيرندگان ابزار قوي براي استخراج اطلاعات باارزش را در اختيار ندارند. مدل هاي آماري در تحليل تصادفات جاده اي براي بيان روابط بين نقش تصادفات و فاکتورهاي محيطي و هندسي بطور گسترده مورد استفاده قرار مي گيرند. با اين حال مشکلات خاصي از قبيل افزايش نمايي در تعداد پارامترها (افزايش تعداد متغيرها) و عدم اعتبار آزمون هاي آماري ناشي از داده هاي پراکنده در جداول احتمالي بزرگ در تحليل آماري سنتي روي مجموعه داده هاي با ابعاد بالا به وجود مي آيد. اينجا جايي است که داده کاوي وارد ميدان مي شود. در اين مقاله به بررسي فنون مختلف داده کاوي پرداخته مي شود و روند کلي در مورد استفاده از فنون مختلف داده کاوي در جهت شناسايي و کشف الگوهاي پنهان در پايگاه داده هاي تصادفات جاده اي ارائه مي شود. طبق نتايج حاصل ، داده کاوي کمک مي کند تا سازمان هايي نظير راه و ترابري ، حمل و نقل و پايانه ها با کاوش بر روي داده هاي تصادفات ثبت شده در سيستم پليس راه ، الگوها و رفتارهاي آينده را پيش بيني کرده و در جهت کاهش تصادفات تصميمات مديرانه تري اتخاذ گردد.
۳. داده کاوي و کشف دانش
به طور رسمي اصطلاح داده کاوي براي اولين بار توسط فيياد۱ در اولين کنفرانس بين المللي "کشف دانش و داده کاوي " در سال ۱۹۹۵ مطرح شد(۲).
داده کاوي يک رشته نسبتاً جديد علمي مي باشد که از انجام تحقيقات در رشته هاي آمار، يادگيري ماشين ، مصورسازي داده و به خصوص پايگاه داده ها شکل گرفته است (۳). داده کاوي و کشف دانش در پايگاه داده ها۲ به فرآيند تحليل مجموعه داده هاي حجيم اشاره دارد. طبق تعريفي که هند و همکارانش (۲۰۰۱) ارائه دادند، داده کاوي به عنوان تحليل مجموعه داده هاي مشاهده شده (اغلب بزرگ ) براي پيدا کردن روابط پنهان است که داده را براي مالکان داده با روش هاي جديدي که هم قابل فهم و هم مفيد است خلاصه مي کند(۴). داده کاوي فرآيند استخراج اطلاعات (قوانين و الگوها) ضمني ، غيربديهي ، از قبل ناشناخته و بالقوه مفيد از داده ها در پايگاه داده است (۵). تعاريف متنوعي از داده کاوي در مراجع مختلف ارائه شده است اما تعريفي که در اکثر مراجع به اشتراک ذکر شده عبارت است از "استخراج اطلاعات و دانش و کشف الگوهاي پنهان از پايگاه داده هاي بسيار بزرگ و پيچيده ".
داده کاوي شامل مراحل مختلفي مي باشد که اين مراحل به صورت زير تفکيک مي شوند : تعيين اطلاعات گذشته ، تميزکردن داده و پردازش اوليه ، ساخت انبارداده ، انتخاب مجموعه داده هاي هدف ، يافتن ويژگي هاي مورد استفاده و تعيين ويژگي هاي جديد، نمايش داده ها، انتخاب عمليات داده کاوي (دسته بندي ، خوشه بندي ، پيش بيني ، وابستگي و غيره )، استخراج الگو، ارزيابي و تحليل الگوي به دست آمده و حذف الگوهاي نامناسب ودر آخر تفسير نتايج داده ها و استنتاج از اطلاعات باارزش . کارهاي اصلي داده کاوي به روش توصيفي و روش پيش بيني تقسيم مي شود(۳). مدل هاي توصيفي براي يافتن الگوها و قوانين قابل تفسير توسط انسان استفاده مي شوند که داده را بهتر تشريح مي کنند. تحليل خوشه ۳، تخمين تراکم و روش هاي مدلسازي وابستگي ، روش هاي توصيفي مورد استفاده در داده کاوي هستند. روش هاي پيش بيني ، برخي متغيرها را براي پيش بيني مقادير ناشناخته ديگر متغيرها استفاده مي - کنند. تکنيک هاي پيش بيني کننده در داده کاوي که از روش هاي دسته بندي ۴ يا رگرسيون استفاده مي کنند، شامل شبکه هاي عصبي ، درخت هاي تصميم - گيري و دسته بندي کننده هاي بيز است . تحليل داده هاي تصادف با استفاده از فنون داده کاوي مورد توجه بسياري از محققان قرار گرفته است که اغلب نتايج با توجه به شرايط اجتماعي -اقتصادي و زيرساخت هاي محل متفاوت بوده اند.
۴. داده کاوي مکاني
داده کاوي مکاني فرايند کشف الگوهاي مکاني مفيد ولي در عين حال ضمني از پايگاه داده هاي حاوي اطلاعات مکاني است . با توجه به حجم عظيم داده هاي به دست آمده از تصاوير ماهواره اي و سيستم هاي اطلاعات مکاني (GIS)، سامانه هاي سنجش از راه دور و ساير ابزارهاي جمع آوري داده ها، گسترش ابزارهاي کشف دانش از پايگاه داده هاي مکاني را به يک امر مهم تبديل نموده است . ابزارهاي کارا براي استخراج اطلاعات از مجموعه داده - هاي مکاني براي سازمان هايي که مجموعه داده هاي بزرگ مکاني را توليد و مديريت مي تواند بسيار مهم باشند. پيشرفت هاي موجود در زمينه ساختمان - هاي داده مکاني و پايگاه داده هاي مکاني ، به همراه توسعه روش هاي داده کاوي و ساخت انبار داده ها، زمينه را براي پيدايش داده کاوي مکاني ايجاد مي - کند. داده هاي فضايي با دو خصوصيت هندسي و مکاني قابل توصيف هستند که در زمان استفاده از روش هاي استخراج دانش باعث مشکلاتي مي - شوند(۶). با اين حال استفاده از روش هاي معمول داده کاوي روي مجموعه داده هاي مکاني به دليل وابستگي هاي مکاني ، ضعيف عمل مي کنند. وابستگي مکاني به ويژگي اطلاق مي شود که برخي صفات در برخي نقاط در فضا با يکديگر مرتبط باشند(۷).
۵. ساخت انبار داده
انبارداده ، مخزني از اطلاعات موضوع گرا، مجتمع ، غيرفرار و وابسته به زمان است که براي پشتيباني از تصميم گيري هاي مديريتي مورد استفاده قرار مي - گيرد(۸). انبارداده ها شامل مقدار زيادي از اطلاعات هستند که از منابع مختلف و مستقل جمع آوري شده اندو اغلب به صورت جدا از پايگاه داده عملياتي نگهداري مي شوند که به منظور تسهيل پردازش پرس وجوهاي کاربران طراحي شده است . انبارداده ، داده هاي دلخواه را از يک يا چند منبع جمع آوري کرده و آنها را به موضوعاتي با گروه هاي اطلاعاتي تبديل مي کند، سپس آنها را به همراه اطلاعات زمان و تاريخ براي پشتيباني بهتر از تصميم گيري ها ذخيره مي کند. اين سيستم ها ديدهاي متعددي از اطلاعات براي طيف هاي مختلف کاربران فراهم مي کند، قدرت اين مفهوم در آن است که به کاربران اجازه تحليل ها و پرس وجوهاي متعدد بر روي داده هايي را مي دهد که قبل از آن هيچ ارتباطي با هم نداشتند. در گذشته پايگاه داده هاي عملياتي براي "پردازش تراکنشي برخط ۱ " بهينه سازي شدند که تراکنش ها بطور معمول کوچک هستند و بر اساس کليد اصلي به تعداد کمي از رکوردها دسترسي دارند. در واقع پايگاه داده هاي عملياتي اطلاعات حالت فعلي را نگهداري مي کنند و عملياتي که بر روي اين نوع پايگاه داده ها صورت مي گيرد عموماً شامل عمليات بهنگام سازي است . در حالي که انبارداده ها اطلاعات تاريخي ، خلاصه شده و يکدست شده را نگهداري مي کنند و براي "پردازش تحليلي برخط ۲" طراحي شده اند و عمل خواندن از انبار، عمده عمليات قابل اجرا بر روي انبارداده را تشکيل مي دهد.داده ها در انبارداده براي تسهيل انجام عمليات موتورهاي پرس وجو براي OLAP، اغلب به صورت فضاي چندبعدي مدل مي شوند که پرس وجوها، داده ها را در ابعاد مختلف براي تشخيص روندها و ناهنجاري ها متراکم مي کنند(۹). ابزار قدرتمند و معمول کاربردي OLAP براي خلاصه داده هاي چندبعدي ،" مکعب داده ۳ " است . مکعب داده عملگري است که مجموعه تواني همه تراکم هاي ممکن معيار خاصي را با توجه به ابعاد مورد توجه برمي گرداند(۱۰).
انبارداده هاي مکاني مانند انبارهاي داده ترافيک و حمل و نقل شامل داده هاي جغرافيايي ، يعني تصاوير ماهواره اي و عکسبرداري هوايي و داده هاي غيرمکاني هستند. تفاوت اصلي انبارداده هاي مرسوم با انبارداده هاي مکاني در اين است که نتايج OLAP انبارداده هاي معمول اغلب به صورت جداول خلاصه شده يا صفحه گسترده هايي از متن يا عدد مي باشند در حالي که در مورد انبارداده هاي مکاني ، نتايج ممکن است مجموعه اي از نقشه ها باشد. در شکل ۱ ماژول هاي اصلي داده کاوي و روند کلي کشف دانش با توجه به داده هاي مکاني و غير مکاني نشان داده شده اند. همانطور که مشاهده مي کنيد نقشه هاي پايه و داده هاي تميزسازي شده و عمليات تبديل روي آنها انجام شده و به داخل انبارداده بارگذاري مي شوند که ديدهاي چندبعدي و عمليات
OLAP براي انواع ابزارهاي تحليل داده کاوي از قبيل دسته بندي ، خوشه بندي و قوانين وابستگي ارائه مي دهد. سپس الگوها يا قوانين کشف شده بصورت نقشه ، جداول ، نگاره ها يا نمايش بصري نشان داده مي شوند.

شکل ۱ - روند کلي جريان داده و ماژول هاي داده کاوي

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید