بخشی از مقاله
چکیده
نرخ بالاي بروز تخلفات ورود به محدوده طرح ترافیک شهر تهـران، نـه تنهـا علـت مهـم بـروز حـوادث ترافیکی در مناطق مرکزي تهران است بلکه اثر بازدارنده این طرح بر کاهش تردد خودروها و آلـودگی فزایندة هوا را بیاثر میکند. سیستم مکانیزه ثبت تخلفات منـابع اطلاعـاتی مناسـبی بـراي بررسـی و تحلیل رفتارهاي ترافیکی وسایل نقلیه در اختیار برنامهریزان قـرار مـیدهـد. در ایـن تحقیـق، دانـش دادهکاوي براي کشف قوانین پنهان در دادههـاي مربـوط بـه خودروهـاي متخلـف ورودي بـه یکـی از پرترددترین معابر ورودي به محدوده طرح ترافیک تهران، جهت بررسی عوامل موثر بر نـرخ ورودهـاي غیرمجاز و پیش بینی تردد تخلفـات در محـدودههـا بکـار گرفتـه شـده اسـت. بـا اسـتفاده از رویکـرد خوشهبندي، ساعات تردد در روزهاي مختلـف بـه 5 خوشـه همگـن تقسـیم شـدهانـد. ضـمن مطالعـه ویژگیهاي هر خوشه، مدلی بر اساس شبکه عصبی مصنوعی جهت پیشبینی خوشههـاي پرتخلـف (بـا تردد غیرمجاز زیاد) بر پایه مشخصات تقویمهاي قمري و شمسی و شرایط جوي توسعه داده شده است که با دقت 87 درصد وضعیت ترددهاي غیرمجاز بـه محـدوده طـرح را در روزهـاي آینـده پـیشبینـی میکند. با استفاده از این مدل میتوان برنامههاي بازدارنده کاهش تخلفات را ساماندهی نمود.
کلید واژه: دادهکاوي، پیشبینی، خوشهبندي، محدوده طرح ترفیک، تردد ورودهاي غیرمجاز
1
-1 مقدمه
ترافیک از نقطه نظر آسیبشناسانه در تهران، یعنی آلودگی محیط زیست، اتلاف انرژي، آسیب زدن بـه وسایل حمل و نقل، اخلال در زندگی شهري، هدر دادن وقت شهروندان و بطورکلی ایجاد مشکل بـراي ساکنین این کلانشهر. ترافیک سنگین و آلودگی هواي ناشی از تردد فزایندة وسـایل نقلیـه در شـبکه معابر شهر تهران، مدیریت شهري را بر آن داشته تا با اعمال تـدابیر ویـژه از شـدت ایـن معضـلات و چالشها بکاهد. از این رو تنظیم جریان تردد خودروها در محدوده مرکزي شهر و جلوگیري از ایجـاد ترافیک در این مناطق، یکی از مسائل عمده در مدیریت حمل و نقل شهري به حساب میآید که براي حل آن راهکارهاي مختلفی پیشنهاد میشود. یکی از این راهکارها که در بسیاري از شهرهاي بـزرگ
دنیا خصوصاً پایتختهاي جهان بکار گرفته میشود، اعمال محدودیتهاي رفت وآمـد در مراکـز و یـا معابر پر رفت وآمد شهري است. این روش در بسیاري از شهرهاي شـلوغ کشـورهاي مختلـف اعـم: از سنگاپور، لندن، آتن، سانتیاگو، بوگوتا، سائوپائولو، مکزیکوسـیتی، ادینبـورگ، مـیلان، جنـوا، اوکلنـد، کپنهاگ، هلسینکی، استکهلم، ترندهم، اسلو، نیویورك و تهران ...در گذشته انجـام شـده و یـا تحـت بررسی و اجرا میباشند .[1] با توجه به مزایاي ایجـاد محـدودههـاي طـرح ترافیکـی، در شـهر تهـران محدوده مرکزي این کلان شهر به عنوان محدوده ترافیکی در نظر گرفته شده اسـت. امـا بـا توجـه بـه محدودیتهاي زمانی ورود به این محدوده، تعدادي افراد قانونشکن با ورود غیرمجاز به محـدوده عـلاوه بر برهم زدن نظم و انضباط ترافیکی، موجب عدم تحقق اهـداف ایـن طـرح شـدهانـد. در ابتـدا، شـیوه کنترل این قانون شکنان بر اساس مراقبـت حضـوري عوامـل انتظـامی و مـأمورین مسـتقر در مبـادي ورودي به محدوده طرح ترافیک پایهریزي شده بـود و ایـن عوامـل موظـف بودنـد از ورود خودروهـاي غیرمجاز به محدوده طرح جلوگیري نمایندو مطابق مقررات با متخلّفین برخورد نمایند. ولـی بسـیاري از رانندگان به دلیل عدم توانایی کنترل پلیس، بطور غیرمجاز وارد محدوده طـرح ترافیـک مـی شـدند. جهت حل این معضل، سیستم مکانیزهثبت تخلّفات ورود به محدوده طرح پیشنهاد شد که بـا اجـراي این طرح علاوه بر کاهش تعداد نیروهاي انسانی پلـیس، تعـداد تخلفـات راننـدگان بطـور واقعـی ثبـت میشد. استفاده از سیستم مکانزهی ثبت تخلّفات، پایگاه مناسبی از دادههايتخلّفـات ایـ ن راننـدگان و نرخ ورود آنها فراهم آورده است که میتوانند مبناي تحلیل و شناخت رفتـار آنهـا باشـد. همچنـین بـا تحلیلعوامل تاثیرگذار بر نرخ تخلّفات ورود به محدوده طرح ترافیک و پیشبینیتعداد تخلّفـات ورود به این محدوده از هر معبر ورودي، برنامههاي کنترلیکاهش تخلّفات، هدفمند خواهد شـد. دادهکـاوي رویکرد کاوش در دادههاي زیاد و کشف قوانین پنهان در دادهها میباشد. یکی از مهمترین کارکردهاي
2
دادهکاوي پیشبینی است که میتواند در پیشگیري جرائم راهنمایی و رانندگی مثمر ثمر واقع شـود و در نهایت منجر به استخراج قواعدي شوند که مبناي تصمیمگیري کنترل ترافیک شهر تهران باشند. در این پژوهش، دادههايتخلّفات ورود به محدوده طرح ترافیک در یکی از معابر ورودي به ایـن طـرح مورد مطالعه قرار گرفته است. با استفاده از رویکرد خوشهبندي (یکی از روشـهاي دادهکـاوي)، سـاعات مختلف از روزهاي مختلف سال بر اساس متغیر تردد غیرمجاز به گروههاي متفاوت با رفتارهاي مشـابه تقسیمبندي شدهاند. تعیین ساعتی از روزهاي مختلف سالکه تردد تخلّفـات بیشـتر از سـاعات دیگـر میباشد و حتی پیشبینی ساعاتی از روزهاي آتی که پیک تردد غیرمجـاز مـیباشـد بـه برنامـهریـزان امکان تمرکز نیروهاي پلیس و تخصیص منابع جهت کاهش تخلّفات را میدهـد. در ایـن مقالـه ضـمن خوشهبندي ساعات مختلف روز و تعیین پیک تخلفات و همچنین تعیین عوامـل مـوثر بـر پـیشبینـی خوشههاي تردد، با توسعه مدلی مبتنی بر شبکه عصبی مصنوعی پـیشخورانـد اقـدام بـه پـیشبینـی ساعات پیک تخلفات در آینده شده است تا باحضور پلیس و اعمال تدابیر کنترلی دیگر در این سـاعات (نه تمامی ساعات روز) آمار تخلفات در این حوزه کاهش یابد.
-2 پیشینه تحقیق
دادهکاوي در مسائل مرتبط با پلیس به عنوان یکـی از کـاراترین ابزارهـا در زمینـه تجزیـه و تحلیـل اطلاعات و دادههاي پلیسی بطور ویژه مورد توجه قرار گرفته است. بخشی از تحقیقات پیشین در حوزه استفاده از رویکرد دادهکاوي در شناسایی و پیشگیري جرایم بـوده اسـت. در ایـن حـوزه مـیتـوان بـه تحقیق کراپسیوگلو و اردوگان در مورد خصوصیات جمعیت شناختی و اخلاقی مجرمینی کـه دوبـاره مرتکب جرم شـدهانـد، اشـاره کـرد .[2] چونـگ و همکـاران [3] و مـون و همکـاران [4] مـروري بـر کابردهاي دادهکاوي در تحلیل جرایم رایانهاي و پیشبینی این نوع جرایم داشتهاند. لی و همکاران یک مدل پشتیبان تصمیم بر اساس تکنیک فازي سام1 براي تشخیص و تحلیل الگوها و روندهاي موجـود در وقوع جرائم ارائه نمودند .[5] اما برخی دیگر از تحقیقات در این حوزه، به کاربردهاي دادهکـاوي در حوزه حمل و نقل و تحلیلرفتار متخلّفین راهنمایی و رانندگی و پیشبینـی و پیشـگیري از ایـن نـوع جرائم اشاره دارد. ماسیجسکی و لیپنیکی از تکنیکهـاي دادهکـاوي بـراي تجزیـه و تحلیـل دادههـاي پایگاه مانیتورینگ سیستمهاي حمل و نقل استفاده نمـودهانـد.[6] یانـگ وتُنـگ دادهکـاوي را جهـت استنباط اطلاعات ترافیکی مهم از دادههاي ترافیکی زمان واقعی به کار گرفتند تا اطلاعات ناشناخته را در دادههاي ترافیک کشف کنند.[7] ژانگ و همکاران با تحلیل دادههاي حـوادث در سیسـتم حمـل و
1 Fuzzy SOM (FSOM)
3
نقل ریلی چین به کمک روشهاي دادهکاوي اقدام به کشف دانش در این نوع دادهها نمـوده اسـت .[8] رحمان و همکـاران کاربردهـاي دادهکـاوي در صـنعت حمـل و نقـل را بررسـی نمودنـد و بـه مزایـاي تکنیکهاي دادهکاوي در این صنعت اشاره داشته اند.[9] همچنین تعـدادي از محققـین بـه پـیشبینـی متغیرهاي ترافیکـی بـر اسـاس داده هـاي جمـعآوري شـده در سیسـتمهـاي حمـل و نقـل هوشـمند پرداختهاند. ونگ و همکاران مدلی بر اساس دادههاي این سیستمها جهت پیشبینی ترافیک پویا ارائـه دادهاند.[10] گانگ و لیو با پیشبینی تـردد در ورودیهـاي یـک تونـل در شـانگهاي اقـدام بـه توسـعه الگوریتمی به نام DMTDCA2 به منظور تنظـیم جهـت ترافیـک خیابـانهـاي چنـد جهتـه پیشـنهاد کردند.[11] کانستنتینسکو و همکاران با استفاده از تکنیک دادهکاوي، روش رانندگی با وسـایل نقلیـه متفاوت را مدلسازي کردند.[12] گسچیلی و همکاران بـه اسـتفاده از رویکـرد خوشـهبنـدي اقـدام بـه گروهبندي جاده موجود و تخمین میانگین سالیانه ترافیک روزانه نمودند .[13] تجزیه و تحلیل حوادث نیز موضوعی است که با بیشترین تعداد کاربردهاي دادهکاوي در آن یافته شـده اسـت. کالیونسـوگلا و تیگدمیر با استفاده از رویکرد شبکههاي عصبی مصنوعی جهـت بررسـی تـاثیرات ویژگـیهـاي راننـده (جنسیت، سن، تحصیل، تجربه رانندگی و...) در حوادث ترافیک استفاده کردند .[14] شریعت مهیمنی و توکلی در مطالعهاي به شناسایی مهمترین عوامل تعیینکننده در شدت مصدومیت رانندگان و سایر سرنشینان وسایل نقلیه درگیر در تصادفها براي راههاي اصلی دوخطه برون شهري ایران با استفاده از دادهکاوي و درخت دستهبندي و رگرسیون پرداختهاند.[15]
به کاربردهاي دیگر دادهکاوي در حوزه حمل و نقـل مـیتـوان بـه فعالیـت جیـان و هانـگ در مسـاله کالیبراسیون سرعت- چگالی با اسـتفاده از روش خوشـهبنـدي اشـاره کـرد.[16] همچنـین هایاشـی و همکاران با شبکههاي عصبی مصنوعی، روشی براي تشخیص خوابآلودگی رانندگان ارائه دادنـد .[17] جعفري و صمدیان نیز به کاربردهاي دادهکاوي در بررسی رفتـار راننـدگان متخلـف در کـلان شـهرها اشاره کردهاند. آنها در این مقاله کاربرد عملی دادهکاوي در تحلیل دادههايتخّلفات ترافیکی را بررسی کردند.[18]
-3 روش تحقیق
در این تحقیق، با استفاده از دادههاي ترافیکی ورود به محدوده طرح ترافیک شهر تهـران و بـر مبنـاي متدولوژي CRISP-DM3، اقدام به تحلیل متغیر تعداد ورودهاي غیرمجـاز بـه محـدوده طـرح در یـک
2 Data Mining based Traffic Direction Control Algorithm 3 Cross Industry Standard Process for Data Mining
4
ساعت و پیشبینی ساعات پرتخلف روزهاي آینده در یکی از پرترددترین معابر ورودي به این محـدوده شده است. با این کار میتوان نسبت به تغییرات تعداد ورودهاي غیر مجاز به این نواحی شـناخت پیـدا کرد و با اتخاذ تدابیر ویژه به اهداف اجراي طرح ترافیک نایل آمد. بـر طبـق متـدولوژي CRISP-DM، یک پروژه دادهکاوي شامل چرخه حیات شش مرحلهاي است که هـر مرحلـه بـه نتـایج مراحـل قبلـی وابسته است. در ادامه ضمن معرفی مراحل این متدولوژي، فعالیتهاي انجام شده در ایـن پـژوهش نیـز توضیح داده میشوند.
-1-3مرحله اول: مرحله درك پروژه و فهم حوزه کاربرد
اولین مرحله از متدولوژي CRISP–DM شامل تعریف آشکار اهداف و نیازمندي هاي مسئله مـیباشـد. مسئله تحقیق در پژوهش حاضر پیرامون دادههاي ترددهاي غیرمجاز در محدوده طـرح ترافیـک شـهر تهران میباشد. محدوده طرح ترافیک در تهران شامل محدودهاي از شهر با بیشـترین تـراکم و سـطح کاربريهاي تجاري و اداري میباشد. ساعات اعمال طرح همه روزه به استثناء روزهـاي پنجشـنبه (از 6:30 صبح لغایت 13 ظهر) و جمعه، از 6:30 صبح الی 17 بعدازظهر بوده و در این بـازه زمـانی تنهـا خودروهاي داراي مجوز میتوانند در محدوده طرح تردد کنند. اجراي دستی کنتـرل محـدوده طـرح ترافیک با توجه به وسعت جغرافیـایی محـدوده طـرح ترافیـک، تعـداد معـابر و ورودي زیـاد و تنـوع محدودیتها و همچنین بروز خطاهاي انسانی به هنگام نظارت، سختیهاي بسیاري را به دنبـال دارد. لذا از مدتها قبل، مدیران و مسئولان برنامهریزي حمل و نقل در این شهر اقدام به راهاندازي سیستم مکانیزه ثبتتخلّفات ورود به محدوده طرح ترافیک نمودهاند. هم اکنون بیش از 110 دوربین در سطح معابر طرح ترافیک اقدام به ثبت پلاك خودروهايمتخلف به همراه لحظه وقوع تخلّـف مـینماینـد. در این تحقیق با تحلیل دادههايتخلّفات، متغری تردد تخلّفات (تعداد متخلفین عبوري در یـک سـاعات از یکی از معابر ورودي) اندازهگیري شده و با رویکردهاي دادهکـاوي شـامل خوشـهبنـدي و شـبکههـاي عصبی مصنوعی وضعیت تردد این خودروها در ساعات آینده تحلیل و پیشبینی شده است.
-2-3مرحله دوم: انتخاب دادهها
این مرحله شامل جمعآوري دادهها براي استفاده از تحلیل دادهکاوي و مشخصکـردن اطلاعـات اولیـه براي ارزیابی دادههاي باکیفیت و انتخاب دادههاي مفید و مورد نیاز میباشد. سـامانه کنتـرل مکـانیزه ثبت تخلّفات محدوده طرح ترافیک، خودروهایی که به صورت مجاز یا غیرمجـاز وارد محـدوده طـرح ترافیک در شهر تهران میشوند را از طریق دوربینهاي خودکار رویت میکند و به صـورت اتوماتیـک
5
پلاك آنها را به همراه تاریخ و زمان عبور به تفکیک شماره معبر ورودي در پایگاه دادهاي که به ایـن منظور طراحی شده، ثبت میکند. پس از تطبیق دادههاي این پایگاه بـا پایگـاه دادههـاي خودروهـاي مجاز به ورود، خودروهاي غیرمجاز شناسایی و در پایگاه دادههـايتخلّفـات ثبـت مـیشـوند. در ایـن پژوهش دادههايتخلّفات این سیستم ( تعداد تخلفات در یک ساعت بـه همـراه تـاریخ و سـاعت انجـام
تخلّف) در بازه زمانی یکساله 1389/09/27) تا (1390/09/30 شاملتخلّفیبش از 900 هـزار خـودرو در طی 2934 ساعت مربوط به پرترددترین معبر محدوده طـرح ترافیـک تهـران (بزرگـراه مـدرس) بـا مساعدت شرکت کنترل ترافیک تهران جمعآوري شده است.
-3-3مرحله سوم: آمادهسازي دادهها
همانطورکه قبلاًذکر شد، سیستم مکانیزه ثبت ورود خودورها به محدوده طرح ترافیک بـه ازاي هـر ورود خودرو از یک معبر، رکوردي در پایگاه دادههاي ثبت ورودها به محدودهي طـرح ثبـت مـیکنـد. لحظه عبور، تاریخ تقویمی عبور، نام معبر، وضعیت خودرو (شامل سه گزینه عدم نیاز به بررسـی، مجـاز
æ غیر مجاز)، پلاك خودرو نمونه دادههاي ثبت شده میباشند. همانطور که اشاره شـد، هـدف از ایـن پژوهش، خوشهبندي و پیشبینی ساعات پرتخلف ورود به محدوده طرح ترافیک از طریق بررسی دقیق
æ علمی تغییرات متغیرهاي مستقل و موثر بر تعداد ترددهاي غیرمجاز میباشد. جهت دستیابی به ایـن هدف لازم است در کنار متغیر تردد غیرمجاز (تعداد خودروي عبوري غیرمجاز از یک معبر در سـاعت)، سایر عوامل موثر بر تردد مانند شرایط آب و هوایی (دما، رطوبـت و میـزان بـارش)، روز هفتـه و ... بـه پایگاه دادهها اضافه شوند. به این منظور دو پایگاه دادهاي دیگر یکی مشخصات روزهـاي مختلـف سـال (شامل تقویم شمسی و قمري) و دیگري شرایط آب و هوایی در محدوده جمعآوري دادهها تهیـه شـده
æ به پایگاه دادههايتخلّفات اضافه شده است. با استفاده از نرم افـزار SQL پایگـاه جدیـدي از دادههـا تهیه شده که شامل تعداد ترددهاي غیر مجاز در روزها و ساعات مختلف محـدوده جمـعآوري دادههـا میباشد و در کنار آن مشخصات تقویمی روز مورد نظر و شرایط جوي نیز قرار گرفته است.
-4-3مرحله چهارم: مدلسازي دادهها
در این مرحله با انتخاب و بهکار بستن تکنیک هاي مدلسازي و دادهکاوي مناسـب دانـش پنهـان درون دادهها کشف میشود. در این پژوهش از روش خوشهبندي که در ادامه معرفی شده جهت خوشهبنـدي ساعات دامنه جمعآوري دادهها بر حسب متغیر تردد غیرمجاز استفاده شده است.
6
روش خوشهبندي K -Means
خوشهبندي، تقسیم یک گروه ناهمگن به چندین زیر گروه همگن است بطوریکه تفـاوت بـین گـروههـا حداکثر و تفاوت درون گروهها حداقل شود. الگوریتم K-Means یک روش خوشهبندي بسـیار متـداول، کاربردي و از روش هاي خوشهبندي افرازبنـدي اسـت. در ایـن روش، بـا تعیـین تعـداد خوشـه (گـروه همگن)، متغیرk، اقدام به تخصیص داده ها براساس یک یا چند متغیر مربوط به هر داده، به هـر خوشـه میشود و عملیات تخصیص تا زمان یافتن خوشههایی همگن و با کیفیـت بطـوري کـه دادههـاي یـک خوشه مقادیر متغیر خوشهبندي مشابهی داشته باشندمجدداً تکرار میشود. با تغییـر مقـدار k و انجـام عملیات خوشهبندي و بر اساس معیارهاي ارزیابی کیفیت خوشهبندي، تعداد بهینـه خوشـه هـا تعیـین میشود.[19]
در این پژوهش، هر داده یکی از ساعات روزهاي مختلف بازه جمعآوري دادهها میباشد کـه متغیـر خوشهبندي آن، تعداد ترددهاي غیرمجاز ورودي به طرح ترافیک در آن سـاعت خـاص اسـت. در روش خوشهبندي، تعداد خوشهها بین 3 تا 8 (متغیر (k خوشه درنظـر گرفتـه شـده و بـه ازاي هـر مقـدار k فرایند خوشهبندي انجام شده است. به ازاي هر تعداد خوشـه مشـخص، سـاعاتی کـه تعـداد ترددهـاي غیرمجاز مشابه با یکدیگر داشته اند در یک خوشه قرار گرفتهاند. مسئله مهـم در خوشـهبنـدي انتخـاب تعداد خوشه بهینه میباشد که با اندازهگیري شاخصهاي کیفیت خوشهبنـدي، تعـداد بهینـه خوشـههـا تعیین میشود. دو شاخص متداول به این منظور شاخصهاي سـایهنمـا و دیـویس- بولـدین مـیباشـد. شاخص سایهنمایی مقدار فشرده بودن داخلی هر خوشه را بیان میکند و هر چه مقدار آن از بیشـتر از 0,7 باشد معرف کیفیت بهتر خوشهبندي است. از طرف دیگر شاخص دیـوس- بولـدین بیـانگر میـزان شباهت مشاهدات درون خوشهها و تمایز بین خوشهها است. هرچـه مقـدار ایـن شـاخص کمتـر باشـد بیانگر کیفیت بهتر خوشهبندي است. پس از انجام فرایند خوشهبندي سـاعاتتخلّـفبـه ازاي 3 تـا 8 خوشه در نرم افزار دادهکاوي Spss-Clementie، شاخصهاي سایه نمـا و دیـویس بولـدین بـه ازاي هـر تعداد خوشه محاسبه شده و در جدول 1 نشان داده شدهاند. بـر اسـاس نتـایج ایـن جـدول، 5 خوشـه عمکلرد بهتري جهت دستهبندي تعداد ترددها در یک ساعت از معبر مورد مطالعه را دارد. لـذا سـاعات بازه تحقیق بر اساس تعداد ترددهاي غیرمجاز به خوشه 5 و با استفاده از رویکرد K-Means گروهبندي شدهاند.
7
جدول -1 مقادیر شاخصهاي سایه نما و دیویس- بولدین براي تعداد خوشههاي متفاوت
شاخص سایهنما (Silhouette) شاخص دیویس - بولدین تعداد خوشهها
0,6 0,653 3
0,7 0,56 4
0,7 0,456 5
0,6 0,493 6
0,6 0,457 7
0,6 0,474 8
-5-3 مرحله پنجم: تحلیل نتایج
جدول2، خلاصه آماري متغیر تردد غیرمجاز (عبور در ساعت) بـه محـدوده طـرح را بـر اسـاس نتـایج خوشهبندي نشان میدهد. ستونهاي »تعداد دادهها در خوشـه« و »درصـد مشـاهدات« بیـانگر تعـداد و درصدي از کل ساعات مورد مطالعه (2934) میباشد که مشخصه ترددد غیرمجاز آنها مشابه هـم بـوده و در یک خوشه قرار گرفته اند. مابقی ستونهاي جدول شامل کمترین و بیشـترین تـرددتخلّـف در هـر خوشه، میانگین و واریانستردد تخلّفات در هر خوشه میباشد. در سطر آخـر ایـن جـدول، میـانگین و انحراف معیار تردد غیرمجاز از این معبر مستقل از خوشهبندي به ترتیب314 و 144خـودرو در سـاعت براورد شده است.
جدول-2خلاصه آماري ترددهاي غیرمجاز در هر خوشه
واریانس میانگین ماکزیمم مینیمم درصد تعداد نام شماره
تردد تردد تردد تردد مشاهدات دادهها در خوشه خوشه
خوشه
2292,7 182,1 250 3 %29 850 کمتخلف 1
13484,6 1302 1457 1170 %0,3 8 بحرانی 2
4435,9 495,5 699 408 %12 351 غیرعادي 3
1465,1 318,2 406 251 %57 1671 عادي 4
9029,1 919 1098 713 %1,8 54 پرتخلف 5
20614 314 1457 3 %100 2934 مجموع
8
مطابق روش K-Means مرکز هر یک از خوشـه هـاي 5گانـه، میـانگین تـردد غیرمجـاز در آن خوشـه میباشد. لذا میتوان خوشهها را از کمتخلّفترین خوشه تا پرتخلّـفتـرین خوشـه (خوشـه بحرانـی) بـر اساس ترتیب صعودي ستون میانگین تردد نامگذاري نمود. جهت شـناخت هرچـه بهتـر متغیـر تـردد
تخلّفات در هر خوشه، در ادامه خوشهها بطور فردي مورد تجزیه و تحلیل قرار گرفتهاند.
خوشه ساعات کمتخلّف (خوشه :(1
29 درصد ساعات مورد مطالعه در این خوشه قرار گرفتهاند بطوري که میانگین تـردد تخلّفـات در ایـن خوشه 182 خودرو در ساعت می باشد که کمترین مقدار را نسـبت بـه سـایر خوشـههـا دارد. لـذا ایـن خوشه به نام کم تخلّفترین خوشه نامگذاري شده است. بر اساس مدلهاي پیش بینی چنانچه ساعتی از روزهاي آتی در این خوشه قرار گیرد نیازي به کنترلهاي سختگیرانه در این ساعات نمیباشد.
خوشه ساعات عادي تخلّف (خوشه :(4
بیش از 57 درصد ساعات طرح ترافیک در این خوشه بـا میـانگین تـردد 318 خـورو در سـاعت قـرار گرفتهاند. به دلیل فراوانی زیاد و نزدیکی تردد غیرمجـاز ایـن خوشـه بـا مقـدار میـانگین، ایـن خوشـه وضعیت عادي تردد نامیده شده است. ممکن است این مقدار تردد از نظر برنامه ریزان زیاد به نظر برسد ولی این مقدار نسبت به خوشههاي ساعات دیگر مقدار کمی است. در صورت زیاد بودن ایـن نـرخ لازم است استراتژيها و برنامههاي بلندمدتی مانند افزایش جرایم و یا برنامههاي آموزشی و فرهنـگسـازي جهت کاهش تخلفات ورود به طرح در همه خوشه ها اجرا شود. قرار گرفتن یک ساعت در ایـن خوشـه بیانگر عدم نیاز به حضور مامورین و یا اجراي برنامههاي بازدارنده بیشتر در ساعت مذکور میباشد.
خوشه ساعات غیرعاديتخلّف (خوشه :(3
حدود 12 درصد ساعات طرح ترافیک در خوشه سوم با میانگین تردد غیرمجاز 495 خـودرو در سـاعت قرار گرفتهاند. ساعاتی که در این خوشه قرار دارند ساعاتی از طـرح ترافیـکانـد کـه تـردد خودروهـاي غیرمجاز در آن بیشتر از حالت عادي است. بیشتر ساعات این خوشه در روزهـاي پـنجشـنبه قـرار دارد همچنین بیشتر ساعات 7 و 8 صبح در این خوشه قرار می گیرند. مقایسه متغیر تردد در ایـن خوشـه و سایر خوشهها بیانگر آن است که مراقب از معبر مورد مطالعه در ساعات این خوشه باید بیشتر از سـایر ساعات دیگر روز باشد.
خوشه ساعات پرتخلّف (خوشه :(5
ساعاتی که در این خوشه قرار گرفتهاند متوسط تردد غیرمجـازي کمتـر از خوشـه بحرانـی کـه شـامل روزهاي خاص سال بودند، دارند اما مقدار آننسبت به میانگین تردد تخلّفات بالا است. ایـن خوشـه بـا 1,8 درصد ساعات، خوشه پرتخلف با 919 تردد غیرمجاز در ساعت نامگذاري شده است.
9
خوشه ساعات بحرانیتخلّف (خوشه :(2
بر اساس نتایج جدول 3 مشخص است که حدود 0,3 درصد ساعات روزانـه طـرح ترافیـک مربـوط بـه خوشه 2 (وضعیت بحرانی) است که میانگین تردد غیر مجاز در آن 1302 خـودرو در سـاعت اسـت. در این خوشه، حداقل و حداکثر تردد به ترتیب 1170 و 1457 تعیین شده است. هر چند درصد سـاعاتی که در این خوشه قرار میگیرند کم است اما وضعیت تـردد از حـد میـانگین 314) خـودرو در سـاعت) خیلی بیشتر است. مطالعه ساعاتی که در این خوشه قرار گرفتهاند مربوط به برخی سـاعات 9 تـا 12 و 16 تا 17 روز 14 شعبان (شب تولد امام زمان(عج))، روز 29 صفر (شب شهادت امام رضـا(ع) کـه ایـن روز بین التعطیلین بوده)، روز 26 اسفند و آخرین روز تابستان می باشد. در واقع ایـن خوشـه مشـخص کننده روزهاي خاصی است که میزان ورودهاي غیر مجاز به محدوده کنترل ترافیـک بـا شـیب تنـدي افزایش یافته است.
-6-3مرحله ششم: توسعه نتایج
اکنون که ترددتخلّفات در ی ک ساعت به پنج گروه تقسـیم شـدهانـد مـیتـوان بـا توسـعه یـک مـدل پیشبینی مناسب اقدام به پـیشبینـی وضـعتی تخلّفـات در سـاعات آینـده یـک روز نمـود. در مـدل پیشبینی، بر اساس ویژگیهاي روز و ساعت تردد (ورودیهاي مدل)، شماره خوشهاي که ساعت مربوطه در آن قرار میگیرد (خروجی مدل) پیشبینی میشود. به این منظـور مـدل شـبکه عصـبی مصـنوعی پیشخوراندي طراحی شده است تا بتوان خوشه مناسب (شماره خوشه) ساعت آینده کاري سیسـتم را پیشبینی کرد. شبکههاي عصبی مصنوعی با پردازش روي دادههاي تجربی، دانش یـا قـانون نهفتـه در وراي دادهها را به ساختار شبکه منتقل میکند که به این عمل یادگیري میگویند. در این مدل نرونهـا کوچکترین واحد پردازش اطلاعات میباشند. هر شبکه از یک لایه ورودي، یک لایه خروجی و تعـدادي لایه میانی با تعدادي نرون درون هر لایه تشکیل شده است و نرونهاي هر لایه با وزنهـایی بـه نرونهـاي لایه بعد متصل شده اند. طی فرآیند آموزش این وزنها جهت دستیابی به شبکه اي با خطاي پـیشبینـی کمتر پیوسته تغییر می کنند.[20] همچنین خروجی هاي هر نـرون بعـد از عبـور از توابـع تبـدیل4 بـه نرونهاي لایه بعد منتقل میشوند. شکل 1 اجزاي یک شبکه عصبی پیشخوراند را نشان میدهد.
4 Transform Function
10
نرونهاي لایه میانی نرونهـــاي وروي
خروجی
خروجی ورودیها
تابع تبدیل تابع پیشپردازش
لایه خروجی لایه پنهان اول لایه ورودي
شکل-1 اجزاء یک شبکه عصبی مصنوعی پیشخوراند
جهت ساخت و تست عملکرد مدل شبکه عصبی، دادههاي خوشهبندي (شامل ساعات مختلف روزهـاي مورد مطالعه که شامل 2934 ساعت میباشد) به دو گروه دادههاي آمـوزش و آزمـایش بـه ترتیـب بـه نسبت 2316) 80 مشاهده) به 618) 20 مشاهده) به صـورت تصـادفی تقسـیم شـدهانـد. از دادههـاي آموزش براي ساخت مدل شبکه عصبی و از دادههاي آزمایش براي ارزیابی دقـت پـیشبینـی اسـتفاده شده است. خروجی شبکه عصبی، شماره خوشه هر ساعت در نظر گرفته شده (شبکه یک نرون در لایـه خروجی دارد) و ورودیهاي شبکه شامل روز هفته، ساعت روز، وضعیت هوا شامل میزان دما و رطوبـت، میزان بارش، تقویم قمري، روز، فصل و ماه سال 11) نرون در لایه ورودي به ازاي هر متغیر لحاظ شده است) بوده است. همچنین شبکه طراحی شده داراي دو لایه میانی با 20 نرون بر هـر لایـه مـیباشـد. پس از آموزش شبکه، مشاهدات آزمایش (متغیرهاي ورودي بـه ازاي هـر سـاعت داده) بـه شـبکه وارد شده و شماره خوشه توسط شبکه پیشبینی شده است. درصد انطباق شماره خوشه پیشـنهادي توسـط شبکه عصبی با شماره واقعی خوشه که توسط مدل خوشهبندي حاصل شـده اسـت، بـه عنـوان معیـار عملکردي مدل درنظر گرفته شده است. در جدول 3، درصد انطباق شماره خوشـه پـیشبینـی شـده و روش خوشهبندي K-Means نشان داده شده است.
جدول -3 ارزیابی نتایج خوشهبندي با درخت شبکه عصبی
دادههاي آزمایش دادههاي آموزش نوع دادهها
تعداد درصد تعداد درصد
540 %87,4 2299 %99,27 تعداد تشخیص خوشه صحیح
78 %12,6 17 %0,73 تعداد تشخیص خوشه اشتباه
618 %100 2316 %100 مجموع
11
نتایج دقت پیشبینی نشان میدهد که شبکه عصبی طراحی شده، 99,3 درصد مواقـع شـماره خوشـه ساعت بکار رفته براي آموزش را به درستی پیش بینی میکند. همچنین بیش از 87 درصد مواقع مـدل شبکه عصبی شماره خوشه داده هاي آزمایش (دادههایی که مدل شماره خوشـه آنهـا را نمـیدانـد) بـه درستی پیشبینی میکند. جدول4، درصد خطاي مدل پیشبینی شماره خوشه را به تفکیک خوشههـا نشان میدهد. به عنوان مثال 96 درصد مواقع مدل، پیشبینی خوشه کمتخلّـف را درسـت پـیشبینـی نموده است و تنها 4درصد شماره خوشه را بجاي کمتخلّف، عادي پیشبینی نموده است. همـانطور کـه در جدول 4 مشاهده میشود، شماره خوشه پیشنهادي توسط مدل خیلـی بـا خوشـه واقعـی مشـاهده تفاوت ندارد. بیشترین انحراف خوشه پیش بینـی و خوشـه واقعـی زمـانی اسـت کـه در خوشـه واقعـی غیرعادي است ولی مدل آن را کمتخلّف پیشبینی می کند که کمتر از 1 درصد مواقع است.