بخشی از مقاله
چکیده
یکی از پیچیدهترین مسائل در شهرهای جهان، نرخ بالای جرم و افزایش ناهنجاریهای اجتماعی در آنهاست. بروز انواع جرم و ناهنجاری باعث ایجاد حس ناامنی و تحمیل مشکلات مالی بر دوش جامعه، دولت و تشکیلات قضائی کشور میشود. امروزه افزایش تصاعدی میزان وقوع جرم به موازات افزایش جمعیت، در اکثر کشورهای جهان قابل مشاهده است. دادهکاوی به مفهوم استخراج اطلاعات نهان و یا الگوها وروابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ است. پیشگیری از جرم همواره یکی از موضوعات اساسی و مهم در زندگی بشری بوده که در طول تاریخ به شیوه های مختلف اعمال گردیده است.
با توجه به گسترش فناوری های اطلاعات و ارتباط و راه اندازی سیستم های جامع اطلاعاتی در نیروی انتظامی و ثبت اطلاعات مجرمان در بانک های اطلاعاتی، کاربرد تکنیک های داده کاوی و کشف دانش به منظور تحلیل و ریشه یابی جرایم از جمله سرقت، یکی از ضرورت های پلیس ایران و دستگاه های قضایی می باشد. مجموعه داده پرونده های کیفری از 150 نمونه افراد تشکیل شده است. از هر نمونه حدودا 22 ویژگی استخراج شده است و هدف شناسایی کلاس جرم است. در این مقاله از یک روش وزن دهی و با استفاده از کشف قانون برای تشخیص جرم استفاده شده است. نتایج حاصل نشان میدهه روش پیشنهادی مبتنی بر وزن دهی ویژگی به نسبت بهتر از روشهای پیشین بوده است.
کلمات کلیدی: تشخیص جرم، ناهنجاری اجتماعی، داده کاوی، پیشگیری از جرم، کشف دانش و قانون، وزن دهی ویژگیها.
-1 مقدمه
تحلیل جرم یکی از عملکردهای نیروهای پلیس است که شامل تحلیل و شناسایی الگوها و روندها در جرائم میشود. الگوهای اطلاعاتی می تواند به نیروی پلیس کمک کند تا منابع خود را به صورت بهینه به کار بندد و همچنین به کاراگاهان و متخصصان مسائل جرم شناسی این فرصت را می دهد که جرم را به سرعت شناسایی و حتی مضنونین احتمالی را تعیین کنند. در بسیاری از موارد، تحلیل جرم حتی به پیدا کردن راه حلی برای مشکلات جرائم در سطح جامعه نیز کمک می کند. - - Bang et al , 2014تحلیل جرم می تواند در سطوح بسیار مختلفی شامل عملکردهای تاکتیکی و استراتژیکی صورت گیرد.
این شاخه به مطالعه گزارشات جرم، گزارشات بازداشت و تلفن های دریافت شده از سمت پلیس برای شناسایی الگوهای در حال پدید آمدن و تشخیص روندهای در حال شکل گیری با سرعت هرچه بیشتر کمک کند. - - Suruliandi & David, 2017توسعه سیستم های کامپیوتری و پیشرفت تکنولوژی هوش مصنوعی در زمینه داده کاوی امکان تحلیل این حجم انبوه داده ها را با استفاده از ماشین در اختیار پلیس قرار میدهد. لیکن، باید این نکته را در نظر داشت که پیدا کردن الگوهای رفتاری جرم، کاری بسیار طاقتفرسا و مشکل است؛ دلیل این امر در مرحله اول این موضوع است که دادهها تاریخی از نظر جغرافیایی کاملا پراکنده بوده و علاوه بر این، به صورت یکپارچه ذخیره نشدهاند. - Hosseinkhani et al , 2014 -
بنابراین، عملا میزان دسترسی به دادههای مورد نیاز در تمام پایگاههای داده به صورت یکسان موجود نمیباشد و این موضوع، مسئله تشکیل انباره داده که اولین گام استفاده از دادهکاوی میباشد را دچار مخاطره شدید میکند. علاوه بر این، پس از تشکیل انباره داده، تعیین روش های مناسب برای تشخیص نوع جرم و تهیه یک مدل مفهومی برای تحلیل جرم به وسیله هوش مصنوعی نیز چالشی طاقت فرسا به حساب میآید . - Wang et al , 2008 - در این مقاله قصد داریم به این سئوال پاسخ دهیم چگونه می توان از داده کاوی در تشخیص جرم استفاده کرد.ادامه مقاله شامل چند بخش است، در بخش دوم کارهای مرتبط مربوط به تشخیص جرم بیان میشود. در بخش سوم روش پیشنهادی گفته میشود.. در بخش چهارم آزمایشها و نتایج بیان میگردد. در بخش پنجم نتیجهگیری و کارهای آینده بیان میگردد. سرانجام لیستی از منابع استفاده شده در این مقاله معرفی میگردد.
-2 کارهای مرتبط
استفاده از ابزارها و الگوریتمهای داده کاوی ماهیت پیچیده دادههای بزهکاری و روابط نامحسوس میان داده ها را مدل کرده و الگوهای جرم را شناسایی، کشف و در سدد پیشگیری برمی آید .از الگوریتمهای طبقهبندی مدلهای بهینه برای پیشبینی ویژگیهای جرائم ارتکابی آینده و از الگوریتم های خوشه بندی در شناسایی نوع جرم روی مجموعه دادههای گردآوری شده استفاده گردید.در بین فناوری های معرفی شده داده کاوی به عنوان یک ابزار قدرتمند در تحلیل داده های جرم نقش مؤثری در کشف الگو و دانش از پایگاه داده جرم در راستای فرایند تصمیم گیری به منظور کاهش فرصت ارتکاب جرم و کنترل جرایم دارد.
آقایی به همراه همکارانش به پژوهشی تحت عنوان جامعیت بخشی به مجموعه داده جرائم به منظور پیشبینی و شناسایی جرائم با استفاده از تکنیکهای داده کاوی پرداختند و دریافتند به کارگیری شیوه های نظام مند جهت شناسایی، کشف و پیشگیری از وقوع جرائم در تحلیل جامعه برای رسیدن به یک سیستم تحلیل جرم رو به گسترش است - آقایی و همکاران،. - 1394اسکندری به همراه همکارانش به پژوهشی تحت عنوان کاربرد داده کاوی در شناسایی و کشف الگوهای پنهان جرم سرقت پرداختند و دریافتند امنیت و آرامش در جامعه تنها با توسل به شیوه های کیفری پس از وقوع جرم محقق نمی شود ، بلکه دولت وظیفه دارد با در پیش گرفتن راه کارهایی، قبل از وقوع بزه، در از بین بردن شرایط تحقق آن تلاش نماید - اسکندری و همکاران،. - 1391
جعفری و همکارش - جعفری و صمدیان - - - 1391 به بررسی کاربرد داده کاوی در بررسی رفتار رانندگان متخلف در کلان شهرها پرداختند و دریافتند فضای خالی بین تئوری و اجرا هنوز بایستی کم تر شود به ویژه در حوزه پلیس به منظور تغییر دادن مفاهیم استفاده از داده کاوی در جایی که اطلاعات تخلفات ترافیکی رابطه مستقیم با افزایش تصادفات و به تبع آن افزایش خسارات مالی و جانی ناشی از آن دارد. این تحقیق از آنجا که شواهد کاربردی را توسط داده کاوی در حوزه تخلفات ترافیکی بیان کرده، می تواند بسیار با ارزش باشد. با این وجود، این تحقیق موفق به نشان دادن اهمیت داده کاوی در دامنه تخلفات ترافیکی و دیگر مشخصه های رانندگان شده است. نجات جان انسان ها به سبب شناسایی رانندگان متخلف و کاهش ارتکاب به تخلفات توسط آنان و به تبع آن کاهش تصادفات جاده ای از اهمیت بالایی برخوردار است.
هم چنین در پژوهشهای خارجی دو محقق پروژه ای تحت عنوان تجزیه و تحلیل و طراحی الگوریتم با استفاده از داده کاوی پرداختن و دریافتن جرم شناسی حوضه بسیار مناسبی برای اعمال داده کاوی می باشد. گزارشات بصورت ساده نوشته شده اند.این نوشته ها به فرصتی که ابزار انهارا درک کنند تبدیل می شوند سپس تکنیک های موجود داده کاوی برای بدست اوردن الگو جرایم و الگوریتم جدید مطرح میشوند تا صحت شناسایی جرم را افزایش دهند - آنشو شارما و رامان کومار1،. - 2013پروژه ای تحت عنوان تحلیل رویکرد بین اداره پلیس و علم کامپیوتر به عنوان وسیله اولیه در داده کاوی توسط دو محقق انجام شد و دریافتند این تحقیق شناسایی انبوه را در داده کاوی پیاده ساخته تا به پلیس در کشف و حل سریع جرم کمک کند - دهاک موراشیناموریتی و کالای سلوان2،. - 2013
-3 روش پیشنهادی
در این بخش روش پیشنهادی برای تشخیص جرم به کمک کشف قوانین و وزن دهی به ویژگیها ارائه خواهد گردید. نمودار روش پیشنهادی در شکل 1 آمده است:
همانطور که در شکل 1 مشخص است، روش پیشنهادی شامل بخش های مختلفی است که در ادامه توضیح داده میشود. ابتدا مجموعه داده مورد استفاده در این مقاله توضیح داده میشود. سپس پیش پردازش انجام میشود. در مرحله بعد وزندهی ویژگی انجام می شود که ایده اصلی تحقیق است. در مرحله بعد ساخت مدل با استفاده از طبقه بندهای مختلف انجام میشود. در آخر ارزیابی مدل انجام میشود.مجموعه داده پرونده های کیفری از 150 نمونه افراد تشکیل شده است. از هر نمونه حدودا 22 ویژگی شامل نام، سن، اعتیاد، میزان تحصیلات، جنسیت، وضعیت تاهل، سابقه قبلی، بومی، فردی یا گروهی بودن میزان جرم، شغل، نوع جرم، .... و نهایتا کلاس جرم است. خصوصیات آماری دادهها در شکل زیر آماده است. همانطور که در شکل زیر آماده است اکثر ویژگی های موجود Nominal یا اسمی هستند.