ارزیابی مدل
بعد از ساخت یک مدل باید نتایج آن را ارزیابی کرد و همچنین اهمیت آن را توضیح داد . معمولاً در مسائل طبقه بندی ، یک ماتریس پیچیدگی ، ابزار مفیدی برای درک نتایج است.
ساخت مدل و نتایج
الگوریتم های داده کاوی جرم در حقیقت سازو کاری برای ایجاد مدل از درون بانک های اطلاعاتی مربوط به جرایم است. برای ایجاد یک مدل، در ابتدا یک الگوریتم باید مجموعه ای از داده ها را تحلیل کرده و یک الگوی خاص و روندهای انجام کار را جستجو کند سپس از نتایج این تحلیل استفاده کند تا مشخصه های مد لهای استخراج را تعریف کند .مدل های استخراج که از یک الگوریتم حــاصل می شوند ممکن است به انواع مختلف دیده شود که عبارتند از:
*مجموعه ای از بخش ها که چگونگی بخش های جنایی را که در تجسس های حادثه ای گروه بندی می شوند ، توصیف می کند . *مجموعه ای از خوشه ها که چگونگی وابستگی حوادث را در یک پایگاه داده توصیف مب کند .
در این بخش تقسیم بندی خوشه ای در تحلیل جرم مورد بحث قرار گرفته است ، روش های پیشنهادی جهت خوشه بندی داده های جرم ارائه گردیده که شبکه عصبی را به منظور برطرف ساختن دیگر تکنیک های خوشه ای بکار می گیرد طبیعت دو تایی متغیر های رفتار جرم ممکن است بعنوان یک مشکل قلمداد شود ، زیرا خوشه بندی کردن و عملکرد تحلیل بر روی این نوع متغیر ها مستلزم وقت زیادی است رمز گذاری دوتایی باعث می شود سنجش فاصله هندسی رایج راکه برای انواع متغیرها به کار می رود ،غیر قابل استفاده باشد . بدلیل آنکه رفتار کمیت های دو تایی می تواند به نتایج گمراه کننده ای در روند خوشه بندی منجر شود .
همچنین قابل ذکر است که الگوریتم کلاسیک عمومی برای موضعات داده های دوتایی قابل استفاده نمی باشد، به دلیل آنکه مرکز های محاسبه شده کلاسیک دوتایی نیستند ،جهت برطرف ساختن این مشکل ،کاربرد متد تقسیم خوشه بندی پیشنهاد گردیده است که در آن یکی از موضوعات دوتایی در یک خوشه مرکزی نشان می دهد . بعنوان مکمل ،اگر در متد خوشه بندی سلسله مراتبی جهت موضع داده های دوتایی خوشه ای برگزیده شود کاربرد متدهای پیوند میانگین مسافت مرکزی لازم است بدانیم که بدلیل انواع متدهای خوشه ای سلسله مراتبی دارای مشکل زمانی می باشد ، در نتیجه استفاده از خوشه بندی سلسله مراتبی با حجم بالای داده های جرم چند بعدی پیشنهاد نمی شود . [3]