بخشی از مقاله
چکیده :
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده های ذخیره شده در این سیستم ها،نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.درداده کاوی بخشی از علم آمار به نام تحلیل اکتشافی داده ها استفاده می شود که در آن برکشف اطلاعات نهفته و ناشناخته از درون حجم انبوه داده ها تاکید دارد.بیمه ،انتقال خطر از فرد یا موجودیتی به دیگری در مقابل پرداخت وجه است که شرط اصلی دراین زمینه احتمالی بودن بروز خسارت است .افزایش علاقمندی به بیمه درمیان مردم،محصولات نوآورانه و کانال های توزیع درگرو رشدصنعت بیمه است سازمان تنظیم مقررات و توسعه بیمه به عنوان یک نهادمستقل برای تنظیم قوانین وتوسعه صنعت بیمه تشکیل شده است اهداف اصلی این نهاد، ارتقائ رقا بت جهت افزایش رضایت مشتریان و اطمینان از امنیت مالی در بازار بیمه است . در این مقاله هدف ،داده کاوی با پیش بینی خسارت های تقلبی وپوشش های درمانی واهی با استفاده از درخت تصمیم که روش مورد استفاده در این مقاله است .
کلمات کلیدی : صنعت بیمه،داده کاوی، ، الگوریتم درخت تصمیم،تقلب ،خسارت بیمه ای
مقدمه
با نظر به افزایش رقابت شرکت های ارایه دهنده خدمات بیمه ای شرکت های مذکور تلاش می کنند با تکیه بر فرایند تصمیم گیری به منظور تعیین اهداف سودآور، ارزیابی ریسک بیمه گذاران و حق بیمه رقابتی به ترکیبی از رشدسهم بازار و سودآوری دست بایند و با شناسایی مشتریان پرخطر و کم خطر سعی بر آن دارند تا بر اساس ویژگی های هر گروه حق بیمه متناسب با آن گروه تعیین گردد، لذا هدف از این پژوهش شناسای پرونده های تقلب در بیمه و ارائه راه حلی برای کم کردن خسارات بیمه ای یکی از مهمترین کارکردهای صنعت بیمه خسارت میباشد. دادهکاوی به مواردی چون تحلیل خسارت و تحلیل تخلف نیز میپردازد.
کلاهبرداری بیمه ای،هرساله خسارت های زیادی را به شرکت های بیمه تحمیل می کند.با وجود پیشرفت های فراوان در شناسایی این تقلب ها ،هزینه های ایجاد شده برای شرکت ها ی بیمه در اثراین کلاهبرداری ها در حال افزایش است .کشف پروندههای خسارت دارای تخلف برای هر شرکت بیمه بسیار مهم است .تکنیکهای دادهکاوی در زمینههای مختلف صنعت بیمه برای ارتقای سطح تصمیمگیری بکار برده میشود. برخی از تکنینکهای دادهکاوی را که میتوان برای صنعت بیمه بکاربرد عبارتند از: طبقهبندی، خوشهبندی، رگرسیون، قواعد وابستگی و خلاصهسازی. این تکنیکها برای کشف دانش از پایگاه دادهها بکار میروند.
2-1تکنیکهای دادهکاوی
تکنیکهای دادهکاوی در زمینههای مختلف صنعت بیمه برای ارتقای سطح تصمیمگیری بکار برده میشود. دادهکاوی را میتوان بعنوان مدل پیشبینی کننده، ابزاری برای تقسیمبندی بازار یا شیوهای برای تحلیل سبد بازار مورد استفاده قرار داد .با این رویکرد میتوان به سوالات مطرح شده در حیطه بازار کسب و کار و تجارت با دقت بیشتری پاسخ داد. برخی از تکنینکهای دادهکاوی را که میتوان برای صنعت بیمه بکاربرد عبارتند از: طبقهبندی، خوشهبندی، رگرسیون، قواعد وابستگی و خلاصهسازی. این تکنیکها برای کشف دانش از پایگاه دادهها بکار میروند - رانجان، - 2009
2-1-1طبقهبندی
طبقهبندی یکی از تکنیکهای معمول برای پرداختن به حجم زیاد داده میباشد .الگوریتمهای طبقهبندی کننده گوناگونی برای این تکنیک وجود دارد مانند :درخت تصمیم، روش دستهبندی بیزین، شبکه عصبی، ماشین بردار پشتیبانی و غیره . پایگاه داده مشتریان را میتوان به گروههای مشابه و هم جنس دستهبندی کرد. پس از دریافت اطلاعات از صنعت بیمه تکنیک طبقه بندی بر روی این دادهها اعمال میشود. [1]
انواع طبقهبندی:
طبقهبندی نظارت شده: در این روش، طبقهها از پیش تعریف شدهاند. دادههای ورودی شامل چندین رکورد هستند که هر رکورد نیز شامل چندین ویژگی و خاصیت است. هر رکرود به یک گروه یا طبقه اختصاص دارد. یکی از اهداف طبقهبندی، تحلیل دادههای ورودی و ارائه مدلی دقیق برای هر طبقه با توجه به ویژگیهای خاص دادههای موجود در آن طبقه میباشد. از این مدل برای اختصاص دادههای جدید به طبقهها استفاده میشود.[2] طبقهبندی نظارت نشده: در این روش طبقهها از پیش مشخص نشدهاند. پس از دستهبندی میتوان نامی برای هر دسته اختصاص داد.
2-2-1خوشهبندی
خوشهبندی را میتوان جزو طبقهبندی نظارت نشده درنظر گرفت. مانند هر تکنیک نظارت نشده، این روش نیز بدنبال یافتن ساختار در یک مجموعه داده میباشد - مدهولاتا ، . - 2012 این روش برای تشخیص ردههای مشابه از دادهها بکار میرود. همچنین، برای گروهبندی براساس رفتار مشتریان نیز کاربرد دارد. با این شیوه میتوان مشتریان و بازارهای هدف را دستهبندی کرد.[2]انواع خوشهبندی عبارتند از : -روشهای پارتیشنبندی -روشهای متراکم شونده سلسله مراتبی -روشهای مبتنی بر چگالی -روشهای مبتنی بر شبکه -روشهای مبتنی بر مدل[2]