بخشی از مقاله

پیش بینی خسارت های آتی در بیمه ایران به وسیله داده کاوی


چکیده
بیمه به عنوان یکی از نهاد های مالی تاثیر گذار در اقتصاد و جامعه است به ابزار ها ی تحلیل ریسک قدرﲤندی دسترسی داشته باشند تا بتوانند ریسک دریافتی را ﲞوبی مدیریت کنند. صنعت بیمه برای تحلیل ریسک وابسته به ﲡارب خسارتی می باشد . به ﳘین دلیل استفاده از ابزار داده کاوی می تواند در سنجش و پ یش بی نی ریسک بیمه گذاران، با توجه به ای ن ﲡارب، بسیار راهگشا بوده و با بکارگیری فراینـد داده کـاوی، داده هـای بیمـه گذاران قب لی را مب نایی برای ارز یابی م یزان ری سک مشتریان جد ید قرار دهد. پژوهش، بکار گیری الگـوریتم هـای داده کـاوی جهـت شناسـایی بیمـه گذاران از ﳊاظ ریسک ﲢمیلی برای شرکت های بیمه می با شد. بدین منظور اب تدا داده های بیمه گذاران بیمه خودرو را از با نک اطلا عاتی بیمه
خودرو کشور، جمع آوری ﳕوده و پس از پالایش داده ها، یک ﳎموعه داده هایی برای اعمال مدل تشکیل میگردد. برای اﳒـام مدلسـازی داده هـا، داده را به دو قسمت داده آزمایشی و آموزش تقسیم ﳕوده و به کمک روش های داده ا جرا می گردند و نتایج صحت بـر روی داده هـا کاوی مانند روشهای مبتنـی بـر پیش بینی الگوریتم ها با یکدیگر مورد مقایسه قرار می گیرند. در انتها به تحلیل درخت تصمیم می پردازیم.

کلیدواژهها: درخت تصمیم، ماشین بردار پشتیبان، شبکه بیزی، شبکه عصبی

١.مقدمه

در صنعت بیمه داده کاوی می تواند به شرکت ها جهت کسب مزیت ﲡاری کمک کند . بطور مثال با بکارگیری تکنیک های داده کاوی شرکت ها می توانند با استفاده از داده ها در مورد الگوهای خرید مشتری و رفتار مشتری ، دانش بدست بیاورند . ﳘینطور فهم بیشتر از کسب و کار برای کمک به کاهش تقلب ،ارتقا بیمه گری و بالا بردن مدیریت ریسک صنعت بیمه برای تحلیل ریسک وابسته به ﲡارب خسارتی می باشد . به ﳘین خاطر تکنیک های داده کاوی به کاربرد زیادی در صنعت بیمه برخوردار باشند ]٢.[
مقاله حاضر در صدد استفاده از داده های مربوط به بیمه نامه های ثالث اتومبیل کل کشور طی سال های ١٣٨٩-١٣٩٠ مشخصه های تأثیرگذار در ریسک بیمه گذاران بیمه ثالث اتومبیل را با استفاده از الگوریتم های داده کاوی رتبه بندی کرده سپس مدل ارائه دهد تا با استفاده از آن بتوان میزان ریسک بیمه گذاران آتی را (بالا ، متوسط یا پایین) پیش بینی کند و در میزان حق بیمه دریافتی از بیمه گذاران ﳐتلف تعدیل ایجاد کرد و با ایجاد سیستم نرخ گذاری مبتنی بر ریسک بیمه گذاران ، میزان رضایت بیمه گذاران را افزایش داد و از طرفی بر سودآور شرکت های بیمه تاثیری مثبت گذاشت. نظری در این مقاله ابتدا مبانی تحقیق تشریح می گردد که شامل مباحث داده کاوی ، ریسک در بیمه و کاربرد داده کاوی در بیمه می باشد . سپس به روش اجرایی و داده های مورد استفاده در تحقیق پرداخته می شود و نهایتا مدلسازی گرفته و نتایج حاصله بیان می گردند .


٢- مبانی نظری تحقیق :
در این ﲞش به بررسی مبانی نظری مرتبط با داده کاوی در صنعت بیمه و برخی تحقیقات صورت گرفته در حوزه مرتبط با تحقیق پرداخته می شود .
٢-١ داده کاوی و کشف دانش از پایگاه داده
٢- داده کاوی توصیفی ، اطلاعات
جدید و غیر بدیهی را بر اساس ﳎموعه ای از داده های موجود ارائه می دهد و هدف کلی آن درک و شناخت سیستم های ﲡزیه و تحلیل شده با استفاده از الگو و روابط موجود می باشد داده کاوی ، عبارت از اقتباس یا استخراج دانش از ﳎموعه ای از داده هاست . بیان دیگر ، داده کاوی فرایندی است که با استفاده از تکنیک های هوﴰند ، دانش را از ﳎموعه ای از داده ها استخراج می کند . ﳎموعه داده هایی که مورد پردازش قرار می گیرند ، ﲢت عنوان ﳎموعه آموزشی شناخته می شوند . دانش استخراج شده در قالب مدل های ، الگوها یا قواعد ارائه می شود . این الگوها ، مدل ها و قواعد اشکال ﳐتلفی از یرای ارائه دانش استخراج شده هستند. این دانش می تواند ملاک تصمیم گیری های آتی ، عملکردهای بعدی و یا تغییرات لازم در سیستم قرار گیرند
٢-٢. روش ها و تکنیک های داده کاوی
برحسب اینکه در فرایند داده کاوی، استنتاج چه نوع دانشی از ﳎموعه ی آموزشی مورد نظر می باشد ، از روش های ﳐتلف داده کاوی می توانﲠره جست . این روش ها از نظر شیوه یادگیری به دو دسته اصلی زیر تقسیم می شوند :
الف – الگوریتم های یادگیری با نظارت ب – الگوریتم های یادگیری بدون نظارت

دو هدف اصلی داده کاوی ، پیشگویی و توصیف است . که در ادامه این دو تشریح می گردند
١- داده کاوی پیشگویی کننده
مدلی را از سیستم ارائه می دهد که توسط ﳎموعه ای از داده های مشخص پیش بینی می گردد . هدف کلی آن طبقه بندی ، پیش بینی و ﲣمین داده ها است .

٢-٣ کاربردهای داده کاوی در صنعت بیمه
در صنعت بیمه داده کاوی می تواند به شرکت ها جهت کسب مزیت ﲡاری کمک کند . به طو مثال با بکارگیری تکتیک های داده کاوی شرکت ها می توانند با استفاده از داده ها در مورد الگوهای خرید مشتری و رفتار مشتری ، دانش بدست بیاورید. ﳘینطور فهم بیشتر از کسب کار برای کمک به کاهش تقلب ارتقا بیمه گری و بالا بردن مدیریت ریسک از آﳒا که تحقیق حاضر از این کاربرد داده کاوی استفاده می کند ، لازم است مبحث شرح داده شود .

یکی از روش های مرسوم برای تعیین ریسک یا خسارت در شرکت های بیمه استفاده از روش های آکچوئری است، در این روش ها بیمه گذاران به گروه های ﳐتلف (مانند سن ، جنسیت، مسافت رانندگی و ...) تقسیم می شوند و برای هر گروه از طریق داده های خسارتی گذشته مقدار و احتمال خسارت ﲣمین زده می شود
٣ . متدولوژی
داده کاوی غالباً می تواند مدل های آکچوئری موجود را از طریق یافﱳ متغیرهای تأثیرگذار اضافی از طریق شناسایی تعاملات و روابط غیر خطی ارتقا دهد .
مهمترین سوال در نرخ گذاری اینست: فاکتورهای ریسک یا متغیرهایی که برای پیش بینی احتمال ادعای خسارت و اندازه یک خسارت مهم هستند کدامند ؟

بنابراین کار این تحقیق در نهایت تعیین فاکتورهای ریسک است که به نرخ گذاری در صنعت بیمه کمک شایانی می کند .


٣-مراحل اجرایی تحقیق
مرا حل اجرا یی ﲢق یق به صورت ز یر خواهد بود :
١- جمع آوری داده از پایگـــاه داده بیمــه گــذاران فعلــی بانــک
اطلاعاتی بیمه خودرو و تقسیم انها به دو د سته داده های آزمایشی و داده های آموزشی؛ ٢- تعیین شاخص هایی برای تعریف طبقات ریسک بیمه گذاران ؛

٣- استخراج الگوها با استفاده از داده های آزمای شی با تکن یک در خت ت صمیم و مقای سه ن تایج با استفاده از روش های دیگر ٤- ارائــه الگــوی کشــف شــده از طبقه بندی بیمه گذاران

٣-١ داده های تحقیق
داده های این تحقیق شامل داده های مر بوط به بیمه نا مه های بیمه گــذاران بیمــه ثلــث اتومبیـل مـی باشند که ﲞشی از آنها دچار حادثه شده اند و خسارت دیده اند.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید