بخشی از مقاله

خلاصه

یکی از وظایف داده کاوی ساختن مدل هایی برای پیشگویی کلاس یک شئ بر اساس بعضی از ویژگی های آن می باشد. همچنین یک شئ می تواند در رده هایی مانند:اعتبار خوب یا بد برای متقاضیان وام تقسیم شود.مساله این است که مشتریانی وجود دارند که علیرغم خوش حسابی مانند سایر مشتریان با آنها برخورد می شود و ضمانت های زیادی برای اعطای تسهیلات از آن ها دریافت می شود و حتی گاهی مشتریان بدحساب تر تسهیلات درخواستی خود را در مدت زمانی کوتاه تر از مشتریان خوش حساب دریافت میکنند.

در این مقاله قصد داریم با جداسازی مشتریان خوش حساب از مشتریان نه چندان خوش حساب بانک و رتبه بندی آن ها نحوه برخورد بانک با مشتریان از لحاظ میزان ضمانت دریافتی،اولویت زمانی پرداخت وام و تسهیلات و...را بر اساس رتبه هر مشتری سازماندهی کنیم.در این مقاله با در نظر گرفتن خصوصیات متقاضیان وام و با استفاده از داده کاوی نسبت به اعتبار سنجی مشتریان بانک اقدام خواهد شد.

با استفاده از روش های درخت تصمیم - C5,2CART - 1 و شبکه عصبی3 که پر کاربردترین تکنیک های داده کاوی در زمینه دسته بندی هستند و با کمک نرم افزار قدرتمند clementine به تجزیه وتحلیل داده ها پرداخته و در پایان با مقایسه سه روش مدل نهایی انتخاب و نسبت به پیشگویی رده مشتریان جدید بر اساس مدل نهایی اقدام خواهد شد و سپس با استفاده از درخت تصمیم گیری نحوه ارتباط بانک با مشتریان تعیین خواهد شد.

1.    مقدمه

در طول دهه های گذشته حجم زیادی از داده ها در پایگاه داده ها انباشته و ذخیره شده اند.در واقع سازمان ها در اطلاعات غرق شده اند در حالیکه تشنه دانش هستند.[1]این امر نشانگر آن هست که سازمان ها نتوانسته انداز دانش درون داده ها به نحو احسن استفاده نمایند. فن آوری داده کاوی سازمان ها را قادر می سازد تا از سرمایه داده هایشان بهره برداری نمایند.این ابزار برای پشتیبانی فرآیند تصمیم گیری استفاده می گردد.

داده کاوی پردازش بهینه تصمیم گیری را در سازمان ها تسهیل نموده و با انجام فرآیند تصمیم سازی از طریق استخراج دانش با ارزش از داده،تصمیم گیری را برای مدیران سازمان تسهیل می نماید.بنابراین ضروری است تا برای بکار بستن این ابزار در سازمان ها اهمیت بیشتری قایل شده تا در نهایت به فرآیند تصمیم گیری بهینه مدیران منجر شود.[2] دادهکاوی یک رشته نسبتاً جدید علمی می باشد که از انجام تحقیقات حداقل در رشتههای آمار، یادگیری ماشین، علوم کامپیوتر خصوصاً مدیریت پایگاه دادهها شکل گرفته است. البته مرزهای این رشتهها در دادهکاوی در حال حاضر مبهم می باشد.

فلسفه ی دادهکاوی این است که با شناخت درست از گذشته، آینده را می توان پیش بینی کرد[3] وظیفه ی دادهکاوی، کاویدن و استخراج از منابع عظیم داده است تا اطلاعات گرانبهایی که در حجم انبوهی از اطلاعات سطحی پنهان شده است را استخراج کند.تفاوت اصلی دادهکاوی و علم آمار، در حجم داده های مورد تحلیل، روش مدلسازی داده ها و استفاده از هوش مصنوعی است.[4] دادهکاوی ترجمه ی عبارت Data Mining و به معنای کاویدن معادن داده هاست.

-2-1پیشینه تحقیق

از روش های یادگیری ماشینی بدلیل قابلیت انعطاف و قدرت پیش بینی این روش ها، در حوزه های مختلفی استفاده شده است. در زمینه مالی نیز از روش های مختلفی برای اهداف متفاوت استفاده شده است. از جمله می توان به تحقیقی اشاره کردکه در آن چن1 و همکاران رویکرد استخراج قوانین را در پیش بینی کاربرد مشتقات برای ریسک مالی شرکت های سازنده بکار گرفته اند. هدف آن ها ارائه یک مدل خبره است که از رویکرد استخراج قوانین استفاده می کند و برای کاربران یک ابزار پیش بینی فراهم می آورد. با توجه به نتایج بیان شد که رویکرد مبتنی بر استخراج قوانین روش موثری برای مشکلاتی هستند که به الگو و رویه دسته بندی مرتبط هستند.[5]

یانگ2 و همکاران به بیان و تشریح تحلیل ساختاری وضعیت های تصمیم گیری سیستم پرداخته اند. سه جزء تصمیم گیری شامل تصویب وام ها، بررسی تحلیل های قبل از وام دهی و بررسی نظارت های بعد از وام می باشد.[6] لی3 و همکارانش در سال 2009 کاربرد داده کاوی را در مدیریت کارت های اعتباری مورد تجزیه و تحلیل قرار دادند و پژوهش های آن ها تفاوت میان داده کاوی و امتیازبندی رفتاری را نشان می دهد.[7]

خندانی و همکارانش در سال 2010 از تکنیک های یادگیری ماشین استفاده کردند و مدل های پیش بینی ناپرامتریک غیرخطی را برای ریسک های اعتباری مصرف کنندگان ایجاد کردند. آن ها یک مقیاس کاردینال را برای ریسک اعتباری مصرف کننده پیشنهاد کردند که این مقیاس فاکتورهای اعتباری سنتی را با تراکنش های بانکی مصرف کننده ترکیب کردند. این امر سبب ارتقای قدرت پیش بینی مدل آن ها شد.[8]

عادل آذر و همکارانش در سال 1389 با استفاده از تکنیک های داده کاوی، قواعد و روابط بین نمرات آ زمون های ورودی و سایر متغیرهای شخصی و شغلی - که قبل از ورود هرکس به سازمان مشخص می گردد - و وضعیت کارکنان با عملکرد شغلی و وضعیت ارتقاء آنان شناسایی شود. تکنیک داده کاوی مورد استفاده در این پژوهش، درخت تصمیم گیری است.[9] هوانگ4 و همکارانش با بیان این که توسعه های اخیر در تکنیک های داده کاوی مثل شبکه های عصبی، برنامه نویسی ژنتیک و ماشین بردار پشتیبان می توانند عملیات دسته بندی را بدون محدودیت روش های قدیمی انجام دهند و همچنین روش های هوش مصنوعی عملکرد بهتری نسبت به روش های آماری سنتی دارند، یک مدل امتیازدهی اعتباری مبتنی بر ماشین بردار پشتیبان ارائه می دهند. به منظور ساخت مدل نسبی برای امتیازدهی اعتباری در این تحقیق، سه استراتزی مبتنی بر ماشین بردار پشتیبان استفاده شده است.[10]

ونگ 5و همکارانش در سال 2008 مدل یادگیری تجمیعی شبکه عصبی چند مرحله ای را ارائه کردند. این مدل برای ارزیابی ریسک اعتباری مورد استفاده قرار می گیرد. مدل ارایه شده شامل شش گام است. نتایج نشان داد که این مدل می تواند یک راه حل مناسبی برای آنالیز ریسک های اعتباری و در کنار آن یک روش مناسبی برای مشکلات طبقه بندی کلاس-دودویی ارائه می کند.[10] مهدی ابزری و همکاران در سال 84 با استفاده از روش های داده کاوی مانند رگرسیون لجستیک و شبکه های عصبی و با کمک نرم افزار SAS Enterpriseminer به اعتبار سنجی مشتریان بانک اقدام کرد و سپس با استفاده از درخت تصمیم،نحوه ارتباط بانک با مشتریان تعیین شد.[11]

دکتر محمد جعفر تارخ وکبری شریفیان در سال 89 به منظور شناسایی مشتریان بانک ملت و تدوین استراتژی های مناسب برای برخورد با آن هااز داده کاوی و ابزار آن مانند الگوریتم ژنتیک و الگوریتم میانگینKاستفاده کردند.بدین منظور ابتدا بانک ملت و بانک اطلاعاتی آن در بخش های مختلف بررسی شد.پس از استخراج داده از بانک اطلاعاتی و پاک سازی آن،مشتریان در گرو ه های مختلف،با استفاده الگوریتم میانگینK به دو روش فازی و غیر فازی گروه بندی شدند.[12]

احمد قدس الهی و همکاران در سال 90 با استفاده از روش های داده کاوی مشتریان را به دو دسته معتبر و غیر معتبر تقسیم بندی کردند.به همین منظور تکنیک های مدل های تحلیل خطی،رگرسیون لجستیک،درخت تصمیم،شبکه های عصبی،ماشین بردار پشتیبان مورد بررسی و مقایسه قرار دادند.نتایج این پژوهش نشان داد تکنیک درخت تصمیم از نظر شاخص های صحت کلی و هزینه پشتیبانی دارای عملکرد بهتری نسبت به سایر تکنیک های ذکر شده است.[10] یاپ1 و همکاران به دلیل نداشتن اطلاعات بانکی،از داده های مالی یک کلوب سرگرمیبرای اعتبار سنجی مشتریان استفاده کردند. دقت های بدست آمده از گره اعتبار سنجی در نرم افزار SAS،درخت تصمیم ورگرسیون لاجیت اختلاف معناداری را نشان نداد.[13]

2.    روش تحقیق

موضوع این تحقیق جداسازی و رتبه بندی مشتریان خوش حساب بانک با استفاده از داده کاوی است.در تحقیق حاضر با مطالعه مقالات در حوزه موضوع اقدام به تهیه ادبیات موضوع نموده و سپس با اخذ داده های مورد نیاز از بانک و تجزیه و تحلیل داده ها نتیجه گیری را ارائه نمودیم. داده ها در تحقیق حاضر از پایگاه داده بانک استخراج شد.باتوجه به اطلاعات موجود در بانک از 23 متغیر پیش بینی شده برای هر مشتری تنها اطلاعات مربوط به 13 متغیر برای هر مشتری استخراج و در فرآیند تحقیق مورد استفاده قرار گرفت.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید