بخشی از مقاله

ارائه طبقه بند ترکیبی جدید جهت تعیین ریسک مشتریان بانک ها

 

چکیده: با توجه به وجود متقاضیان تسهیلات بانکی و کارتهای اعتباری، بانکها نیاز به تصمیم گیری در مورد ارائهی تسهیلات به یک مشتری و تحلیل ریسک سرمایه گذاری خود روی مشتریان را دارند. اصطلاحاً به چنین تصمیم گیریهایی در خصوص اعطای اعتبار به یک فرد از جمله وام، کارت اعتباری و ... اعتبارسنجی و یا پیشبینی ریسک اعتباری گفته میشود. عملیات تعیین ریسک یا اعتبارسنجی به فاکتورهایی از جمله اطلاعات فردی مشتری و سابقه مالی وی بستگی دارد. باید خاطر نشان کرد که بسیاری از بانکهای کشور، قادر به تعیین ریسک اعتباری مشتریان به صورت اتوماتیک نمیباشند. در حال حاضر، با وجود حجم عظیم اطلاعات در بانکها فرایند تحلیل ریسک به صورت دستی، بسیار زمانگیر خواهد بود. بنابراین میتوان گفت که عملیات پیشبینی ریسک اعتباری در چنین بانکهایی سلیقهای بوده و سیاست مشخصی برای آن وجود ندارد. از این رو لزوم اعتبارسنجی و تحلیل ریسک خودکار اهمیت دارد. در این مقاله روش ترکیبی جدید بر پایه ماشین یادگیر حداکثر (Extreme Learning Machine ) جهت تعیین ریسک اعتباری مشتریان بانکها ارائه گردیده است، که در مقایسه با روشهای دیگر توانسته نتیجه مطلوبی را کسب نماید.

کلمات کلیدی: طبقهبندی ترکیبی، ریسک اعتباری، اعتبارسنجی، داده کاوی، ماشین یادگیری حداکثر


.1 مقدمه

اتوماتیک انجام شدن عمل پـیش بینـی ریسـک اعتبـاری بـرای متقاضیان اعتبار و وام علاوه بر صـرفهجـویی در زمـان و هزینـه های بانک معیاری منصفانه و سیاستی مشخص در سراسر شعب بانک اجرا مینماید که این امر عمل نظارت و مدیریت اعتبـارات را تسهیل میکند. در این پژوهش سعی شده اسـت، بـا بررسـی الگوریتمهـای موجـود در زمینـه پـیش بینـی ریسـک اعتبـاری مشتریان، الگـوریتمی کـارا کـه دارای دقـت بـالاتر و همچنـین قابلیت اعتماد بالاتر ارائه گردد.

در این پژوهش به دنبال ارایه روشهـای طبقـهبنـدی جدیـدی هستیم که علاوه بر کارایی بالا دارای قابلیت اطمینان بـالا نیـز باشند. بدین منظور روش جدید طبقهبندی با استفاده از ترکیب طبقهبندها، کـه دارای دقـت بـالاتر و قابلیـت اطمینـان بیشـتر برروی مجموعه دادههای مشتریان بانک میباشـند، ارائـه شـده اســت. طبقــهبنــد پایـه در روش پیشــنهادی ماشـین یـادگیری حداکثر (Extreme Learning Machine) میباشد.

.2 شبکههای مصنوعی

شبکه عصبی روشی است که با اسـتفاده از مجموعـهای از گـره های به هم مرتبط، از کارکرد مغز انسـان تقلیـد مـیکنـد. ایـن روش مبتنی بر مدلهای رایانهای از نرون-هـای زیسـتی اسـت. این روش به شکل گسترده ای در طبقـهبنـدی و خوشـهبنـدی استفاده شده است. شبکههای عصبی به صورت کارشناس خبره در ناحیهای که آموزش دیدهاند تـا در آن کارکننـد، عمـل مـی کنند.

یکی از ساختارهای پر کاربرد شبکههـای عصـبی، کـه در سـال 1958 توسعه یافته است، شبکههای پرسـپترون مـیباشـد .[1] پرسپترون تک لایـه مشـکل بزرگـی دارد و آن ایـ ن اسـت کـه توانایی جداسازی الگوهـای غیـر خطـی را نـدارد، لـذا در سـال 1986 مدل جدید پرسپترون به نام پرسـپترون چندلایـه ارائـه شد. روش پس انتشار خطا از جملـه روش هـای آمـوزش رایـج برای آنها است. تکنیک هایی نیز برای یافتن ساختار بهینـه ایـن شبکه ها، یعنی تعـداد لایـه هـا و تعـداد نـورون هـا در هـر لایـه پیشنهاد شده اسـت .[2] یکـی از مهمتـرین انـواع شـبکه هـای عصبی پیشخور و بازگشتی می باشد.


.3 ماشین یادگیر حداکثر (ELM)

همانگونه که در بخش قبل اشاره شد، در سالهای اخیر، شبکه-های عصبی مصنوعی به طور گستردهای در برنامههای کاربردی شامل طبقهبندی و یا تقریب تابعی استفاده شدهاند. با این حال، عیب اصلی آن این است که سرعت یادگیری شبکههای عصبی مصنوعی بسیار آهستهتر از نیاز واقعی است، که یک مشکل بزرگ در کاربردهای عملی میباشد. برای غلبه بر این مشکل، بسیاری از محققان توانایی تقریبگری شبکههای عصبی رو به جلو، به ویژه در مجموعهی آموزشی محدود را از نقطه نظر ریاضی بررسی کردهاند. یکی از مهمترین دستاوردهای این کار، الگوریتم یادگیری جدید با نام ELM است، که به تازگی برای شبکههای عصبی تک لایه رو به جلو (SLFN) پیشنهاد شده است .[4 ,3]

الگوریتم یادگیری ELM، یک نوع از شبکههـای عصـبی رو بـه جلو تک لایه میباشد. ایـن الگـوریتم مشـکلاتی نظیـر سـرعت همگرایی پایین و به دام افتادن در نقـاط بهینـه محلـی کـه در اغلب شبکههای عصبی وجـود دارد را حـل مـیکنـد. تجزیـه و تحلیل و همچنین آزمایشات متعدد در اغلب موارد عملکرد بهتر ELM را نسبت به الگوریتم پس انتشار (BP) نشان داده است. بنـابراین الگــوریتم یــادگیری ELM جهـت کاربردهــای عملــی مناسب است .[5]

.4 پیشینه

روش های مبتنی بر شبکه های عصبی مصنوعی: بسیاری از

محققان از شبکه های عصبی در زمینهی سنجش اعتبار بهره برده اند که تعدادی از آنها به تفصیل در ادامه شرح داده خواهند شد.

Abdou و همکارانش از شبکهی عصبی [6] برای سنجش ریسک اعتبارات در بانکهای مصر بهره بردهاند. آنها یک مجموعهی دادهای اعتباری ازاطلاعات وامهای اعطا شده توسط بانک های کشور مصر ایجاد نموهاند. در این مجموعهی اعتباری دو روش شبکههای عصبی احتمالاتی

(PNN) و (MLP) Multilayer perceptron اجرا شده و نتایج آن با روشهای سنتی پیشبینی ریسک اعتباری مشتریان مقایسه گردیده است. در این پژوهش، نشان داده


2


شده است که روش PNN کارایی بالاتری نسبت به سایر روشها دارد.

Sustersic و همکارانش در پژوهش خـود [7] یـک مـدل یادگیری برای پیش بینی ریسک اعتباری ارائه کرده اند. در این مدل، فرض شده است کـه مجموعـهی دادهای ورودی خام بوده و شامل دادههای اضافی و ناکامل می باشد. مـدل پیشنهادی در این مقالـه، چهـار مرحلـه دارد. در گـام اول، ویژگی هایی که ارتباطی با دامنهی مسـأله ندارنـد، حـذف میشوند. در گام دوم، از دو روش PCA و الگوریتم ژنتیـک برای انتخاب ویژگی استفاده میشود و خروجی هر یـک از ایــن دو الگــوریتم بــا یکــدیگر ترکیــب شــده و تعــدادی از ویژگیها برای مرحلـهی یـادگیری انتخـاب مـیشـوند. در مرحلـهی یـادگیری از شـبکههـای عصـبی error back-propagtion و روش آماری logit استفاده شده است کـه نتیجهی این مرحله، از ترکیب خروجی دو الگوریتم بدست میآیـد. مجموعـهی دادهای در ایـن پـژوهش، از اطلاعـات مؤسســات مــالی کشــور اســلوونی گــردآوری شــده اســت. آزمایش های این مدل حاکی از کارا بودن روش پیشنهادی می باشد.

Wang و همکارانش در تحقیقات روشهای رایج در ترکیب کردن طبقهبندها با الگوریتمهای رایج طبقهبندی [8] به کار بردهاند. آن روشهای Bagging ، Boosting و Stacking را با الگوریتمهای شبکههای عصبی (ANN)،

درخت تصمیم (DT)، (LRA) Logisitic Regression و SVM اجرا کردهاند.

Wang و همکارانش دو روش ترکیبی جهت پیشبینی ریسک اعتباری مشتریان بانکها، به نامهای Rs-Bagging DT و Bagging-RS DT پیشنهاد کردهاند .[9] در هر دو روش با شیوه مختلف از ترکیب درخت تصمیم، طبقهبندی ترکیبی به روش Bagging و انتخاب زیرمجموعه تصادفی استفاده شده است، که اهدافی نظیر کاهش نویز در درخت تصمیم و بالا بردن دقت طبقهبندی را دنبال کردهاند. روشهای RS-Bagging DT و Bagging-RS DT به ترتیب، در مجموعه دادههای اعتباری آلمان به دقت 78.36 و 78.52 و در مجموعه3

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید