بخشی از مقاله
چکیده
طبقه بندی مشتریان تسهیلات بانکی با استفاده از الگوریتمهای دادهکاوی، بانکها را قادر به حفظ و وفاداری مشتریان قدیم و جذب مشتریان جدید خواهد کرد. یکی از روشهای دادهکاوی، رویکردهای مبتنی برقاعده و درخت تصمیمگیری است و چنانچه تصمیمات مناسبی گرفته شود میتوان مشتریان بانکی را بطور بهینه طبقه بندی کرد. در این تحقیق، یک مدل مناسب برای طبقه بندی مشتریان تسهیلات بانکی ارائه شده است. این مدل بر اساس استانداردCRISP-DM، انجام شده و دادههای مورد نیاز از پایگاه داده مشتریان بانک قرضالحسنه رسالت استخراج شده است.
در میان ویژگیهای مشتریان فقط از شش ویژگی تحصیلات، شغل، درآمد، مسکن، چک برگشتی و بدهی بانکی به عنوان متغیرهای مستقل تحقیق و طبقه بندی مشتری استفاده شده است با استفاده از قواعد و درخت تصمیم نهایی که مبتنی بر معیارهای بهینگی و دقت بوده، طبقه بندی انجام شده و متقاضیان تسهیلات بانکی در یکی از پنج گروه طلایی، نقرهای، برنزی، خاکستری و سیاه قرار میگیرند. پژوهش پیشرو از نظر هدف، کاربردی و از نظر گردآوری دادهها، پژوهشی اسنادی بهشمار میرود. نتایج بدست آمده نشان میدهد که. ریسک بانکی با خطای کلاسها رابطه مستقیم دارد.
مقدمه
یکی از مهمترین دلایلی که بانکها از برنامههای کاربردی در بانکداری نوین استفاده میکنند بهدست آوردن و حفظ بلندمدت مشتری و ارزشگذاری برای وی است که »مدیریت ارتباط با مشتری« نامیده میشود. برنامههای کاربردی CRM میتواند برای پشتیبانی از کل فرآیندهای مشتری مدار در بانکها، در هر اندازه و سطحی شامل بازاریابی، جذب نقدینگی و ارائه خدمات به مشتری استفاده شود. امروزه به منظور حفظ قدرت رقابتی، همه سازمانها بهدنبال راهی برای توسعه، حفظ و نگهداری مجموعه ای از مشتری، محصول، اطلاعات و خدمات در طول مدت مشترییابی، ارائه خدمات و پشتیبانی میباشند که بر CRM استوار هستند.
CRM یک سیستم مدیریت ارتباط با مشتری است در حقیقت این سیستم راهبردی است برای جمعآوری نیازها و رفتارهای تجاری مشتریان تا به ایجاد روابطی قویتر با آنها منجر شود. در نهایت رابطه قوی با مشتریان مهمترین رمز موفقیت هر کسبوکار است. CRM از سه بخش اصلی تشکیل شده است: مشتری - Customer - ، روابط - Relationship - و مدیریت - Management - منظور از مشتری؛ مصرفکننده نهایی است که در روابط ارزشآفرین، نقش حمایت کننده را دارا میباشد.
منظور از روابط؛ ایجاد مشتریان وفادارتر و سودمندتر از طریق ارتباطی یادگیرنده میباشد و مدیریت عبارت است از: خلاقیت و هدایت یک فرایند کسبوکار مشتری مدار و قراردادن مشتری در مرکز فرایندها و تجارب سازمان. امروز در سازمانها به مدیریت ارتباط با مشتری، اهمیتی استراتژیک داده شده است. در شرایط دشوار رقابت، ارتباط به هنگام و سازمانیافته با مشتریان، مناسبترین راه افزایش رضایت مشتری، و در عین حال کاهش هزینههاست. مدیریت ارتباط با مشتری واژهای برای مجموعه متدولوژیها، فرایندها، نرمافزار و سیستمهایی است که به موسسات و بانکها در مدیریت موثر و سازمانیافته ارتباط با مشتریان کمک می کند
خش عمده ای از مراودات بانکها در جهان با ارائه تسهیلات مالی به مشتریان میباشد و در ایران این موضوع بسیار برجستهتر از سایر نقاط میباشد زیرا ساختار کلی بانکها نوعی وابستگی به دولت را ایجاد مینماید و الزام آنها به ارائه تسهیلات مختلف به افراد بدون شناخت کافی از تواناییهای مالی و عملکرد، گذشته آنها مشکلات عدیدهای را در جهت بازپرداخت تسهیلات را موجب گردیده است که بر اساس نظر موسسه بین المللی KPMG میزان مطالبات معوق بانکها، بیانگر ریسک عملیاتی بالای آنها میباشد.
ریسکاعتباری عبارتست از احتمال تعویق، مشکوک بودن وصول یا عدم وصول اصل و سود تسهیلات مالی که در قالب تسهیلات به متقاضیان ارائه میگردد. ریسک اعتباری بطور سادهتر عبارت است از امکان بالقوه اینکه قرضگیرنده از بانک و یا طرف حساب وی، در اجرای تعهدات خود در مقابل بانک در مدت مشخصی ناتوان شود. از مهمترین رویکرد جهت کاهش خسارتهای ریسک اعتباری، شناسائی سنجش درجه و طبقهبندی اعتباری مشتریان میباشد که اصطلاحاً به آن اعتبارسنجی گویند. بر آن اساس هر کدام از متقاضیان تسهیلات دارای یک درجه اعتبار میباشد که آن نوعی برآورد از عملکرد و باز پرداخت تسهیلات در خواستی متقاضی میباشد.
ریسک همواره همراه زندگی انسانها و سازمانها بوده است و کلیه موقعیتهای تصمیمگیری با یک نوع یا طیف با دید وسیع متنوعی از ریسکها روبرو میباشند. در طبقهبندی ریسکهایی که یک بانک یا موسسه اعتباری در طول حیات خود با آن روبرو است، ریسکاعتباری یا ریسک ناشی از قصور در پرداخت جایگاه ویژهای دارد، چرا که به اولین نقش بانک در اقتصاد یعنی گردآوری سپرده و اعطای وام مرتبط است. ریسک اعتباری از آن جهت در نهادهای پولی حایز اهمیت است که منابع بهکار گرفته شده برای تخصیص، در حقیقت بدهی نهاد پولی به سهامداران، مردم و بانکها است که در صورت عدمگردش، هم توان اعتباردهی و هم قدرت تادیه بدهی نهاد پولی بهعنوان وامدهنده را تضعیف میکند
در اقتصاد ایران، بسیاری از عوامل غیرقابل پیشبینی بوده و تحتتاثیر شرایط ایجاد شده تغییر میکند، لذا یک سرمایهگذار برای سرمایهگذاری هرچند کوچک، بر اساس تجربیات گذشته، تا حد ممکن جایی برای این تغییرات یا ریسک میگذارد ولی بعضی مواقع تمامی شرایط اقتصاد براساس انتظارات وی تحقق نمییابد و این عامل منجر میشود تا در اثنای کار، وی با عواملی روبرو شود که شاید کوچکترین حدسی مبنی بر ایجاد آن نداشته، از اینرو دیگر قادر نخواهد بود به تعهدات خود عمل نماید و از دید بانک نیز مشتری تلقی خواهد شد که به تعهدات خود عمل نمیکند و بانک را در دریافت منابع داده شده با مشکل و در مواقعی با زیان مواجه سازد.
در کشور ما طی چند سال اخیر، موضوع ریسک و آسیبهای ناشی از آن مورد توجه سازمانها خصوصاً نهادهای مالی قرار گرفته است اما بهرغم اهمیت آن، چارچوب یکسان و هماهنگی برای پیاده سازی مدیریت ریسک و شاخصهای دقیق برای تعیین ریسک اعتباری وجود نداشته و صنعت رتبه بندی در کشور هنوز جایگاه مناسبی نیافته است که از عمده دلایل این امر میتوان به عواملی چون مسائل فرهنگی، اقتصادی، آموزش، فقدان بانکهای اطلاعاتی متمرکز، خلأ شبکه تبادل اطلاعاتی قوی و کارآمد، عدم وضع قوانین و مقررات کافی و مسائل سیاسی اشاره نمود. لذا باید تدابیری اندیشیده شود تا هم منابع مالی مورد نیاز متقاضیان تامین شده و هم بانک اصلیترین وظیفه خود یعنی اعطای تسهیلات را با حداقل ریسک ممکن انجام دهد. زیرا در شرایط متحول امروز،اساساً موفقیت هر بانک به تسلط آن بر ریسکها و نوع مدیریتی است که بر انواع ریسکها اعمال میکند.
امتیازدهی اعتباری، نظامی است که به وسیله آن بانکها و موسسات اعتباری با استفاده از اطلاعات حال و گذشته متقاضی، احتمال عدم بازپرداخت وام توسط وی را ارزیابی نموده و به او امتیاز میدهند. بهعبارت دیگر امتیازدهی بهمعنی کمی نمودن احتمال نکول در آینده است . امتیازدهی اعتباری یک ابزار عینی برای مدیریتریسک است که مشتریان اعتباری را بیطرفانه و بر اساس آمار و اطلاعات رتبهبندی مینماید. در حالی که روشهای قدیمی برای ارزیابی مشتریان عمدتاً ذهنی و متکی بر دیدگاه مسئول - یا مسئولین - پرداخت وام میباشد
بطور کلی فنون اندازهگیری ریسک اعتباری را میتوان به دو گروه عمده تقسیمبندی نمود:
الف- الگوهای امتیازدهی اعتباری غیرپارامتری ب- الگوهای امتیازدهی اعتباری پارامتری
با طبقه بندی اعتبارسنجی متقاضیان تسهیلات برای کاهش ریسکبانکی با استفاده از رویکردهای مبتنی برقاعده که یکی از تکنیکهای دادهکاوی است، در صورت گرفتن تصمیمات صحیح در این زمینه، سود حاصل از وامهای واگذار شده، بخشی از درآمد مؤسسات و بانکها را تشکیل خواهد داد. تحقیقات نشان دادهاند که با وجود سرویسهای مختلفی که بهتازگی توسط بانکها ارائه شدهاند، واگذاری وام به مشتریان حقیقی و حقوقی هنوز هم به عنوان یکی از مهمترین منابع درآمد برای بانکها و مؤسسات مالی محسوب میشود. بنابراین موضوع اصلی برای هر وامدهنده، طبقه - بندی متقاضیان قبل از اعطای وام به آنها است.
هدف از طبقه بندی، مشخصکردن ویژگیهایی است که بتوان توسط آن، کلاسهای مختلف را از یکدیگر متمایز کرد. طبقهبندی در دادهکاوی طی دو مرحله انجام میگیرد. ابتدا از روی دادههای قدیمی، کلاسهای مختلف تشخیص داده شده و سپس تعلق داشتن دادههای جدید به کلاسهای موجود، پیشبینی میشود. طبقهبندی جزو تکنیکهای یادگیری با ناظر است زیرا با در اختیار داشتن یک مجموعهداده آموزشی - بهعنوان راهنما - ، دادههای جدید را طبقه بندی میکند. این روش جزو روشهای پیشبینی کننده نیز به شمار میآید
طبقه بندی یکی از عملیات رایج و مورد استفاده در دادهکاوی است. طبقهبندی عملیاتی است که سازمانها را قادر میسازد در حل مسائل خاص در مجموعههای بزرگ و پیچیده به کشف الگوها دست یابند. هدف اصلی در این تحقیق، افزایش دقت طبقهبندی متقاضیان تسهیلات بانکی است. در دهه 80 مطالعات الگوریتمهای تقسیمبندی بازگشتی بر پایهی درخت طبقهبندی بهکار گرفته شد. هوانگ و همکارانش از اولین محققانی بودند که به منظور تجزیه و تحلیل رتبه بندی ریسک اعتباری از ماشینبردار پشتیبان که یک روش یادگیری ماشین است، استفاده کردند.
آنها بهمنظور پیشبینی وضعیت اعتباری مشتریان بازارهای ایالات متحده، از ماشینبردار پشتیبان استفاده کردند و نتایج آن را با شبکهعصبی پیشخور مقایسه نمودند. طبق مطالعات آنها، ماشینبردار پشتیبان همانند شبکهعصبی به-دقت پیشبینی نزدیک به 80 درصد دست یافت
پژوهشی خود با هدف پیشبینی درماندگی مالی شرکتها، به بررسی نتایج مدل ماشینبردار پشتیبان در مقایسه با مدل آماری رگرسیون لجستیک پرداختند. یافتههای آنها حاکی از آن است که مدل ماشینبردار - پشتیبان نسبت به مدلرگرسیون لجستیک، نه تنها از دقت کلی بهتری برخوردار است، بلکه توانایی بالاتری نیز در تعمیمپذیری دارد
بهترین روش برای طبقهبندی اعتبارسنجی متقاضیان تسهیلات جهت کاهش ریسک بانکی، شناخت و ویژگی های آنهاست که مدلهای اعتبارسنجی با دریافت مجموعهای از اطلاعات مشتری بهعنوان ورودی، کلاسی را به عنوان خروجی اختصاص میدهند که بانکها از این کلاس میتوانند در راستای تخصیصاعتبار به مشتری بهره گیرند. اغلب مدلهای ارائه شده در این زمینه، مشتریان را با عنوان دو گروه "خوشحساب " و" بدحساب" طبقهبندی میکنند.
از این رو، امکان گرفتن تصمیمات ناعادلانه در حوزه واگذاری اعتبار به مشتریان افزایش مییابد. ارزیابی ریسک اعتباری، یکی از مسائل مهم و پرچالش در زمینه تحلیلهای بانکی به شمار میآید. زیرا از این طریق میتوان از وارد آوردن خسارات کلان که پیامد تصمیمات نادرست واگذاری اعتبار وام به متقاضیان است، تا اندازه زیادی اجتناب کرد[15]با استفاده از روش تحلیلی پوششی دادهها به رتبه-بندی بانکهای صربستان پرداختند. در این پژوهش، دارایی کل، سرمایه کل و تعداد کارکنان - منابع مالی و انسانی - بهعنوان متغیرهای ورودی و درآمد بهره و سود قبل از مالیات بهعنوان متغیرهای خروجی در نظر گرفته شدهاند.
در این تحقیق سعی بر آن است که متقاضیان تسهیلات بانکی با کمک درخت تصمیمگیری و رویکردهای مبتنی بر قاعده طبقه بندی شوند
بدنه اصلی مقاله
با طبقهبندی اعتبارسنجی متقاضیان تسهیلات برای کاهش ریسک بانکی با استفاده از رویکردهای مبتنی برقاعده که یکی از تکنیکهای دادهکاوی است، در صورت گرفتن تصمیمات صحیح در این زمینه، سود حاصل از وامهای واگذار شده، بخشی از درآمد مؤسسات و بانکها را تشکیل خواهد داد.
تحقیقات نشان دادهاند که با وجود سرویسهای مختلفی که بهتازگی توسط بانکها ارائه شدهاند، واگذاری وام به مشتریان حقیقی و حقوقی هنوز هم بهعنوان یکی از مهمترین منابع درآمد برای بانکها و مؤسسات مالی محسوب میشود. بنابراین موضوع اصلی برای هر وام دهنده، طبقه بندی متقاضیان قبل از اعطای وام به آنها است. تاریخچه کشفدانش از پایگاههای اطلاعاتی قدمت چندانی ندارد و امروزه به دادهکاوی مشهور است.
اصطلاح کشفدانش برای نخستین بار در دهه 1990 مطرح شد و توجه پژوهشگران را به سمت الگوریتمهای دادهکاوی معطوف کرد. هدف دادهکاوی، کشف دانش جدید، معتبر و قابل پیگیری با استفاده از ابزارهای هوش مصنوعی و آماری در حجم بالایی از دادهها است.
دادهکاوی، استخراج و اقتباس دانش از مجموعه دادهها است و به فرایندی گفته میشود که دانش را از دادهها استخراج میکند و این دانش در قالب الگوها و مدلها بیان میشود[1]در شکل 1 مراحل کشف دانش از پایگاه دادهها نشان داده شده است این مراحل بهشرح زیر هستند.
-1 انتخاب دادهها : دادههای مربوط به تجزیه و تحلیل و تصمیمگیری از دادههای دیگر جدا میشوند.
-2 پیش پردازش دادهها : پردازش، تمیز کردن و یکپارچهسازی دادهها انجام میگیرد.
-3 تبدیل دادهها : دادههای انتخاب شده به شکل مناسبی برای روش دادهکاوی تبدیل میشوند.
-4 دادهکاوی : در این مرحله از روشهای هوشمندانهای برای
استخراج الگوهای بالقوه مفید استفاده میشود و در مورد این روشها تصمیمگیری میشود.
-5 تفسیر و ارزیابی : در این مرحله، الگوهای جالب توجه نشان دهنده دانش، بر اساس اقدامات انجام شده شناخته میشوند و دانش کشف شده در اختیار کاربر قرار میگیرد.
شکل: 1 مراحل کشفدانش از پایگاه دادهها
یکی از روشهای اکتشاف دانش که عموماً در دادهکاوی به کار میرود روش طبقهبندی و استفاده از الگوریتمهای درختتصمیم میباشد درخت تصمیمگیری درختی است که درآن نمونهها را به نحوی دسته بندی میکنند که از ریشه به سمت پایین رشد میکند و در نهایت به گرههای برگ میرسد. هر گره داخلی یا غیر برگ با یک ویژگی مشخص میشود، این ویژگی سوالی را در رابطه با مثال ورودی مطرح میکند. در هر گره داخلی به تعداد جوابهای ممکن با این سوال شاخه وجود دارد که هریک با مقدار آن جواب مشخص میشود. برگهای این درخت با یک کلاس و یا یک طبقه از جوابها مشخص میشوند. علت نامگذاری آن به درختتصمیم این است که این درخت فرآیند تصمیمگیری برای تعیین طبقه بندی را نشان میدهد.
در این تحقیق دادههای مربوط به مشتریانی که از بانک قرضالحسنه رسالت تسهیلات اعتباری دریافت کردهاند یا خواهند کرد، به عنوان اعضای جامعه آماری قابل استناد و به منظور بررسی احتمال نکول انتخاب شدند دادههای مربوط به مشتریان در یک پایگاهداده در نرمافزار اکسل ذخیره شد. از میان ویژگیهای مشتریان در این تحقیق فقط از شش ویژگی - تحصیلات، شغل، درآمد، مسکن، چکبرگشتی و تعداد روز تاخیر در بدهیبانکی - به-عنوان متغیرهای مستقل تحقیق و طبقهبندی مشتری استفاده شد. با استفاده از درخت تصمیمگیری طبقهبندی متقاضیان تسهیلات بانکی در نرمافزار MATLAB - 2010 - و Excel اجرا شده است. اجرای طبقهبندی متقاضیان تسهیلات بانکی، با استفاده از الگوریتم درخت تصمیمگیری در نرم افزار Matlab در شکل 2 نشان داده شده است.