بخشی از مقاله
چکیده :
امروزه شناسایی مشتریان و ارزیابی آن ها، یک کسبوکار چندین میلیون دلاری در سطح دنیا محسوب شده و حجم مالی آن روزبهروز در حال افزایش است. در سالهای اخیر، توسعه فناوریهای جدید راههای زیادی را برای بانک ها بازکرده است که فرصتهای بیشتری را برای ارزیابی مشتریانشان فراهم نمایند. تکنیکهای مختلف رفتار صورت گرفته در یک بانک را شناسایی کرده و مورد تجزیهوتحلیل قرار میدهد، بهنوعی با شناخت رفتار کاربران یا مشتریان سعی در پیشبینی رفتار آتی آنها داشته و ریسک تخصیص تسهیلات را کاهش میدهد. روش پیشنهادی با دادههای استاندارد مربوط به سیستم بانگداری بانک ایران زمین مورد ارزیابی قرارگرفته است و ویژگیهای استخراجشده توسط طبقهبندی کننده فازی مورد استفاده قرار میگیرد. نتایج حاصله از این طبقه بندی کننده بر روی ویژگیهای استخراجی توسط الگوریتم پیشنهادی، با نتایج حاصل از طبقهبندی با استفاده از تمامی ویژگیها مورد مقایسه قرار گرفته است. روش پیشنهادی مورد شبیهسازی قرار گرفته است. نتایج ارائه شده نشاندهنده کیفیت بالای روش پیشنهادی میباشد. نتایج نشان داد که روش انتخاب منطق فازی ، دارای دقت %79 میباشد که نسبت به سایر طبقه بندی کننده های مشهور برتری قابلتوجهی دارد.
کلید واژهها: عملیات بانکی،خوشه بندی، منطق فازی، طبقه بندی، داده کاوی.
-1 مقدمه
ارائه خدمات بانکداری الکترونیک در برخی موارد دچار ضعف هایی است. مثلا این نوع از خدمات قابل ویرایش برای ارائه وام بدون حضور افراد را ندارد. نمی تواند کارت اعتباری به افرادی بدهد و ضمانتی از آنها درخواست نماید.دیگر موارد بانکداری الکترونیک نیز از این قاعده پیروی خواهند کرد پس شناخت افراد و مشتریان خوش حساب بدون حضور آنها و توسط سیستم باعث خواهد شد تا روند ارائه خدمات بهتر و با سرعت بیشتری قابل انجام باشد.[1] یکی از مواردی که می تواند در اینگونه از سیستم ها مورد بررسی قرار گیرد مبحث وام و ارائه وام است.
منظور انتخاب افراد خوش حساب از میان تمام افراد و ارائه وام به آنها.امروزه در صنعت بانکداری وامها نقش اساسی دارند، در نتیجه با افزایش تعداد درخواستهای وام و با توجه به ریسک موجود در این فعالیتها، ارائه روشی برای مدیریت این وامها ضروری است.[2] یکی از راهای کمیسازی و اندازهگیری ریسک اعتباری - ریسک ناتوانی در بازپرداخت تسهیلات اعطایی - استفاده از مدلهای امتیازدهی اعتباری است که هدف اصلی آنها طبقه بندی نمونهها به گروه های نزدیک است. دو دسته از تکنیکهای اعتبارسنجی شامل تکنیکهای هوشمصنوعی و تکنیکهای آماری است که تکنیک های هوشمصنوعی نسبت به روشهای آماری در برخورد با مشکلات اعتبارسنجی برترند.
هدف، اعتبارسنجی برای طبقهبندی مشتریان بانک ایران زمین به چهار دسته زیر است: مشتریان با اعتبار خوب - گروه اول - ، مشتریان با اعتبار مناسب - گروه دوم - ، مشتریان قابل بررسی - گروه سوم - و مشتریان با اعتبار بد - گروه چهارم - است. مشتریان با اعتبار خوب تعهد بیشتری برای بازپرداخت دارند و می توان به آنها تسهیلات بهتری ارائه کرد در مقابل دیگر گروه ها نیاز به گرفتن ضامن های مختلف برای ارائه خدمات می باشند. به منظور انعکاس چارچوب پژوهش حاضر، در این بخش مختصری از مطالب عنوان شده در هر یک از بخشهای آتی مطرح میشود. در بخش دوم، پیشینه پژوهش های قبلی نشان داده میشود. در بخش سوم، روش پژوهش و آزمون فرضیهها عنوان شده است. در بخش چهارم، تجزیه و تحلیل و آزمون فرضیههای پژوهش به همراه نتایج آن عنوان شده است.
-2 پیشینه تحقیق
چن وهمکاران - - 2011،درپژوهشی تحت عنوان "ارزیابی نتایج آن توسط یک بانک چینی محلی صورت گرفته بود، و هدف آن استخراج پایگاه داده بانک و طبقهبندی دارندگان کارت اعتباری به گروه های مختلف برای مدیریت بهتر ریسک اعتباری بود، یک روش دادهکاوی ترکیبی، شامل دو مرحله پردازش را ارائه کرد که درآن به جای طبقهبندی مشتریان به دو کلاس خوب یا بد، نمونهها را به 3 یا 4 کلاس طبقهبندی میکرد که نتایج خوبی برای ایجاد مدیریت ریسک بانک به همراه داشت.[8] آروراوبابیتا - 2013 - ، در مقاله خود با عنوان » فرآیند ارزیابی اعتبار در بانک«SBI به ارائه مدلی در خصوص ارزیابی ریسک اعتباری مشتریان پرداختند. نتایج تحقیق نشان داد، مناسبترین روش برای ارزیابی اعتبار مشتریان بررسی موقعیت مالی و توانایی مشتریان در بازپرداخت تسهیلات در آینده میباشد.[7]
هوانگ و همکارانش - 2007 - در مقالهای برای مقایسه مدلهای اعتبارسنجی، عملکرد برنامهنویسی ژنتیک را در برابر شبکههای عصبی، ماشین بردار پشتیبان و درخت تصمیم را با استفاده از دیتابیس آلمان و استرالیا مقایسه کردند. مطالعه آنها دقت طبقهبندی بهتری را با برنامهنویسی ژنتیک نسبت به تکنیکهای دیگر نشان میدهد. اگرچه این تفاوتها کم و ناچیز هستند.[15] کای و همکارانش - - 2009 در مقالهای تحت عنوان "یک مدل الگوریتم ژنتیک برای اعتبارسنجیهای شخصی" نشان دادند که الگوریتم ژنتیک یک تابع ارزیابی مناسب را به کار می گیرد. با توجه به ارزش هر دو مشتری خوب یا بد در مجموعه آموزشی، نتایج روی دیتابیس اعتباری آلمان نرخ دقت قابل قبولی را روی مشتریان با کلاس "خوب" منعکس می کند، اما روی مشتریان بد عملکرد ضعیفی دارد.[14]
-3 آزمایشها
-1-3 نزدیکترین همسایه
در این تحقیق سعی شده با تکیه بر ویژگیهای مربوط به دریافت تسهیلات بانکی، ویژگی هایی انتخاب شوند که محاسبه آنها ساده باشد و به سرعت قابلاندازهگیری باشند . الگوریتم K-Means تا به امروز متداولترین ابزار خوشهبندی در کاربردهای علمی و صنعتی محسوب میشود. نام این الگوریتم نشاندهنده خوشهبندی دادهها به K خوشه با میانگین نقاط هر خوشه است که آن را مرکز خوشه مینامیم.[10] الگوریتم یکی از سادهترین روشهای ارائه شده یادگیری است.این متد n شیء دادهای را به k خوشه - که تعداد آن از قبل داده شده - تقسیمبندی میکند.
در ابتدا بهصورت تصادفی برای هر خوشه یک مرکز تعیین میشود. هر شیء دادهای به خوشهای با نزدیکترین مرکز خوشه اختصاص مییابد. پس از این تخصیص اولیه مراکز خوشهها دوباره محاسبه میشوند و همه مراحل دوباره تکرار میشوند. در هر تکرار الگوریتم مراکز خوشهها تغییر میکنند. الگوریتم تا زمانی ادامه مییابد که مراکز خوشهها دیگر تغییر نکنند. در نتیجه k خوشهایجاد شدهاند که یک مجموعه از n شیء دادهای را نمایش میدهند. روش K-Means از مرکز یا میانگین برای نمایش خوشهها استفاده میکند، به همین دلیل به نقاط پرت حساس است. این بدین معنی است که یک شیء دادهای با مقدار خیلی زیاد میتواند توزیع دادهای بین نقاط را به هم بزند.[13] علی رغم اینکه خاتمهپذیری الگوریتم نزدیکترین همسایه تضمین شده است ولی جواب نهایی آن، واحد نبوده و همواره دارای جوابی بهینه نمیباشد. به طور کلی روش ساده مورد نظر دارای مشکلات زیر است:[13]
· جواب نهایی به انتخاب خوشههای اولیه وابستگی دارد.
· روالی مشخص برای محاسبه اولیه مراکز خوشهها وجود ندارد.
· اگر در تکراری از الگوریتم تعداد دادههای متعلق به خوشهای صفر شد راهی برای تغییر و بهبود ادامه روش وجود ندارد
-2-3 منطق فازی
در این تحقیق، رویکردی با استفاده ازمنطق فازی به عنوان یک سیستم تشخیصی برای رتبه بندی و اعتبارسنجی مشتریان بانک ایران زمین ارائه گردید. به دلیل حجم زیاد داده های مربوط به مشتریان بانک،. معمولا بدست آوردن تشخیص نهایی اعتبارسنجی حتی برای سیستم به دلیل پیچیدگی و غیرخطی بودن روابط بین عوامل زیادی که اندازه گیری شده است، دشوار بوده که این عوامل احتمالا میتوانند با یک فرآیند تصمیمگیری شبیه به انسان با استفاده از الگوریتمهای هوشمصنوعی - - AI حل شوند.
سیستم فازی معرفی شده در این گزارش به صورت زیر می باشد: تعداد مجموعه های فازی : نه مجموعه - هشت مجموعه برای فازی ساز : مثلثی. غیرفازی ساز : میانگین مرکز ثقل موتور استنتاج فازی : ممدانی و لارسن پایگاه قواعد فازی : جدول جستجو. بخشها را به تفصیل معرفی خواهد شد. در این مرحله برای هر متغیر ورودی، توابع عضویت را در نظر می گیریم تا ورودیهای قطعی تبدیل به فازی شوند و در سیستم استنتاج فازی قرار بگیرند. توابع عضویت انواع مختلفی دارند، مانند مثلثی، ذوزنقه ای، گوسی و غیره. تابع فازیساز مورد استفاده در این آزمایش، فازیساز مثلثی میباشد.
eFIS = addvar - eFIS,'input','rotbe',[1 50] - ;
غیرفازیساز کردن: ورودی هر فرآیند فازی مجموعه فازی است که حاصل
اجتماع مجموعه های فازی در قدم 4 بود و خروجی آن یک عدد است. مجموعه فازی که در مرحله قبل به ما نتیجه داد به ظاهر نمی تواند حاصل عملکرد سیستم فازی و نتیجه نهایی که مشخص کند بالاخره خروجی کدام یک از مقادیر متغیر ها در برآیند قوانین بوده است را تعیین کند. پس باید از این مجموعه یک مقدار را که تعیین کننده باشد بدست آورد. که به این عمل اصطلاحاً دِفازی کردن گفته می شود. شاید عامه پسندترین روش، محاسبه مرکز ثقل میباشد، که مرکز سطح زیر منحنی را می دهد. برای این منظور 5 روش از پیش ساخته شده وجود دارد : مرکز ثقل، نیمساز، نصف ماکزیمم - میانگین مقدار ماکزیمم مجموعه خروجی - ، بزرگترین ماکزیمم و کوچکترین ماکزیمم.[6] پایگاه قواعد : پایگاه قواعد به مجموعه "اگر -آنگاه" فازی گفته می شود که قلب سیستم استنتاج فازی را تشکیل میدهد. دو روش عمده برای تعیین قواعد فازی وجود دارد: یکی استفاده از دانش خبره و دیگری استفاده از آموزش های خود سازمانده، مانند الگوریتم های نوین و شبکه عصبی است که در اینجا از روش اول برای تعیین قواعد فازی استفاده شده است.
یک قانون اگر-آنگاه به صورت "اگر Xبرابر A باشد، آنگاه Yبرابر B است "تعریف می شود که Xو Yمتغیرهای ورودی و خروجی و Aو Bمقادیر زبانی - توابع عضویت - نوشته شده برای این متغیرهاست. ذکر این نکته ضروری است که در روش ممدانی، خروجی به شکل فازی تعریف می شود. قسمت "اگر Xبرابر A باشد"، قسمت "مقدم یا فرض" و قسمت "آنگاه Yبرابر Bاست" را قسمت "نتیجه یا برآیند" گویند.[6] از میان تمام قوانین موجود یک قانون به صورت پیش فرض انتخاب شده است که در ادامه می آوریم. چنانچه سرویس انتخاب شده rotbe باشد و رتبه فرد کمترین مقدار را داشته باشد میتوان به آن اعتماد کرد و به ایشان وام داد.
-4 ویژگیهای محیط پیاده سازی
برای پیاده سازی روش پیشنهادی ابتدا عملیات پیش پردازش داده ها انجام شده است که در این فاز داده ها به شکل استاندارد و به نمای جدولی تبدیل می گردند. برای انجام این کار از زبان برنامه نویسی جاوا استفاده شده است. بعد از انجام این فاز برای شبیه سازی روش پیشنهادی از نرم افزار MATLAB R2016b استفاده گردیده است. این شبیه سازی بر روی سیستمی کامپیوتری با پردازنده core2duo با میزان حافظ اصلی 4 گیگابایت و بر روی سیستم عامل ویندوز 7 اجرا شده است.
-5 داده های مورد استفاده
همان طور که در فصل قبل بیان شد، برای ارزیابی روش پیشنهادی از داده های مربوط به سیستم بانکداری بانک ایران زمین جمع آوری شده از شعب استان فارس می باشد. این داده ها حاوی 1000 نمونه هستند یعنی 1000 مشتری مختلف داریم که در چهار دسته و طبقه خوب، متوسط، نامناسب و بد قرار می گیرند. در واقع کلاس داده تحت عنوان چهار می باشد که در واقع بیانگر اعتبار و عدم اعتبار مشتری می باشد. در این مجموعه داده