بخشی از مقاله

چکیده

روند اقتصاد کشور به سوی رقابتی شدن پیش می رود که این روند بر روی تمامی شرکتها و موسسات نیز تاثیر گذاشته است. بانکها یکی از مهمترین ارکان اقتصاد هر کشوری هستند که رشد و یا افول این مراکز قدرت اقتصادی بر روی بدنه اقتصاد کشور تاثیرگذار است. یکی از مهمترین وظائف بانکها تخصیص اعتبار و یا وام به افراد و یا موسسات می باشد. از آنجائیکه در چندین سال اخیر مباحثی همچون عدم پرداخت بدهی ها گریبان گیر بسیاری از بانک های کشور بوده است در این مقاله با استفاده از تکنیک های طبقه بندی که در حوزه داده کاوی هستند به ارائه روشی جهت تحلیل ریسک مشتریان حقیقی وامهای بانکی خواهیم پرداخت.

بعلت اینکه الگوریتم های متنوعی اعم از درخت تصمیم، شبکه های عصبی، قوانین بیزی و ... در طبقه بندی مورد استفاده قرار می گیرند انتخاب الگوریتم مناسب نیز مسئله ای مهم است که باید بدان پرداخت که در این مقاله با رویکردی نوین معیارهای موثر بر انتخاب الگوریتم مناسب تعیین و سپس الگوریتم های منتخب با استفاده از روش تاپسیس که یکی از معروفترین تکنیکهای تصمیم گیری چندمعیاره برای رتبه بندی گزینه ها است، رتبه بندی خواهند شد. روش مورد استفاده در این مقاله می تواند بعنوان یک سیستم پشتیبان در جهت تحلیل ریسک مشتریان وامها بکار رود. در این مقاله از یک پایگاه داده استاندارد واقعی استفاده شده است.

-1 مقدمه

به مرور زمان استخراج و کشف سریع و دقیق اطلاعات با ارزش و پنهان از پایگاه داده ها به عنوان داده کاوی 1مورد توجه قرار گرفت.به این شکل بود که فرایند داده کاوی به عنوان فرایند آماری و تجزیه و تحلیل در فرایند کشف دانش در پایگاه داده ها پر رنگ شد،به حدی که گاه داده کاوی به عنوان مترادف کشف دانش در پایگاه داده ها مورد استفاده قرار می گرفت.امروزه فرایند استخراج اطلاعات معتبر و از پیش ناشناخته،قابل فهم و قابل اعتماد از پایگاه داده های بزرگ و و استفاده از آن در تصمیم گیری داده کاوی نامیده می شود. داده کاوی فرآیندی تکرارپذیر است که پیشرفت در آن با کاوش از طریق روش های خودکار یا دستی صورت می گیرد.

داده کاوی سودمندترین سناریوی تحلیلی اکتشافی است که در آن تصور و برداشت از پیش تعیین شده ای درباره نتیجه "قابل توجهی" که به دست می آید، وجود ندارد. در حقیقت داده کاوی، جست و جوی لازم برای یافتن اطلاعات کلی جدید، ارزشمند و غیر بدیهی از میان حجم زیاد داده ها می باشد. به تعبیر بهتر داده کاوی تعامل همکاری بین انسان و کامپیوتر است. بهترین نتایج از ایجاد تعادل بین دانش متخصصان در توصیف مسائل و اهداف با قابلیت های جست و جوی کامپیوتر به دست می آید. - شهرابی و شکورنیاز، - 1387

در عمل، دو هدف اصلی داده کاوی شامل پیش گویی و توصیف می باشد. پیش گویی شامل به کارگیری بعضی متغیرها یا فیلدها در مجموعه داده ها برای پیش گویی و مقادیر ناشناخته یا آتی دیگر متغیرها می باشد و توصیف، از سوی دیگر در پی یافتن الگوهای توصیف داده ها که توسط انسان ها قابل تفسیر هستند، تأکید دارد. نظر به اینکه داده کاوی یک فعالیت طبیعی است که بر روی مجموعه داده های حجیم و بزرگ اعمال می شود، یکی از بزرگترین بازارهای هدف، انبار جامع داده ها، مراکز داده اختصاصی و سیستم پشتیبانی تصمیم به دست آوردن تخصص هایی در صنایعی مانند خرده فروشی، تولید، مخابرات و ارتباطات، بهداشت عمومی، بیمه و حمل و نقل است.

در مباحث تجاری از داده کاوی می توان برای ارائه روش های جدید خرید، استراتژی های سرمایه گذاری و تشخیص هزینه های غیر مجاز در سیستم حسابداری استفاده نمود. داده کاوی می تواند رقابت و بازده بازاریابی را بهبود بخشیده و درآمدها، حمایت و رضایت مشتریان را جلب کند. همچنین از تکنیک های داده کاوی می توان برای حل مشکلات فرآیند تجارت استفاده نمود که در حقیقت هدف، درک تقابل و ارتباط بین شیوه های کسب و کار و سازماندهی های لازم می باشد.

بسیاری از مجریان قانون و واحدهای بازرسی ویژه که مأمور شناسایی فعالیت های کلاهبرداران و کشف روش های ارتکاب جرم هستند، به طور موفقیت آمیزی از فرآیند داده کاوی استفاده و از مزیت نسبی آن بهره مند می شوند. برای مثال، این متدولوژی می تواند متخصصین و تحلیلگران را در تشخیص الگوهای بحران رفتاری در رابطه با مواد مخدر، معاملات و تراکنش های پول شویی، حرکات و فعالیت های گروه های آدمکشان زنجیره ای و شناسایی قاچاقچیان در نقاط مرزی یاری دهد. تکنیک های داده کاوی همچنین در مباحث مرتبط با مأموران اطلاعاتی توسط افرادی که بسیاری از منابع داده های بزرگ و حجیم را به عنوان بخشی از فعالیت های مربوط به امور امنیت ملی ذکر می کنند، مورد استفاده قرار می گیرد. - شهرابی و ذوالقدرشجاعی، - 1388

-2 معرفی ابزارها

2-1 طبقه بندی

طبقهبندی2 به معنی پیش بینی برچسب3ها برای دادهها بر اساس دادههای برچسب خورده قبلی میباشد. - کانتاردزیک، - 1389 طبقه بندی فرایندی است برای یافتن مدل4 - یا تابع - که دادهها را تشریح و کلاسهای آنها را تشخیص میدهد. برای رسیدن به این هدف از مدل ساختهشده استفاده میشود که میتواند برچسب کلاسهای نامشخص را بدست آورد. مدل بیان شده بر اساس تحلیل مجموعهای از داده های آموزشی5 - داده هایی که برچسب کلاس آنها مشخص می باشد - بدست می آید. "مدل بدست آمده چگونه تشریح می شود ؟" مدل به دست آمده ممکن است به شکلهای مختلف از جمله قوانین طبقه بندی - IF-THEN - شکل 1، درخت تصمیم6 شکل 2، فرمول های ریاضی و یا شبکه های عصبی7 ، شکل 3 نشان داده شوند.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید