بخشی از مقاله
چکیده:
با گسترش روز افزون استفاده از سامانههای مدرن بانکی و افزایش تعداد تراکنشهای بانکی، سوء استفادههای مالی و تقلب در این تراکنشها بیش از پیش نمود پیدا کرده است. این سوء استفاده ها علاوه بر از دست دادن منابع مالی هنگفت، باعث کاهش اعتماد مشتریان به استفاده از سامانههای مدرن بانکی و در نتیجه کاهش اثربخشی این سامانهها در مدیریت بهینهی سرمایه و تراکنشهای مالی میشود. هر چند جلوگیری از تقلب بهترین راهکاهش تقلبهای بانکی است، اما افراد سودجو از راههای مختلف به اهداف خود دست پیدا میکنند.
بنابراین روشهایی مورد نیاز است تا تراکنشهای مشکوک به صورت برخط شناسایی و از انجام آنها ممانعت به عمل آید. در سالهای اخیر روشهای دادهکاوی توانستهاند با موفقیت در جلوگیری از پولشویی، تشخیص تقلب کارتهای سپرده و اعتباری به کار گرفته شود. در این پایاننامه، روشهای دادهکاوی به منظور تشخیص تقلب در بانکداری الکترونیک بررسی میشود. به این منظور روشی ترکیبی شامل خوشهبندی و کلاسبندی برای تشخیص تقلب ارائه شده است. در روش پیشنهادی قبل از کلاسبندی ،خوشهبندی انجام میشود تا یک فیلد مفید به این اطلاعات اضافه شود؛ زمانی که این فیلد به اطلاعات اضافه شد، کلاسبندی روی فیلدهای قبلی و فیلد جدید انجام میشود.
.1 مقدمه
ورود به قرن بیست و یکم و عصر اطلاعات و دانایی، با چالشها و نگرانیهای مهمی همراه بوده است؛ بطوری که هیچ یک از برنامههای توسعهای طراحی شده و فناوریهای نوین قرن بیستم نتوانستهاند تاثیر قاطعی بر حل این مسائل و تبعات ناشی از بروز آن بر جای گذارند. اما به نظر بسیاری از محققین و صاحبنظران، انقلاب فناوری اطلاعات میتواند نقش اساسی در مواجهه با این چالشها داشته باشد. دورهای از زمان که در آن به سر میبریم دوران الکترونیکی شدن همه چیز2 نامیده شده است که از جمله آنها میتوان به تجارت الکترونیکی3، بانکداری الکترونیکی4، یادگیری الکترونیکی5، تدارکات الکترونیکی6، شهروند الکترونیکی7، دولت الکترونیکی8 و در مجموع زندگی الکترونیکی9 اشاره کرد.
با رشد روزافزون معاملات تجاری در سطح جهان و ظهور پدیده تجارت الکترونیک و نیاز ساختار تجارت به حضور فعال و قدرتمند بانکها جهت نقل و انتقال منابع مالی، بانکداری الکترونیک را به عنوان بخش تفکیکناپذیر از تجارت الکترونیک مطرح میکنند. پدید آمدن دو مفهوم جدید با عنوان پول الکترونیک10و انتقال الکترونیکی منابع، اساس شکلگیری بانکداری الکترونیک شد.
در واقع بانکداری الکترونیک اوج استفاده از فناوری اطلاعات و ارتباطات در جهت حذف دو قید زمان و مکان از خدمات بانکی شده است. امروزه، مهمترین موضوع در بانکداری الکترونیکی امنیت است. نگرانی اصلی بانک ها تضمین تراکنشهای الکترونیکی مشتریان میباشد ،با این حال متقلبان برای رسیدن به هدف خود بسیار پیچیده و هوشمندانه عمل میکنند. با علم به این موضوع بانکها سعی بر بهینهسازی سیستمهایی به منظور کشف تقلب و بررسی رفتارهای مشکوک در معاملات آنلاین را دارند. از آنجایی که خدمات بانکداری الکترونیک بسیار گسترده است، شناسایی تقلب در این حیطه نیز از گستردگی زیادی برخوردار است؛ مانند کشف تقلب در حوزه کارت های الکترونیکی، اینترنت بانک، موبایل بانک، تلفن بانک و بسیاری دیگر از این موارد می-باشد
امروزه با گسترش فناوریهای مدرن و ارتباطات جهانی، تقلب به طرز چشمگیری در حال افزایش است و هزینههای زیادی را به کسب وکارها تحمیل میکند. در نتیجه شناسایی تقلب به مسأله بسیار مهمی تبدیل شده است. سیستمهای مالی مبتنی بر فناوری اطلاعات به دلیل پتانسیل بالایی که در جهت امکان سرقت پولی در حجم بالا دارند، اغلب اهداف راحتی برای حملهکنندگان هستند که از نقص احراز هویتهای متعدد و یا نقاط ضعف موجود در مدلهای امنیتی اجرا شده در سرویسها استفاده کرده و اهداف خود را پیاده مینمایند.
از روشهای دادهکاوی میتوان جهت تشخیص تقلب در سیستم بانکداری الکترونیکی استفاده کرد. دادهکاوی به مفهوم استخراج اطلاعات نهان و یا الگوها و روابط مشخص در حجم زیادی از داده ها در یک یا چند بانک اطلاعاتی بزرگ است. بسیاری از مردم دادهکاوی را مترادف واژه های رایج کشف دانش از داده ها - KDD - میدانند. وظیفهی دادهکاوی، کاویدن و استخراج از منابع عظیم داده است تا اطلاعات گرانبهایی که در حجم انبوهی از اطلاعات سطحی پنهان شده است را استخراج کند. تفاوت اصلی دادهکاوی و علم آمار، در حجم دادههای مورد تحلیل، روش مدلسازی دادهها و استفاده از هوش مصنوعی است.
در این تحقیق هدف این است که روش جدیدی جهت تشخیص تقلبی بودن یا نبودن یک تراکنش در سیستم بانکداری الکترونیکی با استفاده از ترکیب الگوریتمهای K-NN و K-Mean ارائه شود. پیش از این تحقیقی با این موضوع ارائه نشده است که با استفاده از ترکیب الگوریتمهای K-NN وK-Mean ، راهکاری ارائه کند که موجب تشخیص تقلب در سیستم بانکداری الکترونیکی گردد.روش پیشنهادی که از جهت تشخیص تقلب در سیستم بانکداری الکترونیکی با ترکیب الگوریتمهای K-NN و K-Mean میباشد، میتواند دقت بالاتری نسبت به روشهای قبلی داشته باشد. همچنین طرح مساله انجام شده و مطالبی در زمینه اهمیت و ضرورت انجام این تحقیق بیان گردید.
در این فصل به شناخت بانکداری الکترونیکی و عوامل موثر در تعریف و شناسایی رفتار کاربران پرداخته شده و دستهبندی رفتارها بیان گردید؛ همچنین روشهای شناسایی انواع تقلب در بستر بانکداری الکترونیک، شرح هریک از انواع تقلب، شرح تکنیکهای تشخیص تقلب و معایب و مزایای هر یک از آنها گفته شد. سپس بیان گردید که این امر به دلیل اثر مستقیم آن روی خدمت رسانی به مشتریان، کاهش هزینههای عملیاتی و قابل اطمینان کردن تراکنشهای الکترونیکی، اهمیت فراوانی دارد.
لذا به کارگیری تکنیکهای شناسیایی تقلب به منظور جلوگیری از اقدامات متقلبانه در سیستمهای بانکداری امری حائض اهمیت می باشد که ضرورت انجام این پایاننامه را مشخص میکند. تاکنون سیستمهای مختلفی بواسطه روشهای ماشینی هوشمند و تکنیک دادهکاوی جهت شناسایی جرم در رفتار کاربران طراحی شده و در صنایع مختلفی همچون بیمه، پزشکی و بانکداری بکارگرفته شده است
هدف این پایاننامه ارائه روشی جهت تشخیص تقلب در سامانه بانکداری اینترنتی است؛ لذا تشخیص رفتار کاربران و دستهبندی الگوهای بوجود آمده، شرایطی را در جهت پیشبینی نفوذ غیرمجاز و تشخیص رفتارهای مشکوک و تقلبآمیز مهیا میسازد.
ادامه این مقاله به صورت زیر میباشد.ذر بخش دوم به بررسی چند روش از روشهای تشخیص تقلب در سیستم بانکداری الکترونیکی با استفاده از تکنیکهای دادهکاوی پرداخته خواهد شد. بخش سوم به ارائه روش تشخیص تقلب در سیستم بانکداری الکترونیک با استفاده ترکیبی از الگوریتمهای K-NN و K-Means پرداخته خواهد شد. در ادامه این بخش به بررسی کارآیی روش پیشنهادی از طریق شبیه سازی در محیط نرمافزار رپیدماینر پرداخته خواهد شد. نهایتآ در بخش آخر یک نتیجهگیری و جمعبندی از مقاله خواهیم داشت.
-2بررسی روشهای تشخیص تقلب در سیستم بانکداری الکترونیکی
در منابع علمی، تقلب در کارتهای بانکی به روشهای گوناگونی تعریف شده است که چکیدهی این تعاریف را میتوان اینگونه جمعبندی کرد: تقلب در کارتهای بانکی، به کلاهبرداری یا تقلب به وسیلهی کارت بانکی یا هرگونه سازوکار پرداخت مشابه اطلاق میشود، که تراکنش در منبع متقلبانه انجام میشود.
روشهای دادهکاوی بهعنوان یکی از اصلیترین ابزارهای شناسایی تقلب در کارتهای بانکی استفاده میشود. دادهکاوی، فرآیند کشف روابط ناشناخته و الگوی دروندادههاست، درواقع فعالیتی است که بهطور اساسی با آمار و تحلیل دقیق دادهها انطباق دارد. هرچه حجم دادهها بیشتر و روابط میان آنها پیچیدهتر باشد، دسترسی به اطلاعات نهفته در دادهها مشکلتر میشود، لذا نقش دادهکاوی به عنوان یکی از روشهای کشف دانش، روشنتر میشود. راهبردهای کلان مسائل شناسایی تقلب در حوزه کارتهای بانکی را نیز میتوان منطبق با راهبردهای دادهکاوی دانست
در منبع دیگری روشها و مدلهای استفادهشده برای کشف تقلب را بررسی شد. آنها مدلهای کشف تقلب در حوزه کارتهای اعتباری را با دو رویکرد نظارتشده و نظارتنشده طبقهبندی کردند و برای کشف تقلب در کارتهای بانکی، روش خوشهبندی را بهکار بردند. بهکمک این روش، حسابهایی که در یک بازه زمانی مشخص الگوی رفتاری متفاوتی از خود نشان میدهند، شناسایی میشوند
استفاده از شبکههای عصبی مصنوعی برای طبقهبندی در بسیاری از زمینهها، کاربرد فراوانی دارد که یکی از ویژگیهای آنها، خاصیت یادگیری نظارت نشده است. شبکههای عصبی مصنوعی نیز یکی از روشهایی است که برای شناسایی تقلب در کارتهای بانکی استفاده میشود. برتری شبکههای عصبی نسبت به روشهای دیگر این است که میتواند از تراکنشهای گذشته الگو بگیرد و با گذشت زمان نتایج را بهبود دهد. همچنین میتواند قوانین را استخراج کند و رفتار آینده را براساس وضعیت فعلی پیشبینی کند
در کاربرد روشهای دادهکاوی برای کشف تقلبهای مالی را مورد بررسی قرار دادند. آنان 49 مقاله چاپشده در مجلات معتبر را بررسی کردند و مشخص شد که در مجموعه تحقیقهای مورد بررسی، از شش طبقه از کاربردهای داده کاوی برای کشف تقلبهای مالی استفاده شده است. این موارد عبارتند از طبقه بندی، رگرسیون، خوشه بندی، پیشبینی، کشف دادههای پرت و تصویرسازی. هر یک از این شش طبقه، با مجموعهای از رویکردهای الگوریتمی حمایت میشود که بهدنبال استخراج ارتباطهایی مربوط از دادهها هستند . این رویکردها در نوع مسائلی که قادر به حل آنها هستند، با یکدیگر تفاوت دارند.