بخشی از مقاله

چکیده

شرکت های مخابرات برای حفظ رابطه خوب با مشتریان موجود خود و جذب مشتریان جدید و شناسایی مشتریان سودده یا ضرر رسان، از تکنیک های دادهکاوی استفاده میکنند. خوشه بندی موجب شناخت صحیح تر مشتریان میگردد تا در تعریف و تصمیم گیری طرحهای تبلیغاتی، مورد استفاده قرار گیرد. در این مطالعه از سوابق خرید 999 مشتری در شرکت مخابرات خراسان جنوبی که طی یکسال جمع آوری شده است استفاده کردیم. هدف از این پژوهش تقسیم بندی مشتریان به چند خوشه میباشد که پس از مشخص شدن خوشه ها و تعداد اعضای هر کدام، مشتریان پر مصرف را از سیستم خارج و مشتریان پر ارزش از دست رفته را نیز شناسایی کرد. در این تحقیق با نرم افزار کلمنتاین و توسعه مدل RFM به مدل LRFM و دو الگوریتم TwoStep و k_Means توانستیم مشتریان را به پنج دسته ی وفادار، بلقوه، جدید، از دست رفته و پر مصرف تقسیم کنیم تا این بخش بندی معیار مناسبی در تصمیم گیری های آینده شرکت باشد و بتوانیم در خصوص هر دسته از مشتریان تصمیم گیری بهتری در آینده داشته باشیم.

واژگان کلیدی: مدل LRFM، الگوریتم TwoStep ،الگوریتم . k_Means

مقدمه

دادهکاوی به مفهوم استخراج اطلاعات نهان و یا الگوها و روابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ است. بسیاری از مردم داده کاوی را مترادف واژه های رایج کشف دانش از دادهها میدانند. دادهکاوی پایگاهها و مجموعههای حجیم دادهها را در پی کشف واستخراج دانش، مورد تحلیل و کند و کاوهای ماشینی و نیمهماشینی قرار میدهد. این گونه مطالعات و کاوشها را در واقع میتوان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینهها و کاربردها، و نیز ابعاد و اندازههای دادههای امروزین است که شیوههای ماشینی مربوط به یادگیری، مدلسازی، و آموزش را طلب مینماید.

به طور کلی، داده کاوی فرآیند تجزیه و تحلیل دادهها از دیدگاههای مختلف و خلاصه آن را به اطلاعات مفید است. هدف از استخراج این اطلاعات مفید افزایش درآمد، کاهش هزینهها، یا هر دو میتواند باشد. نرم افزارهای داده کاوی ابزارهای برای تجزیه و تحلیل دادهها هستند و اجازه میدهد تا کاربران به تجزیه و تحلیل دادهها از بسیاری از ابعاد و یا زوایای مختلف، بپردازند و روابط ناشناخته بین آنها را کشف کنند. شناسایی مشتریان و نیازهای مشتریان از عوامل مهمی است که تولید کنندگان برای به دست آوردن مزیت رقابتی در ارائه محصولات یا خدمات خود به مشتریان از آن کمک میگیرند. شرکتها باید مشتریان خود را اولویتبندی نمایند و تمرکز خود را بر مشتریان کلیدی قرار دهند.

اهمیت این موضوع به این دلیل است که با قطع ارتباط مشتریان و تمایل آنها به رقبای شرکت نه تنها باعث ضرر و زیان مالی می گردد بلکه از دست دادن شهرت و اعتبار خوب را هم در پی دارد. همچنین ممکن است مشتریان فعلی تجارب منفی خود را با مشتریان بالقوه به اشتراک بگذارند و این منجر به از دست رفتن اعتماد مشتریان بالقوه میشود.سازمانها میتوانند اهداف اساسی خود، از جمله دستیابی به مزیت رقابتی را با شناسایی گروههای مختلف مشتریان و نیازهای آنها دنبال کنند تا با نیل به رضایت مشتری، که خود منجر به وفاداری مشتری در بلندمدت میگردد به سوددهی بیشتر برسند. همچنین شناسایی مشتریان کلیدی و حفظ آنها نه تنها منجر به جذب مشتریان جدید میشود بلکه برای پر کردن جای خالی کسانی که تصمیم به قطع قرارداد با شرکت بسته اند نیز مفید است.چرا که که عمدتاً هزینه های کسب مشتری کلیدی جدید پنج برابر بیشتر از هزینه حفظ مشتری فعلی میباشد - کاتلر و آرمسترانگ، . - 1386

طبقه بندی یکی از موضوعات مهم در مدیریت ارتباط با مشتری است. در طبقهبندی مشتریان، کل جمعیت مشتریان را به گروههای کوچکتری تقسیم میکنیم، به طوری که مشتریان یک گروه دارای ویژگیهای مشابه هم هستند. در حالت ایده آل، سازمان باید یک درک خوب در مورد همه مشتریان خود داشته باشد، که این امر در دنیای واقعی امکانپذیر نیست. طبقه بندی مشتریان و خوشه بندی آنان به مدیران کمک میکند که درک بهتری از نیازهای آنان داشته باشند. داده کاوی دارای ابزارهای مختلف برای طبقه بندی مشتریان است که از تکنیک های متعددی بهره میگیرد. معروفترین ابزارهای دادهکاوی به ترتیب پرطرفدار بودن، زبان برنامه نویسی آر - Venables et al, 2016 - ، زبان برنامه نویسی پایتون - Miller, Bryce, 2016 - ، Clementine که نسخه 13 آن با نام SPSS Modeler نامیده میشود، نرمافزار وکا و نرم افزار متلب میباشد.

مفاهیم تعیین کننده در داده کاوی
هم پیوندی : - Bagging - هم پیوندی قابلیتی برای یافتن روابط ناشناخته موجود در اطلاعات است. این روابط مواردی از قبیل اینکه حضور مجموعهای از مقولات اشاره به این دارند که مجموعه مقولات دیگری نیز احتمالا وجود دارند را شامل می شود. این قابلیت اساساً روشی است برای اینکه کشف کنیم چه مقولاتی به هم میخورند. از آن با عنوان تحلیل سبد بازار یا گروهبندی خویشاوندی نیز یاد میشود.طبقه بندی - : - Boosting طبقه بندی در واقع ارزشیابی ویژگیهای مجموعه ای از دادهها و سپس اختصاص دادن آنها به مجموعه ای از گروههای از پیش تعریف شده است. این متداولترین قابلیت داده کاوی میباشد. داده کاوی را میتوان با استفاده از دادههای تاریخی برای تولید یک مدل یا نمایی از یک گروه بر اساس ویژگیهای دادهها به کار برد. سپس میتوان از این مدل تعریف شده برای طبقه بندی مجموعه دادههای جدید استفاده کرد. همچنین میتوان با تعیین نمایی که با آن سازگار است برای پیش بینیهای آتی از آن بهره گرفت.

الگوهای ترتیبی: قابلیتهای ترتیبی هم مانند قابلیتهای هم پیوندی این خاصیت را دارند که میتوانند وقایع را به هم مرتبط کنند. این کار در هم پیوندی سنتی یا تحلیل سبد بازار مجموعهای از مقولات را به عنوان مقولات پشت سر هم ارزیابی میکنند و از ابزارهایی مثل سریهای زمانی برای تعیین ترتیب بهره می برند. الگوهای ترتیبی علاوه بر آن، این قابلیت جدید را هم دارند که میتوانند فاصله زمانی بین دو واقعه را تخمین بزنند. برای مثال این قابلیت امکان نتیجهگیریهایی از قبیل اینکه "هشتاد درصد افرادی که کامپیوتر میخرند ظرف مدت یک سال چاپگر هم خواهند خرید." را مهیا می نماید. به این ترتیب شناسایی نوعی از خریدهای مقدماتی که پتانسیل خریدهای بعدی را در آینده تعیین میکنند، عملی میشود. در نتیجه از چنین تحلیل هایی به شدت در تبلیغات فروش استفاده می گردد.

خوشه بندی : - clustering - قابلیت خوشه بندی وظیفه تقسیم یک گروه ناهمجنس را در چندین زیر گروه بر عهده دارد. این فرایند یک تفاوت اساسی با طبقه بندی دارد. زیرا در این مدل هیچ گونه الگوی آموزشی نداریم. خوشه بندی به طور خودکار ویژگیهای متمایز کننده زیر گروهها را تعریف میکند و زیر گروهها را سازماندهی می نماید. و به عنوان نوعی قابلیت داده کاوی غیر مستقیم مطرح است. این ابزارها پایگاهداده را بر اساس ویژگیهای دادهها به چندین بخش تقسیم می کنند و گروههایی از رکوردها را به وجود میآورند که نمایانگر یا صاحب صفت خاصی هستند. الگوهای به دست آمده در ذات پایگاه داده نهادینه هستند و نشانگر بعضی اطلاعات غیر منتظره و در عین حال ارزشمند شرکتی باشند.

به منظور طبقه بندی کاربردهای دادهکاوی در شرکتهای مخابرات، رویکردهای مختلفی وجود دارد که از آن جمله میتوان به موارد زیر اشاره کرد:

طبقهبندی بر اساس روشهای داده کاوی: این طبقه بندی شامل خوشه بندی، رگرسیون، دسته بندی، کشف الگو و ... میباشد. در این نوع طبقه بندی، هدف ارزیابی و بهبود تکنیک های داده کاوی بکار رفته و بکارگیری روشهای جدید برای حل مسائل است.طبقه بندی بر اساس حوزه کاری: در این نوع طبقه بندی، هدف بهبود و ارائه راهکارهای جدید دادهکاوی در حوزههای موجود در سازمانهای مخابرات است. بعنوان مثال تلفن ثابت، تلفن همراه، دیتا و . ADSLطبقه بندی بر اساس هدف: در این نوع طبقه بندی، هدف شناسایی حوزههای جدید داده کاوی در مخابرات با محوریت جذبو حفظ مشتری است که از این گروه میتوان به بازاریابی هدفمند، افزایش سود، افزایش رضایت مشتری اشاره نمود.

براساس مطالعه و بررسی انجام شده، میتوان گفت طبقه بندی جامعی از کارهای انجام شده در صنعت مخابرات انجام نشده است. از آنجاییکه هدف اصلی شرکتهای مخابراتی، افزایش سود و رضایت مشتری از طریق ارائه خدمات متناسب به مشترکین میباشد، رویکرد این تحقیق برای طبقه بندی کاربردهای داده کاوی، مبتنی بر رفتار مشترکین است. برای این منظور با استفاده از مدل پیشنهادی LRFM که در بخش 3 توضیح داده شده است خوشه بندی را انجام میدهیم.در ادامه مقاله به تحقیقات پیش در خصوص خوشه بندی مشتریان می پردازیم در بخش بعدی مدل پیشنهادی که به دسته بندی مشتریان براساس توسعه مدل RFM به LRFM را توضیح میدهیم و به ارزیابی و اجرای این الگوریتم در محیط کلمنتاین پرداخته و در بخش آخر به نتیجهگیری نهایی در خصوص این تحقیق خواهیم پرداخت.

تحقیقات پیشین در زمینه روش های داده کاوی

در مطالعهی صورت گرفته در - Clemens et al, 2010 - نویسندگان مدلی را برای تجزیه و تحلیل رفتار خرید مشتریان در سوپر مارکت شبیه سازی کردند. این مدل شبیه سازی، دانشی را در مورد آنچه که مشتری داخل فروشگاه انجام میدهد را از قبیل نحوه حرکت در فروشگاه، چیدمان محصولات، خرید و یا نخریدن محصولات را نشان میدهد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید