بخشی از مقاله
چکیده
حفظ مشتریان با شناخت رفتار آنها در خرید، از راهکارهای مناسبی در جهت بهبود و سودآوری فروش در بازار رقابتی امروز میباشد. مدیریت ارتباط با مشتری با تحلیل ارزش دوره عمر هر مشتری میتواند شرکتها را در دستیابی به این مهم یاری رساند. تحقیق حاضر با ارائه مدلی مبتنی بر الگوریتم k-means و مفاهیم RFM و یافتن تعداد خوشه بهینه با شاخص اعتبارسنجی دیویس-بولدین، اقدام به خوشهبندی مشتریان یک واحد صنعتی سسهای خوراکی نموده است. در ادامه با بررسی رفتار خرید مشتریان هر خوشه، سیاستگذاری تعاملی با مشتریان تنظیم و ارزشگذاری توصیفی انجام شده است.
-1 مقدمه
رقابت تنگاتنگ در بازارهای جهانی و روند کاهش منابع در دسترس، شرکتها را بر آن داشته تا با روی آوردن به روشهای نوین مدیریتی سعی در افزایش بهرهوری نمایند. یکی از این علوم جدید، دانش مدیریت ارتباط با مشتری - Customer Relationship Management - است که با در نظر گرفتن نقش و جایگاه کلیدی مشتری در تلاش برای دستیابی به این مهم میباشد.
بالا بودن هزینه جذب مشتری نسبت به حفظ مشتری، موجب شده تا شرکتها راهکارهایی جهت بهبود سیاستگذاری های تعاملی با مشتریان خود تنظیم نمایند. از این حیث، تحلیل رفتار مالی مشتریان میتواند نقش تعیین کنندهای در هدفمندی فروش و افزایش آن داشته باشد. یکی از اهداف CRM تشخیص مشتریان با سودآوری بیشتر است. استخراج و تحلیل ویژگیهای تازگی خرید - Recency - ، تعداد تکرار - Frequency - و حجم مالی - Monetary - در یک بازه زمانی برای هر مشتری با استفاده از تکنیکهای دادهکاوی راه حل مناسبی جهت ارزشگذاری مشتریان از لحاظ سودآوری میباشد.
دورسان و کیبر در سال 2016 با بررسی پارامترهای RFM برای 369 مشتری به عنوان نمونه از سه هتل پنج ستاره در آنتالیا ترکیه و اقدام به خوشهبندی آنها نمودهاند ب1ب. سیدحسینی و همکارانش نیز در سال 2010 با استفاده از الگوریتم k-means و شاخص دیویس-بولدین و پارامترهای RFM در دو حالت وزندهی شده و بی وزن دادههای شرکت ساپکو را مورد بررسی قرار دادند
وو در سال 2013 با ترکیب دو روش "نقشههای خود سازمانده" و "k-means" و استفاده از پارامترهای RFM مشتریان یک سالن آرایش مو اقدام به بخشبندی مشتریان کردند. در این پژوهش که بر روی اطلاعات 9620 تراکنش از 789 مشتری در سه ماهه نخست سال 2008 صورت گرفت، مشتریان به چهار نوع "مشتریان وفادار"، "مشتریان بالقوه"، "مشتریان جدید"و "مشتریان از دست رفته" دسته بندی شدند
قاضیان و همکارانش تحقیقی با هدف یافتن رابطه بین مدیریت ارتباط با مشتری - CRM - و واکنش آنها در سال 2016 بر روی مشتریان شرکت ال جی تهران انجام دادندکه به بررسی تاثیرات " سرویسدهی اینترنت"، "پشتیبانی مشتری" و "پشتیبانی بازاریابی" به عنوان ابعادی از CRM بر روی حوزههای واکنشی مشتریان مانند "واکنش به قیمت"، " توسعه برند"، " ترجیح برند" و " قصد خرید" پرداختند
هو و همکارش نیز در سال 2014 توانستند با تعریف یک الگوی RFM اقدام به طراحی و توسعه یک الگوریتم جدید بدون نیاز به اطلاعات شناسایی مشتری با نام الگوی RFM درختی نمودند ب5ب. نیادزایو در سال 2016 به بررسی نقش مدیریت ارتباط با مشتری در افزایش وفاداری مشتریان با استفاده از تاثیراتی که بر متغیرهای ارزیابی خدمت میگذارد پرداخت
-2 مدل پیشنهادی در تحلیل رفتار مشتریان صنعت غذا
تحقیق حاضر سعی دارد با بررسی دادههای فروش شرکت و یافتن رفتار خرید مشتریان، به واحد فروش شرکت جهت تنظیم تعاملات مالی خود با مشتریان یاری رساند. با توجه به مطالعات صورت گرفته، تحقیق پیش رو بعد از جمعآوری و پیشپردازش دادهها، با استفاده از الگوریتم k-means اقدام به خوشهبندی اولیه نمود و برای یافتن تعداد خوشه بهینه از شاخص اعتبارسنجی دیویس-بولدین که در ادامه توضیح داده میشود، استفاده شده است. سپس با بررسی رفتار مالی هر خوشه، مشتریان را گروهبندی نمودهاست. مدل طراحی شده این فرآیند مطابق شکل - 1 - میباشد.
جمع آوری داده ها از واحد فروش پردازش داده ها و آماده سازی جهت بررسی استخراج مولفه های تازگی خرید، تعداد تکرار و حجم مالی “RFM” پیاده سازی الگوریتم k-means در نرم افزار متلب یافتن تعداد خوشه بهینه با استفاده از شاخص دیویس؛بولدین خوشه بندی مشتریان تحیلی رفتار مالی هر خوشه گروه بندی مشتریان براساس خوشه ها
شکل : - 1 - مدل پیشنهادی در تحلیل رفتار مشتریان صنعت غذا
-1-2 جمعآوری داده
مجموعهی دادههایی که در این تحقیق مورد بررسی قرار گرفتند از یک پایگاه داده فروش سسهای خوراکی در سال 1395 به مشتریان استان مازندران میباشد. این پایگاه داده شامل فیلدهای کد مشتری، نام کالا، تاریخ سفارشدهی، تعداد و مبلغ خرید میباشد.
-2-2 پردازش، استخراج دادههای مورد نیاز و نرمالسازی
بعد از پاکسازی فیلدهای خالی، تعداد 21878 تراکنش مورد بررسی قرار گرفتند. سپس جهت استخراج پارامترهای تازگی خرید، تعداد تکرار و حجم مالی، تراکنش های بدست آمده مورد بازبینی قرار گرفتند و در نهایت تعداد 2663 شیء جهت پیادهسازی الگوریتم بدست آمد.
برای جلوگیری از انحراف نتیجه به سمت دادههای با مقیاس بزرگ از نرمالسازی دادهها استفاده میشود. از شیوههای نرمالسازی میتوان به نرمالسازی min max و Z-score و نرمالسازی با استفاده از مقیاسبندی اعشاری اشاره کرد. در این تحقیق نرمالسازی با روش min max در بازه 1@،>0 صورت گرفته است. این روش یک مقدار v از A را به مقدار Y در فاصله [new minA, new maxA] نگاشت میکند که به صورت رابطه - 1 - میباشد ب7ب:
-3-2 الگوریتم k-means
الگوریتم k-means به دلیل سادگی و سرعت بالا از پرکاربردترین روشهای خوشه بندی دادهها میباشد. این روش برای یافتن خوشههایی به شکل کره در پایگاه دادههای کوچک تا متوسط کاربرد خوبی دارد. این الگوریتم پارامتر k را به عنوان ورودی گرفته و مجموعه n شیء را به k خوشه افراز میکند. به طوریکه سطح شباهت داخلی خوشهها بالا بوده و سطح شباهت اشیا بیرون خوشهها پایین باشد. شباهت هر خوشه نسبت به متوسط اشیا آن خوشه سنجیده شده که این متوسط، مرکز خوشه نامیده میشود. این الگوریتم بصورت شکل - 2 - میباشد ب7ب:
ورودی: k برابر با تعداد خوشهها و یک پایگاه داده شامل n شی خروجی: یک مجموعه از k خوشه که معیار مربع خطا را حداقل میکند.
آغاز :
- به صورت تصادفی k نقطه ی دلخواه را به عنوان مراکز خوشه های ابتدایی انتخاب کن
هر شیء را با توجه به بیشترین شباهت آن به مرکز خوشه ها، به خوشه ها تخصیص بده
- مراکز خوشه ها را به روز کن به این معنی که برای هر خوشه میانگین اشیا آن خوشه را محاسبه کن
بله :
آیا مرکز جدید خوشه ها با مرکز قبلی تفاوت دارد؟
خیر : پایان
شکل : - 2 - الگوریتم خوشهبندیmeans؛× k
سنجههایی که برای محاسبه شباهت یا عدم شباهت دادههای عددی موردی استفاده قرار میگیرند عبارتند از اقلیدسی، منهتن و مینکوفسکی. در این تحقیق از سنجهی اندازهگیری اقلیدسی به علت معمولتر بودن استفاده شده است که به صورت روابط - 2 - تا - 4 - تعریف میشود
که در آن i و j موقعیت دو نقطه در فضا و مقدار p برابر با تعداد ابعاد فضای مسئله است.
-4-2 تعیین تعداد خوشه بهینه
جهت اعتبار سنجی الگوریتم و یافتن تعداد خوشه بهینه از شاخصهایی همچون دان، دیویس-بولدین و سیلهوئیت استفاده میشود. در این تحقیق از شاخص دیویس-بولدین بدلیل کاربرد بیشتر استفاده شده است. در این شاخص تعداد بهینه خوشه ها بر مبنای محاسبه کمترین شباهت بین خوشهها و بیشترین شباهت درون خوشهها بدست میآید که کمترین مقدار نشانگر تعداد خوشه بهینه میباشد . شباهت بین دو خوشه از رابطه - 5 - محاسبه میشود.