بخشی از مقاله
چکیده
افزایش دقت مدلها و فرآیندهای بخشبندی مشتریان حقیقی در بازاریابی مستقیم از چالشهای اصلی موردتوجه متخصصین در سالهای اخیر است. این مقاله سعی دارد تا 3 رویکرد مهم SU,SC,CFS را که در انتخاب خصیصه مشتریان مورداستفاده هستند با یکدیگر مقایسه و کاربرد هریک را تشریح کند. نتایج مقاله نهتنها محققین را در انجام پروژههای خود یاری میکند، بلکه اطلاعات مؤثری را نیز در اختیار مدیران و سیاستگذاران حوزه بازاریابی قرار میدهد.
مقدمه
بیشک در محیط کسبوکار رقابتی امروزی که در آن تمام بنگاههای اقتصادی با محدودیت منابع روبرو هستند، شناسایی و پیشبینی، هدفگیری و ارتباط با مشتریان حقیقی و سودآور امری حیاتی برای بهکارگیری بهینه و هدفمند منابع و بقای موجودیت کسبوکار در عرصه رقابتی کنونی محسوب میشود.
از طرفی نیز ماهیت پویای محیط بازار رفتار مشتریان را بهطور فزایندهای ناپایدار و غیرقابل پیشبینی میسازد که به نوبه خود برنامهریزی مدیران را دشوار می سازد. اینچنین چالشهایی تولیدکنندگان را بهسوی تعامل نزدیکتر با مشتریان و شناخت هرچه بیشتر تفاوت خواستهای آنها سوق میدهد. در این میان یکی از راههای دسترسی بدون واسطه به مشتریان بازاریابی مستقیم است که در مقابل روش سنتی یعنی بازاریابی انبوه قرار دارد.
درواقع بازاریابی انبوه و بازاریابی مستقیم دو رویکرد در تبلیغ و ارتقاء محصول هستند. بازاریابی انبوه از رسانههای ارتباطجمعی بهصورت انبوه، بدون توجه به تفاوتهای افراد، برای مخاطب قرار دادن تمام گروههای مشتریان بهره میبرد. در مقابل بازاریابی مستقیم علاوه بر اینکه تفاوت بین گروه مشتریان را مدنظر قرار میدهد، ویژگیها و نیازهای آنها را موردمطالعه قرار داده و مشتریان بالقوه را نیز بهعنوان مشتریان هدف جهت ترفیع محصولات انتخاب میکند.
بنابراین بهبود فرآیند شناسایی مشتریان هدف در شرایط رقابتی حاکم کنونی دارای اهمیت زیادی است؛ اما تمام این اقدامات در محیط بازارهای امروزی که مبتنی بر سیستمهای دیجیتال و کاربریهای مبتنی بروب هستند و حتی کوچکترین تراکنش میان مشتریان و تولیدکننده، مولد حجم انبوهی از دادهها است، بدون تحلیل دادهها امکانپذیر نخواهد بود. به عبارتی میتوان گفت محیط کسبوکار در حال گذار بهسوی دنیایی است داده محور.
در این نقطه بحرانی است که بازاریابی مستقیم نیازمند استفاده از ابزارهای تحلیلی و آماری مانند دادهکاوی است تا بتواند الگوهای موردنیاز را از درون انبوهی از دادهها استخراج کرده و مورداستفاده قرار دهد. چراکه با دادهکاوی میتوان وقایع آینده را بر اساس روند گذشته پیشبینی کرد، اشیاء و افراد را برای آشکار ساختن الگو طبقهبندی کرد، افراد و اشیاء را بر اساس صفات و ویژگیها دستهبندی کرد، وقایعی را که احتمال دارد همزمان رخ دهند شناخت و وقایعی را که یکی باعث وقوع دیگری میشود شناسایی نمود و فرآیند را پیشبینی کرد. پس میتوان گفت:
دادهکاوی مرحلهای است از فرآیند کشف دانش از پایگاههای داده، جهت کشف الگوهای پنهان و ضمنی حاکم بر مجموعه دادهها
در این محیط متلاطم رابطه مشتری بازمان نیز تغییر میکند و چنانچه کسبوکار و مشتری درباره یکدیگر بیشتر بدانند این رابطه تکامل و رشد مییابد. در حقیقت محصول مشترک دادهکاوی و بازاریابی مستقیم را میتوان اینگونه بیان کرد: مشتری شناسی، هدفگیری، مشتری مداری.
شکل 1طرح کلی فرایند کشف دانش
اما امروزه دیگر چالش اصلی نه استفاده از دادهکاوی بلکه بهبود دقت مدلهای پیشبینی بهدستآمده از این فرآیند هست و این امر جز با حذف دادههای زائد محقق نمیشود. شاید هیچچیزی بهتر از اصل GIGO نتواند اهمیت پیشپردازش مجموعه دادهها را بیان کند . طبق این اصل اگر دادههای ورودی به سیستم زائد و ناکارآمد باشند، خروجی سستم نیز زائد و بیفایده خواهد بود؛ اما مرحله پیشپردازش داده خود شامل چندین مرحله ازجمله: پاکسازی داده ها، نرمالایز کردن دادهها، تغییر شکل دادهها، استخراج خصیصه و انتخاب خصیصه است. محصول نهایی مرحله پیشپردازش داده نیز مجموعههای آموزشی هستند که از آنها برای ساخت مدل استفاده میشود. استخراج و انتخاب خصیصه نیز جزئی از مرحله کاهش ابعاد است.
بهطوریکه هدف از انتخاب خصیصه پیدا کردن ویژگیهای مطلوب از بین کل ویژگیهای موجود است، درحالیکه در استخراج خصیصه، هدف انتقال ویژگیهای انتخابشده از فضایی با ابعاد بیشتر به فضایی با ابعاد کمتر و تعداد متغیرهای اندک هست. مطالعات پایهای مقاله حاضر نیز بر انتخاب خصیصه و مرحله پیش پردازش داده معطوف است. پژوهشگران - Crone.et al, 2006 - با توجه به فقدان مطالعات تفصیلی در ارتباط با تعاملات میان مدل پیشبینی و پیشپردازش دادهها در حوزه بازاریابی مستقیم بحثهایی را ارائه کردهاند. Pyle - 1999, 2003 - نیز اهمیت و ضرورت مرحله پیشپردازش را اینگونه بیان میکند: دلیل اصلی پیشپردازش داده نمایان ساختن خصیصههای پنهان و ضمنی، درک و دسترسی آسانتر به ارتباطات دادهها و الگوهای حاکم بر آنها طی مرحله دادهکاوی است.
اهمیت انتخاب خصیصه نیز در کاربریهای دادهکاوی انکارناپذیر است. بهطوریکه Van der putten - 1999 - و Piramuthu - 2004 - نیز توجه ویژهای به این مسئله داشتهاند. بررسیهای مطالعه مفروض نیز بر اساس همین موارد سعی در حل مشکل نرخ پایین حفظ مشتری و همچنین عدم توانایی شرکت مفروض در پیشبینی زمان خرید دارد . ازنقطهنظر دادهکاوی با توجه به اینکه هرماه کمتر از %10 کل گروه مشتریان محصولات شرکت را دریافت میکردند، واکنش این گروه مشتریان بهعنوان دادههای نامتوازن - نامتعادل - در نظر گرفتهشده است. بهطور خاص مطالعه مفروض تأثیر انتخاب خصیصه بر دو مدل پیشبینی شبکههای عصبی - ANN - و درخت تصمیم - DT - را مورد آزمون و ارزیابی قرار داده است.
B2مبانی نظری و پیشینه پژوهش
همانگونه که Piramuthu - 2004 - اشاره میکند هدف غایی انتخاب خصیصه داشتن فضای خصیصهای با 4 مشخصه زیر است:
-1 کاهش ابعاد
-2 حفظ اطلاعات کافی در مورد خصیصهها
-3 ارتقای تفکیکپذیری گروههای متفاوت مفهوم هدف
-4 قیاس پذیری خصیصهها در گروه مشابه.
از مزیتهای بالقوهای که فرآیند داده کاوی با دارا بودن انتخاب خصیصه به دست میآورد میتوان به تسهیل تجسم و تفهیم دادهها، تقلیل منابع مصرفی برای محاسبات مانند ذخیرهسازی دادهها، کاهش زمان محاسبات و ارزیابی و بهبود عملکرد مدل پیشبینی اشاره کرد.
Guyon & Elisseeff - 2006 - در کل 3 رویکرد اساسی Filter, Wrapper, embedded را برای انتخاب خصیصه معرفی کردهاند. طبق نظر Hall - 2000 - ، CFS که زیرمجموعه رویکرد Filter است، از طریق ارزیابی قابلیت پیشبینی هر یک از خصیصهها بهطور جداگانه، مطلوبیت مجموعه خصیصهها را موردسنجش قرار میدهد، درحالیکه همزمان نیز میزان افزونگی آنها را مدنظر دارد. CFS همیشه در جستوجوی زیرمجموعه خصیصه های ایده آلی است تا دربرگیرنده مواردی باشند که درسطح بالایی با خصیصه هدف دارای همبستگی هستند.
افزون بر این Hall نشان داده است که CFS بهطور قابلتوجهی میتواند تعداد خصیصههای ورودی را کاهش داده و همزمان عملکرد مدل پیشبینی را در همان سطح قابلقبول حفظ کرده و یا حتی بهبود بخشد. در طرف دیگر SC درجه ناسازگاری یک زیرمجموعه خصیصه را با توجه ارزش اصلی خصیصه هدف موردسنجش قرار میدهد. ازآنجاییکه مجموعه کامل خصیصه همیشه بالاترین سازگاری را دارد، SC میتواند برای جستوجوی کوچکترین زیرمجموعه ویژگی که سازگاری مشابهی با مجموعه کامل دارد مورداستفاده قرار گیرد.
Liu and Setonio - 1996 - اظهار کردهاند که SC قادر است تعداد ویژگیها را بهطور قابلملاحظهای کاهش دهد. در مطالعه مفروض نیز SU بهعنوان یکی از روشهای انتخاب خصیصه بهمنظور بهبود عملکرد مدل پیشبینی شامل مجموعه روشهای مورداستفاده بوده است. البته نیاز به ذکر است که SU از یک تابع آنتروپی برای ارزیابی همبستگی بین متغیر وابسته و یک خصیصه - متغیر - مستقل استفاده میکند
رویکرد Wrapper توسط پژوهشگران - Vianene et al, 2001 - در یک مورد کاربردی ANN برای مدل سازی رویداد خرید درزمینه حفظ مشتری موردبحث قرارگرفته است. Yu and Chao - 2006 - انتخاب خصیصه جمعی را با رویکرد Wrapper برمبنای الگوریتم ژنتیک پیشنهاد کردند. -
دو مورد از رویکرد Wrapper - الگوریتم تبرید شبیهسازیشده و رگرسیون مرحلهای - را برای بهینهسازی مسائل انتخاب خصیصه مقایسه کردند. مطالعه مفروض نیز بهطور مشخصی از CFS, SU, SC برای مطالعه تأثیر انتخاب خصیصه بر عملکرد مدلهای پیشبینی مورداستفاده بهره گرفته است.