بخشی از مقاله
چکیده
شرکتهای تجاری بزرگ با تحلیل رفتار مشتریان خود در شبکههای اجتماعی علایق، رفتارها و احساس آنها را نسبت به خدمات و محصولات خود به دست آورده و از آن در بهبود خدمات به مشتریان خود استفاده میکنند. شرکتهای مخابراتی نیز با تحلیل علایق و رفتار مشتریان خود می توانند سرویسهای بهتری به مشترکین تلفن ثابت، تلفن همراه و اینترنت ارائه نمایند. در این مقاله با استفاده از ایده شبکه اجتماعی، یک راهکار جدید برای تحلیل رفتار کاربران در صنعت مخابرات ارائه شده و با شناسایی شبکه ارتباطی تماسهای مشترکین تلفن ثابت رفتار کاربران مورد بررسی قرار میگیرد.
-1 مقدمه
سازمانهای مخابراتی روزانه حجم وسیعی، داده، تولید و ذخیره می کنند و از آنجایی که تحلیل چنین حجم وسیعی از دادهها به طور دستی، کار بسیار دشواری است، این سازمانها جزو اولین صنایعی هستند که از مزایای داده-کاوی بهره بردهاند. کاربرد دادهکاوی در صنعت مخابرات، میتواند به این سازمانها اجازه دهد تا با بهبود خدمات، سود بیشتری از مشترکین حاضر کسب کنند و نیز بتوانند در جذب مشترکین جدید از سایر رقبا پیشی بگیرند.
از سوی دیگر، شرکتهای تجاری توانسته اند با استفاده از شبکههای اجتماعی، ارتباطات میان مشتریان را کشف کرده و با تحلیل رفتار افراد، میزان رضایت-مندی آنها را نسبت به خدمات و محصولات خود به دست آوردند و از آن در بهبود خدمات به مشتریان خود استفاده کنند. در این مقاله با استفاده از ایده شبکه اجتماعی، یک راهکار جدید برای تحلیل رفتار کاربران در صنعت مخابرات ارائه شده و با شناسایی شبکه ارتباطی تماسهای مشترکین تلفن ثابت، رفتار آنها مورد بررسی قرار میگیرد. از این رو ابتدا در بخش دوم مقاله، کارهای انجام شده درخصوص تحلیل رفتار مشترکین با تمرکز بر حوزه تلفن ثابت مورد بررسی قرار میگیرد. در بخش سوم، راهکار پیشنهادی به تفصیل بیان میشود و در پایان نتیجهگیری ارائه خواهد شد.
-2 مرور کارهای گذشته
کارهای متعددی درخصوص داده کاوی در صنعت مخابرات انجام شده که هریک با هدف خاص، دادههای یک یا چند حوزه از مجموعه فعالیت شرکتهای مخابرات را مورد بررسی قرار دادهاند. در [1] کاربردهای داده کاوی در شرکت های مخابراتی ملی و بین المللی با رویکرد مبتنی بر هدف، بررسی و طبقه بندی شده است که بر این مبنا، کارهای انجام شده در حوزه تلفن ثابت را میتوان به چند دسته کلی تقسیم نمود. هدف اول شناسایی مشتریان جدید و ارائه سرویس مناسب به آنهاست که در طی یک مدت زمان کوتاه پس از ورود مشتری جدید، تماسهایی که این مشتری با مخاطبان دیگر داشته شناسایی میشود، و لیست سرویسهایی مطابق با مخاطبان مشتری جدید در ابتدای کار به وی پیشنهاد میشود.
هدف دوم، اندازهگیری ارزش مشتری است. ایده اصلی در این روش شناسایی و اندازهگیری ارزش مشترکین و تلاش در حفظ مشترکین با ارزش میباشد. در شرکت AT&T ارزش مشتری را مدت زمانی که مشتری از خدمات این شرکت استفاده کرده است، تعیین می کند که این مدت زمان در واقع درآمدی است که شرکت از یک مشتری به دست میآورد. کار اصلی که در این شرکت انجام شده است شناسایی وضعیتهای مختلف مشترکین قبلی که از خدمات شرکت انصراف دادهاند میباشد. برای مثال روند کلی که باعث انصراف یک مشتری از خدمات شرکت شده است از قبیل انصراف از طرحهای مختلف، انتخاب نکردن طرح جدید، کاهش تعداد تماسها و... توسط تکنیکهای دادهکاوی مورد بررسی قرار گرفته و زمان تقریبی انصراف مشتری از خدمات محاسبه شده و سیاستهایی برای جلوگیری از انصراف مشتری از خدمات شرکت لحاظ شده است
هدف سوم دسته بندی مشترکین و شناسایی نوع مشترکین است. بدحسابی و خوش حسابی مشتریان به خصوص برای برخی شرکتهای مخابراتی که ابتدا سرویس ارائه می دهند و سپس صورتحساب صادر می کنند مسئله مهمی است و اغلب تاثیر زیادی بر درآمدها و مطالبات آنها دارد. در همین راستا، مقاله [3] چند تکنیک داده کاوی را بکار گرفته است و نتایج تحلیلی آنرا ارائه کرده است. در پژوهش دیگری که با هدف شناسایی مشترکین بد حساب و اعلام زمان مناسب برای عکس العمل انجام شده است، از داده های مرکز مخابرات تهران استفاده شده و با بکارگیری تکنیک های داده کاوی، یک مدل دادهکاوی برای شناسایی مشترکین بدحساب شرکت های مخابرات ایران ارائه شده است
در پژوهشی که در شرکت مخابرات خراسان جنوبی انجام شده است، یک سیستم نرم افزاری هوشمند مبتنی بر تکنیک های داده کاوی برای طبقه بندی مشترکین این شرکت طراحی وپیاده سازی شده است .[5] در این پروژه، داده های مربوط به مشترکین تلفن ثابت، تلفن همراه، مشترکین دیتا و اینترنت مورد کاوش قرار گرفته است. در تحقیق دیگری که براساس داده های یکی از مراکز مخابرات کشور جمع آوری شده است، چارچوبی برای طبقهبندی مشترکین مخابرات تلفن ثابت ارائه شده که بر اساس مدل بدهکاری، مشتری برمبنای وضعیت کارکرد از دو بعد ارزش و ضد ارزش سنجیده می شود. در انتها نیز بر اساس بخش بندی انجام گرفته با کمک تکنیک های داده کاوی، راهبردهایی برای برخورد با هر یک از گروههای مشتری، ارائه شده است
در مقاله دیگری [7] با به کار بردن درست الگوریتم های خوشه بندی فازی مشتریان ناپایدار و غیر دائم شرکت مخابرات را که از آنها به عنوان مشتریان نرم نام گذاری می شود و در نتیجه نسبت مشتریان دائم و همیشگی شرکت مخابرات را با دقت بالا مشخص کنیم تا بتواند برای حفظ مشتریان ناپایدار و افزایش تعداد مشتریان، برنامه ریزی های لازم را انجام دهند.
در مقاله [8] با استفاده از چهار الگوریتم به بررسی مشترکین پرداخته و نتایج آنها را در جهت یافتن مناسبترین الگوریتم برای تعیین زمان قطعی تلفنهای ثابت شرکت مخابرات با یکدیگر مقایسه نموده اند. با استفاده از این الگوریتمها به دنبال تقسیم مشترکین به دو دسته خوش حساب و بدحساب می باشند. سایر کارهای انجام شده در حوزه تلفن ثابت، با هدف بررسی سیر تغییرات رفتاری مشترکین و تعیین طول عمر مشتری انجام شده است
-3 راهکار پیشنهادی
در این بخش یک راهکار جدید برای تحلیل داده های مشترکین تلفن ثابت بر مبنای شبکه ارتباطی کاربران ارائه خواهد شد. از آنجایی که هدف اصلی از تحلیل داده های شبکه اجتماعی در صنعت مخابرات، ارائه سرویسهای مناسب به کاربران است، در این مقاله راهکار پیشنهادی برای ایجاد شبکه ارتباطی مشترکین دو هدف اصلی را دنبال میکند، هدف اول شناسایی شبکه ارتباطی هر مشترک تلفن ثابت و هدف دوم شناسایی رفتار مشتری در ارتباط با دو اپراتور همراه اول و ایرانسل میباشد. برای این منظور، ابتدا روش مناسب برای مدلسازی دادهها انتخاب میشود. سپس برمبنای دو هدف اصلی، پیش پردازش و آماده سازی داده ها انجام شده و شبکه ارتباطی ایجاد میشود. در پایان، نتایج بدست آمده ارائه خواهد شد.
-1-3 انتخاب روش مناسب برای مدلسازی دادهها
برای ایجاد شبکه ارتباطی مشترکین در شرکت مخابرات خراسان رضوی، مهمترین چالش، حجم زیاد دادههاست که روشها و ابزارهای معمول قادر به پشتیبانی از این حجم اطلاعات نمیباشند. SQL زبان برنامهنویسی معیار و متعارفی است که برای ارتباط با پایگاه های داده رابطهای استفاده میشود .[12] امکان استفاده از این زبان برای عملیات های مختلف پایگاهداده میسر است.
از آن جایی که امروزه نیاز به بهکارگیری حجم بزرگی از دادهها در دسته بندی های مختلف محسوس است، تحقق بخشیدن این امر با رویکرد SQL، یعنی این که بتوان از SQL در تمامی موارد بدون مشکل و محدودیت استفاده کرد، عملا غیرممکن است. این امر منجر به ظهور NoSQL که عموما با عنوان Not Only SQL - به معنی اینکه SQL به تنهایی کافی نیست - شده است. با NoSQL ، امکان ذخیرهسازی دادههای بدون ساختار در گره های پردازشی متعدد فراهم میشود و بدلیل عدم نیاز بهشِمای ثابت،تغییر مقیاس افقی را امکان پذیر میکند. همچنین این نوع پایگاه داده قابلیت پشتیبانی از حجم زیاد داده که بر روی چندین سیستم ذخیره شدهاند را دارند. بههمین دلیل برای غلبه بر چالش حجم زیاد دادهها، از NoSQL برای ذخیرهسازی دادهها استفاده شده است.
از سوی دیگر، برای مدلسازی دادههای مورد بررسی، باید از پایگاه داده گرافی که قادر به مدل کردن ارتباطات میان مشترکین باشد استفاده شود. برای انتخاب پایگاه داده مناسب که هم مبتنی بر NoSQL باشد و هم بتواند حجم زیادی از داده را پشتیبانی کند، در ادامه برخی از پایگاه دادههای گرافی به همراه کاربرد و ویژگیهای آنها ارائه شده است.
پایگاهداده تجاری AllegroGraph برای ساخت برنامه های کاربردی وب معنایی ایجاد شده است که قادر است داده های سهگانه را ذخیره و از طریق زبان پرسوجوی SPARQL آنها را بازیابی کند. این پایگاهداده دارای امکاناتی از جمله تحلیل شبکههای اجتماعی و استنتاج های مختلف نیز میباشد .[14] پایگاهداده DEX به عنوان یکی دیگر از پایگاه داده های گراف تجاری با کارایی و مقیاس پذیری بالا معرفی شده که استفاده از API آن بسیار ساده است .[15] همچنین HyperGraphD و InfiniteGraph دو پایگاه داده برای ذخیره سازی گراف های بزرگ در یک محیط توزیع شده هستند که از مهمترین ویژگی های آن می توان به قابلیت توسعه، قابلیت حمل و متنباز بودن اشاره کرد
از میان پایگاه داده های متن بسته، می توان به VertexDB اشاره کرد که پایگاه داده متنبسته با کارایی بالاست و از پروتکل HTTP برای درخواستها و JSON برای پاسخها استفاده میکند .[18] یکی دیگر از پایگاه داده های متن بسته، G-Store است که از ساختار گراف برای پیدا کردن مکان مناسب برای ذخیرهسازی دادهها بر روی دیسک استفاده می کند و دارای یک موتور جستجوی توکار نیز هست
Neo4j یکی از پایگاه داده های گراف متنباز با کیفیت بالا و محبوب میباشد که به طور خاص برای برنامه های کاربردی Java تولید شد، اما از Python هم پشتیبانی می کند. این پایگاه داده با روشهای مختلف اندیس گذاری، بازیابی داده ها را تسهیل میکند. Neo4j یک چارچوب برای پیمایش گرافها، یک انباره مبتنی بر دیسک و یک API شیگرا را پیاده سازی میکند. بطور خلاصه می توان گفت پایگاه داده گرافی Neo4j در مقایسه با سایر پایگاه داده ها از مزایای بیشتری برخوردار است که در این مقاله نیز از Neo4j استفاده شده است .[19] بطور خلاصه دلایل استفاده از این پایگاه داده به شرح زیر میباشد:
▪ از دادههای ورودی با فرمت csv به خوبی پشتیبانی میکند. این ویژگی باعث میشود تا بتوان خروجی پایگاه دادههای رابطهای مانند SQL Server را به راحتی به Neo4j وارد کرد.
پشتیبانی از حجم بسیار زیاد داده نیز از مهمترین ویژگیهای Neo4j استکه در نسخه رایگان این پایگاه داده، تا 34 میلیارد گره و همچنین 34 میلیارد یال پشتیبانی میکند.
-2-3 آمادهسازی دادهها بر اساس اهداف
دادههایی که برای ساخت شبکه ارتباطی کاربران تلفن ثابت مورد استفاده قرار گرفته است، مربوط به اطلاعات تماس در شبکه تلفن ثابت در چهار ماه اول سال 94 میباشد که بالغ بر یک میلیارد و دویست میلیون تماس بوده است. فایل ورودی شامل چهار فیلد اطلاعاتی "شماره تلفن مبدا"، "شماره تلفن مقصد"، "زمان برقراری تماس" و "مدت زمان مکالمه" بوده است. به منظور آمادهسازی دادهها برای ایجاد شبکه ارتباطی مشترکین تلفن ثابت، ابتدا لازم است بر مبنای هدف موردنظر، ویژگیهای لازم برای تحلیل داده ها شناسایی و محاسبه شوند. برای هدف اول که شناسایی شبکه ارتباطی هر مشترک تلفن ثابت می باشد، دادههای قابل استخراج برای هر شماره تلفن عبارتند از:
▪ مجموع تعداد کل تماسهای ورودی به این شماره تلفن
▪ مجموع تعداد کل تماسهای خروجی از این شماره تلفن
▪ مجموع مدت زمان تماسهای ورودی به این شماره تلفن
▪ مجموع مدت زمان تماسهای خروجی به این شماره تلفن
همچنین، برای هدف دوم که شناسایی رفتار مشتری در ارتباط با دو اپراتور همراه اول و ایرانسل میباشد، اطلاعات زیر به ازای هر تماس تلفن ثابت با دو اپراتور استخراج شده است:
▪ مجموع تعداد تماسهای ورودی از اپراتور ایرانسل
▪ مجموع تعداد تماسهای خروجی به اپراتور ایرانسل
▪ مجموع مدت زمان تماسهای ورودی از اپراتور ایرانسل
▪ مجموع مدت زمان تماسهای خروجی به اپراتور ایرانسل
▪ مجموع تماسهای ورودی از اپراتور همراه اول
▪ مجموع تماسهای خروجی به اپراتور همراه اول
▪ مجموع مدت زمان تماسهای ورودی از اپراتور همراه اول
▪ مجموع مدت زمان تماسهای خروجی به اپراتور همراه اول
-3-3 ایجاد شبکه ارتباطی بر مبنای اهداف
در این بخش، روش پیشنهادی برای ایجاد شبکه ارتباطی مشترکین از روی
▪ پشتیبانی از زبان Neo4j CQL که کاملا شبیه زبان SQL ریز مکالمات تلفن ثابت ارائه خواهد شد. متداولترین روش برای این ایجاد است و کار با آن را آسان میکند.
▪ از مدل داده گرافی به خوبی پشتیبانی میکند.
▪ از شاخص گذاری بوسیله [21] Apache Lucene پشتیبانی میکند.
▪ دارای یک واسط کابری مناسب است.
گراف، ایناست که برای هریک از شماره های مبدا و مقصد یک گره جداگانه در نظر گرفته شود و برای هر تماس یک یال بین مبدا و مقصد برقرار شود، که میتواند براساس تماسهای تلفن همراه و یا تلفن ثابت ایجاد میشود. تنها تفاوت این دو در انتخاب نوع گره هاست که در حالت اول، هر گره نماینده یک شماره تلفن همراه و در حالت دوم نماینده تلفن ثابت میباشد.