بخشی از مقاله

چکیده

امروزه، اینترنت به مشتریان امکان میدهد تا نظرات و عقاید خود را در مورد سازمانها و محصولات بیان نموده و سایر افراد را در مورد تجربهی خود مطلع کنند، بدین ترتیب تأثیر نظرات مشتریان بر موفقیت یک کسب وکار غیر قابل چشمپوشی است. هدف این پژوهش، معرفی یک روش مبتنی بر واژه نامه برای استخراج و کمی سازی گرایش احساسی مشتریان در مورد ویژگیهای یک کالا با بررسی و تحلیل نظرات آنها به زبان فارسی میباشد. پژوهش حاضر از جنبه هدف، کاربردی و از منظر روش تحقیق از نوع پیمایشی مقطعی میباشد.

در این تحقیق، نظرات مشتریان پیرامون 11 ویژگی 3 مدل گوشی تلفن همراه در فروشگاه آنلاین دیجی کالا در تابستان سال 1393 جمع آوری گردید و در هشت گام شامل: انتخاب کالای مورد نظر و جمع آوری نظرات، پیش پردازش دادههای متنی، استخراج ویژگیهای کالا، ایجاد واژهنامهها، استخراج الگوهای نظرات، تعیین قطبیت یا گرایش احساسی بخش های نظرات، پس پردازش و در انتها جمع بندی و کمی سازی گرایش احساسی نظرات مورد تحلیل قرار گرفت. نتایج اعتبارسنجی نشان میدهد روش معرفی شده از دقت بالایی در کمی سازی گرایشهای احساسی مشتریان برخوردار میباشد.

-1 مقدمه

با گسترش سریع تجارت و کسب و کار الکترونیکی و فروش کالاها/خدمات تحت وب، تعداد خریداران این کالاها/خدمات نیز رو به افزایش است. به منظور افزایش رضایت مشتری و نیز تجربه ی خرید وی، بیشتر فروشندگان و سازمانها این امکان را برای مشتریان خود فراهم آوردهاند تا در مورد کالاها/خدمات آن ها نظرات و عقاید خود را بیان نمایند. تمایل افراد برای بیان نظرات خود و به اشتراک گذاری آن با دیگران، در رفتار سایرین نیز اثرات بالقوهای خواهد داشت. عدم توجه به این تاثیرات میتواند منجر به شکست و در نهایت نابودی یک کسب و کار در دنیای مجازی شود.

افزون بر این، بسیاری از مشتریان به بررسی ویژگی های کالا/خدمات در نظرات خود می-پردازند که توجه به آن میتواند بر بهبود کیفیت کالا/خدمات تأثیر بسزایی داشته باشد. در مطالعات متعددی سعی شده است تا سیستمهایی ارائه شود که به تحلیل خودکار یا نیمه خودکار این نظرات پرداخته و نتایج قابل قبول و قابل کاربردی را نمایش دهند. این سیستمها، که به سیستمهای عقیده کاوی یا تحلیل احساسات شهرت دارند، با استفاده از تکنیکهای دادهکاوی و متن-کاوی بر روی این متون انتقادی، نظیر خلاصهسازی، طبقهبندی ، خوشهبندی و ...، فروشندگان را برای تصمیمگیری بهتر در مورد ارائه کالاها و خدمات یاری میکند .[1]

بر خلاف پژوهشهای گستردهای که در چند سال اخیر بر روی عقیده کاوی بر روی متون زبان انگلیسی صورت گرفته است، روش و سیستمی ساختیافته برای عقیده کاوی نظرات بیان شده به زبان فارسی ارائه نشده است. از این رو در این پژوهش، سیستمی برای انجام عقیده کاوی مبتنی بر ویژگی ها و مشخصات فنی یک گروه کالایی در زبان فارسی، توسعه داده میشود. با تحلیل این نظرات، از دید درون کشوری و درون سازمانی، سازمان-ها میتوانند برنامههای بازاریابی، روشهای بهبود ارائه خدمات و کیفیت محصولات، راههایی برای توسعه و ورود به بازارهای جهانی را در اهداف و برنامههای بلند مدت کسب و کار خود در نظر بگیرند.

برای بیان عقاید و نظرات در اینترنت، سه قالب کلی وجود دارد: نقاط قوت و ضعف ، نقاط قوت و ضعف1 همراه با نظر کوتاه و قالب آزاد.[1] 2 برای تعیین گرایش احساسی در قالب اول و دوم، تنها کافی است تا ویژگی های کالا/خدمت مشخص گردد، زیرا گرایش احساسی در بخش نقاط قوت و ضعف به وضوح تعیین شده است.

اما در قالب سوم، هم ویژگیها و هم گرایش احساسی هر یک باید تشخیص داده شود. بنابراین اولین مسئله در عقیده کاوی متون با قالب آزاد، تعیین ویژگی های کالا/خدمت در نظرات مشتریان است. دومین مسئله در عقیده کاوی، تشخیص اطلاعات ذهنی مشتریان و سپس ردهبندی عقاید بر اساس نظرات یافت شده برای ویژگی کالاها است. در این حالت رویکردهای عقیده کاوی به سه دسته کلی تقسیم میشوند:

1.    تعیین گرایش احساسی ویژگی ها یا صفات مطرح شده برای کالا/ خدمات.

2.    تعیین گرایش احساسی جملات عقیدهای در هر نظر.

3.    تعیین گرایش احساسی هر نظر به صورت کلی.

علاوه بر این، روش های ردهبندی احساسی متون انتقادی به دو دسته نظارت شده و بدون ناظر نیز تقسیم میشوند. در روشهای نظارت شده، بر چسب کلاس هر متن یا جمله انتقادی مشخص بوده و میزان صحت نتایج بر اساس روابط ردهبندی مشخص میگردد. در این روشها، معمولاً از تکنیک-های یادگیری ماشین در آموزش و ایجاد مدلی برای رده بندی اسناد استفاده می شود. در روشهای بدون ناظر، معمولاً از واژهنامهها استفاده میگردد و گرایش احساسی با شمارش مثبتها و منفیها به دست میآید.

-1-1 استخراج ویژگیها و عبارات کلیدی

همان طور که بیان شد، اولین مسئله در عقیده کاوی یافتن ویژگی های کالا در نظرات مشتریان است که در این بخش به این موضوع پرداخته می شود. ترنی ، برای استخراج ویژگی ها و عبارات کلیدی به یافتن عباراتی پرداخته است که حاوی صفت یا قید هستند، زیرا این دو بیانگر یک عقیده شخصی در جمله میباشند .[3] لئونگ و همکاران نیز، برای استخراج ویژگیها از یک متن نظر، از برچسب ادات سخن استفاده کردهاند .[12] زیا و همکاران، برای استخراج ویژگی و بهبود نتایج از روش ترکیبی برچسب ادات سخن به همراه ارتباط کلمات استفاده و ردهبندی بر اساس آنها صورت میگیرد .[5]

در [17] برای استخراج ویژگیها از یک سری نشانههای خاص نظیر حروف بزرگ، برچسبهای ادات سخن، نوع کلمه و مانند آن بهره برده شده است. لیو و همکاران، توصیهگری مبتنی بر اولویتها و عقاید مشتریان ارائه نمودهاند .[18] تمرکز روش معرفی شده در این مقاله بر روی اسناد انتقادی به زبان چینی در مورد رستورانها است و استخراج ویژگیها بر مبنای قید صورت می-گیرد. برای تشخیص قیدها هم از برچسبهای ادات سخن استفاده میشود.

-2-1 تعیین گرایش احساسی در سطح کلمات و عبارات

در این رویکرد تلاش بر این است تا گرایش احساسی کلمات و عبارات منحصر به فرد تعیین شود. مبنای کار در این رویکرد این است که در جملات یک متن انتقادی، مشتری ممکن است ویژگی های مختلفی از کالا را با گرایشهای احساسی متفاوتی بیان نماید. به همین جهت لازم است تا ابتدا گرایش احساسی کلمات و عبارات تعیین گردد.

پاپسکیو و اتزیونی ، از روش برچسبسزنی ساده شده - که یک روش رده بندی بدون ناظر است - برای یافتن گرایش معنایی واژگان در یک زمینه خاص، جهت کارآیی بهتر استفاده می کنند .[16] در تکنیک بیان شده توسط لیو، که بر روی الگوی دوم بیان نظرات کاربرد دارد، گرایش احساسی هر الگوی استخراجی توسط نقاط قوت و ضعف مشخص میگردد .[1]

استفاده از واژه نامه برای تعیین گرایش احساسی در سطح کلمات نیز در مطالعات متعددی به کار رفته است .[14-6 ,12 ,13] در این روش مترادفها و متضادهای یک صفت در شبکه واژهها، بسته به اینکه صفت دارای چه گرایش احساسی باشد، به لیست مثبتها و منفیها اضافه میشود. از این لیست، در مراحل بعدی برای تعیین گرایش احساسی در سطح جمله و عبارت استفاده میشود.

-3-1 تعیین گرایش احساسی در سطح جملات متن انتقادی

پس از تعیین گرایش احساسی کلمات و عبارات، در این رویکرد، سعی میشود تا جملات هر متن انتقادی به صورت مجزا ردهبندی گردند. اساس این رویکرد این است که در یک متن انتقادی لزوماً تمام جملات در مورد یک کالا منفی یا مثبت نیست، بلکه ترکیبی از این دو میباشد. در روش هو و لیو، برای خلاصه سازی در سطح ویژگی کالاها، جملاتی که در برگیرنده یک ویژگی خاص هستند تجمیع شده و تعداد نظرات مثبت و منفی در مورد آن شمارش میگردد .[13]

در [20]، علاوه بر ماژول تعیین احساسات در سطح کلمه، ماژولی برای تعیین احساسات در سطح جمله نیز وجود دارد. برای این مرحله نیز از دو مدل میانگین هارمونیک و میانگین هندسی استفاده شده است. در [19]، که به خلاصهسازی نظرات مشتریان در وب میپردازد، بخش استخراج ویژگی کالاها از روشی مشابه [13] میکند که شامل فرآیندهای زیر است: تحلیل برچسبهای ادات سخن، محاسبه فراوانی عبارت-معکوس فراوانی جمله - tf-isf - ، اگر صفتی در نزدیکی این اسامی نماینده قرار داشته باشد، با آن نماینده به عنوان یک ویژگی عقیدهای مکرر رفتار میشود.

-4-1 تعیین گرایش احساسی در سطح متن نظر

به طور کلی، مهمترین مزیت ردهبندی احساسی در سطح اسناد این است که باعث فراهم آوردن عقیده غالب بر سند میشود. با این وجود، کاستی اصلی ردهبندی در سطح اسناد به این شرح است که جزئیات تمایلات و عدم تمایلات افراد را مشخص نمیکند. ترنی با محاسبه میانگین گرایشهای معنایی به دست آمده برای لغات، مثبت یا منفی بودن هر یک از متون انتقادی را تعیین نموده است .[3]

روش-های یادگیری ماشین نیز نظیر بیز ساده [6 ,5 ,4]، ماکزیمم آنتروپی [5 ,4]، ماشینهای بردار پشتیبان [8 ,7 , 5 ,4]، 3SMO، که حالت بهینه شده ماشین بردار پشتیبان است، [18] و شبکههای عصبی مصنوعی [8] برای رده بندی احساسی متون انتقادی به کار برده شده است. دیو وهمکاران، برای تعیین گرایش احساسی هر متن یا ردهبندی آن به یکی از دو کلاس مثبت و منفی از یک تابع امتیاز استفاده می کنند .[15] در [12] نیز، تعیین گرایش احساسی در سطح متن انتقادی بر اساس رتبهبندیهای پنجگانه و یک تابع امتیاز صورت میگیرد، برخلاف روشهای دیگر که فقط مثبت یا منفی بودن یک متن را در نظر میگیرند.

-1-2 انتخاب کالای مورد نظر و جمع آوری نظرات

هدف نخست در این گام انتخاب یک کالا جهت بررسی و تحلیل نظرات آن است که در این پژوهش نظرات بیان شده در مورد تلفن همراه مورد بررسی قرار میگیرد و سایت دیجی کالا4 برای جمع آوی نظرات انتخاب شده است. همانطور که در بخش - 2 - بیان شد، نظرات ممکن است در سه قالب کلی بیان شوند، از آنجا که شیوه ی مطرح شده در این پژوهش به صورت بدون ناظر عمل میکند، قابلیت به کارگیری بر روی هر سه قالب بیان نظرات را دارد. نظرات میتواند با استفاده از یک خزنده ی وب5 و یا به صورت دستی جمعآوری شود. هر یک از متون انتقادی به صورت یک فایل متنی مجزا ذخیره میگردد. علت این امر، سادگی محاسبه ی تعداد مشتریان برای به کارگیری در مراحل بعدی و نیز کاهش زمان پردازش در متون کوتاه است.

-2 روش و ابزار تحقیق

آنچه در این بخش بدان پرداخته می شود ارائه ی یک روش مبتنی بر قانون و واژه نامه و بدون ناظر برای استخراج بخشهای عقیدهای در نظرات ثبت شده به زبان فارسی توسط مشتریان در خصوص یک کالای خریداری شده است. روش ارائه شده در این پژوهش یک رویکرد نیمه خودکار است، چرا که ایجاد واژه نامه ها تا حدی به صورت دستی و بر اساس دامنه ی مورد نظر انجام گرفته است.

همچنین به منظور فراهم آوردن الگویی مناسب برای استخراج عقاید، نیاز است که بخش هایی از داده های متنی موجود به صورت دستی برچسب گذاری شده و سپس بر اساس این موارد، الگوها و قوانین زبانی موجود شناسایی گردند. این قوانین می توانند در شناسایی و برچسب گذاری خودکار بخشهای عقیدهای سایر متون نظرات مورد استفاده قرار گیرند. در این پژوهش به منظور انجام پردازشهای متنی خودکار از نرمافزار متنکاوی Gate Developer 7.0 استفاده شده است که یک پلتفرم نرمافزاری متن باز و رایگان برای پردازش زبان طبیعی میباشد. .[21]

-2-2 پیش پردازش دادههای متنی

در این گام، که به نام آماده سازی متون نیز شناخته میشود، عملیات ابتدایی متن کاوی انجام میگیرد. یکی از مشکلات کار با متون فارسی شیوههای نوشتاری متفاوت برای نوشتن یک کلمه ی خاص است. در زبان فارسی نوشتار عامیانه علاوه بر نوشتار کتابی و اداری برای نوشتن متن نظرات رایج است و بسیاری از کاربران فارسی زبان، نوشتار عامیانه را نسبت به کتابی ترجیح می-دهند.

به عبارت دیگر در هنگام بیان نظرات توسط مشتریان به زبان فارسی قواعد این زبان رعایت نمیگردد و همین امر سبب دشواری تحلیل متون فارسی میگردد. در این پژوهش برای انجام این کار، افزونه ی زبان فارسی که برای پلتفرم گیت نوشته شده است [23]، به کار رفته است. این گام با استفاده از این افزونه به وظایف زیر شکسته میشود:

·    تفکیک جملات به کلمات و نشانهها: در این مرحله هر نشانه در متن شناسایی می شود. همانطور که قبلاً نیز بیان شد، هر نشانه می تواند یک واژه، عدد و علائم نقطهگذاری و غیره باشد.

·    تفکیک متون به جملات: هر یک از متون به جملات تفکیک میشوند تا در مراحل بعدی قابل استفاده باشند. در واقع با استفاده از جملات محدوده ی اثر یک بخش عقیدهای کوچکتر میشود و از گذاشتن اثر جانبی بر سایر بخشهای متن نظر جلوگیری میکند.

·    برچسب گذاری ادات سخن یا تعیین مشخصه ی دستوری نشانهها: نوع برچسب و نقشی که می تواند به یک نشانه در جمله اختصاص داده شود، در این مرحله تعیین میگردد. این نقشها برای تعیین و شناسایی الگوهای زبانی مورد استفاده قرار میگیرد.

-3-2 استخراج ویژگیهای کالا

هدف از این مرحله مشخص نمودن ویژگی هایی است که در متون نظرات به دنبال آنها هستیم. از آنجا که نظرات مود بررسی در مورد تلفنهای همراه می-باشد، ویژگی های مطرح برای یک تلفن همراه در نظر گرفته می شود. این ویژگی ها و در واقع مشخصات فنی کالا است که در سایت دیجی کالا برای هر دستگاه نشان داده شده است.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید