بخشی از مقاله
چکیده
پردازش زبانهای طبیعی1 بعنوان زیرمجموعهای از هوش مصنوعی2، میتواند توصیهها و بیانات را با استفاده از زبانی که بطور طبیعی در مکالمات روزمره بکار میرود، بفهمد و مورد پردازش قرار دهد. احساسات درونی یک انسان بخشی از ارتباطات روزمره اوست. یکی از رفتارهای خروجی که نشاندهندهی حالات درونی فرد می باشد نحوه نوشتاری اوست. حل چنین مسألهای منجر به دریافت کامل معنای یک پیام متنی است و باعث افزایش کیفیت تعامل بین بشر و کامپیوتر میگردد. مسألهی اساسی در این تحقیق، طراحی یک الگوریتم کارا و مؤثر جهت تشخیص احساس3 از روی متن فارسی و بدست آوردن احتمال هر کدام از احساسهای اصلی جمله است.
جملات احساسی مورد تحقیق شامل 6 کلاس احساس اصلی شامل »عصبانیت«، »ناراحتی«، »خوشحالی«، »تنفر«، »ترس« و »عشق« میباشد. الگوریتم ارائه شده به ازای برخی از واژگان احساسی شاخص که از گروههای ششگانه مذکور، به کمک تکنیکهای ریشهیابی و برچسبگذاری و بر اساس معیار رتبهبندی فرکانس سند برگزیده شدهاند، بردارهای هموقوعی4 و تشابه کسینوسی5 دوبهدوی آنها را تشکیل میدهد. با در نظر گرفتن ترکیبات مختلف از صفتها و افعال کشف شده در جملات ، میزان ارتباط آنها محاسبه میشود. دقت الگوریتم پیشنهادی با توجه به کیفیت دیتاست آموزش، بطور میانگین در تشخیص احساس متن فارسی حدود %88 میباشد. ابزار محاسباتی بکار رفته برای گرفتن نتایج ، نرمافزار - 2012 - MATLAB میباشد.
.1 مقدمه
از دیرگاه کلمهی "روبات" و "کامپیوتر" به سرد و خشک و بی احساس بودن شناخته شدهاند، ولی میتوان روزی را تصور کرد که این شناخت به کلی متحول شود. تشخیص احساسات شاخهای از علوم کامپیوتر و پردازش زبان طبیعی1 است که سعی دارد ماشین و هوش مصنوعی را با احساس و عواطف انسانی آشنا و تشخیص آنها از هم را میسر سازد .[1] اهمیت این مساله جایی مشخص میشود که به اطرف خود بنگریم و دریابیم همین حالا هم بسیاری از روابط و برخوردهای ما با هوشهای مصنوعی است. از کارهای روزمره مانند استفاده از کامپیوتر و تلفن همراه،سیستمهای تلفنی پاسخگوی خودکار، استفاده از وبسایتهای مختلف گرفته تا حتی کارهای صنعتی و علمی. بدیهی است که تشخیص احساسات و عواطف میتواند این ماشینها را به بشر نزدیکتر ساخته و آنها را قادر به کمکرسانی هر چه بیشتر به او میکند.
مثلا روباتهای تخصیص مشتری که امروزه در فروشگاههای زنجیرهای بزرگ کاربردی شدهاند را تصور کنید که احساسات مشتری را تشخیص داده، مشتری عصبانی و پرخاشگر را سریعا به مدیریت ارجاع میدهد و مشتریان دیگر را به نوبت به باجههای تسویه میفرستد. تلفن همراهی را تصور کنید که بر اساس مکالمات شما با افراد تشخیص میدهد که روز دشواری داشتهاید و بطور خودکار تماس کسانی که سابقهی بیشترین دعوای لفظی را دارند را بلاک میکند تا شما در آرامش باشید.
تشخیص احساس در زمان حال بیشترین کاربرد را در سایتهای عرضهی انواع کالا - مجازی یا حقیقی - دارد. بسیار مهم است که مدیر سایت و شرکت عرضه کنندهی محصول بدانند کدام نقد و بررسیها از یک محصول مثبت هستند و کدام منفی و اینکه شدت منفی یا مثبت بودن چقدر است.[2] کاربر از محصول کمی ناراضی است یا شدیدا؟ شرکتهای بزرگی همچون amazon و google از سیستم تشخیص احساس متن برای بررسی نظرات کاربران استفاده میکنند. بنابراین، تشخیص احساس متن، ماشینهای فعلی را یک نسل به جلو رانده و باور عمومی بر بیاحساس بودن ماشینها را کمرنگتر میسازد. در پی آن باعث آسانتر شدن بسیاری از جهات زندگی انسان نیز خواهد شد.
.2 ادبیات و سابقه موضوع
تلاش برای افزودن امکان بیان و تشخیص احساس، زمینه جدیدی از تحقیقات به نام محاسبات عاطفی2 را به روی محققان باز کرده است. امروزه بسیاری از واسطهای کاربر3 مبتنی بر متن هستند. تشخیص خودکار احساس از دادههای متنی نقش بسیار مهمی در طراحی واسطهای هوشمند کاربر دارد. برای تشخیص احساس یک متن، ابتدا باید یک مجموعه دادهی آموزشی وجود داشته باشد که این مجموعه شامل تعدادی جمله و عبارت است که هر جمله با استفاده از یک فرد خبره، برچسبگذاری شده است. همچنین تحلیلی بر روی جملات زبان باید صورت گیرد. حل مسأله منجر به دریافت کامل معنای یک پیام متنی و دریافت حالت احساسی نویسندهی آن متن در حین نگارش میشود و باعث افزایش کیفیت تعامل بین بشر با احساس و کامپیوتر بی احساس میشود. همچنین باعث دسته بندی متون بر اساس احساس حاکم بر آن میباشد.
لیبرمن4 و سلکر5 از روشی استفاده کردهاند که احساس یک جمله را بر اساس رایجترین احساسهای موجود در پایگاه دانش آشکار می کند. این رو از دانش دنیای واقعی در وضعیتهای مختلف زندگی روزانه برای دسته بندی جملات به گروههای احساسی پایه استفاده می کند. در این روش ابتدا مفاهیم مربوط به هم در یک شبکه مفهومی6 دسته بندی می شوند. سپس کلمات کلیدی احساسی تعریف شده به شبکه مفهومی تخصیص می یابد. در آخرین مرحله مفاهیم مختلف در این شبکه ها مورد جستجو قرار می گیرند تا احساس جمله مربوطه استخراج شود. به طور مثال کلمات دزدیدن، ربودن، گم شدن و از دست دادن همگی در یک شبکه مفهومی قرار می گیرند که احساسی ناراحتی را در پی دارد .[3]
تشخیص احساس بشر از روی متن با طبقهبندی مسأله یک متن داده شده با کلاسهای احساسات تعریف شده از قبل به آسانی تهیه میشود. ابتدا باید یک دیتاست برای هر کلاس احساس داشته باشیم. روشهای زیادی تا بحال برای تشخیص احساس از متن پیشنهاد شده است که تعدادی از آنها عبارتند از کلمات توقف1، پردازش آماری زبان طبیعی2، مدل مبتنی بر آنتولوژی3، مدل فضای برداری4 و ...
روش کلمات توقف پیادهسازی آسان دارد و بر پایه مجموعهای از عبارات از قبل تعریف شده، برای طبقهبندی متن به طبقات احساسی میباشد. با وجود آسانی این روش، وجود واژهنامه مؤثر سخت است زیرا فقط %4 کلمات استفاده شده در متن، ارزش احساسی دارند. بنابراین این روش برای طیف گستردهای از زمینههای کاربردی نیست 5]و.[4 روش NLP آماری روشی مبتنی بر وابستگی معنایی است که هر لغت ارزش احتمالاتی برای یک کلاس احساس خاص دارد. با اینحال، این روش نیاز به مجموعه داده آموزشی5 با مقیاس بالا و کیفیت بالا برای طبقهبندی بهتر دارد.[6] روش آنتولوژی نیز از شبکههای معنایی مثل Word Net و Concept Net استفاده میکند .[7]
برای زبان فارسی از روشهایی مانند برچسب گذاری کلمات و شمارش کلمات استفاده شده است. در این روشها کلمات احساسی متن شمرده می شوند و نتیجه به توجه به تشخیص فرد خبره با ضرائب عددی مشخص وزن دار می شود و در نهایت احساسی که عدد حاصل در بازه عددی مربوط به آن قرار دارد به عنوان احساس منتخب برگزیده می شوند. نمونه ای از کلمات برچسب گذاری شده: احساس شادی: لذت، خندیدن و... .احساس ناراحتی: گریه، اشک، غم، ناراحتی و... این نشان داده شده است که روشهای ترکیبی که دو یا چند روش همزمان روی متن اعمال میشوند بهترین جواب را در بر دارند 9]و.[8
در [10] پیکرهای شامل 3702 جمله از 6 احساس خوشحالی، عصبانیت، خنثی، ناراحتی، تنفر، ترس میباشد. هدف اصلی در این مقاله، به دست آوردن نتایج به صورت ترکیب احتمالاتی از کلاسهای مختلف بوده است. بدین منظور به جای استفاده از فرکانس هر کلمه، میزان احتمال تعلق کلمه مورد نظر به هر کلاس را محاسبه می کنیم. در [11] دو احساس شادی و ناراحتی مورد بررسی قرار گرفتهاند. برای زبان فارسی از روشهایی مانند برچسبگذاری6 کلمات و شمارش کلمات استفاده شده است. در این روشها کلمات احساسی متن شمرده میشوند و نتیجه با توجه به تشخیص فرد خبره با ضرایب عددی مشخص وزندار میشود و در نهایت احساسی که عدد حاصل در بازه عددی مربوط به آن قرار دارد بعنوان احساس منتخب برگزیده میشود.
.3 روش تحقیق
در این تحقیق، برخلاف کارهای گذشته به جای آنالیز بر روی لغات، آنالیز بر روی عبارات انجام شده است تا دقت بیشتری در حل مسئله حاصل شود. این مسأله در مثال زیر توضیح داده شده است. در جملهی زیر } من خیلی استرس دارم. موضوع انشاء فردا در مورد عشق است و من هیچی بلد نیستم