بخشی از مقاله
خلاصه
حالات هیجانی چهره، نقش اساسی در انتقال منظور و ارتقاء کیفیت ارتباطات انسانی دارند. با پیشرفت روزافزون در شناسایی چهره و اهمیت آن، در این مقاله به شناسایی حالات هیجانی چهره، توسط مدل یادگیری هیجانی مغز پرداخته شدهاست. مدل یادگیری هیجانی مغز، براساس سیستم لیمبیک مغز انسان که مسئول محرک هیجان انسانی است، ایجاد شدهاست. هدف از این مقاله، افزایش نرخ بازشناسی حالات هیجانی چهره است. ورودی مدل پیشنهادی، دیتاست استاندارد Cohn-Kanade که شامل شش حالت هیجانی خوشحالی، ناراحتی، خشم، تعجب، ترس و تنفر میباشد.
ویژگیهای تصاویر به روش PCA استخراج شده و جهت محاسبه نرخ بازشناسی حالات هیجانی چهره، وارد مرحله دستهبندی از مدل یادگیری هیجانی مغز شدهاست. همچنین ماتریس ارتباطاتی که شامل ابرو، چشم و دهان ایجاد و با میانگینگیری به تشخیص حالات هیجانی چهره پرداخته شدهاست. ماتریس ارتباطات قادر است، درصورت ورود یکی از ویژگیها به سیستم، حالات چهره را شناسایی نماید. نتایج تحلیل دیتاست، نرخ بازشناسی حالات چهره را 95/81 درصد نشان دادهاست. با توجه به نتایج این مقاله، مدل یادگیری هیجانی مغز نرخ بازشناسی حالات هیجانی را با دقت بالایی نشان میدهد.
کلمات کلیدی: مدل یادگیری هیجانی مغز، PCA، ماتریس ارتباطات، شناسایی حالت چهره.
.1 مقدمه
چهره یک ویژگی منحصر بفرد برای انسان است. حالتهای چهره، تغییراتی هستند که در پاسخ به حالتهای هیجانی انسان یا ارتباطات اجتماعی او، در چهره ظاهر میشوند. شناسایی حالت چهره1، یکی از زمینههای تحقیقاتی در بینایی-کامپیوتر است که در آن به شناساییحالت چهره افراد پرداخته میشود. در سیستمهای شناسایی حالت چهره تشخیص دادهمیشود که فرد در کدام یک از حالات خوشحالی2، ناراحتی3، خشم4، تعجب5، ترس6 و تنفر7 است .[1] بنابراین در این مقاله به بازشناسی حالات هیجانی چهره پرداخته شدهاست. مدل پیشنهادی الهام گرفته از سیستم لیمبیک8 مغز انسان - مسئول محرک هیجانی - میباشد. از این مدل جهت بالا بردن نرخ بازشناسی حالات هیجانی استفاده شدهاست.
نخستین مطالعات مکتوب و مستند در زمینهی شناسایی حالت هیجانی متعلق به داروین9 است که در سال 1872 منتشر شدهاست. داروین جزئیات حالات چهره مربوط به هیجان انسانها و حیوانات را بیان نمود .[2] تحقیقات زیادی بعد از داروین انجام گرفت. داماسیو10 در سال 1994 بیان نمودهاست: از اولین علایق، ایجاد و شناسایی حالات هیجانی چهره است. حالت هیجانی نقش مهمی را در تشخیص انسانی ایفا میکنند و بنابراین در مطالعات علوم شناختی، اعصاب و روانشناسی اجتماعی، ضروری هستند .[3] کوهن11 در سال 2001، نیز به این نتیجه رسید که حالات چهره میتوانند نقشی اساسی در ارتباطات انسانی ایفا کنند .[1]
ویلبر12 در سال 2011 ، از علائم زبانی حالات چهره، برای کدگذاری در دستور زبان استفاده نمودند .[4] بنابراین مدلهای درک حالات هیجانی چهره برای پیشرفت بسیاری از رشتههای علمی مهم هستند .[1] لکشمی13 و همکاران در سال 2008، به تشخیص حالات احساسی در دنباله ویدئویی پرداختند. آنها از رنگ پوست برای تشخیص ناحیه چهره استفاده کردند. از روش استخراج ویژگی تجزیه مؤلفههای اصلی - PCA - 14 استفاده نمودند. بعد از مرحله تشخیص چهره، سیستم به طور موثر احساس را تشخیص داد .[5] مارتی15 و همکاران در سال 2009، روشی برای تشخیص حالات هیجانی با بهره گیری از چهرههای ویژه ارائه دادند و از PCA برای استخراج ویژگی تصاویر ورودی استفاده کردند.
در این روش، مجموعه آموزش به شش کلاس پایه - خوشحالی، ناراحتی، خشم، تعجب، ترس و تنفر - اختصاص داده شده و آزمایش خروجی بر مبنای این شش کلاس صورت میپذیرد. از دیتاستهای Cohn-Kanade و 16 JAFFE استفاده نمودند. نرخ شناسایی در دیتاست JAFFE، 75 درصد و در دیتاست Cohn-Kanade، 77/5 درصد حاصل شد . [6] مانال عبداالله17 و همکاران در سال 2012، روش بهبود یافتهای را برای تشخیص تصاویر دیجیتال چهره با استفاده از PCA ارائه دادهاند. در این روش تصاویر به مجموعههای کوچکی از ویژگیها یا چهرههای ویژه تجزیه شدند. در این روش به میزان سی و پنج درصد زمان نسبت به PCA کاهش یافته و دقت تشخیص بالایی رسیدهاست .[7]
مورتازا18 و همکارانش در سال 2013، تشخیص خودکار حالات چهره را یکی از تأکید شدهترین مسائل در سیستمهای امنیتی، تأیید یا تصدیق اعتبار مثل جرمشناسی نامیدهاند. حالات چهره نه تنها احساسات را نشان میدهد، بلکه همچنین میتواند برای قضاوت دیدگاههای ذهنی وجنبههای روانپزشکی استفادهشود .[8] کوماری19 و گروهش در سال 2015، بیان نمودند که سیستم تشخیص حالات چهره کاربردهای زیادی دارد و فقط به درک رفتار انسان، آشکارسازی اختلالات ذهنی و بیان ساختار انسانی محدود نمیشود .[9] بهشتی و همکاران در سال 2010، اجزای اصلی سیستم لیمبیک در پردازش-های هیجانی را توصیف نمودهاند که یک مدل محاسباتی سیستم لیمبیک براساس این مفاهیم را مورد بررسی قراردادهاند .[10]
مدل یادگیری هیجانی مغز - 20BEL - ، یک روش قوی در کنترل زمان واقعی و سیستمهای تصمیمگیری است. بنابراین برای شناسایی حالات هیجانی چهره مدل مناسبی میباشد؛ همچنین سیستم بیولوژیکی مغز انسان همیشه درست عمل کرده و هسته اصلی در تشخیص حالات میباشد، در این مقاله از مدل BEL در تشخیص حالات هیجانی استفاده - شدهاست. هدف مقاله حاضر، شناسایی حالات هیجانی چهره با استفاده از مدل BEL است. مدل BEL یکی از جدیدترین موضوعات در حوزه علوم شناختی21 است. مدل یادگیری هیجانی مغز، برای شناسایی حالات چهره یک مدل محاسباتی برای حالت هیجانی است. در این مقاله، مدل پیشنهادی پژوهش برای شناسایی حالات هیجانی چهره ارائه شده است و در ادامه، با آزمایشات مختلف مدل پیشنهادی ارزیابی میگردد. در نهایت، نتیجهگیری پژوهش بیان شدهاست.
.2 روش پیشنهادی
روش پیشنهادی در این مقاله، مدل BEL است که مبتنی بر سیستم لیمبیک مغز پستاندارن عمل میکند. برای توضیحات بیشتر لازم است متذکر شویم که سیستم لیمبیک مغز انسان مسئول محرک هیجانی بوده و از چهار هسته اصلی کورتکس حسگر22، تالاموس23، آمیگدال24 و اوربیتوفرانتال25 تشکیل شدهاست .[11] بنابراین از آنجاییکه تاکنون تحقیقی روی بازشناسی حالات چهره توسط مدلی که الهام گرفته از سیستم بایولوژیکی مغز انسان باشد، صورت نگرفته است در این مقاله مدلی ارائه میشود که این ویژگی را داشته و بر مبنای سیستم بایولوژیکی انسان قادر به شناسایی حالات هیجانی انسان باشد.
بنابراین در این روش، ابتدا تصاویر چهره افراد فراخوانی شده، پس از اعمال روشهای پیشپردازش تصویر، کیفیت تصاویر بهبود یافتهاست. سپس اجزای مهم چهره توسط PCA استخراج شد. این اجزای استخراج شده، مکانیابی شده و ماتریس ارتباطات26 برای اجزای صورت تشکیل گردیدهاست. این ماتریس میتواند اطلاعاتی نظیر فاصله اجزا از هم یا شباهت در ویژگیهای یکدیگر باشد. در نهایت برای هر چهره، یک ماتریس ارتباطی وجود دارد که این ماتریس برای هر چهره ذخیره میگردد. سپس، وزنهای الگوریتم BEL مقداردهی اولیه میشوند. در مرحله بعد دادهها تقسیم میشوند تا برای ورود به شبکه BEL آمادهسازی شوند.
در این پژوهش، تقسیم دادهها به روش k-fold انجام میشود. در تقسیم دادهها به روش k-fold یک دسته برای آزمایش سیستم و k-1 دسته برای آموزش سیستم، در نظر گرفته میشود. در مرحله بعد الگوریتم BEL شروع به یادگیری مینماید. ضرایب و وزنهای آن به روزرسانی میگردد و سیستم ارزیابی می-شود. روند یادگیری تا زمانی ادامه مییابد تا بهترین k برای تشخیص حالات چهره تخمین زده شود. در شکل 1 روند اجرای شبیهسازی نشان داده شدهاست.