بخشی از مقاله
چکیده-
هدف این تحقیق، ارائه الگوریتمی برای تشخیص و تخمین هوشمند میزان درد، از روی تغییرات چهره افراد است که با استفاده از استخراج ویژگی از چهره و اجرای روشهای دستهبندی روی آنها انجام می شود. در یک سیستم تشخیص خودکار درد، دقت و قابلیت اطمینان سیستم از اهمیت ویژهای برخوردار است و به همین دلیل تلاشهای اخیر بیشتر در جهت افزایش دقت و کاهش خطای این سیستمها بوده است.
یکی از مهمترین راهها برای دستیابی به این هدف، محدود کردن الگوریتم استخراج ویژگی به ناحیههایی است که بیشتر بیانگر درد و ناراحتی در چهره هستند . این کار با کاهش ابعاد بردار ویژگی، به افزایش سرعت پردازش منجر میشود. در این مقاله الگوریتمهای استخراج ویژگی HOG ،LBP ، Gaborو POEM ابتدا بروی تصاویر چهره کامل و سپس روی نواحی که در مواقع بروز درد بیشتر تحت تأثیر قرار میگیرند، مانند ناحیه چشم و ابرو و دهان، اعمال میشود و سرعت و دقت تشخیص میزان درد در این دو حالت مقایسه میشود. نتایج نشان میدهد که اعمال توصیفگرها بطورموضعی توانسته است با دقت و سرعت بالاتری میزان درد را در افراد نسبت به اعمال بهکل چهره تشخیص دهد.
-1 مقدمه
درگذشته تشخیص میزان درد تنها برمبنای بیان بیمار و مشاهده حالات وی بود. روشهای خود احضاری در جمعیتهای مهمی مثل نوزادان و کودکانی که قادر به صحبت نیستند، بیماران دارای اختلالات روانی و افراد بدحال یا بیهوش، قابل استفاده نمیباشند. روشهای خود اظهاری و مشاهدهای بسیار وابسته به فرد میباشند و نتایج مناسب زمانی به دست میآید که بیمار در اوج حالات بیان درد باشد ولی در مواردی که درد مداوم در طول زمان وجود دارد، دچار خطا میشود.
سیستم تشخیص خودکار درد، پیشنهاد مناسبی برای مراکز درمانی است. این روش میتواند ارزیابی دردهای مداوم و مستمر را انجام دهد و نتایج اقدامات درمانی و پیشگیرانه در مراکز درمانی را بخصوص برای بیمارانی که نمیتوانند در شرایط حاد، درخواست کمک کنند را بهبود دهد. سیستم خودکار بسیار معقولتر از روشهای مشاهدهای است چون مشاهده فرد تحت تأثیر فاکتورهای شخصی و ارتباطی وی با بیمار قرار میگیرد درحالیکه تشخیص خودکار درد از این تأثیرات مصون است. این سیستم همچنین به کسب اطلاعات جدیدی در مورد درد میپردازد. بهطور مثال در مورد پویایی - دینامیک - حالات چهره اطلاعات مفیدی میدهد. این روش حساسیت بالایی به جزئیترین تغییرات دارد و فعلوانفعالات درونی بیشتری را نسبت به روشهای قبلی ثبت میکند.
-2 مطالعات قبلی
در مطالعات مختلف روشهای استخراج ویژگی متفاوتی برای تخمین درد از روی چهره استفادهشده است. در مطالعه [2] از سه روش تبدیل کسینوسی گسسته - 1 - DCT و الگوی باینری محلی 2 - LBP - و هیستوگرام گرادیان جهتدار 3 - HOG - استفادهشده است.
DCT و LBP مشخصههای مختلف تغییرات بافتی را نشان میدهند. ویژگیهای DCT ظاهر تصویر را در یک مقیاس بزرگ توصیف میکنند که میتواند در تصاویر بازسازی DCT دیده شود. در این روش ساختار تصویر کلی حفظ میشود اما لبههای تیز ناپدید میشوند. بهطور معکوس، ویژگی LBP توصیفگر محلی و موضعی، تشخیص لبهها است . در حالت عادی برای همسایگی 8 پیکسل، تعداد الگوهای LBP برابر 256 حالت است. ویژگی HOG وقوع جهت گرادیان را در یک جزء تصویر محاسبه میکند.
توصیف گر HOG در ابتدا برای تشخیص چهره معرفی شد و بعد، چون اطلاعات ظاهر و شکل را با محاسبات ساده نمایش میدهد، درزمینه آنالیز حالت چهره نظر همه را جلب کرد. Florea و همکارانش از فیلتر گابور جهت تشخیص میزان درد از روی حالت چهره استفاده کردند.
فیلترهای گابور ازجمله فیلترهای خطی و محلی می باشند که در موارد مختلفی از قبیل آنالیز بافت و آشکارسازی لبه بهطور وسیعی استفاده شدهاند.
در مطالعه دیگری[1] ویژگیهای هیستوگرام توپوگرافیک - 4 - HOT در چارچوب بسط سری تیلور تابع تصویر، با مشتقگیری از تصاویر برای تکمیل شاخصههای چهره استفاده شد. تبدیل ویژگی مقیاس مقاوم 5 - SIFT - و مدل جدیدتر آن 6 - SURF - که ازجمله الگوریتمهای توصیف و تعیین ویژگیهای محلی در تصویر هستند در تطبیق یک مجموعه تصویر و شناسایی اشیاء و ساخت مدل سهبعدی از روی تصاویر و ردیابی اشیاء در ویدئو، در مطالعه دیگری بکار گرفتهشده است.[5 ,4] الگوی دودویی گابور محلی 7 - LGBP - یک ویژگی مبتنی بر ظاهر است که در آن LBP روی بزرگترین پاسخ فیلتر گابور یک تصویر، بهجای تصویر طبیعی اعمالشده است
-3 روش کار
تخمین میزان درد از روی حالت چهره شامل چند مرحله است. این مراحل با تشخیص، قطعهبندی و تنظیمات لازم بر اساس نقاط شاخص موجود روی تصاویر صورت شروع میشود. سپس توصیفگرهای ویژگی بر مبنای ویژگیهای بافتی گابور، LBP یکنواخت ، HOG سرعتبالا و POEM بهمنظور استخراج ویژگیهای چهره مورداستفاده قرار میگیرد. ابعاد بردارهای ویژگی بهدستآمده بهوسیله روش انتخاب ویژگی 8 - FS - کاهش داده میشود[6] سپس بردار ویژگی بهدستآمده از طریق ماشین بردار پشتیبان - 9 - SVM دستهبندی میشود.
روش پیشنهادی این مطالعه، بهصورت ارائه روش نوینی در اعمال توصیف گرها بر چهره، است. به این صورت که برخلاف اکثر مطالعات درزمینه تشخیص درد که توصیفگرهای ویژگی بر چهره کامل افراد اعمال میشود، در این مطالعه چهره به بخشهای مختلف تقسیم میشود و توصیفگرهای موردنظر بر نواحی دارای بیشترین بیان احساس درد ، اعمال میشوند. در این مطالعه علاوه بر الگوریتمهای استخراج ویژگی که بهطورمعمول در ارزیابی میزان درد از روی چهره استفاده میشود از الگوریتم POEM که ترکیبی از توصیفگرهای HOG و LBP است نیز استفادهشده است.
-1-3 استخراج ویژگی
استخراج ویژگی دو هدف اصلی و مهم را دنبال میکند: تبدیل تصویر ورودی به بردار ویژگی و کاهش ابعاد برای طبقه بندی مؤثر. یک الگوریتم استخراج ویژگی خوب، طبقهبندی قوی و مؤثر و تشخیص خوب را تضمین میکند. استخراج ویژگی بهمنظور یافتن ویژگیهای کلیدی که قرار است برای تصمیمگیری از آنها استفاده شود، بهکاربرده میشود.
-1-1-3 توصیف گرهای ویژگی
در این مطالعه روشهای استخراج ویژگی HOG و LBP و Gabor و POEM روی تصاویر اعمال میشود. هر یک از توصیفگرها، یکبار روی کل تصویر چهره اعمال میشود و بار دیگر ، بهعنوان روش پیشنهادی بهصورت محلی روی نواحی چشم و ابرو و دهان که بهوسیله نقاط شاخص بهدستآمدهاند، اعمال میشوند زیرا این نواحی چهره بیشترین بیان احساس درد رادارند.
HOG-1-1-1-3
عملگر HOG روشی برای استخراج ویژگیهای محلی در تصویر است. ویژگی HOG ، استفاده از توزیع گرادیانهای محلی یا جهت لبه در ناحیه مشخصی از تصویر کوانتیزه بر اساس جهت است. ویژگیهایی که از این طریق به دست میآیند تمایز بالا دارند و بهطور صادقانه حالت چهره را بیان میکند.
در HOG، یک همسایگی w*w در نظر گرفته میشود، این همسایگی سلول نامیده میشود و برای هر سلول یک هیستوگرام گرادیان محاسبه میشود. سپس گرادیان تصویر با استفاده از فیلتر مناسبی - فیلتر سوبل - ، در جهت x و y محاسبه میشود و کانولوشن تصویر اصلی با هر یک از این گرادیانها و اندازه و جهت گرادیان به دست میآید. برای محاسبه هیستوگرام گرادیان، زاویه گرادیان بین 180-0 درجه یا 0-360درجه محدود میشود. این محدوده زاویه به n درجه مساوی تقسیم میشود که n تعداد جهتهای گرادیان یا بینهای هیستوگرام است. برای محاسبه هیستوگرام در این مطالعه از روش محاسبه سریع استفادهشده که در آن هیستوگرام با استفاده از گرادیان عمودی و افقی وزندار میشود. پس از محاسبه هیستوگرام گرادیان در هر سلول، این مقدار به پیکسل مرکزی سلول اختصاص مییابد.
Gabor-2-1-1-3
موجکهای گابور که به فیلترهای گابور نیز معروفاند، بهطور گسترده جهت استخراج ویژگیهای ظاهری چهره در قالب مجموعهای از ضرایب چندمقیاسی10و چند جهتی11 مورداستفاده قرارگرفتهاند. برای استخراج اطلاعات بافتی، یک بانک فیلتری شامل فیلترهای گابور با مقیاسها و چرخشهای متفاوت ایجاد میشود
هسته کانولوشن فیلتر گابور حاصلضرب یک تابعنمایی مختلط و گوسین است. اگر فیلترهای گابور بهطور مناسب و دقیق تنظیم شوند، عملکرد بسیار مناسبی در تشخیص ویژگیهای بافت و لبه بافت دارند. فیلترهای گابور می توانند برای زوایا و فواصل مختلف طراحی شوند و به تصویر اعمال شوند. چون محاسبات موجکهای گابور بسیار زیاد و پیچیده استمعمولاً یک بانک فیلتر شامل فیلترهای گابور با مقیاسها و زوایای مختلف ایجاد میشود.[
درروش پیشنهادی ما 40 فیلتر گابور - 5 مقیاس و 8 جهت - روی تصاویر چهره اجرا کردیم تا بردار ویژگی استخراج شود
فیلتر گابور از طریق رابطه زیر محاسبه میشود:
چرخشی در کنار هم قرارگرفته و یک عدد 8 بیتی تشکیل میدهد. در این مطالعه از LBP یکنواخت استفاده شده و بین به 59 حالت کاهش پیداکرده است.
POEM-4-1-1-3
عملگر POEM که نسخه بهبودیافته HOG است، بعد از گرفتن گرادیان تصویر، علاوه بر جهت از اندازه گرادیان نیز در محاسبات خود استفاده میکند. این توصیفگر را میتوان بهنوعی، ترکیبی از LBP و HOG نیز بیان کرد که پس از گرفتن گرادیان از تصویر، تصاویر اندازه گرادیان را بر اساس جهتهای کوانتیزه تجزیه میکند، سپس با انباشتن12 این تصاویر تجزیهشده، کدگذاری LBP را روی آنها انجام میدهد، سپس هیستوگرام را از هر یک از سلولهای مشخصشده استخراج میکند.
رابطه - - 4 محاسبه POEM برای یکجهت کوانتیزه را نشان میدهد که در کنار رابطه - 5 - همان رابطه LBP را نشان میدهد که در این روابط N تعداد پیکسلهای همسایه و حد آستانهای با مقدار کمی بزرگتر از صفر است. درنهایت با کنار هم قرار دادن هیستوگرام هر سلول هیستوگرام نهایی را تشکیل میدهد. رابطه - 6 - مقدار نهایی POEM را نشان میدهد که در آن، Q تعداد جهتهای کوانتیزه است.
که f فرکانس فاکتور سینوسی، انحراف فاز، انحراف معیار، جهت موجک و نسبت ابعاد فضایی است.[6]
LBP-3-1-1-3
عملگر LBP بهعنوان یک توصیفگر قدرتمند بافت است این عملگر برای هر پیکسل با توجه به برچسب پیکسلهای همسایه 3×3، یک عدد دودویی تولید میکند و پیکسل مرکزی بهعنوان حد آستانه در نظر گرفته میشود. این بدینصورت است که برای پیکسلهای با مقدار بزرگتر یا مساوی مقدار پیکسل مرکزی برچسب 1 و برای پیکسلهای با مقادیر کوچکتر از مقدار پیکسل مرکزی برچسب 0 قرار میگیرد. سپس این برچسبها بهصورت
-2-3 دسته بندی ویژگیها
روشهای مختلفی برای دستهبندی ویژگیهای استخراجشده از تصاویر ایستا و پویای حالت چهره مورداستفاده قرارگرفته است. بهعنوان یک مثال ساده دستهبند نزدیکترین همسایه13، نمونه مورد آزمایش را به دسته نزدیکترین نمونه از دادههای آموزش نسبت میدهد. معیار نزدیک بودن دادهها میتواند فاصله اقلیدسی 14 بین داده آزمایش و داده های آموزش باشد.