بخشی از مقاله
چکیده
امروزه پایش فعالیتهای فیزیکی انسان توسط حسگرهای پوشیدنی به یکی از مهمترین زمینههای تحقیقاتی در حیطه مهندسی پزشکی بدل شده است. یک چالش مهم در این فرآیند، بهبود عملکرد طبقهبندهای مبتنی بر یادگیری ماشین برای تشخیص و تفکیک نوع فعالیتهای انسان از روی سیگنال ثبتی این حسگرها می باشد.
در این مقاله چگونگی جداسازی ویژگیهای رفتاری انسان با استفاده از مفهوم یادگیری عمیق تحلیل می شود. بدین منظور روش شبکههای عصبی کانولوشنی برای طبقهبندی سیستماتیک چهار رفتار از قبل تعریف شده شامل خوابیدن، دویدن، اتوکشیدن و دوچرخهسواری استفاده شده و نتایج آن با روش مبتنی بر شبکه های عصبی کلاسیک مقایسه شده است. نتایج حاصل از مقایسه این دو راهکار، حاکی از آن است که استفاده از یادگیری عمیق، به طور متوسط قادر است نتایج حاصله را در حدود 13/5درصد بهبود بخشد.
-1 مقدمه
باتوجه به آمارهای ارائه شده توسط مؤسسههای جهانی، متخصصین امر بر این باورند که در سالهای آینده با توجه به پیشرفت علم پزشکی و رشد جمعیت جهان، درصد قابل توجهی از مردم به سنین سالمندی خواهند رسید که این افراد بیشتر تمایل دارند که به صورت فردی زندگی کنند. بر این اساس پایش دایمی سلامت این افراد یکی از چالش های پیش رو در جوامع پیشرفته و در حال توسعه خواهد بود. یک راه ابتدایی برای پایش سلامت این افراد، همراه داشتن تجهیزات پزشکی سیار یا مراقبت حضوری توسط پرستار است و لیکن این راهکار هزینه قابل توجهی دارد. راهکار متقابل، استفاده از حسگر هایی است که علاوه بر آن که می توانند فعالیتهای لحظه به لحظه فرد شامل نشستن، خوابیدن، ایستادن و نظایر آن را ثبت کنند، با مشکل عدم رعایت حریم خصوصی نیز مواجه نیستند.
با این حال در این نوع از پایش به دلیل استفاده از حسگرهای مختلف و ثبت های متنوع، وجود یک یک سامانه مبتنی بر هوش مصنوعی برای تلفیق و استنتاج از این اندازه گیری ها ضرورت می یابد. متاسفانه سامانه های متعارف مبتنی بر هوش مصنوعی در این خصوص با چالش هایی مواجه هستند که مهم ترین آن ها اشتباه در تفکیک برخی از فعالیتها است که این نوع از خطا به علت تغییرپذیری سیگنالهای ثبت شده و تشابه برخی از فعالیتهای طبیعی انسان با یکدیگر، رخ میدهد. از این رو بهبود عملکرد طبقهبندهای مبتنی بر یادگیری ماشین برای تشخیص و تفکیک نوع فعالیتهای انسان از روی سیگنال ثبتی این حسگرها در سالیان اخیر به موضوعی جذاب برای محققین این حوزه بدل شده است.
تا کنون روشهای مختلفی برای انجام طبقهبندی مزبور، پیشنهاد شدهاند که چالش اصلی در اغلب آنها حصول دقت قابل قبول در شرایط تنوع و شباهت نوع فعالیتهای مورد شناسایی است. در برخی تحقیقات، از ماشین بردار پشتیبان* به منظور تفکیک فعالیتهای گفته شده استفاده شده است
برخی تحقیقات جدیدتر، شبکههای عصبی مصنوعی را به عنوان طبقهبندهای غیرخطی برای تفکیک فعالیتها در فرآیند فوق استفاده کردهاند. اگرچه این شبکهها توانستهاند در برخی موارد فعالیتهای متفاوت با یکدیگر را به خوبی تفکیک نمایند ولیکن عدم امکان مدلسازی دادهها به فرم دنباله زمانی و همچنین محدودیت در تفکیک فعالیتهای مشابه، عملکرد شبکه های عصبی کلاسیک را در فرآیند فوق محدود میسازند. در برخی تحقیقات برای تقویت عملکرد شبکه عصبی از تلفیق آن با مفهوم فازی نیز استفاده شده است.
در سالیان اخیر شبکههای عصبی مبتنی بر یادگیری عمیق ، به عنوان خانواده ای از شبکههای عصبی مطرح شده اند که به طور مستقیم از ورودی تغذیه میشوند و نسبت به عوامل ناخواسته از قبیل نویز و اعوجاجها مقاوم میباشند و از سوی دیگر به صورت همزمان ویژگیهای سطح بالا را برای انجام طبقهبندی استخراج مینمایند. روشهای مبتنی بر شبکههای عصبی متعارف و یا سامانههای فازی به دلیل این که امکان مدلسازی دادهها به فرم دنباله زمانی را ندارند، در زمینه تشخیص فعالیت دچار محدودیت هستند.
این در حالی است که روش های مبتنی بر یادگیری عمیق می توانند دنباله زمانی مدل نمایند و لذا این خانواده از روش ها می تواند برای حل مشکلات بازشناسی فعالیت که دارای ماهیتی وابسته به زمان است، راهکاری موثر به شمار آید
در این مقاله کارایی این مفهوم با استفاده از شبکه موسوم به شبکه عصبی کانولوشنی در تشخیص فعالیت به سیگنالهای ثبت شده از فعالیتهای انسان، آزموده و با روشهای مبتنی بر مفهوم شبکه عصبی متعارف مقایسه میگردد.
ساختار این مقاله به صورت زیر می باشد: در بخش دوم مقاله، روش تفکیک فعالیت های انسان مبتنی بر یادگیری عمیق تشریح می گردد. در بخش سوم، روش مزبور بر روی دادهگان حاصل از ثبت فعالیتهای روزانه شامل دراز کشیدن، دویدن، دوچرخه سواری و اتو کردن، آزموده شده و نتایج به دست آمده از آن با نتایج حاصل از آزمون دادگان مشابه توسط یک نمونه شبکه عصبی کلاسیک - شبکه عصبی پرسپترون چند لایه - ** مقایسه و ارزیابی می-شوند. بخش پایانی مقاله به نتیجهگیری اختصاص دارد.
-2 مواد و روش ها
راهکار این پژوهش برای تفکیک فعالیتها، یادگیری عمیق و ابزار در نظر گرفته شده برای اجرای چنین تفکیکی، شبکه های عصبی کانولوشنی هستند. لذا در این بخش، ساختار و نحوه عمل ابزار فوق تشریح شده و در بخش های آتی عملکرد آنها در تفکیک فعالیت ها مورد بررسی قرار می گیرد.
-1-2 شبکه عصبی CNN
شبکههای عصبی عمیق، خانوادهای از شبکههای عصبی هستند که به طور مستقیم از ورودی تغذیه میشوند و به صورت همزمان ویژگیهای سطح بالا را برای انجام طبقهبندی استخراج مینمایند. در شکل - - 1 معماری شبکه عصبی CNN استفاده شده و همچنین لایههای مختلف آن نمایش داده شده است. خروجی شبکه، نمایانگر کلاس مربوط به فعالیت میباشد.
شکل - - - 1 شمای شبکه عصبی CNN
· لایه کانولوشن
اولین لایه برای شبکه CNN لایه کانولوشن میباشد. در این مرحله از کار، فیلتر ایجاد شده، بر روی سیگنال ثبت شده، لغزانده شده و خروجی ناشی از این عملیات به صورت یک ماتریس برای مرحله بعد ذخیره میگردد. فیلتر مورد استفاده فیلتر لگاریتمی با پارامترهای متغیر میباشد. روند حرکت ماتریس فیلتر بر روی ماتریس سیگنال، بصورت زیر است.
که در رابطه اخیر، W سایز فیلتر،K کرنل* نورون های سایز لایه کانولوشن ،S میزان گام و P تعداد صفرهای بازنشانی شده میباشد. فیلتر به صورت یک ماتریس 3×3 بر روی ماتریس سیگنال مورد نظر در هر مرحله لغزانده می شود که در قالب رابطه - 2 - بیان می گردد:
در این جا K2 ابعاد ماتریس سیگنال بوده - در اینجا فرض شده است که ماتریس مربعی است - و wi ها ماتریس فیلتر میباشند.
· لایه ادغام
قرار دادن یک لایه ادغام بین چندین لایه کانولوشنی پشت سر هم در معماری CNN ها امری رایج است. کارکرد این لایه، کاهش اندازه مکانی - عرض و ارتفاع - سیگنال - ورودی - به منظور کاهش تعداد پارامترها