بخشی از مقاله
چکیده
شناسایی آریتمیهای قلبی با استفاده از سیگنال الکتروکاردیوگرام - ECG - به دلیل تشخیص بههنگام شرایط خطرناک قلب، از اهمیّت زیادی در حوزهی تحقیقات پزشکی و علوم کامپیوتر برخوردار است. امروزه بیشتر از آنالیز دستی برای تشخیص آریتمیهای قلبی استفاده میشود که فرآیندی زمانبر است. به علاوه آنالیز دستی همواره مستعد خطای انسانی است. در این مقاله از الگوریتم یادگیری عمیق در شناسایی و تشخیص آریتمیهای قلبی استفاده شده است. دادههایی که برای یادگیری و ارزیابی روش پیشنهادی استفاده شده است، از چالش physionet/computing 2017 انتخاب شدهاند. نتایج شبیه-سازیهای انجام شده نشان میدهند که سیستم پیشنهادی در دستهبندی سیگنالهای ECG شامل کلاسهای ریتمهای با فیبریلاسیون دهلیزی، ریتمهای طبیعی، ریتمهای نویزی و سایر ریتمها، در مقایسه با روشهای موجود، دقت بالاتری نتیجه داده است.
واژگان کلیدی: سیگنالهای قلبی، فیبریلاسیون دهلیزی، یادگیری عمیق، شبکهی عصبی
مقدمه
فیبریلاسیون دهلیزی - AF - یک تند تپشی قلبی - بیش از صد ضربه در دقیقه - است. AFمعمولاً ناهماهنگی فعالیت دهلیز قلب را نشان میدهد و باعث بروز اختلال در فعالیت دهلیزها میشود. آریتمی قلبی به معنای غیرطبیعی بودن ریتم تپش قلب است. AF رایجترین آریتمی قلبی است که در یک الی دو درصد از جمعیت رخ میدهد. این نوع آریتمی قلبیمعمولاً باعث ایجاد مشکلاتی همچون نارسایی قلبی، احساس خستگی مزمن و سکتهی مغزی میشود. تخمین زده شده بیش از دوازده میلیون از اروپاییها و ساکنین آمریکای شمالی به AF دچار هستند و محتمل است در طی سی الی پنجاه سال آینده این مقدار سه برابر شود. مهمتر آنکه وقوع AF با افزایش سن، از %5 در چهل تا پنجاه سالگی، به 5 الی %15 در هشتاد سالگی افزایش مییابد.
الکتروکاردیوگرام - Electrocardiogram - یا نوار قلب - ECG - نمودار ثبتشدهی تغییرات پتانسیل ناشیاز تحرّک عضلهی قلب است. شناسایی AF از یک بازهی زمانی کوتاه ECG، چالش برانگیز است و وجود تعداد زیادی از ریتمهای دیگر، این عمل را دشوارتر میکند. در این مقاله قرار است ریتمهای سیگنال ECG را دستهبندی کنیم. برای این منظور، چهار دسته در نظر گرفته شده است:
•:Normal Sinus Rhythm ریتم سینوسی یا ریتم طبیعی در پزشکی به ریتم تپیدن نرمال قلب گفته میشود که بر روی سیگنال ECG به صورت مجموعهی منظمی از امواج است.
•:Atrial Fibrillation شایعترین نوع آریتمی قلبی است که تحریک الکتریکی، مسیر مشخصی را در قلب طی نمیکند. فیبریلاسیون دهلیزی هنگامی رخ میدهد که در دهلیزها، موج الکتریکی تحریک، جهت مشخصی نداشته باشد. یعنی سلولهای عضلانی دهلیز به صورت نامنظم تحریک و منقبض میشوند. درنتیجه انقباض منظم دهلیز وجود ندارد و دهلیزها نمیتوانند خون را به صورت کامل به بطنها پمپ کنند. در AF ضربان بطن از دهلیز پیروی نمیکند و بطن بدون نظم طبیعی منقبض میشود.
•:Too Noisy to Classify مجموعه سیگنالهای با نویز بسیار زیاد و تقرباًی بدون الگوی خاص در این دسته قرار میگیرند.
•:Other Rhythm این دسته شامل تمامی ریتمهای دیگر است.
مقدمهای بر سیگنالهای قلبی
سیگنالهای قلبی یا الکتروکاردیوگرام - ECG - توسط دستگاه کاردیگراف نمایش داده میشود. طبق شکل 2، اولین موج بالا روندهی مثبت، موج P نام دارد و مربوط به انقباض دهلیزها میباشد. موج P، 0.04 الی 0.12 ثانیه طول میکشد. دومین موج، QRS نام دارد. این موج مربوط به انقباض بطنها است و شامل یک موج منفی به نام Q، یک موج مثبت به نام R و یک موج منفی دیگر به نام S میباشد. QRSکمتر از 0.12 ثانیه طول میکشد. موج مثبت بعدی موج T و مربوط به زمان استراحت قلب است - با مراجعه به - Hampton, 2013 - میتوان اطلاعاتی جامعتر در خصوص سیگنالهای قلبی کسب کرد - .تشخیص یک سیگنال نرمال قلبی نیاز به دانش تخصصی دارد و ممکن است دچار خطای انسانی شود. امروزه دستگاههای جدیدی تولید شدهاند که سیگنالها را آنالیز میکنند و ریتم نرمال را از یک ریتم غیر نرمال یا Arithmetic تشخیص میدهند.
مقدمهای بر شبکههای عصبی کانولوشن
شبکههای عصبی کانولوشن - CNN - یکی از مهمترین روشهای یادگیری عمیق هستند. این نوع شبکههای عصبی در زمینههای متنوعی قابل استفاده هستند. - Jeelani et al, 2018 - در حوزهی تشخیص تصاویر پزشکی، با استفاده از یادگیری عمیق و شبکههای کانولوشن، توانسته است تصاویر MRI ٌ را بازسازی کند و از نظر کیفی، بهبود ببخشد. در - Xu et al, 2017 - از این نوع شبکهها در زمینهی پردازش صوت استفاده شده است. در مدل طراحی شدهی - Tang and Wu, 2018 - و - He et al, 2016 - ، جهت تشخیص و دسته-بندی متون، از لایههای شبکهی کانولوشنی استفاده شده است.در شبکههای کانولوشنی، چندین لایه با روشی قدرتمند آموزش میبینند. به طور کلی، یک شبکه CNN از سه لایه اصلی تشکیل میشود که عبارتند از : لایه کانولوشن، لایه Pooling و لایهکاملاً متصل. لایههای مختلف وظایف مختلفی دارند. در شکل 3 یک معماری کلی از شبکه عصبی کانولوشن برای دستهبندی تصاویر به صورت لایه به لایه نمایش داده شده است. در هر شبکه عصبی کانولوشن دو مرحله برای آموزش وجود دارد.
مرحله feed forward و مرحله backpropagation یا پس انتشار. در مرحله اول، تصویر ورودی به شبکه تغذیه میشود و این عمل چیزی جز ضرب نقطهای بین ورودی و پارامترهای هر نورون و نهاتاًی اعمال عملیات کانولوشن در هر لایه نیست. سپس خروجی شبکه محاسبه میشود. در اینجا به منظور تنظیم پارامترهای شبکه و یا به عبارت دیگر همان آموزش شبکه، از نتیجه خروجی جهت محاسبه میزان خطای شبکه استفاده میشود. برای این کار، خروجی شبکه را با استفاده از یک تابع خطا - loss - function با پاسخ صحیح مقایسه و به این ترتیب میزان خطا محاسبه میشود . در مرحله بعدی براساس میزان خطای محاسبه شده، مرحله backpropagation آغاز میشود . در این مرحله گرادیانت هر پارامتر با توجه به قائده chain rule محاسبه میشود و تمامی پارامترها با توجه به تأثیری که بر خطای ایجاد شده در شبکه دارند تغییر میکنند. بعد از بروزرسانی پارامترها، مرحله بعدی - feed - forward شروع میشود. بعد از تکرار تعداد مناسبی از این مراحل، آموزش شبکه پایان مییابد.شبکه های عصبی CNN به صورت خاص برای دستهبندی مناسب هستند. بنابراین در این پژوهش شبکه CNN انتخاب شده است.
مروری بر کارهای گذشته
با توجه به اهمیّت رسیدگی به وضعیت بیماران در اسرع وقت، روشهای هوشمند برای تشخیص آریتمی جهت صرفهجویی در وقت و اجتناب از خطای انسانی در چند دههی اخیر توسعه یافته است. - Andreotti et al, 2017 - با استخراج 169 ویژگی از هر سیگنال، توانستند سیستمی به دست آورند که به کمک آن با F1 = %79 سیگنالهای قلبی را تشخیص میدهد. - Bin et al , 2017 - با بهره