بخشی از مقاله
چکیده
طبقهبندهای مبتنی بر یادگیری ماشین در سالیان اخیر به ابزاری موثر برای تشخیص زودهنگام ضایعات در تصاویر زیستی بدل شده اند. در این مقاله رفتار شبکههای عصبی کانولوشنی در تشخیص بیماری قلبی از روی تصاویر تشدید مغناطیسی بطن چپ تحلیل می شود. بدین منظور روش شبکههای عصبی کانولوشنی بر روی تعداد 50 تصویر از این نوع شامل موارد سالم و بیمار آزموده می شود. نتایج حاصل از این بررسی، حاکی از آن است که استفاده از راهکار فوق، به طور متوسط قادر است دقت تشخیصی را در حدود 88 درصد به دست دهد که این پارامتر به تفکیک برای موارد سالم و بیمار 92 و 84 درصد حاصل آمده است.
کلمات کلیدی: تشخیص ضایعه قلبی، بطن چپ، تصویر تشدید مغناطیسی، یادگیری عمیق، شبکه عصبی کانولوشنی.
-1 مقدمه
قلب و عروق از مهمترین اندام های بدن هستند که در آن خون اکسیژن دار به شریان های بدن پمپاژ می گردد.[1] در نارسایی احتقانی قلب، بطن ها بطور کامل تخلیه نمی شوند که این امر باعث افزایش فشار در دهلیزها و وریدهای مجاور می گردد. از آنجا که مشخصه هایی که بر عملکرد غیرصحیح قلب و بالاخص بطن چپ تاثیرگذارند عملاً قابل درمان و برگشت پذیرند، لذا در نارسایی سمت چپ قلب، اندازه گیری حجم حفره های قلبی خصوصاً بطن چپ از اهمیت ویژه ی برخوردار است.[2] برای ارزیابی عملکرد قلب دستگاه های تشخیصی تهاجمی و غیر تهاجمی وجود دارند که در این میان دستگاه های غیر تهاجمی بیشتر مورد استفاده قرار می گیرند. در میان روش های غیرتهاجمی متداول ترین آنها CT-Scan* و MRI آنژیو هستند که در این میان رزولوشن زمانی بهتر MRI آنژیو نسبت به CT آنژیو آن را محبوب تر می سازد. همچنین افراد دارای فیبریلاسیون دهلیزیمعمولاً از تصویربرداری CT منع می شوند چرا که به دلیل ضربان قلب نامنظم و بالا می بایست دوز اشعه تابشی افزایش یابد که این خود برای سلامتی بیمار مضر است. به منظور پردازش و حصول دقیق اندازه گیری عملکردی و کاربردی قلب ، ابتدا نیاز به جدا کردن محدوده قلب از سایر اندامهای مجاور موجود در تصاویر قفسه سینه است که این خود به دو صورت دستی و اتوماتیک در کامپیوتر انجام می شود. محققان عمدتآ در پی حصول راه حلی موثر هستند که این مسئولیت را از دوش شخص اپراتور بردارد و با حداقل میزان خطا نسبت به روش دستی عمل جداسازی اتوماتیک بطن چپ را در تصاویر نتیجه دهد. همچنین تشخیص خودکار سلامت یا بیماری از روی نمونه جدا شده بطن چپ نیز خود مساله قابل توجهی در این حیطه به شمار می آید.
در دسته ای از پژوهشهای انجام شده [3] که هدف تشخیص بیماری ضعف عضله قلب می باشد از روش طبقه بندی مورفولوژیکی مستقاز قطعه بندی موسوم به CP-CHARM استفاده شده است. در این روش ویژگی ها از سراسر تصویر استخراج می شوند که همین امر الگوریتم را از قطعه بندی بی نیاز می سازد. حسن این روش آن است که گستره وسیعی از ویژگی های مورفولوژیکی تصویر را در طبقه بندی دخیل می نماید. مجموعه ویژگی های استخراجی، متنوع بوده و همین امر طبقه بند را در افزایش دقت یاری می نماید. در گونه دیگری از الگوریتم ها بررسی تصاویر تشدید مغناطیسی به جهت تشخیص زود هنگام بیماری های قلبی مادرزادی مد نظر قرار گرفته است. در این روش ها از تکنیک های معمول پیش پردازش، بهبود تصویر و به دست آوردن ویژگیهای مشترک تصاویر استفاده شده است. در نهایت با استفاده از روش های شبکه عصبی کلاسیک همچون پرسپترون چندلایه، طبقه بندی و تعیین نوع عارضه قلبی بیمار، صورت می گیرد.[4]
در سالیان اخیر کاربرد شبکههای عصبی مبتنی بر یادگیری عمیق*، در فعالیت های مهندسی پزشکی رشد و گسترش قابل توجهی داسته است. یکی از اعضای پر کاربرد این خانواده شبکه عصبی کانولوشنی است که به طور مستقیم از ورودی تغذیه شده و از نمونه های دریافتی ورودی ویژگیهای سطح بالا را برای انجام طبقهبندی استخراج مینمایند . در این مقاله عملکرد شبکه عصبی فوق به منظور تشخیص بیماری های قلبی بر روی تصاویر تشدید مغناطیسی آزموده می شود. ساختار این مقاله به صورت زیر می باشد: در بخش دوم مقاله، روش مورد نظر برای تفکیک قلب سالم و بیمار در تصاویر مبتنی بر شبکه کانولوشنی تشریح می گردد. در بخش سوم، روش مزبور بر روی تصاویر واقعی تشدید مغناطیسی شامل قلب های سالم و بیمار آزموده شده و نتایج به دست آمده از آن ارزیابی میشوند. بخش پایانی مقاله به نتیجهگیری اختصاص دارد.
-2 تشریح روش پیشنهادی مبتنی بر شبکه عصبی کانولوشن
یکی از روشهای مبتنی بر یادگیری عمیق، شبکههای عصبی کانولوشنی هستند که از لایههای مختلفی در ساختار خود استفاده می نمایند. در لایه های یک شبکه عصبی کانولوشنی فرآیندهای استخراج ویژگی از داده و طبقه بندی به کمک این انجام می شود. عملیات استخراج ویژگی در این گونه از شبکه های عصبی به صورت سلسله مراتبی بوده به این معنی که با رفتن به لایه های بالاتر، ویژگیهای استخراج شده هم غیر خطیتر میشوند. شمایی از یک شبکه عصبی کانولوشنی در شکل - 1 - آمده است. چنانکه ملاحظه می شود شبکه CNN از لایه های ورودی، Normalization، کانولوشن, Pooling و تماما متصل تشکیل می شود.در کاربرد پردازش تصاویر - مانند این پژوهش - لایه ورودی شامل مقادیر پیکسل های خام تصویر ورودی هستند. در لایه Normalization تغییرات تصویر روی نور سفید و شدت روشنایی پیکسل های خام ورودی، یکنواخت می شود.
روش های تفاضلی، فیلترینگ بالاگذر و نرمالسازی واریانس انتخاب هایی هستند که عموما بدین منظور به کار می روند. لایه موسوم به بانک فیلتر یا همان لایه کانولوشن مهمترین لایه مورد استفاده در شبکه مورد بررسی می باشد. در این لایه تعدادی فیلتر بانک تعریف شده و بر روی تصاویر اعمال می گردند. هر فیلتر از لحاظ مکانی کوچک است و تنها بخشی از عرض و ارتفاع را شامل می شود اما در امتداد عمق توده ورودی ادامه پیدا می کند. در واقع با یک توده سه بعدی مواجه هستیم که دارای طول و عرض و عمق است. بدین ترتیب در هر عمق یک ماتریس بعنوان برشی از توده ورودی، وجود دارد و وقتی گفته می شود که فیلتر مورد نظر در راستای عمق اعمال می شود، بدان معناست که این فیلتر بر روی تمامی این ماتریس ها اعمال می شود. بر اساس آنچه گفته شد، آموزش تصویر ورودی به شبکه شامل ضرب نقطه ای بین ورودی و پارامترهای هر نرون و نهایتا اعمال عملیات کانولوشن در هر لایه است که خروجی شبکه را به دست می دهد.
سرانجام به منظور آموزش شبکه میزان خطای شبکه محاسبه می شود بدین ترتیب که خروجی شبکه را با استفاده از یک تابع خطا با پاسخ صحیح مقایسه نموده و در مرحله بعدی بر اساس میزان خطای محاسبه شده مرحله پس انتشار خطا انجام می شود. بدین منظور گرادیان هر پارامتر محاسبه شده و تمامی پارامترها با توجه به تاثیری که بر خطای ایجاد شده در شبکه دارند، تغییر پیدا می کنند. موارد گفته شده تا کنون مربوط به لایههای استخراج ویژگی بودند. حال این ویژگیهای استخراج شده باید به یک لایه طبقه بندی کننده داده شوند تا به کار طبقه بندی داده ها پرداخته شود. لایهای که انجام این کار را عهدهدار است، لایه تماماً متصل* است که در آن اتصال کاملی بین تمامی نرونها با نرونهای لایه قبل از خود برقرار میشود6]و.[5 به علاوه در لایههای قبلی، خروجیها در قالب توده بیان میشدند اما در این لایه به دلیل این که باید نتایج طبقه بندی مطرح شود، خروجی در قالب بردار بیان میشود. بعد از به روز شدن این پارامترها مراحل پیشگفته تکرار می شوند تا پس از انجام تعداد تکرار مناسبی از این مراحل، آموزش شبکه با همگرایی آن پایان یابد. فرآیند عملکرد شبکه عصبی کانولوشنی در کاربرد مورد نظر این تحقیق و در دو فاز آموزش و آزمون را می توان در شبه کد ذیل خلاصه نمود.