بخشی از مقاله
چکیده
شناسایی زودهنگام بهترین روش مقابله با بیماری سرطان سینه میباشد. مهمترین راه تشخیص زودهنگام این سرطان تصویربرداری پزشکی است. ماموگرافی یک روش استاندارد طلایی جهت شناسایی زودهنگام سرطان سینه محسوب میشود. تودهها رایجترین علائم در تصاویر ماموگرافی هستند. برای شناسایی و یافتن تودهها در تصاویر ماموگرافیمعمولاً از روشهای مختلف پردازش تصویر، مانند ناحیه بندی با استفاده از الگوریتمهای خوشهبندی و یا روشهای آستانه گذاری مختلف، استفاده میشود. در این مقاله از یک الگوریتم ناحیه بندی مناسب استفاده می-شود که تعدادی ناحیه مشکوک را شناسایی میکند.
بنابراین از الگوریتم شبکه عصبی برای یادگیری الگوهای مثبت نادرست استفاده میشود. درواقع با استفاده از شبکه عصبی یک فیلتر هوشمند برای حذف نواحی مثبت نادرست پیشنهاد میشود تا بدینوسیله کارایی سیستم توده یاب خود را افزایش دهیم. طی بررسیهای بعمل آمده، استفاده از یک روش مبتنی بر رشد ناحیه بهصورتی که بهصورت تطبیقی به کار رود میتواند به شناسایی تودهها در تصاویر ماموگرافی کمک کند. نکته مهم در بهکارگیری الگوریتم رشد ناحیه این است معیار همگنی در آنیک عدد ثابت نباشد. چون بافت سینهزنان مختلف باهم فرق دارد، آستانه همگنی نیز متفاوت خواهد بود. ما قصد داریم این الگوریتم را بهگونهای بهکارگیریم که این آستانه بهصورت تطبیقی محاسبه گردد.
کلید واژه- سرطان سینه، ماموگرافی، تودههای سرطانی، ناحیه بندی، الگوریتم شبکه عصبی
-1 مقدمه
سرطان سینه یکی از شایعترین سرطانها در میان زنان محسوب میشود. شناسایی زودهنگام بهترین روش مقابله با بیماری سرطان سینه میباشد .[1] مهمترین راه تشخیص زودهنگام این سرطان تصویربرداری پزشکی است.[2] تکنیک-های تصویربرداری زیادی مدام توسعه داده میشوند و برای تشخیص زودهنگام این بیماری مورد استفاده قرار میگیرند .[4] بعضی از این تکنیکها به منظور غربالگری استفاده میشوند که از میان آنها ماموگرافی مؤثرترین روش برای تشخیص زودهنگام محسوب میشود .[7] امروزه ماموگرافی یک روش استاندارد طلایی جهت شناسایی زودهنگام سرطان سینه محسوب میشود.
علائم مختلفی در تصاویر ماموگرافی میتوانند نشاندهنده وجود سرطان باشند. در بین این علائم تودهها رایجترین علامت هستند 3]، 5، .[6 تشخیص تودهها دشوار است، زیرا ویژگیهای تودهها ممکن است مبهم یا مشابه بافت اصلی سینه باشد. تودهها غالباَ در نواحی پرچگال بافت سینه واقع شده و دارای مرزهای همواری بوده و از طرف دیگر دارای شکلهای بسیار زیادی نیز میباشند. برای شناسایی و یافتن توده ها در تصاویر ماموگرافیمعمولاً از روش های مختلف پردازش تصویر، مانند ناحیه بندی با استفاده از الگوریتم های خوشه بندی و یا روش های آستانه گذاری مختلف، استفاده می شود. در این مقاله ما نیز از یک الگوریتم ناحیه بندی مناسب استفاده خواهیم کرد که منجر به تولید تعدادی ناحیه مشکوک شود.
-2 روش پیشنهادی - بخش بندی تصویر -
قطعهبندی یک تصویر بر تفکیک. جداسازی تصویر به نواحی- به طوری که پیکسلهای هر ناحیه دارای یک ویژگی خاص - که میتواند متعلق به یک شی باشد - مشترک میباشند دلالت دارد. به طور کلی تعریف مشخصی برای قطعهبندی وجود ندارد. از اینرو نمیتوان یک روش استاندارد واحدی از قطعهبندی را به وجود آورد. بلکه مجموعهای از روشها ارائه شدهاند که درجه کارایی مختلفی برای قطعهبندی هر تصویر دارند. به طور عمومی مسأله قطعهبندی را به صورت زیر فرموله میکنند:
ناحیه کل تصویر را R در نظر بگیرید. قطعهبندی روندی است که در آن ناحیهی تصویر R به n زیرناحیه R1، R2،... Rn افراز میگردد به طوری که داریم: که در آن، P - Ri - ، گزاره منطقی تعریف شده بر روی نقاط در مجموعهی Ri میباشد و مجموعه تهی است.در این مقاله، هدف از بخشبندی تصویر، بدست آوردن تعدادی ناحیهی مشکوک یا ROI1 هایی است که ممکن است در درون آنها تودهای نهفته باشد. در کل، ممکن است بر روی یک تصویر تعدادی ROI شناسایی شوند که همگی مبین یک توده باشند. به عبارتی نگاشت -ROI به- توده یک نگاشت یک- به-یک نیست.
-1-2 الگوریتم رشد ناحیه
رشد ناحیه پروسهای است که در آن پیکسلهای مجاور با دامنه یکسان با یکدیگر گروهبندی میگردند تا یک ناحیه قطعهبندی شده را شکل بدهند. قطعهبندی با انتخاب یک مجموعه از نقاط به نام نقاط دانه2 آغاز میگردد و با الحاق نقاط مجاور هر نقطه دانه که دارای مشخصات مشابهی - نظیر بازهی مشخصی از سطح خاکستری - با آن نقطه دانه میباشند، رشد ناحیه انجام میگیرد. در شکل - 1 - هندسه رشد ناحیه نشان داده شده است.
-2-2 روش بخشبندی پیشنهاد شده
در این گام قصد داریم الگوریتم پیشنهادشده برای استخراج نواحی مشکوک را تشریح کنیم. در این راستا از روش نصف کردن نیوتون برای یافتن ریشه الهام گرفته و تعدادی ناحیهی مشکوک به توده ارائه میدهیم. مراحل الگوریتم پیشنهادشده را در زیر مشاهده میکنید:
تصویر را به تعدادی سلول ناهمپوشان با اندازهی مساوی تقسیم میکنیم - گریدبندی تصویر به سلولهایی با ابعاد . - S*Sدر هر سلول پیکسل با بیشترین سطح خاکستری را می-یابیم. مختصات آن را با index و مقدار آن را با m نشان می-دهیم.First ابتدای بازهای را نشان میدهد که در آن بازه به دنبال جواب میگردیم و rear نیز مبین انتهای بازه است. در ابتدا، first را برابر 0 و rear را برابر m در نظر میگیریم.Th= - first+rear - /2 در نظر گرفته و یک الگوریتم رشد ناحیه را با مقدار th روی تصویر اعمال میکنیم. در واقع این آستانه تعیین کننده همگن بودن پیکسلهای درون ناحیه مورد نظر است.
ناحیهی داخل کانتوری که index را در بر گرفته است مدنظر قرار دهید. اگر مساحت این ناحیه از یک حد بالا - Area_Max - بیشتر شود یا مدور بودن این ناحیه از یک حد ماکزیمم - Circ_Max - تجاوز کند آنگاه first=th قرار داده و به گام 4 برمیگردیم، در غیر این صورت اگرمساحت این ناحیه از یک حد مینیمم - Area_Min - کمتر شود آنگاه rear=th قرار داده و به گام 4 بازمیگردیم، اگر 2 شرط بالا برقرار نبودند آنگاه این ناحیه به عنوان یک ناحیه مشکوک اولیه استخراج گردیده و به سراغ سلول بعدی رفته و گام 2 را دنبال میکنیم. یکی دیگر از شروط توقف پردازش روی یک سلول این است که اختلاف دو th متوالی از کمتر شود.
مدور بودن به صورت تعریف میشود که P محیط ناحیه و A مساحت ناحیه را بیان میکند. هرچه یک ناحیه دوارتر باشد این مقدار به یک نزدیکتر میشود و برعکس هرچه از دواربودن خارج شود این مقدار بزرگتر میشود. همچنینArea_Max=8000 و Area_Min=155 در نظر گرفته شدهاندچون تودهای وجود ندارد که مساحت آن از 8000 - یعنی تودهای با شعاع - 50 بزرگتر و از 155 - یعنی تودهای با شعاع - 7 کوچکتر باشد. لازم به ذکر است که این مقادیر در مورد تصویر مقیاسشده بدست آمده است. یکی از مزایای این روش این است که یک درجه آزادی در اختیار رادیولوژیست قرار میدهد بدین صورت که خود رادیولوژیست میتواند مقدار این پارامترها را تعیین و مشخص کند که سیستم تودههای موجود در چه ابعادی را کشف کند.
Circ_Max به صورت عملی و با انجام آزمایشهای متوالی برابر 7 فرض شده است. نیز در این مقاله برابر 4 سطح خاکستری و S نیز برابر 32 در نظر گرفته شده است. هرچه S را زیادتر کنیم تعداد نواحی مشکوک کاهش یافته و از تعداد نمونه-های مثبت نادست FP - یعنی نمونههایی که به اشتباه توسط سیستم به عنوان توده معرفی شدهاند - کاسته میشود، اما از طرفی دیگر TPR - نرخ کشف نمونههای مثبت درست - نیز پایین میآید و برعکس. بنابراین باید بین S و FP و TP موازنه برقرار کنیم. با انجام آزمایشهای متوالی به این نتیجه رسیدیم که بهترین مقدار برای S برابر 32 میباشد.
مثلاَ در mdb132 دو توده قابل مشاهده است که به فاصله کمی در کنار هم قرار گرفتهاند. اگر S را برابر 64 در نظر بگیریم آنگاه تنها تودهی بزرگتر شناسایی میشود اما اگر S را برابر 32 فرض کنیم در اینصورت تودهی کوچکتر نیز کشف خواهد شد.میتوانیم با استفاده از معیاری که به صورت تعریف میکنیم نواحی غیردوار کوچک - زوائد خطی مانند رگها - را فیلتر کنیم. برای انجام این کار این معیاررا برای هر ناحیه به صورت جداگانه محاسبه کرده و در صورتی که این مقدار از یک حد مینیمم کمتر باشد آنگاه این ناحیه به عنوان یک ناحیهی کوچک خطی شناخته شده و حذف میشود. همچنین ممکن است پردازش بر روی 2 سلول مجاور منجر به تولید 2 ناحیه تقریباَ یکسان شود که با یکدیگر همپوشانی دارند.
برای حذف نواحی تقریباَ یکسان، مرکز ثقل نواحی بدست آمده از مرحله قبل را بدست آورده و از 2 ناحیهای که فاصله مرکز ثقل آنها از یک حد آستانه کمتر باشد آن ناحیهای باقی خواهد ماند که دوارتر باشد. درنمونهای از ا درنمونه اگوریتم بخشبندی مطرحشده نشان داده شده است.حال وقت آن رسیده که به نواحی بدست آمده از این مرحله برچسب دهیم - TP یا . - FP برچسب مربوط به هر ناحیه بر اساس روال زیر تعیین میگردد: ابتدا یک مستطیل محاطی به گونهای رسم میشود که ناحیهی مورد نظر را به صورت کامل در بر داشته باشد. فرض کنید که - LX,LY - مبین طول و عرض این مستطیل و - - معرف مرکز ثقل ناحیهی موردنظر و - - } { نشاندهندهی مرکز و شعاع توده پس از انجام بیوپسی باشد. حال برای برچسب زدن نواحی بدست آمده در گام بخشبندی از 3 شرط زیر استفاده میکنیم:
اگر هر 3 شرط بالا برقرار باشند آنگاه یک ناحیهی مشکوک به عنوان TP برچسب میخورد. درغیر این صورت حتی اگر یکی از شروط برقرار نباشند آنگاه آن ناحیهی مشکوک به عنوان FP برچسب میخورد. در مقالات مختلف معمولاَ از یکی از شروط بالا برای برچسب زدن یک ناحیه مشکوک استفاده میشود. اما در اینجا ما از ترکیب عطفی هر 3 شرط استفاده کرده و یک شرط بسیار قوی تولید نمودیم. لحاظ شرایط ضعیف باعث میشود که نواحی بیشتری به عنوان TP شناسایی شوند در حالیکه از نقطه-نظر متخصصان پزشکی آن ناحیها واقعاَ مبین توده مورد نظر نیستندمثلاَ. در [1] پس از اعمال الگوریتم بخشبندی، 4 ناحیه مشکوک به دست آمد که از بین آنها تنها ناحیهای که با فلش قرمز مشخص شده است به عنوان TP برچسب خورده و 3 ناحیه دیگر ناحیههایی را نشان میدهند که به اشتباه به عنوان توده نمایش داده شدهاند، از اینرو به این 3 ناحیه برچسب FP می-دهیم.
در ادامه قصد داریم که با استفاده از تکنیکهای یادگیری ماشین از تعداد نمونههای به اشتباه مثبت در هر تصویر بکاهیم.پس از گام بخشبندی در کل 1304 ناحیه بدست آمد که از بین آنها 57 ناحیه به عنوان TP و 1247 ناحیه به عنوان FP برچسب خوردند. همان طور که در ابتدای بخش اشاره کردیم، نگاشت -ROIبه-توده نگاشتی یک-به-یک نیست. پس تعداد 57 TP به این معنی نیست که از 58 تودهی موجود موفق به کشف 57 توده شدهایم بلکه در این گام از 58 تودهی موجود در 261 تصویر توانستیم 53 توده را کشف کنیم. بنابراین به حساسیت برابر 0,913 دست یافتیم و به صورت میانگین 4,77 نمونهی به اشتباه مثبت به ازای هر تصویر خواهیم داشت.