بخشی از مقاله
چکیده
سرطان سینه یکی از بیماریهای شایع در زنان است و در بسیاری از مواقع که دیر تشخیص داده شود موجب مرگومیر میشود. برای بررسی وجود سرطان معمولاً از تصاویر ماموگرافی حرارتی یا MRI استفاده میشود. در این مقاله یک روش برای تشخیص سرطان سینه از روی تصاویر MRI با خوشهبندی k-means و الگوریتم بهینهسازی جستجوی فاخته - CSO - ارائه شده است. از خوشهبندی به منظور یافتن بهترین سطح جداسازی برای آستانهیابی دوسطحی تصویر MRI استفاده شده است. از آنجایی که الگوریتم k-means در یافتن مراکز تصادفی عمل کرده و اغلب دقت پایینی دارد از CSO برای یافتن بهترین مراکز خوشهها استفاده شده است. نتایج نشان میدهند که روش ترکیبی k-means و - KMCSO - CSO نسبت به موارد مشابه تشخیص دقیقتری دارد.
-1 مقدمه
در حال حاضر سرطان یکی از مسایل مهم و اصلی بهداشت و درمان در ایران و تمام دنیا است در کشورهای آسیایی مانند ایران نیز طی چهار دهه گذشته میزان شیوع سرطان پستان در زنان افزایش یافته و یکی از شایعترین بدخیمیها در بین زنان ایرانی شناخته شده است .[1] این نوع بیماری در زنان کمتر از 30 سال نادر است و پس از30 سالگی شیوع آن بیشتر میشود. در ایران سرطان پستان در زنان یک دهه زودتر نسبت به کشورهای توسعهیافته ایجاد میشود.
سرطان پستان بدخیمی بافت اصلی پستان است. در واقع سلولهای نسج پستان که سازنده شیر برای تغذیه نوزادان است، دچار بدخیمی میشوند .[3] طبق آمار انستیتو ملی سرطان ایالات متحده آمریکا، از هر هشت زن یک نفر در زندگی خود مبتلا به سرطان پستان میشود
با وجود سرطان پستان در سنین پایینتر در سالهای اخیر و وجود بافت متراکم پستان در این گروه و احتمال مخفی ماندن ضایعه در این نوع بافت، وجود روش مکمل تشخیصی جهت افزایش حساسیت تشخیص ضروری به نظر میرسد. مشخص شده است که حساسیت ماموگرافی به شدت تحت تاثیر تراکم نسج پستان است و با افزایش دانسیته پستان حساسیت ماموگرافی کاهش می-یابد بهطوریکه حساسیت ماموگرافی در زنان دارای پستان متراکم ممکن است % 30 کاهش یابد
در بیش از نیمی از زنان کمتر از 50 سال - % 51 -75 - و حداقل یک سوم زنان بالای 50 سال بافت پستان متراکم است و این در حالی است که این گروه در دوره طولانیتری در معرض خطر هستند و پرگنوز بالینی بدتری دارند .[6] متأسفانه میزان ابتلا به سرطان در برخی از کشورها به شدت رو به افزایش است
در سال 2003، تحقیقات اسمیت1 و همکارانش نشان داد که تشخیص به موقع سرطان پستان باعث جلوگیری از مرگ و میر زود هنگام بیماران خواهد شد. تشخیص زود هنگام این سرطان یکی از مهمترین چالشها در جهت سلامت جامعه است
با توجه به این امر مطالعات بسیاری در جهت تشخیص و درمان هر چه سریعتر این بیماری انجام شده است. با این حال در بسیاری از موارد، سرطان سینه تا رسیدن به مرحله پیشرفته تشخیص داده نمیشود. این نتیجه با آمار تأسف بار زنده ماندن افراد مبتلا به سرطان سینه ارتباط دارد. روند رو به رشد سرطان در کشور،خصوصاً در مورد سرطان پستان، ضرورت اطلاعرسانی در جهت ارتقاء سطح آگاهی عموم جامعه، تشخیص زودهنگام، راهکارهای پیش-گیری و مدیریت درمان این بیماری را مطرح میسازد .
یکی از مهمترین و موثرترین راههای تشخیص این سرطان، بخصوص در مراحل اولیه بیماری، انجام ماموگرافی یا تصویربرداری MRI2 از سینه است. علاقهمندی به تصویربرداری از پستان با تشخیص اینکهتقریباً یک هشتم از زنان در طول دوره زندگی خویش سرطان پستان را تجربه خواهند کرد، گسترش یافت.
یاوریان [9] در پژوهش خود تحت عنوان استفاده از روشهای مختلف پردازش تصویر در تشخیص سرطان سینه عنوان نمود یک الگوریتم جداسازی در یک زمینه ماموگرافی یک الگوریتم استفاده شده برای تعیین محیط پستان یا انواع ویژه ناهنجارهای مانند میکروکلسیفیکیشنها و تودههاست. به طور عمومی این حقیقت پذیرفته شد است که تعیین تودهها از لحاظ فنی بسیار مشکلتر از تعیین میکروکلسیفیکیشنها هستند و توسط بافت اصلی پستان تحریک شوند یا محو شوند.
هدف اصلی مرور و کلاسبندی الگوریتمهای متفاوت تعیین توده میباشد. این نکته قابل توجه است که الگوریتمهامعمولاً برای تشخیص تودههای خاصی به کار میروند. مانند مقایسه بین دیدگاههای پستان؛ مقایسه بین پستانهای چپ و راست یک نفر و همچنین مقایسه ظاهری همان ماموگرافیها .
عزیزی [10] پژوهشی تحت عنوان پردازش تصاویر ماموگرافی جهت تشخیص تودههای سرطانی به کمک تکنیکهای پردازش تصویر انجام داد. وی عنوان نمود یکی از مهمترین و مؤثرترین راههای تشخیص این سرطان، بهخصوص در مراحل اولیه بیماری، انجام ماموگرافی است. با توجه به تصاویر ماموگرافی اقدام به تشخیص تودههای موجود در تصاویر مینماییم. در این روش، نرمافزار بدون نیاز به تشخیص ناظر، نواحی اطراف توده را به طور کامل و دقیق شناسایی میکند و آن را به صورت مجزا نمایش میدهد. در این مطالعه با استفاده از تکنیکهای پردازش تصویر از جمله انجام عملیات حذف نویز، تشخیص لبه و جداسازی نواحی با تراکم بیشتر به تحلیل تصاویر ماموگرافی پرداخته شده است. سرعت بالا و نبود خطای انسانی از مهمترین عوامل مؤثر در روش پیشنهادی است.
مسعودی [11] پژوهشی با عنوان تشخیص و طبقهبندی تودههای سرطان سینه توسط استخراج ویژگی از تصاویر ماموگرافی با استفاده از تکنیکهای پردازش تصاویر و بهکارگیری شبکه عصبی انجام داد. در این مقاله شکل هندسی و ویژگیهای جدید بر پایه شکل و لبهی هندسی برای طبقهبندی ضایعات جرمی سینه بر اساس استاندارد BIRADS ارائه شده است. بر اساس این سیستم جرمهای سینهای با استفاده از شکل، سایز و چگالی متمایز میشوند که رادیولوژیست میتواند به صورت بصری به تشخیص از روی تصاویر ماموگرافی بپردازد. به علت این که جرمهای سینهای شکل منظم و قائدهمند ریاضی ندارند، اندازهگیری آنها بسیار مشکل است. ویژگیهای مختلفی بر اساس شکل و لبه هندسی بر پایه ماکزیمم و مینیمم شعاع جرم برای طبقه بندی جرمهای سینهای ارائه شده است.
همچنین ویژگیهای هندسی بر اساس شکل-های منظم به عنوان ویژگیهای بهتری نسبت به شکلهای نامنظم شناخته شدهاند. در این مقاله، با استفاده از تکنیکهای پردازش تصویر، الگوریتمی طراحی شده است که می تواند توده سرطانیرا به صورت کاملاً هوشمند از سایر بخشهای سالم پستان استخراج نمایدو آن را به صورت کاملاً مجزا نمایش دهد. قبل از اجرای فرآیند استخراج توده سرطانی، از برخی تکنیکهای پیش پردازش تصویر جهت ارتقای کیفیت تصویر ماموگرافی استفاده شده است. در نهایت بردار ویژگی استخراج شده بعنوان ورودی شبکه عصبی طراحی شده قرار داده شده و در نهایت دقت طبقهبندی را که براساس نوع توده در تصویر ماموگرافی است مشخص شده است
اهمیت مقوله پردازش تصاویر پزشکی و از آن جمله پردازش تصاویر ماموگرافی بدین جهت است که پزشک و رادیولوژیست را در تشخیص راحتتر بیماری یاری میدهد و بدین ترتیب بیمار در برابر خطرات جبرانناپذیری که پیش روی خواهد داشت حفظ میشود.
پردازش تصویر شامل دو موضوع بهبود تصاویر و درک تصاویر یا بینایی ماشین میباشد. بهبود تصاویر دربرگیرنده روش هایی چون فیلتر محوکننده، تبدیل هیستوگرام، بسط رنگ زمینه و بهبود لبه برای بهتر کردن کیفیت دیداری تصاویر و اطمینان از روش درست آنها در محیط مقصد - چاپگر یا نمایشگر کامپیوتر - است. در بهبود تصاویر هدف برجسته نمودن ویژگیهای اصلی تصویر برای آنالیز بعدی یا نمایش تصویر میباشد. اما مفهوم اطلاعات اصلی در داده را افزایش نمیدهد.
بهبود تصویر، یک تصویر را به منظور ایجاد مفهوم واضح از آن برای مشاهده بشر تغییر میدهد. سیستم بینایی ماشین اطلاعات مفیدی را درباره یک صحنه با استفاده از تصویر دوبعدی آن جمعآوری میکند. هدف یک سیستم بینایی ماشین به دست آوردن یک توصیف معنادار از صحنه و هم چنین ایجاد یک مدل جهان واقعی از تصویر میباشد. روند کار در بینایی ماشین شامل مراحل زیر میباشد
- دریافت تصویر - از طریق دوربین یا اسکنر -
- پردازش تصویر - بهبود تصویر، ترمیم تصویر -
- قطعهبندی تصویر، آنالیز تصاویر
- تطبیق مدل و تشخیص الگو
-2 روش کار
در این مقاله برای تشخیص غده سرطانی از آستانهیابی تصاویر استفاده می-شود. در تصاویر MRI قسمتهای سرطانیمعمولاً پررنگتر از سایر قسمت-های سالم پستان هستند. از این رو با دوسطحی کردن تصاویر MRI به طوری که برخی قسمتهای تصویر - قسمتهای سرطانی - به رنگ کاملاً سفید و مابقی قسمتها به رنگ کاملاً سیاه دربیایند. پس میتوان مسئله را به یک خوشهبندی دوکلاسه تبدیل کرد؛ به طوریکه شدت روشنایی پیکسلها دادههای مسئله و رنگهای سیاه و سفید دو خوشهی مسئله میباشند. پس از اجرای خوشهبندی میتوان مرز خوشهها را مشخص نمود و این مرز را سطح جداسازی پیکسلهای تصویر درنظر گرفت. بهطوریکه تمام پیکسلهایی که روشنتر از آستانه هستند سفید و تمام پیکسلهایی که تیرهتر از آستانه هستند سیاه میشوند. انتظار می-رود پس از اجرای این رویه قسمتهای سرطانی سفید و مابقی تصویر سیاه شود.
-1-2 الگوریتم k-means
الگوریتم k-means یک الگوریتم خوشهبندی است که یک سری داده را در تعداد مشخصی خوشه دستهبندی میکند. روال الگوریتم به طور خلاصه به شرح زیر است:
1. تعیین تعداد خوشهها - k -
2. انتخاب مراکز خوشه به تعداد k به طور تصادفی
3. یافتن فاصلهی هر داده تا هر مرکز و اختصاصِ داده به مرکزی که کمترین فاصله را در مقایسه با سایر مراکز دارد.
4. میانگین گیری از داده های هر خوشه و تعیین مقدار میانگین به عنوان مرکز جدید خوشه
5. تکرار مراحل 3 و 4 تا رسیدن به همگرایی - تا زمانی که دیگر مقدار مراکز تغییری نکنند. -
شکل : - 1 - شبه کد الگوریتم k-means
الگوریتم k-means علیرغم کارکرد خوب و پرسرعتش یک ایراد اساسی دارد. ایراد اصلی این الگوریتم وابستگی شدید جواب نهایی به انتخابهای اولیه-ی مراکز است - مرحله 2 از الگوریتم - . یعنی هربار با انتخابهای متفاوت پاسخ-های متفاوت ارائه میدهد که بسیاری از این پاسخها بهترین پاسخها نمیباشند. به عبارت دیگر کیفیت جداسازی تصاویر با k-means تا حدود زیادی شانسی است و هیچ تضمینی نیست که انتخابهای اولیه منجر به پاسخهای بهینهای شود. از این رو برای یافتن بهترین مراکز انتخاب اولیه از الگوریتم CSO استفاده میشود.
-2-2 الگوریتم بهینهسازی جستجوی فاخته - CSO -
الگوریتم بهینهسازی جستجوی فاخته - CSO - 3 یک روش مناسب برای یافتن پاسخهای بهینهی یک مسئله است که از رفتار پرندهای به نام فاخته الهام گرفته شده است. این پرنده تخم خود را در لانههای پرندههای دیگر میگذارد و اغلب پرندهی میزبان تخم فاخته را با تخم خود اشتباه میگیرد به طوریکه تا مدتها به جوجهی فاخته مانند جوجههای خود غذا میدهد.
در اینجا مسألهی اصلی ما یافتن بهترین انتخابهای اولیهی مراکز در خوشهبندی k-means میباشد. در این مقاله از الگوریتم فاختهی ارائه شده توسط یانگ و دب[12] 4 استفاده شده است. در این روش قوانین زیر وجود دارد:
- در هر زمان هر فاخته فقط یک تخم میگذارد و آن تخم را در یکی از لانهها به صورت تصادفی قرار میدهد.
- بهترین لانهها با بهترین راهحلها به تولیدهای بعدی منتقل خواهند شد.
- تعداد لانههای میزبان همواره ثابت است و احتمال اینکه پرندهی میزبان تخم فاخته را تشخیص دهد بین 0 تا 1 است. در صورتی که میزبان تخم فاخته را تشخیص دهد، یا تخم فاخته را از بین میبرد یا لانه را به طور کل رها کرده و یک لانهی جدید میسازد. برای سادگی، در هر دور از تولید، راهحلها به ترتیب کیفیت مرتب میشوند و کسری از آنها که بدترین راهحلها را دارند از بین رفته و راهحلهای جدید به جای آنها تولید میشود. - با این روش خود به خود تعدادی از تخمهای گذاشته شده توسط فاخته که کیفیت ندارند از بین میروند و مثل این میماند که پرندهی میزبان آنها را تشخیص داده است - .
شکل : - 2 - شبه کد الگوریتم CSO
هر تخم یک راهحل است و در مسألهی ما هر راهحل مقدار اولیهی مراکز برای الگوریتم k-means است.
صلاحیت هر راهحل - Fi - با استفاده از تابع ارزیابی PSNR تعیین میشود که باید ماکزیمم شود. الگوریتم k-means با هر راهحل اجرا شده و تصویر نهایی جداسازی شده با تابع ارزیاب PSNR ارزیابی میشود. راهحل هایی که بالاترین PSNR را دارند به تولیدهای بعدی منتقل شده و راهحلهای با PSNR کم از بین میروند.
در فاخته نیز پارامترهای اولیهای وجود دارد که عبارتند از: تعداد اولیه فاختهها، تعداد لانهها - n - و درصدی از بدترین راهحلها که در هر تولید حذف میشوند . - Pa - تعیین درست این پارامترها نیز در کارایی فاخته تأثیر خواهد داشت. یانگ و دب [12] در مقاله خود ابراز داشتهاند که مقادیر n=15 و Pa=0.25تقریباً برای هر مسألهای مناسب هستند.
-3-2 روشهای ارزیابی
توابع ارزیابی زیادی در رابطه با کیفیت تصاویر جداسازی شده وجود دارد که 4 مورد از آنها در این مقاله استفاده شده است.
یکی از روشهای مرسوم برای ارزیابی، تابعنسبتِ سیگنال به نویز پیک5
- PSNR - میباشد. تابع PSNR یک اندازهگیری ریاضیاتی برای ارزیابی تصویر است که بر اساس اختلاف پیکسل بین دو تصویر عمل میکند. همچنین میتوان از آن برای تخمین کیفیت یک تصویر تغییریافته با تصویر اصلیاش استفاده نمود. مقدار PSNR برای هر تصویر به صورت زیر محاسبه میشود.