بخشی از مقاله
چکیده - در این مقاله یک روش براي تشخیص سرطان سینه در تصاویر ماموگرام دیجیتال با استفاده از تبدیلات موجک و متعامد هسته ارائه می شود. تصاویر ماموگرام با استفاده از موجک به 4 سطح فرکانسی متفاوت تجزیه شده اند. در هر کدام از این سطوح تجزیه، میانگین و انحراف معیار براي هر تصویر محاسبه شده است. در این تحقیق، براي طبقه بندي تصاویر ماموگرام دیجیتال از تبدیل متعامد هسته استفاده شده است. روش پیشنهادي، با استفاده از روش cross-validation تست شده است. نتایج بدست آمده، نشان می دهد که روش پیشنهادي ما، براي تشخیص سرطان سینه در تصاویر ماموگرام از قابلیت اطمینان بالایی برخوردار است.
-1 مقدمه
سرطان سینه یکی از خطرناك ترین انواع سرطان در بین زنان دنیا می باشد، که بیش از %11 زنان در طول عمر خود با این بیماري روبرو می شوند. به گزارش آژانس بین المللی سازمان سلامت جهانی - IARC - ، سالانه بیش از یک میلیون مورد سرطان سینه در سراسر جهان پیش بینی شده است، به گزارش این آژانس این بیماري منجر به مرگ بیش از 400 هزار زن در طول هر سال می شود.[1] بنابراین، تشخیص سریع و به موقع سرطان سینه جهت کاهش مرگ و میر ناشی از این بیماري امري ضروري می باشد. از طرفی دیگر باید به این مسئله توجه داشت که تشخیص زود هنگام سرطان سینه، کار آسانی نمی باشد. لذا براي این کار باید از روش هایی با قابلیت اطمینان بالا بهره برد.
همان طور که می دانیم سرطان به خاطر از کنترل خارج شدن یک گروه از سلول ها اتفاق می افتد. این گروه از سلول ها به سرعت به سلول هایی که به صورت توده یا بافت هاي اضافی تقسیم می شوند، به عبارتی دیگر این توده ها تومور نامیده می شوند. در کل تومورها به دو دستهي خوشخیم و بدخیم تقسیم می شوند. ماموگرافی دیجیتال یک ابزار مفید و مناسب براي طبقه بندي تومورها و همچنین تشخیص سرطان سینه می باشد.[2] یک گام مهم و اساسی در تکنیک هاي پردازش تصویر استخراج ویژگی از تصویر مورد نظر است. ویژگی هاي استخراج شده از تصاویر ماموگرام دیجیتال می توانند به صورت مستقیم از داده هاي مکانی یا از یک فضاي متفاوت دیگر بدست آیند.
با استفاده از تبدیل موجک در فضاي فرکانسی، می توان مشخصات و ویژگی هاي مفیدي از یک تصویر بدست آورد. از آنجایی که ویژگی هاي استخراج شده از تصویر متغیر و وابسته به مقیاس می باشند، لذا انتخاب ویژگی هاي مناسب براي طبقه بندي تصاویر گام مهمی می باشد. موجک ها براي تصاویر ماموگرام دیجیتال یک نمایش مالتی رزولوشن مفید بدست می دهند.[3] امروزه، روش هاي مختلفی با استفاده از تبدیل موجک براي آنالیز تصاویر ماموگرام ارائه شده است. از جمله کارهاي ارائه شده می توان به چند مورد اشاره کرد: آقاي لیو و همکارانش، در بررسی خود نشان دادهاند، که آنالیز چند دقته تصاویر ماموگرام با استفاده از ضرایب موجک ها براي سیستم هاي تشخیص، مفید می باشد. آنها در سیستم خود از یک سري ویژگی هاي آماري به منظور طبقه بندي تصاویر ماموگرام بهره برده اند .
[4] فریرا و بورگس نشان داده اند که با استفاده از بزرگترین ضرایب موجک می توان یک بردار متناظر با تصاویر ماموگرام دیجیتال در فرکانس هاي پایین ارائه داد. در این بررسی، از موجک هاي 4 Daubechiesو 8 و 16 در 4 سطح تجزیه استفاده شده است .[5] آنجلینی و همکارنش، یک روش براي طبقه بندي دو کلاس ارائه کرده اند، که کلاس اول توده ها و کلاس دوم غیر توده ها می باشد. در این تحقیق براي طبقه بندي این دو کلاس از روش هاي مبتنی بر: پیکسل ، تبدیل موجک گسسته و نمایش تبدیل موجک تکاملی استفاده شده است. در این بررسی، طبقه بند SVM براي طبقه بندي تصاویر بکار برده شده است .[6] موسی و همکارنش، یک سیستم مبتنی بر آنالیز موجک جهت استخراج ویژگی و یک سیستم عصبی-فازي وفقی براي طبقه بندي تصاویر ماموگرام ارائه کرده اند.
در این تحقیق تصاویر ماموگرام به دو کلاس نرمال و غیر نرمال و اینکه آیا تصاویر غیر نرمال از نوع توده یا میکروکلسیفیکیشن هستند طبقه بندي شده اند .[7] ساکا و همکارانش، یک روش به منظور مقایسه برخی توابعموجک که معمولاً براي تشخیص میکروکلسیفیکیشن و استخراج ویژگی بکار می روند ارائه کرده اند .[8] یانگ و همکارانش، یک روش براي تشخیص میکروکلسیفیکیشن در تصاویر ماموگرام با استفاده از موجک ارائه کرده اند. در این تحقیق، تصاویر به باندهاي فرکانسی مختلف تجزیه شده اند .[9] این مقاله با استفاده از تبدیلات موجک و متعامد هسته یک سیستم براي تشخیص سرطان سینه در تصاویر ماموگرام دیجیتال ارائه می دهد، تبدیل موجک به صورت جداگانه براي استخراج بردارهاي ویژگی، به تصاویر ماموگرام اعمال می کنیم. با استخراج این بردارهاي ویژگی در مرحلهي بعد می توان تصاویر ماموگرام را طبقه بندي کرد. در این مقاله از تبدیل متعامد هسته براي طبقه بندي تصاویر ماموگرام دیجیتال استفاده شده است.
-2 تبدیل موجک دو بعدي
در دو دههي اخیر فعالیتهاي عظیمی در جهت بهبود ابزارهاي محاسباتی و ریاضیاتی بر مبناي ایدهي چند دقته صورت گرفتهاست. امروزه ایده چند دقته بودن تصویر در تکنولوژي و علوم معاصر نفوذ کرده است. به طور مثال گسترش موجکها در علوم اطلاعات و مخصوصاً پردازش سیگنال، فشردهسازي اطلاعات جهت انتقال سریع، حذف نویز سیگنالها و تصاویر، موجب شده که روش هاي چند دقته بیش از پیش مورد استفاده قرار بگیرند. بنابراین ایدهي چند دقته یک روش مؤثر و کارا و موفق در بسیاري از زمینههاي علمی بخصوص در پردازش تصویر میباشد. این نمایش اجازه میدهد تا به صورت اساسی و اصولی روي ساختار بافتی تصاویر متمرکز شد. کیفیت چند دقتی یکی از دلایلی است که سبب شده تا تبدیل موجک و تبدیل کرولت در بسیاري از کاربردها خصوصاً در پردازش تصاویر مفید واقع شوند.
تبدیل موجک دو بعدي می تواند توسط تبدیل موجک گسسته یک بعدي با فیلتر هاي جداپذیر پیاده سازي شود. توسط فیلترهاي جداپذیر و با اعمال تبدیل موجک یک بعدي به تمام ردیف هاي تصویر و تکرار این عمل بر روي همه ستون هاي تصویر می توان تبدیل موجک دو بعدي را محاسبه کرد. هنگامی که تبدیل موجک گسسته دو بعدي به یک تصویر اعمال می شود براي آن تصویر 4 مجموعه از ضرایب تبدیل مانند شکل 1 می آید. 4 زیر باند بدست آمده از تبدیل موجک گسسته دو بعدي LL، LH، HL و HH می باشد. همان گونه که در شکل 1 مشاهده می شود زیر باند LL مربوط به ضرایب فرکانس پایین و زیرباندهاي HL، LH و HH مربوط به ضرایب فرکانس بالاي تصویر می باشد.
تبدیل موجک گسسته دو بعدي اطلاعات حوزه فرکانس تصویر را نشان می دهد. همان گونه که در شکل 2 نشان داده شده است. در سطوح مختلف تجزیه موجک، در ابتدا آنالیز فیلتر بانک بر روي ردیف هاي تصویر انجام گرفته و بعد از این، آنالیز فیلتر بانک بر روي ستون هاي تصویر انجام می گیرد. که چهار زیر باند LL، LH، HLو HH بدست می آیند. از آنجایی که اکثر تصاویر در باند پایه قرار دارند و چون زیر باند LL مربوط به فرکانس هاي پایین تصویر است. لذا زیر باند LL نسبت به زیر باند هاي LH، HLو HH داراي اطلاعات بیشتري از تصویر می باشد.
-3 تبدیل متعامد هسته
تبدیل متعامد هسته برگرفته شده از تبدیل متعامد خطی است .[10] لازم به ذکر است که تبدیل متعامد هسته یک روش جبري براي طبقه بندي دو کلاس از داده ها می باشد. در ابتدا فرض می کنیم که دادههاي آموزش متعلق به کلاس اول و داده هاي متعلق به کلاس دوم هستند به طوریکه - برابر تعداد کل داده هاي آموزشی و هر دادهي برداري به صورت است. در اینجا را که یک نگاشت غیر خطی است، طوري تعریف می شود که فضاي نتیجهي نگاشت داده هاي آموزش باشد.
فضاي تعریف در واقع مزیت اصلی روش تبدیل متعامد هسته به خاطر همین نگاشت است. زیرا نگاشت باعث شده طول بردار داده مستقل از تعداد داده ها باشد. یعنی مقدار m مستقل از تعداد کل داده ها یعنی است. در حالیکه در تبدیل متعامد خطی به خاطر نبود این نگاشت طول بردار داده باید از تعداد کل داده ها بیشتر باشد تا این تبدیل قابل اعمال به داده ها باشد یعنی m>n که این نقص تبدیل متعامد خطی است.
از آنجایی که مقدار ویژهي یک ماتریس منحصر به فرد نمی باشد، بنابراین پس از بدست آوردن بردار ویژهي ماتریس بردار را طوري بدست می آوریم که اندیس متناظر با بزرگترین مقدار ویژهي ماتریس است. در واقع بردار بخشی از بردار ویژهي ماتریس است که متناظر با اندیس بزرگترین مقدار ویژه ماتریس می باشد. اکنون اگر ماتریس تبدیل WV به داده هاي کلاس اول و کلاس دوم در فضاي ویژگی اعمال شود در نتیجه داده ها به دو کلاس مجزا از هم تبدیل خواهند شد که این نتایج می توانند براي رسیدن به نرخ هاي طبقه بندي بالا مفید باشند.
1-3 روش طبقه بندي
در این مقاله، تبدیل متعامد هسته براي طبقه بندي تصاویر ماموگرام مورد استفاده قرار گرفته است. روش طبقه بندي به این گونه است که پس از بدست آمدن ماتریس تبدیل با نگاشت داده هاي تست x ماتریس بدست می آید. با بدست آمدن ماتریس مقدار خروجی y که نتیجهي حاصلضرب ماتریس در ماتریس wv است.