بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

سيستم هوشمند بازيابي و دسته بندي تصاوير پزشکي بر اساس محتوا
چکيده :
امروزه بخش عظيمي از تصـاوير پزشـکي بـه فـرم ديجيتـال بخ توليد و ذخيره مي شوند، اين امر سبب شده است مـديريت پايگـاه هـاي بي داده پزشکي بزرگ ، به صورت يک چالش در علـم پزشـکي نمـود پيـدا پي کند. بازيابي تصاوير پزشکي يک ابزار ضروري براي مديريت پايگـاه داده مو تصاوير پزشـکي اسـت . يکـي از مهمتـرين مراحـل در بازيـابي تصـاوير، ش دسته بندي تصاوير است ، که سبب کاهش زمان بازيابي تصوير مي شـود. رو اين مقاله يک سيستم هوشـمند و کـاراي بازيـابي تصـاوير پزشـکي بـر مر اساس محتواي تصوير را ارائه مـي دهـد. در پيـاده سـازي ايـن سيسـتم ، باز ويژگيهايي از تصاوير استخراج شده انـد کـه بـه بهتـرين وجـه ، متمـايز باز کننده تصاوير از هم باشند. به منظور دسته بندي بهينه تصـاوير، از يـک مت دسته بندي کننده SVM چند کلاسه استفاده شده اسـت . بـراي بهبـود تو هرچه بيشتر عملکرد سيستم پيشـنهادي ، از بـازخورد ارتبـاط اسـتفاده قس شده است . سيستم ارائه شده در اين مقاله تحت يک پايگاه داده بـزرگ ، ح شامل ١١٠٠٠ تصوير اشعه X در ١١٦ کـلاس مختلـف ، مـورد ارزيـابي در قرار گرفته است . نتايج بدست آمده کارايي بالاي سيستم ارائـه شـده را ايم اثبات مي نمايد.

واژه هاي کليدي : بازيابي تصوير بر اساس محتوا، دسته بندي تصـاوير، تصاوير پزشکي اشعه X ، ماشين بردار پشتيبان .

١- مقدمه
بازيابي تصاوير بر اساس محتوا، سـالهاي زيـادي اسـت کـه بـه منظـور به مديريت رشد روز افزون داده هاي ديجيتال ، مورد اسـتفاده قـرار گرفتـه عن است [١]. تصـاوير پزشـکي بخـش بسـيار مهمـي از فرآينـد تشـخيص رو بيماري در مراکز پزشکي هستند. در حال حاضر بسياري از بيمارستانها سوابق بيماران و همچنـين تصـاوير آنهـا را بصـورت کـاملاً ديجيتـالي ، باز نگهداري و استفاده مي کنند. رشد روز افزون اين داده هاي رقمي ذخيره در شده ، نياز به مديريت اين داده ها و بازيابي اطلاعـات از آنهـا را بـه طـور بــ هرچه بيشتر، قابل لمس مي سازد [٢]. امروزه مراکز راديولـوژي بـزرگ ، هم سالانه در حدود ده ها ترابايت تصوير توليد مي کننـد. بـه عنـوان مثـال ش راديولوژي بيمارستان دانشـگاه ژنـو، در سـال ٢٠٠٧بـه تنهـايي ، ش از ٧٠٠٠٠ تصوير در روز، توليد کرده است و اين تعـداد بـه طـور وسته در حال افزايش است [٣]. پايگاه هاي داده تصاوير پزشکي فعلي جود در مراکز پزشکي ، توسـط افـراد متخصـص بـا کلمـات کليـدي اخص گذاري ، دسته بندي و بازيابي مي شوند. با توجه به اين نکته که ، شهاي بازيابي بر اساس متن ، از توصيف کامل اطلاعـات بصـري غنـي بوط به محتواي تصـاوير پزشـکي ، نـاتوان هسـتند، بنـابراين اهميـت يابي تصاوير پزشکي بر اساس محتوا بيش از پيش احساس مي شـود.
يابي تصاوير پزشکي بر اسـاس محتـوا، بـا مقايسـه تصـاوير بيمـاران عدد و بازيابي حالتهاي مشابه از ميان آنهـا، مـي توانـد کمـک شـايان جهي به متخصصين پزشکي ، در تشخيص نوع بيماري بيماران ، نمايد.
قسمت ٢ اين مقاله ، به ذکر مختصري از کارهاي مرتبط انجام شـده در حوزه بازيابي و دسته بندي تصاوير پزشکي بر اساس محتوا، مـي پـردازد. قسمت ٣، به معرفي پايگاه داده استفاده شده در اين مقاله پرداخته - . سيستم پيشنهاد شده در اين مقاله در قسمت ٤ تشريح شده اسـت . قسمت ٥، نتايج آزمايشها و در قسمت آخر، نتيجه گيري مقاله ، ارائه داده است .
- تحقيقات قبلي انجام شده
از روز افزون دانش پزشکي به بازيابي تصاوير پزشکي ، ايـن مبحـث را يکي از مهمترين زمينه هاي تحقيقاتي مشهور تبديل کرده اسـت . بـه ـوان مثـال ، در سـال ٢٠٠٧، Zhang Gang و Zong-Min Ma روشي را با بهره گيري از ويژگي موجک و مجموعه هاي فازي ارائه دادند
روش ارائه شده بـراي پايگـاه داده اي از تصـاوير CT، در بهتـرين يابي ، داراي دقت ٩٦ درصد و ميانگين دقت اين روش ، در حـدود ٨٧ صـد بـوده اسـت . در سـال ٢٠٠٨، Qin Chen و Xiaoying Tai ، راي بازيــابي تصــاوير بــا اســتفاده از ويژگيهــاي هيســتوگرام رنــگ و بستگي نگاشت رنگ و روش شاخص گذاري معنايي پنهان ( Latent Semantic Indexin) ، در پايگـاه داده اي شـامل ١٣٤٥ تصـوير بـه ميانگين دقت ٩١ درصد دست يافتند [٥]. در همين سال ، Xiaoying Tai و Wang Li-dong، با استفاده از ويژگي همبستگي نگاشت رنگ - بافت و بهره گيري از مدل GTI، در پايگـاه داده اي از ١٠٣٢ تصـوير بـه دقـــت حـــدود ٩٠ درصـــد، دســـت يافتنـــد[٦ ]. در ســـال ٢٠٠٨، Pourghassem و Ghassemian با اتفـاده از يـک روش دسـته بنـدي سلسله مراتبي و با استفاده از ويژگيهاي شکل و بافت ، در پايگاه داده اي از ٩١٠٠ تصوير اشعه X، در يک مسأله شامل ٢٥ کلاس الحـاق شـده ، به دقت حدود ٩١ درصد و چنانچه سه کلاس از نزديکترين کلاسها، بـه عنوان کلاس صحيح در نظر گرفته شـود، بـه دقـت حـدود ٩٨ درصـد دست يافته اند[٧].

٣- پايگاه داده
در اين مقاله ، از پايگاه داده ٢٠٠٧ ImageCLEFmed اسـتفاده شـده است . اين پايگاه داده شـامل ١٠٠٠٠ تصـوير آمـوزش و ١٠٠٠ تصـوير آزمايش در ١١٦ کلاس مختلف است [٨]. تصاوير مذکور، تصاوير اشـعه X بوده ، که به فرمت PNG ذخيره شده اند.
٤- سيستم پيشنهادي
٤-١- استخراج ويژگي
در اين مقاله ، قبل از استخراج ويژگيهـا از تصـاوير، هـر يـک از تصـاوير توســط الگــوريتم درون يــابي بوســيله دو خــط مســتقيم ، در نــرم افــزار MATLAB، به تصاوير ٢٥٦*٢٥٦ پيکسل ، تبديل شده اند. در اين تحقيق ويژگيهاي زير از هـر يـک از تصـاوير اسـتخراج و مـورد استفاده قرار گرفته اند:
- يک بردار ويژگي ٦٤ عنصري ، که در واقع از تغيير اندازه تصوير اصلي و بدست آوردن يک تصوير کوچکتر ٨*٨، از تصوير اصلي بدسـت مـي - آيد.
- يک بردار ويژگي ١٦ عنصري ، شامل ويژگيهـاي کنتراسـت ، انـرژي ، همبستگي و همگني ، که از ماتريس همرخدادي [٩]، تحت چهار زاويـه
٠ ، ٤٥ ، ٩٠ و ١٣٥ بدست آمده اند.
- يک بردار ويژگي ٨٠ عنصري ، که از تقسيم کردن تصوير به پنج زيـر تصوير(بالا سمت چپ ، بالا سمت راست ، پايين سمت چپ ، پايين سمت راست و مرکز)، و بدست آوردن بردار ويژگي ١٦ عنصري قسـمت قبـل براي هر يک از اين پنج زير تصوير، حاصل مي شود.
- يک بردار ويژگي ١٦ عنصري ، که با استفاده از اعمال تبـديل موجـک روي تصوير بدست مي آيد.
- يک بردار ويژگي ٣٦ عنصري هيستوگرام راستاي لبـه [١٠] کـه حـد آستانه براي نقاط لبه ٠.٢ در نظر گرفته شده است .
-يک بردار ويژگي ٥ عنصري ، شامل گشتاورهاي نـامتغير(ايـن ضـرايب نسبت به دوران ، انتقال و تغيير مقياس مقاوم هستند) [١١].
- يک بردار ويژگي ٤ عنصري ، شـامل ويژگيهـاي جهـت محـور اصـلي ، طول محور اصلي ، طول محور فرعي و ميزان کشيدگي .
٤-٢- نرمال سازي
هدف از نرمال سازي اين است که هر مولفه بردار ويژگي تأثير يکسـاني در نتيجه داشته باشد. فرض کنيد تعداد تصاوير موجـود در پايگـاه داده N باشد و هر تصوير يک بردار ويژگي K بعدي دارد، بنـابراين m امـين بردار ويژگـي را بصـورت نمـايش مي دهيم . در نتيجه ماتريس بردار ويژگي تمام تصاوير بصورت زير است :

امين مولفه بردار ويژگي xm است . k امين ستون مـاتريس x ، بردار مربوط به k امين مولفه تمـام بردارهـاي ويژگـي xm اسـت ، ميانگين اين ستون را با μ و انحراف معيار آنرا با σ نمايش مـي - دهيم . با استفاده از رابطه زير تمامي مولفه هاي بردارهاي ويژگي به بازه [١+,١-] نگاشت مي شوند:

با توجه به اينکه معمولاً مقادير در محـدوده [١+,٠] نرمـال مـي شـوند، xmk بصورت زير تغيير مي کند:

٤-٣- کاهش ابعاد بردار ويژگي
در اين مقاله ، بردار ويژگي بدست آمده داراي ٢٢١ بعد است . بـا توجـه به تعداد بالاي ويژگي ها، براي کاهش تعداد ويژگـي هـا و بدسـت آوردن تعداد ويژگي بهينه با توجه به زمان اجرا و کـارايي روش ارائـه شـده ، از PCA استفاده شده است .کارايي روش ارائه شده با افزايش ابعـاد تـا ٦٠ بعد، به طور قابل ملاحظه اي افـزايش مـي يابـد و بطوريکـه در شـکل ١ مشاهده مي شود، با افزايش ابعـاد بـه بـيش از ٦٠ بعـد، کـارايي بهبـود اندکي يافته است . بنابراين به منظور بهره گيـري از زمـان اجـراي قابـل قبول ، در اين مقاله ابعاد بردار ويژگي با استفاده از PCA، ٦٠ بعـد ، در نظر گرفته شده است .



شکل ١: دقت روش پيشنهادي بر اساس تعداد ويژگيها
٤-٤- دسته بندي توسط ماشين هاي بردار پشتيبان
(Support Vector Machines)
ماشين هاي بردار پشتيبان (SVM) از جمله معروف ترين دسـته بنـدي کننده هاي موجود در حوزه پزشکي هستند [١٢و١٣]. اين روش دسـته - بندي را بين دو کلاس ، توسط پيدا کردن يک سطح تصميم گيري ، کـه بر اساس نقاط حاوي بيشترين اطلاعات در مجموعه آموزش مـي باشـد، انجام مي دهد [١٤]. فرض کنيد {x,...x,,...x,} مجموعه اي از نمونه های آموزش باشـند.که به صورت بردار های مجموعـه بردارهـاي آمـوزش ، هجادياپذير توسط خط است i، اگر يک ابر سـطح وجـود داشـته باشـد کـه ، نمونه هاي مثبت در يک سمت ، و نمونه هاي منفي در سـمت ديگـر آن قرار گيرند. اين ابر سطح توسـط پيـداکردن مقـادير w و b، کـه داراي محدوديت زير باشد، بدست مي آيد:

از ميان ابر سطح هاي جداساز، ابر سطحي که فاصله تا نزديکترين نقطه را ماکزيمم مي کند، ابر سطح جداساز بهينـه (OSH) ناميـده مـي شـود. OSH توسط مينيمم کردن w2 تحت محدوديت (٤) پيدا مي شـود. اگـــر ، N ضـــرايب لاگرانـــز غيرمنفـــي ، بـــا محدوديت هاي (٤) باشد، معادله لاگرانژي بصورت زير تعريف مي شود:


که αها ضمناً بايد شرايط زير را برآورده سازند:

تابع (L α, ,bنسبت به wو b مينيمم ، و نسبت به  مـاکزيمم مي شود. در نتيجه فرم کلـي تـابع دسـته بنـدي کننـده خطـي بـاينري SVM را بصورت زير مي توان نوشت [١٥]:

کـــه بردارهـــاي پشـــتيبان نقـــاطي بـــا ٠ <α مـــي باشـــند. در حـالتي کـه مجموعـه آمـوزش توسـط خـط جداپـذير نمـي باشـد، متغييرهاي کمکي ξ مورد استفاده قرار مي گيرند کـه ميـزان تخطـي هر xi از محدوديت (٤) را مشخص مي کنند. در اين حالت با اسـتفاده از اين متغيرها مينيمم سازي زير انجام مي شود:

که در روابط فوق C معرف جريمه مربوط به خطاي دسته بندي اشـتباه است .
در دسته بندي کننده هاي SVM، بـراي حالـت غيـر خطـي ، داده هـاي آموزشي به يک فضاي با بعد بالاتر نگاشت مي شوند تـا داده هـا توسـط خط قابل جداسازي باشند. در واقع بردارهاي آموزشي xi توسط تـابع غيرخطي R→Rk : بـه يـک فضـاي اقليدسـي بـا بعـد بـالا، نگاشت مي شوند، که hk است . در اين حالـت ، تـابع دسـته بنـدي SVM بصورت زير تعريف ميشود[١٤]:

چنانچـه ٠ ≤(f)x ورودي x بـه کـلاس ١ و در غيـر اينصـورت بـه کلاس ١- نسبت داده مي شود . SVM در واقع براي مسأله دسته بندي باينري طراحي شده است . لذا چنانچه با مسأله چند کلاسه ، نظير پايگاه داده هاي تصاوير پزشکي مواجه باشيم ، نياز به يـک روش چنـد کلاسـه مناسب وجود دارد. علاوه بر استفاده از روشـهايي کـه بـراي مسـائل دو کلاسه (باينري ) ارائه شده اند، روشهايي نيز براي بسـط ايـن روشـها بـه منظور استفاده در مسائل چند کلاسه ارائه شده است [١٦]. در واقـع ، K کلاس دوبدو ناسازگار، بوسيله حـل مسـائل دو کلاسـه و ترکيـب آنهـا، قابل جداسازي هستند. براي اين منظور به عنوان مثال مي توان از روش تزويج دوبدو(pairwise coupling) اسـتفاده کـرد [١٧]. ايـن روش از SVM باينري بين تمام زوج کلاسها استفاده مي کند. بنابراين ايـن راه -حل براي K کلاس ، از 2.(1-K)K دسته بندي کننده باينري بهره مـي - جويد. هر کدام از اين 2.(1-K)K، دسته بنـدي کننـده يـک رأي بـراي يک کلاس صادر مي کنند. کلاسي کـه بيشـترين رأي را در مقايسـه بـا ساير کلاسها بدست

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید