بخشی از مقاله
چکیده
تشخیص به کمک کامپیوتر ندولهای منفرد ریوی به کمک رادیولوژی یکی از روشهای تشخیص زودرس سرطان در تصاویر سی تی اسکن است. در این پژوهش ی ک سیستم تشخیص به کمک کامپیوتر برای تشخیص ندولهای ریوی در سی تی اسکن بر اساس طبقه بندی کننده ماشین بردار پشیتبانی جهت تشخیص ندولهای منفرد ریوی ارائه شده است. بدین ترتیب که در ابتدا با استفاده از روشهای دادهکاوی حجم دادهها کاهش داده میشوند. سپس با تقسیم بندی نواحی قفسه سینه، مناطق مشکوک به ندول شناسایی میشوند و در نهایت ندول ها تشخیص داده میشوند.
در مقایسه با روشهای مبتنی بر آستانه، طبقه بندی کننده ماشین بردار پشتیبان با دقت بیشتری به تقسیم بندی نواحی ریه ها میپردازد. برای تشخیص مناطق مشکوک به ندول، سیستم پیشنهادی بطور موثری در تشخیص ندولهای مشکوک و مناطق آن ها نسبت به روشهای قبلی بهتر عمل کرده است. همچنین در این پژوهش نرخ مثبت کاذب با ترکیب طبقه بندی کننده ماشین بردار پشتیبان و عملیات فیلتر کردن کاهش یافته است. سیستم پیشنهادی بر روی دادههای 147 بیمار از کنسرسیوم پایگاه داده تصاویر ریه مورد ارزیابی قرار گرفته است. نتایج آزمایشگاهی نشان میدهد که سیستم پیشنهادی موفق شده است نرخ حساسیت%90 در نرخ مثبت کاذب 4 در هر اسکن را بدست آورد. با مقایسه سیستمهای گذشته، سیستم پیشنهادی عملکرد مناسبت تری را نسبت به سیستمهای گذشته در تشیخص ندولهای منفرد ریوی در تصاویر سی تی اسکن بدست آورده است.
-1مقدمه
امروزه در دانش پزشکی جمع آوری داده های فراوان در مورد بیماری های مختلف از اهمیت فراوانی برخوردار است. مراکز پزشکی با مقاصد گوناگونی به جمع آوری این داده ها میپردازند. تحقیق روی این داده ها و به دست آوردن نتایج و الگوهای مفید در رابطه با بیماری ها، یکی از اهداف استفاده از این داده هاست. حجم زیاد این داده ها و سردرگمی حاصل از آن مشکلی است که مانع رسیدن به نتایج قابل توجه می شود؛ بنابراین از تصویر کاوی و داده کاوی برای غلبه بر این مشکل و به دست آوردن روابط مفید بین عوامل خطرزا در بیماری ها استفاده میشود. تصویر کاوی در زمینه استخراج دانش پنهان از تصاویر، ارتباط بین داده های تصاویر یا الگوهایی که به طور آشکار و شفاف در تصویر ذخیره نشده اند بحث می کند. تصویر کاوی چیزی فراتر از فقط توسعه داده کاوی در حوزه تصویر است.
تصویر کاوی یک حوزه میان رشته ای است که بر روی تخصص های بینایی ماشین، پردازش تصویر، بازیابی تصویر، داده کاوی، یادگیری ماشین، پایگاه داده و هوش مصنوعی بنا شده است. علیرغم اینکه در هر کدام از حوزه های فوق تحقیقات فراوانی صورت گرفته است، پژوهش در مورد تصویر کاوی مسئله ای نوپا و در ابتدای راه است. یک حجم بسیار بالایی از تصاویر، مانند تصاویر ماهواره ای، تصاویر پزشکی و عکس های دیجیتال بصورت روزانه تولید می شود اگر این تصاویر تحلیل شوند، اطلاعات بسیار مفیدی را در اختیار ما قرار می دهند6[،3،[.2 دو تکنیک اساسی در این زمینه وجود دارد، تکنیک اول کاوش را
در حجم وسیعی از تصاویر مستقل انجام می دهد. تکنی ک دوم کاوش را در یک مجموعه تصاویر یکپارچه شده و به هم مرتبط انجام می دهد .]1[ هدف اصلی تصویر کاوی تولید همه الگوها ی قابل توجه از تصاویر بدون دانستن اطلاعاتی از محتوا ی تصاویر می باشد. یعنی بدون اینکه یک دانش اولیه از محتوا ی تصاویر داشته باشد بصورت هوشمندانه از یک مجموعه تصاویر داده شده به عنوان ورودی، بتواند الگوهای مهم را استخراج کند. الگوهایی که استخراج می شوند می توانند انواع مختلفی ماننده الگوهای دسته بندی شده، الگوهای توصیفی، الگوهای وابسته، الگوهای موقتی و الگوهای فضایی باشد.
-1 کارهای گذشته
برای اولین بار تشخیص ندول های ریوی با استفاده از الگوریتم ژنتیک از روی تصاویر سی تی اسکن توسط یانگ بوم لی ارائه شد. هدف از ارائه این مقاله پیاده سازی روش تطبیق الگو1 با الگوریتم ژنتیک2 برای تتشخیص ندول های ریوی در تصاویر سی تی اسکن3 می باشد. در این مقاله روش تطبیق الگو و الگوریتم ژنتیک با یکدیگر ترکیب شده اند تا بتوان موقیت و مقیاس یک ندول را ارزیابی و اندازه گیری کرد.
لی و همکارانش تشخیص خودکار ندول های ریوی در تصاویر سی تی اسکن مبتنی بر روش تطبیق الگو بهبود یافته ارائه کردند.هدف از این پژوهش توسعه یک تکنیک برای سیستم های تشخیص به کمک کامپیوتر جهت تشخیص ندول های ریوی از روی تصاویر سی تی اسکن می باشد. در واقع در این مقاله یک روش تطبیق الگو مبتنی بر الگوریتم ژنتیک برای تشخیص ندول هایی که در ریه قرار دارند ارائه شده است. الگوریتم ژنتیک4 برای تعیین موقعیت هدف در تصاویر بسیار موثر است و انتخاب نوع ندول با استفاده از تطبیق الگو بسیار سریع است. علاوه بر این، تطبیق الگومعمولی برای تشخیص ندول هایی که در منطقه ریه وجود دارند با نام تطبیق الگو دیواره ریه5 شناخته شده اند..[ 8 ]
آرنولد شیلام و همکارانش تشخیص چند مقیاس ندول ریوی با استفاده از رادیوگرافی قفسه سینه را ارائه کردند. این روش شامل تقسیم بندی اشیا فعال مشود. تشخیص نامزدهای ندول توسط /LQGHEHUJʼV برای اولین بار ارائه شده که از چند- مقیاس و طبقه بندی درجه دوم برای تشخیص استفاده میکرد. تقسیم بندی لکه های حباب با چند-مقایسه لبه بر روی k همسایگی تمرکز دارد.کاپینی یک سیستم مبتنی بر شبکه عصبی برای تشخیص کامپیوتری ندول ریوی از روی رادیوگرافی قفسه سینه ارائه کرد. در این مقاله از پردازش چند مقیاسه و شبکه عصبی مصنوعی استفاده 6کند.فیلترهای بیولوژیکی الهام گرفته از ماژول های LONGو Gabor، برای افزایش ویژگی های برجسته تصویر به کار گرفته شده اند..
آنتونلی یک سیستم تشخیص به کمک کامپیوتر ندول های ریوی براساس ابزار قوی فازی، الگوریتم ، به تجزیه و تحلیل مورفولوژیک3 8 بعدی جهت تفکیک ندول های ریوی و رگ های خونی از هم پرداخت. زی جیونگ یک روش توموگرافی کامپیوتری جدید ندول ریه به کمک تشخیص کامپیوتری برای تشخیص ندول جامد و غیرجامد ارائه کرد. در مرحله اول به کمک تصمیم گیری با حد آستانه فازی، مناطقی از داده های سی تی اسکن بخش بندی میشوند. سپس با استفاده از انحنای محلی گواسی و »نقطه« نقشه، شاخص هر شی بدست می آید و مقادیر ماتریس هشین شکل گرفته و اشیایی که کروی شکل هستند شناسایی میشوند. ترکیبی از شاخص اشیا و ویژگی »نقطه« باعث میشود که بتوان تعریفی خوبی از نامزدها به عنوان ندول داشت. ژاجیونگ لی یک سیستم محاسباتی تشخیص کامپیوتری جدید برای تشخیص ندول های منفرد در تصاویر سی تی اسکن ارائه کرد که با استفاده از پایگاه داده دانشکده پزشکی دانشگاه تگزاس مورد ارزیابی قرار گرفته است.
سان چوی از تبدیل ویژگی ژنتیک مبتنی بر برنامه نویس و طبقه بندی برای تشخیص خودکار ندول های ریوی از روی تصاویر توموگرافی کامپیوتری استفاده کرد.این سیستم از سه مرحله تشکیل شده است. مرحله اول حجم ریه با استفاده از حد آستانه تقسیم بندی میشود و اجزای سه بعدی متصل برچسب گزاری میشوند. در مرحله دوم آستانه های متعدد مطلوب و هرس مبتنی بر قوانین برای تشخیص مناطق مشکوک به ندول اعمال میشوند.در مرحله نهایی، یک طبقه بندی کننده مبتنی بر برنامه نویسی ژنتیک آموزش داده میشود و برای طبقه بندی ندول ها و غیر ندول ها استفاده میشود. وانگ تشخیص ندول های ریوی 3 بعدی در تصاویر سی تی اسکن سریالی ارائه کرده است. سی تی اسکن سریالی یعنی گرفتن بیش از دو سی تی اسکن از یک بیمار در 24 ساعت.
این سیستم ندول ها را بوسیله اطلاعات هندسی سه بعدی طی فرآیند الحاق، تقسیم بندی و جستجو منطقه مشکوک شناسایی میکند..[ 10 ] آتسوشی روش ترکیبی برای تشخیص ندول های ریوی با استفاده از توموگرافی گسیل پوزیترون/سی تی اسکن ارائه کرده است. در این روش ترکیبی تصاویر PET اطلاعات کاربردی را ارائه میدهند و این در حالی است که تصاویر CT اطلاعات تشریحی را بیان می کنند و این ترکیب باعث شد تا وی بتواند ندول های ریوی کوچک متابولیسم گلوگز9 را شناسایی کند. .[12]
-1-2 ماشین بردار پشتیبانی
ماشینهای بردار پشتیبانی SVM - ها - ، شامل دستهبندی کنندهی بردار پشتیبانی - SVC - و رگرسور بردار پشتیبانی - SVR - بوده و از دقیقترین و نیرومندترین الگوریتمهای دادهکاوی بشمار میروند. ماشینهای بردار پشتیبانی، در ابتدا توسط وپنیک و در دهه 90 میلادی توسعه داده شدند. اصول نظری مربوط به این الگوریتمها را میبایست در تئوری یادگیری آماری جستجو کرد. یکی از ویژگیهای قابل توجه الگوریتمهای مذکور آن است که در اغلب موارد هیچ حساسیتی را نسیت به ابعاد دادهها از خود نشان نمی دهند15]،14،.[13
SVM ها به خانوادهای از مدلهای خطی تعمیم یافته تعلق دارند. در این خانواده از مدلها، بر اساس مقدار مربوط به ترکیب خطی خصیصه ها تصمیماتی در مورد دسته بندی و رگرسیون اتخاذ می شود. همچنین، گفته میشود که ماشینهای بردار پشتیبانی به روشهای کرنل تعلق دارند. SVM ها، علاوه بر دارا بودن یک شالوده ریاضیاتی منسجم در تئوری یادگیری آماری، عملکرد بسیار خوب و موفقیت آمیزی را در کاربردهای عملی و واقعی از خود به نمایش گذاشته اند. تعدادی از این کاربردها عبارتند از: تشخیصهای پزشکی، بیوانفورماتیک، پردازش تصویر و متن کاوی. ماشینهای بردار پشتیبانی، مشابه با شبکههای عصبی، قادر هستند تا برای هر تابع چند متغیره، تقریبهایی را با درجه دقت دلخواه به دست دهند، بنابراین و به منظور مدلکردن سیستمها و فرایندهای غیر خطی و بسیار پیچیده، می توان از SVM ها استفاده کرد.[16]
-2-2 ندول های منفرد ریوی
ندولهای منفرد ریوی یا ضایعات سکهای ضایعات ریوی محیطی با حدود مشخص هستند که یا از بیماریهای گرانولوماتوز و یا از نئوپلاسمها ناشی میشوند. تشخیص با رادیولوژی است. علت ایجاد ندول ممکن است بیماری عفونی یا نئوپلاستیک خوشخیم یا تومورهای بدخیم اولیه یا ثانویه باشد. تعدادی از خصوصیات تومور ممکن است به نفع خوشخیمی یا بدخیمی باشد، ولی در اغلب موارد تشخیص قطعی نیست. در صورتیکه نتوان سرطان را رد کرد باید بلافاصله بیمار تحت درمان جراحی قرار بگیرد.[17]
میزان کلی بروز سرطان در ندولهای منفردی که در رادیوگرافی دیده میشود حدود 5%-10 است. با این حال، در بیمارانی برای رزکسیون ندول انتخاب میشود، احتمال سرطان در نهایت بسیار بیشتر است. شیوع تشخیصهای محتمل در ندول منفرد ریه بهشرح زیر است: 35% کارسینومهای اولیه، 35% گرانولومهای غیراختصاصی، 20% گرانولومهای سلی، حدود 5% تومورهای مختلط - هامارتومها - و 5% کارسینومهای متاستانیک. گروه متفرقه کوچک دیگر شامل آدنومها، کیستها و سایر ضایعات میباشد. میزان کلی بروز ندولهای منفرد در مردان 3 تا 9 برابر زنان است. شیوع سرطان در مردان تقریباً دو برابر زنان است. اندازه ضایعات اهمیت زیادی دارد چون ضایعات با قطر بیش از 1 سانتیمتر احتمال بدخیمی قابل توجهی دارند و اگر قطر ضایعات 4 سانتیمتر یا بیشتر باشد احتمال بدخیمی بسیار زیاد خواهد بود، ولی ضایعات با قطر 1 سانتیمتر یا کمتر احتمالاً گرانولوم هستند.
-3-2 کاهش نرخ مثبت کاذب
هدف اصلی در این پژوهش کاهش نرخ خطا میباشد. خطا میتواند شامل تصویر سرطان باشد که سیستم تشخیص ندول آن را بهعنوان تصویر سالم میشناسد - منفی کاذب - 10 یا تصویر سالمی که سیستم آن را با برچسب سرطان همراه میسازدمعمولاً. در یک سیستم تشخیص به کمک کامپیوتر، برای تمامی ویژگیهای تصویر و یا هر ویژگی استخراج شده از آن فقط یک مدل آموزش می بیند و فقط از همان مدل بهمنظور دستهبندی تصاویر آزمایشی استفاده میشود. این امر باعث میشود نتیجهی موردنظر تحت تأثیر خطاهای آن مدل قرار گیرد. این خطاها ممکن است به دلیل نامناسب بودن مجموعه دادههای آموزشی یا استفاده از الگوریتم های آموزشی نامناسب و یا پیکربندی نامناسب این الگوریتم ها به وجود آیند.
-3 سیستم پیشنهادی
روش پیشنهادی، بر اساس ساختار سیستمهای تشخیص ندول مبتنی بر ماشین بردار پشتیبان پیادهسازی شده است. دو وظیفهی مهم در تشخیص، مدلسازی یا دستهبندی و طبقه بندی میباشد که اگر بهخوبی انجام شوند، آنگاه میتوان عملکرد بهتری را در تشخیص مشاهده نمود. سیستم پیشنهادی دارای دو راهکار مهم میباشد که باعث میشوند، مدل سازی یا دستهبندی الگوها و تصمیمگیری بهخوبی انجام شوند و درنتیجه نرخ خطا کاهش و نرخ تشخیص سیستم افزایش یابد. در این بخش جزئیات سیستم تشخیص به کمک کامپیوتر پیشنهادی ندولهای ریوی توضیح داده میشود.
-1-3 پیش پردازش داده ها
ورودی سیستم پیشنهادی، مجموعهای از تصاویر دریافت شده از مرحله پیش پردازش داده ها میباشد. این تصاویر شامل ویژگیهایی می باشند که در جدول - 1 - نشان داده شده اند. همانطور که دراین جدول مشاهده میکنید، این ویژگیها درواقع شامل مقادیری میباشند.