بخشی از مقاله
خلاصه
سرطان پانکراس یکی از مهمترین و خطرناکترین بیماریهایی است که سلامت بشر را تهدید میکند. برای تشخیص این بیماری روشهای تشخیصی متفاوتی وجود دارد که یکی از ارزانترین و در دسترسترین آنها تشخیص با استفاده از تصاویر سیتیاسکن است. عارضههای پانکراس به صورت کلی شامل تومورها و کیستها که انواع خوشخیم و بدخیم دارند و پانکراتیت میشوند. هدف این تحقیق شناسایی انواع عارضهها از نوع سالم آن با استفاده از ترکیب طبقهبندهای شبکه عصبی MLP میباشد.
الگوریتم استفاده شده در این تحقیق شامل دو مرحله است که در مرحله اول پنج شبکه عصبی MLP برای تشخیص هر کدام از عارضهها آموزش دیده و متخصص میشوند و نتایج آنها برای آموزش شبکه عصبی میانجی در مرحله دوم استفاده و در نهایت توسط این مرحله تصمیمگیری نهایی اتخاذ میشود . روش پیشنهادی در مقایسه با روش تشخیصی با استفاده از یک شبکه عصبی MLP نتایج بهتری را ارائه داده است چرا که یادگیری دستهجمعی، از یادگیری بهترین طبقهبند پایه بهتر است.
.1 مقدمه
پانکراس - لوزالمعده - غدهی بزرگی است که بخشی از دستگاه گوارش بوده و در پشت معده قرار گرفته و به شکل لولهای اسفنجی با طول 15 سانتیمتر میباشد. زمانی که سلولهای این بخش رشد غیرقابل کنترلی داشته باشند و تشکیل یک تومور را بدهند، سرطان پانکراس ایجاد میشود. عارضههای موجود در لوزالمعده را به پنج دسته تقسیم میکنند که در این میان تومورهای بدخیم با درصد قابل توجهی شایع میباشد. برای تشخیص سرطان پانکراس روشهای مختلفی وجود دارد.
پزشک در صورت نیاز، از روش کلانژیوپانکراتوگرافی استفاده میکند. در این روش با قرار دادن لولهی آندوسکوپ در دهان و حرکت آن از دهان به پانکراس، تزریق رنگ و گرفتن تصاویر با اشعهی ایکس، تصاویر کامل و دقیقی بدست میآید. همچنین یک نمونه بافت برای بیوپسی - نمونهبرداری - از طریق لوله آندوسکوپ قابل استخراج است. در صورتی که نمونهبرداری، سرطان پانکراس را تأیید کرد، آزمایشهای بیشتری برای تعیین مرحله پیشرفت بیماری صورت میگیرد.
یکی از این آزمایشها لاپاراسکوپی است. در این روش، لوله کوچکی به همراه یک دوربین فیلمبرداری کوچک و یک منبع نور وارد حفره شکمی میشود . با این کار، تومور قابل مشاهده است. گاهی اوقات، به جراحی تشخیصی نیاز است. جراح با این روش میتواند تومور را به صورت مستقیم مورد بررسی قرار داده و از وضعیت سرطانی بودن گرههای لنفاوی مجاور، اطلاع پیدا کند. همچنین نمونههای بافت را برای بررسی زیر میکروسکوپ - خوشخیم و یا بدخیم بودن تومور - جدا میکند.
مشکل روش نمونهبرداری وقتگیر و پرهزینه بودن آن است. بنابراین در این تحقیق سعی داریم با تجزیه و تحلیل تصاویر پزشکی برای تشخیص این بیماری، پزشک را یاری کنیم. در مدت انجام این پژوهش تلاش خواهیم کرد سیستم تشخیصی بر پایه پردازشتصویر طراحی کنیم که بتواند پانکراتیت و همچنین تومورها و کیستهای خوشخیم را از نوع بدخیم آن شناسایی کند . با توجه به این که پایگاه داده استانداردی تا کنون در این خصوص ارائه نشده، اقدام به جمعآوری تصاویر سیتیاسکن مورد نیاز کردیم. در ادامه این تصاویر را در شش گروه نرمال، پانکراتیت، تومورهای بدخیم، تومورهای خوشخیم، کیستهای بدخیم و کیستهای خوشخیم طبقهبندی نمودیم.
یک سیستم مرکب، از ترکیب طبقهبندهای مختلف بوجود میآید. در این سیستم به طبقهبندهایی که نتایج آنها با هم ترکیب میشوند، طبقهبندهای پایه گفته میشود. یکی از متداولترین طبقهبندهای پایه شبکههای عصبی هستند. یادگیری دستهجمعی، از یادگیری بهترین طبقهبند پایه بهتر است. در این تحقیق برای شناسایی پنج نوع عارضه پانکراس از نوع سالم آن با استفاده از ترکیب طبقهبندها با شیوهای ابتکاری، نتایج بهتری در طبقهبندی عارضهها بدست آمد که در ادامه به تشریح آن خواهیم پرداخت.
شروع تحقیقات در خصوص سرطان پانکراس با استفاده از تصاویر سیتیاسکن به سال 1997 برمیگردد .[1] در این تحقیق با کمک مشخصات تصاویر سیتیاسکن، سه طبقهبند شبکهعصبی، بیزین و هایاشی کمی دو برای تشخیص سرطان پانکراس از التهاب پانکراس با هم مقایسه شدند. در نهایت مشخص گردید شبکهعصبی تشخیص بهتری نسبت به دو طبقهبند دیگر دارد.
در سال 2008 با استفاده از شبکهعصبی در خصوص تشخیص سرطان پانکراس تحقیقاتی صورت گرفت .[2] در این الگوریتم با استفاده از هیستوگرام رنگی تصاویر EUS، شبکهعصبی آموزش داده شد و موفق شدند پانکراس سالم، پانکراس مزمن و سرطان پانکراس را از هم تشخیص دهند.. محقیقین از شبکهعصبی پرسپترون چندلایه به عنوان طبقهبند اصلی استفاده نمودند. میزان دقت میانگین تشخیصی %95 بود.
در پژوهش دیگری که بر روی تصاویر EUS انجام شد از آنالیز تصاویر دیجیتال - - DIA برای تشخیص سرطان پانکراس از نوع مزمن و طبیعی آن استفاده شده است .[3] در این مقاله ابتدا 228 مشخصه تصویر استخراج شده و سپس توسط الگوریتم انتخاب ویژگیPCA، یازده ویژگی مهم از بین این 228 ویژگی انتخاب و برای آموزش شبکهعصبی مورد استفاده قرار گرفت که در نهایت دقت تشخیص %93 حاصل شد.
برای تشخیص سرطان پانکراس با استفاده از آزمایشات پاراکلینیکی 120 بیمار، پایگاه دادهای ایجاد و برای آموزش شبکهعصبی مورد استفاده قرار گرفت .[4] شبکهعصبی استفاده شده، شامل 11 نورون ورودی و یک نورون خروجی است. در این تحقیق عملکرد شبکهعصبی مورد بررسی قرار گرفت و مشخص گردید شبکهعصبی با 20 نورون میانی بهترین کارایی را در تشخیص دارد.
.2 روش تحقیق
در این پژوهش ابتدا مرحله پیشپردازش را بر روی تصاویر جمعآوری شده انجام میدهیم. ابتدا باید نرمالسازی تصاویر صورت گیرد. با توجه به این که عمل شناسایی با استفاده از الگوهای موجود در تصویر انجام می شود، لازم است که تصویر از نظر کنتراست وضعیت مطلوبی داشته باشد، تا تاثیر نامطلوبی در مرحلهی استخراج ویژگی و شناسایی الگو ایجاد نکند. به همین خاطر از یکسانسازی هیستوگرام میتوان بهره گرفت. همچنین در صورت وجود نویز در تصاویر با استفاده از فیلتر میانه، آن را حذف میکنیم.
یکی از بزرگترین مشکلات ما در تحقیق اخیر بدست آوردن پایگاه داده مورد نیاز بود. با وجود مکاتبات صورت گرفته با نویسندگان مقالات قبلی متاسفانه پاسخی از آنها برای کسب پایگاه داده دریافت نکردیم. در نتیجه در مرحله اول اقدام به جمعآوری تصاویر مورد نیاز در این خصوص کردیم. برای این کار با همکاری بیمارستان امام رضا - ع - مشهد و با کمک گرفتن از پزشکان متخصص این رشته موفق به ایجاد یک پایگاه داده مناسب با تعداد 151 نمونه شدیم.
بعد از مرحله پیشپردازش باید استخراج الگو را انجام دهیم. نمونههای عارضهها به بلوکهای مساوی 16*16 پیکسلی تقسیم میشوند و از این بلوکها پایگاه داده نرمال و یکپارچهای بوجود میآید، تا سیستم توسط این پایگاه داده آموزش ببیند. با استفاده از تصاویر موجود الگوهای شش کلاس ذکر شده را از تصاویر جدا کرده و از آنها برای آموزش سیستم تصمیم گیرنده استفاده میکنیم. با توجه به اندازههای متفاوت، این عارضهها ممکن است در یکی از ابعاد 16*16، 32*32، 64*64 ، 128*128 و یا 256*256 پیکسل قرار گیرند. پس از استخراج الگوها و دستهبندی، شش مجموعه بدست میآید. در نهایت برای آموزش شبکه عصبی MLP، با اعمال پنج پایگاه داده گفته شده، خروجی شبکه محاسبه و با بردار هدف متناظر آن مقایسه میشود و تفاوت بین خروجی محاسبه شده و خروجی دلخواه که خطا نامیده میشود به سمت عقب در سراسر شبکه منتشر میگردد.
سپس وزن ها مطابق با الگوریتم گرادیان کاهشی که تمایل به حداقل رساندن خطا را دارد تغییر کرده و تنظیم میشوند. این کار تا زمانی که خطا برای کل نمونههای آموزشی به یک مقدار کوچک قابل قبول برسد ادامه پیدا میکند. باید توجه داشت که ممکن است خطا به میزان تعیین شدهی مورد نظر ما نرسد، در این حالت تعداد تکرار یا ایپک برای پایان، در نظر گرفته میشود.
در اینصورت ما پنج شبکه داریم که هر کدام فقط با نمونههای سالم و یکی از عارضهها آموزش دیده و توانایی شناسایی آن را دارد. چون بلوکهای اعمال شده 16*16 میباشند، بنابراین هر شبکه نیاز به 256 نورون ورودی و یک نورون خروجی دارد. هر شبکه با دریافت نمونهها وزنهای خود را تنظیم میکند. بعد از آموزش پنچ شبکه عصبی، دوباره همه نمونهها را بدون توجه به کلاس آن به تمامی پنج خبره اعمال کرده و خروجی آنها را جهت آموزش شبکه میانجی مورد استفاده قرار میدهیم. به این ترتیب شبکهعصبیمیانجی با توجه به خروجی هر پنج شبکه، آموزش دیده و در نهایت یکی از پنج کلاس بیماری و یا نرمال را به عنوان تصمیم نهایی اتخاذ میکند.
با توجه به اینکه شش کلاس مختلف در این مسئله داریم، استفاده از یک دستهبند استاندارد توانایی لازم برای شناسایی این تعداد کلاس را با دقت قابل قبول ندارد. بنابراین برای حل این مشکل از چندین دستهبند استفاده میکنیم و هر یک از آنها را مسئول شناسایی و تفکیک دو کلاس قرار میدهیم و در نهایت نظر همهی دستهبندها را به طبقهی دوم که شبکه میانجی است ارسال میکنیم تا این شبکه در خصوص نتیجه نهایی تصمیمگیری نماید.
برای آموزش هر یک از دستهبندهای طبقه اول از پایگاه دادهای متشکل از نمونههای یک عارضه با نمونههای سالم استفاده میکنیم. چون پنج نوع عارضه داریم بنابراین در طبقه اول پنج دستهبند وجود دارد. نتیجه این پنج دستهبند به طبقهی دوم که خود یک دستهبند دیگر است ارسال و نتیجه نهایی مشخص میشود. این کار باعث میشود هر دستهبند با توجه به اینکه با کل پایگاه داده مواجه نمیشود، خیلی خوب آموزش دیده و توانایی خوبی در جداسازی دو کلاس پیدا کند. با این کار محدودهی خطای دستهبندها متفاوت میشود و همیشه در هر محدوده از فضای حالت، حداقل یکی از دستهبندها جواب صحیح دارد که این محدودهی صحیح توسط دستهبند میانجی مشخص میشود.