بخشی از مقاله

چکیده

سرطان سینه یکی از بیشترین بیماری های تهدید کننده زندگی زنان در کل جهان می باشد. بر طبق تحقیق های انجام گرفته در دهه های اخیر این بیماری یکی از کشنده ترین بیماری ها در زنان می باشد. بنابراین تعیین آن در مراحل اولیه بسیار ضروری است. سیستم تصمیم گیری خودکار در سال های اخیر برای تعیین سریعتر این بیماری استفاده شده است. یکی از ابزارهای پرکاربرد در این زمینه شبکه های عصبی - ANN - است. در این تحقیق از مدل شبکه عصبی پس انتشار - BP - جهت شناسایی و تشخیص بیماری سرطان براساس داده های ماموگرافی و WDBC استفاده شد. در بهترین شناسایی و طبقه بندی بیماران دقت شبکه برای داده های ماموگرافی و WDBC به ترتیب 97 و 81 شد. نتایج نشان داد شناسایی سرطان با استفاده از داده های واقعی بسیار دقیقتر بود.

کلمات کلیدی: داده های ماموگرافی، داده های WDBC، سرطان سینه، شبکه عصبی مصنوعی، کلاس بندی،

.1مقدمه

شبکههای ع صبی از اواخر 1980 در پز شکی مورد ا ستفاده قرار گرفت ند. هر دو نوع شب که با یادگیری ناظر - Supervised - و غیر ناظر - unsupervised - به عنوان راه کار های موفقی در طب استفاده شدهاند. در بسیاری از تحقیقات طبی که نتیجه گیری از دادههای حجیم مربوط به یک بیماری خاص به طور دستی امکان نداشته است، شبکههای عصبی توانستهاند در تشخیص بیماری به پز شکان یاری ر سانند. همچنین در ب سیاری از م سائل پز شکی نظیر پیش بینی امید زندگی بیماران خاص و یا ساخت ابزارهای پزشکی شبکههای عصبی مورد بهرهبرداری قرار گرفتهاند. دقت و صحت نتایج نهایی بد ست آمده از شبکه فقط به ساختار شبکه وابسته نبوده بلکه به دادههایی که برای آموزش شبکه به کار میروند نیز بستگی دارد.

اگر اطلاعات درست از تعداد بیماران بیشتری در دست باشد، عملکرد شبکه بهبود قابل توجهی خواهد یافت .[1] کاربردهای شبکه ع صبی در موارد پز شکی در یکی از حالات ت شخیص بیماریها، پیش بینی و پیش آگاهی، مهند سی پزشکی می باشد.تشخیص بیماری مهمترین مرحله کار درمان می باشد. به علت این که در بسیاری از موارد پردازش دادههای وسیع مربوط به یک بیماری خاص به طور دستی برای پزشکان امکان ندارد و یا بسیار پیچیده و طولانی ا ست به کار بردن شبکههای عصبی که بسیارسریع و تا حد قابل قبولی قابل اعتمادند، توان سته ب سیاری از این مشکلات را حل کند. نحوه استخراج اطلاعات در هر بیماری بسیار با اهمیت است و هر چه از تعداد بیماران بیشتری استفاده شود، عملکرد شبکه بهتر خواهد بود.

ا ستفاده از تکنیک های شبکه ع صبی در پیش بینی و شنا سایی بیماری در سال های اخیر ب سیار مورد ا ستفاده قرار گرفته ا ست. این تکنولوژی با استفاده از کامپیوتر و بسیار کم هزینه تر از تکنیک های آزمایشگاهی براحتی می تواند بیماری های مختلف را پیش بینی و شناسایی کند 2]، 3، 4، 5، 6، 7، 8، .[9 تشخیص و پیش بینی پیشرفت بیماری از لحاظ پزشکی بسیار حائز اهمیت است. بعنوان نمونه پیش بینی پیشرفت سرطان بسیار در پزشکی مورد برر سی قرار میگیرد بنابراین محقیق را به تحقیق در زمینه شنا سایی، پیش بینی، طبقه بندی بیماریها با ا ستفاده از شبکه عصبی وادار کرده است 2]، 3، 10، .[11 این تحقیق ها هزینه درمان را تا حد زیادی کاهش میدهد.

تحقیق ها منحصر به بخش خاصی از بدن نمی باشد و میتواند برای پیش بینی و کلاس بندی کردن سرطان اندام های مختلف مانند سرطان سینه [10] ، سرطان پروستات [3] و غیره استفاده شود. تشخیص به موقع سرطان سینه به طور چشمگیری مرگ و میر ناشی از آن را در جام عه ز نان کاهش مید هد .[12] ب نابراین ا هداف تحقیق عبارتند از: بررسی شبکههای عصبی و انتخاب مناسب توابع انت قال، ت عداد لا یه های مخفی م ناسب، ت عداد نرون و غیره؛استفاده از شبکه عصبی طراحی شده در شناسایی بیماری سرطان سینه با داده های ماموگرافی و WDBC؛

.2  شبکه عصبی طراحی شده
1-2 مجموعه داده

داده ها از سایت UCI از بخش Breast Cancer Wisconsin - Diagnostic - Data Set فراخوانی می شود. در این سایت داده های مربوط به سرطان سینه در سه حالت داده های واقعی ماموگرافی، WDBC و WPBC وجود دارد. در این تحقیق از دو سری داده های ماموگرافی و WDBC استفاده شد. داده ها پس از جمع آوری وارد یک فایل اکسل شدند و بیماران دارای سرطان را در فایل اکسل با 1 و بیماران بدون سرطان را با 0 مشخص کردیم. این عمل به این منظور انجام گرفت که بتوان برای نتایج نمودارROC رسم شود.داده های ماموگرافی موجود در فایل گرفته شده از سایت شامل 10 ویژگی زیر می باشد.که تعداد کل بیماران مورد بررسی 699 عدد می باشد. کلاس های سرطان پیشرفته 241 عدد می باشد که حدود 34,5 کل داده ها ا ست و تعداد بدون سرطان 458 عدد می با شد و حدود 65,5 کل داده ها است.

داده های WDBC1 جمع آوری شده شامل 30 پارامتر است که-1 در سال 1995 از تصاویر دیجیتال توسط ویلیام ولبرگ جمع آوری شده از بیماران دارای سرطان و معمولی ایجاد شده است. این داده ها شامل 10 ویژگی مختلف همراه با میانگین، انحراف معیار و بزرگترین مقدار می باشد. ده ویژگی عبارتند از:تعداد کل بیماران 569 عدد می باشد که - 37 - 212 عدد آنها سرطان دارند و - 63 - 357 عدد آنها سرطان ندارند.بطور مجزا هر دو سری داده مربوط به بیماران به سه قسمت تقسیم بندی شدند. سری اول مربوط به آموزش شبکه، سری دوم مربوط به تست شبکه و سری سوم مربوط به اصلاح سازی شبکه می باشد. انتخاب این داده ها بصورت رندوم انجام گرفت و هیچ تفکری در انتخاب آنها نبود. به این طریق تقسیم بندی ها مطابق جدول - 1 - انجام گرفت.

2-2 پیش پردازش دادهها

از آنجا که مقادیر ورودی شبکه عصبی ممکن است دارای پراکندگی زیاد باشد، که این پراکندگی باعث می شود که شبکه نتواند جواب مطلوبی بدهد. برای جلوگیری از این پراکندگی باید مقادیر ورودی را به رنج خاصی محدود کرد که این کار نرمال سازی نام دارد. نرمال سازی بردارها بسیار مفید و مطلوب خواهد بود. این کار سبب می شود که تغییرات بردارها در همه ابعاد فضای بردار ورودی، یکسان باشد.روش نرمال سازی که در این تحقیق از آن استفاده می شود به صورت زیر است:محاسبه انحراف استاندارد مولفههای متناظر همه بردارهای ورودی مجموعه آموزشی و تقسیم همه مولفهها بر انحراف استاندارد محاسبه شده؛ بنابراین داده ها با استفاده از تابع نرمالساز بین 1-0 نرمالسازی شدند. این عمل برای همه داده های آموزش، تست و اصلاح سازی استفاده شد.

3-2 ساختمان شبکه عصبی پس انتشار

BP استاندارد یک الگوریتم با کاهش شیب می باشد که در آن وزنهای شبکه در جهت خلاف شیب کارایی حرکت میکند. لغت پس انتشار به رفتار شبکه BP در محاسبه شیب در شبکه های غیر خطی چند لایه اشاره دارد. الگوریتم های مختلفی وجود دارند که بر مبنای این الگوریتم استاندارد عمل میکنند، از جمله این الگوریتمها به الگوریتم گرادیان توام میتوان اشاره نمود. بنابراین در این تحقیق از شبکه با تعداد لایه های مختلف با الگوریتم های مختلف آموزشی استفاده شد. معیار انتخاب شبکه مناسب میانگین مربعات خطا - MSE - و سرعت شبکه بود.جهت طراحی شبکه از دستور newff استفاده شد، سایر پارامترهای شبکه به گونهای طرح ریزی شدند که درهر بار اجرای برنامه از کاربرگرفته میشوند. از توابع آموزشی نرم افزار مطلب استفاده شد. الگوریتمهای مختلف آموزشی - جدول - 2 با شرایط مشابه برای داده ها مورد تست و ارزیابی قرار گرفتند و شبکه های مختلفی مورد تست و ارزیابی قرار گرفت.

بعد از تکرار توابع آموزشی مختلف بهترین تابع آموزشی trainlm بدست آمد. بعنوان نمونه تابع trainlm برای شبکه دو لایه با تابع انتقال مشابه تقریبا دارای MSE ، 0,05 شد در حالیکه برای تابع traincgb برابر 0,1 ، برای تابع trainbfg برابر 0,12 و برای تابع traincgf برابر 0,142 شد. بطورکلی برای اکثر توابع دقت کمتر از تابع trainlm شد، البته برای تابع traincgb سرعت شبکه بهتر از تابع trainlm بدست آمد. در این تحقیق با تکرارهای مختلف تعداد لایه ها و تعداد نرون ها در هر لایه تغییر داده شدند. طبق بررسی های انجام شده تعداد 30 و 18عدد نرون در هر لایه معمولاً بهترین دقت ها را برای داده های ما ارائه داد.

بنابراین ما برای همه الگوریتم های آموزشی این تعداد نرون ها را بررسی نمودیم. در 30 نرون دقت ها خیلی بهتر بود ولی زمان اجرا نیز بیشتر بود اما با کاهش نرون سرعت بهتر شده و دقت هم کاهش می یابد. در ضمن LM بهترین دقت را داشت و در ضمن سرعت مناسبی نیز ارائه داد، بنابراین در این تحقیق از تابع trainlm بعنوان تابع آموزش دهنده شبکه ها استفاده شد.هر شبکه دارای پارامترهایی است که در این تحقیق بصورت تجربی و بر اساس سعی و خطا بدست آورده شدند. این پارامترها نسبت به پارامترها توابع انتقال، تعداد نرون و تعداد لایه ها اثر کمتری بر
شبکه ها داشتند. با تکرار این مقادیر را در شبکه ها بصورت زیر انتخاب کردیم:

4-2 منحنی مشخصه عملکرد

منحنیهای ROC2 در سال 1950 توسعه پیدا کردند، اولین بار برای تشخیص سیگنال رادیویی دارای نویز بکار رفت. اخیراً معلوم شده است که این منحنی ها در تصمیم گیری پزشکی کاربردهای قابل توجهی پیدا کردهاند. یک منحنی ROC ، یک نمودار گرافیکی است که عملکرد یک سیستم طبقه بندی باینری را بوسیله تفکیک پذیری این سیستم توضیح میدهد. منحنی های ROC در حقیقت یک پارامتر است که کیفیت و دقت کلاس بندی را نشان می دهد. این نمودار رابطه بین چهار پارامتر TP، FP، TN و FN را بیان می کند.

TP - مثبت واقعی - : تشخیص های درست سرطان سینه در بیماران با استفاده از نتایج شبکه عصبی.

FP - مثبت کاذب - : تشخیص غلط سرطان سینه در بیماران - بیمار سرطان ندارد ولی شبکه عصبی آنرا در مجموعه بیماران سرطانی قرار داده است - .

TN - منفی واقعی - : تشخیص درست نبود سرطان سینه در بیماران با استفاده از نتایج شبکه عصبی.

FN - منفی کاذب - : تشخیص غلط سرطان در بیمار - تشخیص سرطان در شخص در حالیکه واقعاً سرطان ندارد - .

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید