بخشی از مقاله
خلاصه
یکی از خطراتی که زنان را به شدت تهدید می کند، سرطان سینه می باشد. درصورتی که بتوان این توموررا درسینه تشخیص داد، شانس زندگی فرد به صورت سالم و عادی بیشتر خواهد بود، از این رو ساخت سامانه هایی جهت تشخیص این نوع سرطان، مانند سامانه های تشخیص درحوزه های دیگر پزشکی امری بسیار حیاتی
محسوب میگردد. شبکه های عصبی مصنوعی دریک محدوده وسیعی ازمسائل کلاس بندی داده استفاده می شوند. الگوریتم پس انتشار تکنیک طبقه بندی استفاده شده در آموزش شبکه عصبی مصنوعی می باشد. از آنجا که این الگوریتم تعدادی معایب دارد، کلاس بندی باشبکه عصبی مبتنی برروش گروهی جابجایی داده ها پیاده سازی شده است. بنابراین این دو روش در کلاس بندی سرطان سینه خوش خیم وبدخیم با هم ارزیابی می شود.
نتایج حاصل از این پژوهش نشان می دهد که نرخ دقت برای تشخیص خوش خیم بودن و یا بد خیم بودن سرطان سینه %99.3 توسط شبکه عصبی مبتنی بر روش گروهی جابه جایی داده ها می باشد؛ که نسبت به نتایج بدست آمده الگوریتم آموزشی پس انتشار عملکرد بهتری در تشخیص بیماری سرطان سینه دارد.
کلمات کلیدی: شبکه عصبی مصنوعی، کلاس بندی، پس انتشار، روش گروهی جابجایی داده ها
مقدمه
در حدود 40030 مرگ ناشی از سرطان در ایالات متحده آمریکا درسال 2013 توسط انجمن سرطان آمریکا پیش بینی شده است 620 - ،39 زنان و 410مردان - . سرطان سینه به تکثیر غیر طبیعی سلول ها در بافت سینه اشاره دارد دومین علت شایع مرگ و میر در زنان بعد از سرطان ریه است. از سال 1989، نرخ مرگ و میر از سرطان سینه در زنان جوان با سن زیر پنجاه سال به شدت کاهش یافته است . چنین نرخ مرگ ومیر کاهش داده شده ای می تواند به تشخیص اولیه و درمان موثر مربوط شود.
سرطان سینه یکی از شایع ترین انواع سرطان است که در مراحل اولیه بیماری، قابل درمان است. درمان و علل سرطان سینه هنوز مورد تحقیق وبررسی است و از آنجا که هیچ روش پیشگیری در دسترس نیست، شناسایی وتشخیص زود هنگام این بیماری برای بهبودی کامل بسیار مهم وکلیدی می باشد در حقیقت قدم اول برای درمان، تشخیص آن می باشدوبه همین دلیل به دنبال راهکار به منظور شناسایی زود هنگام این بیماری نتیجه تحقیقات را از روی داده های مربوط به بیماران متعلق به دانشکده پزشکی ویسکانسین4 مورد آزمون وبررسی قرار گرفت.
در حوزه یادگیری ماشین ، روش های بسیاری برای کلاس بندی سرطان سینه ارائه شده است. در این مقاله دو روش الگوریتم پس انتشار و روش گروهی جابجایی داده ها را به تفصیل بیان می کنیم. ساختار این مقاله به شرح زیر است: در بخش 2کارهای انجام شده درزمینه استفاده از الگوریتم های یادگیری ماشین در تشخیص سرطان سینه مرور خواهد شد در بخش به بررسی الگوریتم پس انتشار و روش گروهی جابجایی داده ها پرداخته می شود.. سپس در بخش 4کارآیی روش های مذکور مقایسه می شود و در بخش 5 نتیجه این مقاله ارائه خواهد شد.
مروری برکارهای انجام شده
استفاده از تکنیک های یادگیری ماشین در تشخیص پزشکی به تدریج افزایش می یابد .تکنیک های داده کاوی و محاسبات نرم ، برای استخراج قوانین والگوها از مجموعه داده های مختلف به کار برده شده اند .تعدادی از این تکنیک ها ، نتایج بسیار خوبی را در مشکلات طبقه بندی ، نشان داده اند که می توانند در شناخت بیماری ها به کارشناسان پزشکی کمک کنند. هامیلتون و همکاران با استفاده از الگوریتم RIAC به دقت %96 دست یافته اند.در این روش از قانون استنتاج از طریق کلاس بندی تقریبی برای استنتاج کردن قوانین از نمونه های مبتنی بر تئوری مجموعه ناهنجار استفاده می شود.
کوئین لان با استفاده از الگوریتم درخت تصمیم به دقت %94,74 دست یافت یک سیستمی است که کلاس بند درخت تصمیم را یاد می گیرد. C4.5 از رویکرد تقسیم و تسخیر برای توسعه دادن درخت تصمیم استفاده می کند که توسط هان ، مارین واستون در سال 1996 پیشگام شد. پنا ریس دقت بدست آمده با استفاده از روش بدست آورد.در این روش از ترکیب روش فازی و الگوریتم تکاملی برای ارائه سیستم های تشخیص به طور اتوماتیک استفاده می شود . این روش بنابر دو ویژگی استفاده می شود : اولا ، آنها عملکرد کلاس بندی بالایی دارند ، ثانیا نتایج سیستم ها شامل چند قانون ساده وبنابراین تفسیری هستند.جان آبونی با استفاده از تکنیک خوشه بندی فازی با ناظر به دقت %95,57 دست یافته است .
این کلاس بند می تواند به عنوان یک بسط از کلاس بند بیز درجه دوم در نظر گرفته شود . متغیرهای ورودی مربوط به خوشه بندی فازی مبتنی برآنالیز خوشه توسط فیشر باتفکیک معین درون کلاس انتخاب شده اند.پائولین از شبکه عصبی پیش خور و الگوریتم پس انتشار برای آموزش شبکه عصبی استفاده کرد.عملکرد شبکه با مجموعه داده سرطان سینه ویسکانسین برای الگوریتم های آموزشی مختلف ارزیابی شده است و بالاترین دقت %99,28 مربوط به الگوریتم چندجمله ای لونبرگ می باشد. لاوانیا با استفاده از الگوریتم درخت تصمیم به دقت کلاس بندی %92,97رسید.
در این مقاله آنالیز عملکرد با کلاس بند درخت تصمیم CART و بدون انتخاب ویژگی انجام شده است. آرپیت بی هاردواج الگوریتم GONN5 را ارائه داد که دقت آن با داده های تست و آموزش به مقدار 50 به 50 برابر -98,24 97,73درصد می باشد. در این مقاله از یک روش جدید به نام شبکه عصبی بهینه شده ژنتیکی برای حل مشکلات کلاس بندی استفاده شده است. عملگرهای قطع و جهش جدید را معرفی می کند که از عملگرهای قطع وجهش استاندارد متفاوت است.
الگوریتم پس انتشار
شبکه عصبی پیشخور از شبکه های عصبی بیولوژیکی الهام گرفته شده و متشکل از تعداد زیادی واحد که سلول های عصبی مصنوعی نامیده می شوند می باشد که توسط لینک های وزن دار متصل شده اند. این واحدها باتعداد لایه ها مرتب شده اند، به نامهای یک لایه ورودی، یک یا چند لایه مخفی و یک لایه خروجی. k تعداد کل لایه ها در یک شبکه و تعداد کل واحدها در l امین لایه لایه ام لایه ورودی، لایه kام لایه خروجی و لایه بین 0 و k لایه مخفی می باشد.