بخشی از مقاله
چکیده. پیشبینی و تشخیص سرطان سینه براساس دادههای پیشین را میتوان در دسته مسایلNP قرار داد و روشهای هوشمند از جمله سیستمهای خبره راهکارهایی نوینی در یافتن پاسخ اینگونه مسایل است که در دهههای اخیر مورد توجه قرار گرفته است. در این پژوهش دادههای 1200 بیمار سرطان سینه زنان ، بیمارستان امید مورد مطالعه بوده که از 30 ویژگی مهم در تشخیص و پیشبینی سرطان سینه، پس از مطالعه و استخراج نظرات خبره پزشکی، 25 ویژگی اصلی انتخاب و حجم داده 4,320,000 فیلد جهت ورود به سه سیستم دادهکاوی یعنی SVM - ، شبکه عصبی MLP و سیستم خبره طراحی شده با CLIPS که دارای 964 قانون بود - ایجاد گردید. نتایج تحقیق نشان از کارایی بالاتر سیستم خبره از دیگر روشهای داده کاوی داشته است به گونهای است که صحت 0/965 عملیات پیشبینی و تشخیص سرطان سینه را با استفاده از سیستمهای خبره، قدرت این روش دادهکاوی را نسبت به دو روش دیگر، نمایان ساخت.
. 1 مقدمه
پیچیدگیهای محاسباتی مسائل، آنها را در دستهبندی های مختلفی قرار میدهد که شاید هنوز نتوان به طور مشخص یک دستهبندی استاندارد برای مسایل در نظریه پیچیدگی محاسباتی قائل بود.مسایل غیر قطعی1 گونهای عمده از این گونه مسائل هستند . بسیاری از مسایل مربوط به پیشبینی یک فرایند، مسائل NP هستند که سیستم خبره در داده کاوی میتواند یک روش هوشمند جهت پیشبینی فرایندهای غیرقطعی باشد.
یعنی پیشبینی وضعیت آینده در ابعاد مختلف مبتنی بر وقایع گذشته و حال را انجام دهد به صورتی که استخراج دانش توسط داده کاوی و اعلام نتیجه بر عهده سیستم خبره باشد.اخیرا استفاده از داده کاوی در حوزه پزشکی مورد توجه زیادی قرار گرفته است. معمولا محیط پزشکی غنی از اطلاعات است در حالی که نیازمند دانش می باشد. تکنیک های داده کاوی میتوانند برای کشف دانش مورد نیاز استفاده شوند.
[1] رشد سریع پایگاه های داده پزشکی در کشورهای پیشرفته، انگیزه ای شده است برای اینکه محققین پزشکی از تکنیک های داده کاوی برای استخراج دانش از این پایگاه داده ها استفاده کنند.[2] سرطان پستان2 یا چنگار پستان یکی از سرطانهای شایع است .طبق محاسبات انستیتو ملی سرطان ایالات متحده آمریکا، از هر هشت زن یک نفر در زندگی خود مبتلا به سرطان پستان میشود. این سرطان درصورتی که به موقع تشخیص داده شود به راحتی قابل درمان است.
[3] در صورت متمرکز بودن بافتسرطانی معمولاً از ترکیبی از عمل جراحی - لامپکتومی - ، شیمی درمانی، و رادیوتراپی استفاده میگردد . ماموگرافی نیز در تشخیص این بیماری نقش محوری دارد. عموما تشخیص سریع سرطان سینه نیازمند آزمایشات دقیق و تشخیص پزشک خبره می باشد.[6] به گزارش سازمان بهداشت جهانی 3 تنها در سال 2014 در ایران 9795 بر اثر این بیماری جان خود را از دست دادهاند . شکل 1 و 2 وضعیت مرگ و میر ناشی از سرطان وهمچنین میزان مرگ و میر ناشی از سرطان سینه در ایران در سال 2014 نشان میدهد.
تعداد مرگ و میر ناشی از سرطان در ایزان،سال [7]2014
روشهای سیستمهای خبره در داده کاوی میتوانند به کاهش تعداد پاسخها و نتایج مثبت کاذب و منفی کاذب در تصمیم گیری پزشکان کمک کنند[8,9]در نتیجه، رویکردهای جدید مانند کشف دانش از پایگاه داده - KDD - ،که شامل تکنیکهای داده کاوی هستند، روز به روز محبوبیت بیشتری یافته و تبدیل به یک ابزار تحقیقاتی مطلوب برای پژوهشگران علوم پزشکی شده اند. به کمک آنها پژوهشگران میتوانند الگوها و روابط بین تعداد زیادی از متغیرها را شناسایی کرده و پیش بینی نتایج حاصل از یک بیماری با استفاده از ذخایر اطلاعاتی موجود در پایگاههای داده برای آنها امکان پذیر گشته است.
[10] بررسیها و مطالعات گوناگونی در زمینه مشکلات ناشی از پیش بینی بقای بیماران مبتلا به سرطان پستان، با استفاده از روشهای آماری و شبکههای عصبی مصنوعی صورت گرفته، اما فقط تعداد کمی از مطالعات حوزه پزشکی در زمینه تشخیص سرطان با استفاده از روشهای خبره در داده کاوی انجام شده است[11] بنابراین تشخیص سرطان سینه با استفاده از سیستمهای خبره و مقایسه با دیگر تکنیکهای داده کاوی - شبکه عصبیMLP، ماشین بردار پشتیبان - هدف اصلی این تحقیق میباشد. باتوجه به مطالب گفته شده فرضیه پژوهش به این شکل مطرح میگردد:" در جهت تشخیص سرطان سینه ، سیستمهای خبره نسبت به دیگر روشهای داده کاوی - شبکه عصبیMLP، ماشین بردار پشتیبان - کارایی مناسبی دارند."
دلن و همکاران از شبکه های عصبی مصنوعی، درخت تصمیم گیری و رگرسیون لجستیک برای توسعه مدلهای پیش بینی سرطان پستان با تجزیه و تحلیل پایگاه های بزرگ داده که از پایگاه داده مشهور ویسکانسین - The Surveillance, Epidemiology, and End Results - گردآوری شده بود، بهره جستند . نتایج تحقیقات آنها نشان داد که الگوریتم درخت تصمیم برای استخراج دانش از دادههای موجود مقدم بر سایر روشها بود و نتایج به دست آمده از تحقیق، نزدیک به واقعیت بود.
[12] همچنین یی و فویانگ از ماشین بردار پشتیبان به تنهایی برای کشف الگوهای تشخیص سرطان پستان، از داده های موجود در بیمارستان ویسکانسین استفاده کردند . نتایج به دست آمده نشان داد که SVM برای تشخیص الگوهای سرطان پستان روش مناسبی بود و نتایج به دست آمده با شواهد موجود و واقعی مطابقت داشت.[13] لاندین1 و همکارانش از مدل شبکه های عصبی مصنوعی و رگرسیون لجستیک برای پیش بینی 5، 10 و 15 ساله بقای بیماران مبتلا به سرطان پستان استفاده کردند. آنها 951بیمار مبتلا به سرطان پستان را مورد مطالعه قرار داده و اندازه تومور، وضعیت گره های لنفی، نوع بافت، تشکیل توبول، نکروز تومور و سن را به عنوان متغیرهای ورودی محسوب کردند.
سپس به این نتیجه رسیدند که درختان طبقه بندی و همچنین رگرسیون لجستیک برای تفسیر بالینی بسیار آسانتر است.[14] پندهارکر1 و همکاران از چندین روش داده کاوی برای بررسی الگوهای موجود در سرطان پستان استفاده نمودند. در این مطالعه، آنها نشان دادند که داده کاوی میتواند به عنوان یک ابزار ارزشمند در شناسایی شباهتها - الگوها - در مورد سرطان پستان با هدف تشخیص، پیش آگهی و درمان به کار رود.[15]
.2 جامعه آماری وابزارهای اندازهگیری
این پژوهش بر اساس پرونده پزشکی 1200 بیمار، بیمارستان سرطانی امید ارومیه تهیه گردید است و با توجه به وجود 30 متغیر موثر در تشخیص سرطان سینه، حجم اطلاعاتی بالغ بر 4,320,000فیلد جهت عملیات دادهکاوی وجود خواهند داشت. Toolbox شبکههای عصبی و SVM در MATLAB و نیز پیاده سازی سیستم خبره در محیط CLIPS، ابزارهای این پژوهش جهت تشخیص سرطان سینه می باشند. در این پژوهش استفاده از 30 عامل موثر در تشخیص سرطان سینه که براساس نظر پزشکان خبره و استانداردهای سازمان بهداشت جهانی استخراج گردیده است و همچنین استخراج اطلاعات 1200 بیمار بیمارستان امید ارومیه، حجم اطلاعاتی بزرگی را پدید آورده است که داده کاوی این حجم اطلاعات در خصوص تشخیص سرطان سینه تا کنون سابقه نداشته است.
.3 متریال و متد
همانگونه که اشاره شد، مجموعه سیستمهای خبره یکی از موفقترین راهحلهای تقریبی برای مسائل کلاسیک هوش مصنوعی است. یک برنامه کامپیوتری هوشمند که از دانش و روشهای استنتاج برای حل مسائلی استفاده میکند که به دلیل مشکل بودن، نیاز به تجربه و مهارت انسان دارند.
شکل:3 ساختار یک سیستم خبره[4]
میتوان از دانش چندین فرد خبره به طور همزمان و یا پیوسته برای رسیدن به حل یک مساله در هر زمان استفاده کرد. در این صورت سطح دانش و تخصصی که از ترکیب دانش چند فرد خبره به دست میآید از سطح دانش یک فرد خبره بیشتر است. دربرخی موارد اضطراری به پاسخی سریعتر از پاسخ انسان نیاز است و سیستم خبره که بتواند بلادرنگ پاسخ دهد مطلوب است.همچنین سیستمهای خبره میتوانند به روش هوشمندانه از یک بانک اطلاعاتی استفاده کنند.[4] میتوان ویژگیهای مهم سیستم خبره این گونه بیان نمود:
-1 سیستم خبره برای تقریب توابع گسسته به کار میرود. -2 نسبت به نویز داده های ورودی مقاوم است. -3 برای دادههای با حجم بالا کاراست از این رو در داده کاوی استفاده میشود. -4 میتوان سیستم خبره را به صورت درختی از قوانین if-then نمایش داد که برای استفاده قابل فهم است. -5 امکان ترکیب عطفی - - AND و فصلی - - OR فرضیهها را میدهد. -6 در مواردی که مثالهای آموزشی فاقد همه ویژگیها هستند نیز قابل استفاده است[15] در این پژوهش، در کنار سیستم خبره دو روش داده کاوی یعنی ماشین بردار پشتیبان و شبکههای عصبی مصنوعی برای تشخیص سرطان پستان
تجزیه و تحلیل شد و بهترین راهکار در تشخیص سرطان سینه شناسایی گردید. دادههایی که از بیماران سرطان سینه در بیمارستان امید ارومیه جمع آوری گردید مربوط به سالهای 1390 تا 1395 بود. پایگاه داده قبل از پردازش شامل 1200 نمونه و 30 ویژگی اولیه بود که پس از پردازش اولیه، تمیز کردن دادهها، نهایتا 4,320,000فیلد اطلاعاتی که همگی 25 ویژگی از جدول1 را دارا بودند، باقی ماند.