بخشی از مقاله
*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***
معرفي يک شبکه عصبي فازي جهت طبقه بندي انواع سرطان سينه
چکيده — سرطان سينه يکي از شايع ترين سرطان ها ميان زنان است . براي تشخيص به موقع بدخيم يا خوش خيم بودن يک توده سرطاني معرفي يک سيستم هوشمند دقيق و مطمئن ضروري است . در اين مقاله يک سيستم هوشمند که شامل يک شبکه فازي- عصبي است را معرفي مي کنيم . اين سيستم شامل دو قسمت اصلي مي باشد يکي سيستم فازي و ديگري شبکه عصبي است . وظيفه سيستم فازي تهيه ورودي براي شبکه عصبي است و وظيفه شبکه عصبي نيز کشف قواعد فازي و سپس نتيجه گيري مناسب از آنها براي انجام بهترين طبقه بندي است .براي ارزيابي عملکرد اين سيستم هوشمند از مجموعه داده هاي سرطان سينه WDBC1 استفاده شده است . نتايج حاصل از اين پژوهش نشان مي دهد که سيستم طبقه بندي داده ها در شناخت سرطان سينه داراي دقت بالايي مي باشد و مي تواند به عنوان ابزاري براي کمک به علم پزشکي به کار رود.
کلمات کليدي : سرطان سينه ، سيستم فازي، شبکه عصبي، طبقه بنديکننده
١. مقدمه
امروزه درصد قابل توجهي از آمار بالاي مرگ و مير در زنان کشور به سرطان سينه اختصاص مي يابد آمارها افزايش ابتلا و کاهش سن ابتلا به سرطان سينه در ايران را خبر ميدهند. بنا بر آمار، از هر چهار زن يکي به سرطان سينه مبتلا ميشود[١]. تجزيه و تحليل داده هاي اخير نشان داده است شانس زنده ماندن بيماري که حداکثر ٥ سال از اولين تقسيم سلولي سرطاني در او ميگذرد٨٨% ودر بيماري که ١٠سال ازاولين تقسيم سلولي سرطاني دراو ميگذرد ٨٠% مي باشد[٢]. پس يک نياز ضروري ارائه يک سيستم دقيق براي تشخيص به موقع خوش خيم يا بدخيم بودن توده هاي سرطاني کشف شده مي باشد[٣]. در صورتي که نتايج معاينات و تصويربرداري هاي پستان غيرطبيعي باشند، قدم بعدي نمونه برداري از توده جهت ارسال به آزمايشگاه وبررسي ميکروسکوپي سلول هاي آن است .روش هاي مختلفي براي نمونه برداري وجود دارند که يکي از روشها نمونه برداري به کمک جراحي مي باشد. اين روش بسيار دقيق اما تهاجمي و پر هزينه است [٤]. روش ديگرآزمايش آسپيراسيون سوزني ٢(FNA) است ، در بسياري از موارد به عنوان قدم اول در تشخيص يک توده پستاني، که مشکلات روش قبلي را ندارد[٥]و اين روش بسيار آسان و ارزان است و حتي نيازي به بي حسي ندارد[٦ ]. تحقيقات زيادي در رابطه با تشخيص سرطان پستان به کمک تکنيک هاي يادگيري ماشيني صورت گرفته است که در اين ميان به مطالعات انجام شده روي پايگاه داده Wisconsin Data (WDBC)Set Breast Cancer مي پردازيم [٧].گروهي از دانشمندان يک سيستم هوشمند ترکيبي که از شبکه هاي عصبي فازي min-max براي آموزش شبکه عصبي و ازدرخت تصميم رگرسيون ٣ براي کلاسه بندي وبراي انتخاب بهترين درخت تصميم ازجنگل تصادفي ٤ (RF) استفاده کردند و براي ارزيابي از داده هاي سرطان سينه استفاده کردند و بااين روش به دقت
٩٨.٨٤% دست يافتند[٨].انتخاب ويژگي ها که نقش مهمي در طبقه بندي دارد را بر اساس آنتروپي فازي انجام داد. اين روش در مقايسه با ساير روش ها نشان داد دقت طبقه بندي به ٩٧.١٨% رسيده است [٩], براي طبقه بندي داده هاي سرطان از سيستم هاي فازي زباني استفاده کرده اند که نتايج بدست آمده حاکي از آن است که در بيش از ٩٥% موارد نسبت به روش هاي آماري از دقت و صحت بالاتري در دسته بندي برخوردار است [١٠].
در اين مقاله ما نيز يک شبکه فازي –عصبي معرفي کرده ايم که به طبقه بندي سرطان سينه پرداخته که دقت پيش بيني آن ٩٩.٢% مي باشد و نسبت به ساير روش هاي مطالعه شده مطلوب تر است .
٢. مدل توصيفي
٢,١. سيستم فازي
سيستم فازي براي در اختيار گرفتن مفهوم عدم قطعيت يک چهار چوب بسيار
دقيق ايجاد مي کند . برخي از مفاهيم اساسي سيستم هاي فازي عبارتند از : متغيرهاي زباني
يکي از اساسي ترين عناصر در سيستم هاي فازي مفهوم متغير زباني مي باشد يعني متغيري که به جاي اعداد مقاديرش واژه است . واژه ها به وسيله مجموعه هاي فازي در محدوده اي که متغيرها تعريف شده اند مشخص مي شود.
يک متغير زباني را با پنج پارامتر به صورت نمايش مي دهيم .
X : نام متغير زباني
: مجموعه مقادير زباني است که X انتخاب مي کند.
U : دامنه فيزيکي واقعي است که در آن ، متغير زباني X مقادير کمي خود را انتخاب مي کند (مجموعه مرجع ).
G : گرامري که بر طبق آن ، مقادير مختلف متغير زباني توليد مي شود.
M : قاعده اي لغوي که مقادير زباني در T را به يک مجموعه فازي در U مرتبط مي سازد، (تابع عضويت ).
با معرفي متغيرهاي زباني ما قادر خواهيم بود توصيف هاي مبهم و نامعلوم در زبان هاي طبيعي را در مباحث رياضي فرموله کنيم .
مجموعه فازي :
مجموعه اي بدون مرزهايي واضح يا بدون ويژگي عضويت دو دويي(باينري) در واقع برخلاف مجموعه هاي حقيقي (crips) که در آن هر شي يا عنصر يا متعلق به مجموعه هست يا نيست در يک مجموعه فازي درجات نسبي عضويت عناصر ممکن است .
يا به عبارت ديگر نرمي در ارتباط با عضويت عناصر در يک مجموعه فازي تعريف شده و ميزان عضويت عناصر در مجموعه هاي فازي بين صفر و يک متغير است . در واقع مجموعه هاي حقيقي حالت خاصي از مجموعه هاي فازي هستند
تابع عضويت :
هر مجموعه فازي مي تواند توسط يک تابع عضويت نشان داده شود که است . اگر درجه عضويت aدر مجموعه فازي xبيانگر درجه عضويت عنصر يک عنصر از مجموعه فازي برابر با صفر باشد آن عضو کاملا از مجموعه خارج است و اگر درجه عضويت يک عضو برابر با يک باشد آن عضو کاملا در مجموعه قرار ميگيرد . اگر درجه عضويت يک عنصر مابين صفر و يک باشد اين عنصر درجه عضويت نسبي دارد.
فازي سازي :
فازي سازي به عنوان نگاشتي از يک نقطه به يک مجموعه فازي A در U تعريف شده است . فازي سازي بايد اين حقيقت را در نظر بگيريد که ورودي در نقطه X حقيقي است اما مجموعه فازي A بايد در نقطه X مقدار تعلق به غير از صفر نيز داشته باشد.
٢,٢. شبکه عصبي :
الگويي براي پردازش اطلاعات ميباشند که شبکه هاي عصبي مصنوعي با تقليد از شبکه هاي عصبي بيولوژيکي مثل مغز انسان ساخته شده اند.
عنصر کليدي اين الگو ساختارجديد سيستم پردازش اطلاعات آن ميباشد و از تعداد زيادي عناصر (نرون ) با ارتباطات قوي داخلي که هماهنگ با هم براي حل مسائل مخصوص کار ميکنند تشکيل شده اند. شبکه هاي عصبي با توانايي قابل توجه خود در استنتاج نتايج از داده هاي پيچيده و مبهم ميتوانند در استخراج الگوها و شناسايي گرايش هاي مختلفي که براي انسان ها و کامپيوتر شناسايي آنها بسيار دشوار است استفاده شوند[١١].
٢,٣. شبکه هاي فازي عصبي
تلفيق شبکه هاي عصبي - مصنوعي با مفاهيم و کاربردهاي سيستم هاي فازي به ايجاد سيستم هاي فازي – عصبي مي انجامد. دو مدل براي سيستم هاي فازي- عصبي ارائه شده است :
سيستم هايي براي پاسخ به اظهارات زباني، که بلوک رابط فازي (بردار ورودي )براي شبکه عصبي چند لايه را فراهم ميکند، که شبکه عصبي مي تواند براي تعيين خروجي يا تصميم گيري در مورد ورودي ها استفاده شود .
سيستم هاي فازي که ورودي آنها را شبکه عصبي چند لايه تهيه مي کند و سيستم فازي مي تواند براي تعيين خروجي يا تصميم گيري در مورد ورودي ها به استتنتاج از ورودي ها بپردازد .
لازم به ذکر است در عمل سيستم هاي فازي و شبکه هاي عصبي هر کدام مزايا و معايب خود را دارد.
رفتار سيستم هاي فازي نسبت به شبکه هاي عصبي مطلوب تر است ، زيرا اين سيستم ها را مي توان با استفاده از قوانين فازي که برگرفته از اظهارات بياني مي باشند، تحليل کرد.اما از آنجا که براي هر متغير ورودي مي بايست مجموعه مرجع را به چندين زيربازه کوچک تقسيم کرد و همچنين برنامه هاي کاربردي در سيستم هاي فازي محدود به دانش افراد خبره مي باشد، کسب دانش از اظهارات بياني دشوار است ؛ پس با استفاده از شبکه هاي عصبي به صورت خودکار به کسب قوانين فازي از داده هاي عددي مي پردازيم ، براي استفاده از مزاياي هر دو تکنيک به ترکيب آنها مي پردازيم وبه کار مي بنديم [١٢].
٣. طبقه بندي کننده فازي - عصبي :
پس ازمطالعه روي سيستم هاي موجود، سيستم پيشنهادي به گونه اي که در « شکل ١ » نمايان شده است سازماندهي گرديدکه يکي از مناسب ترين روش ها جهت طبقه بندي کننده ها مي باشد . ورودي فازي را به هدف حقيقي نسبت مي دهد. قبل از پرداختن به نتيجه ، بحث کامل راجع به اجزاي سيستم پيشنهادي ضروري است . اين بحث را در دو زير مجموعه انجام مي دهيم .
٣,١. سيستم فازي
به عنوان يک اصل اساسي، مشخص کردن ورودي ها در سيستم هاي فازي با استفاده از متغير هاي زباني صورت مي گيرد. همانطور که قبلا اشاره شد هر متغير زباني با چهار پارامتر(X,T,U,M) مشخص مي شود.
استخراج FNAدر اين تحقيق هر کدام از ويژگي ها که توسط آزمايش شده اند يک متغير زباني مي باشند. مجموعه مقادير زباني که روي هر کدام از اين متغير ها تعريف شده اند عبارتند از:
مقادير عددي که بعد از انجام آزمايش و نرمال سازي نتايج به هر يک از قرار دارد حال ما [ ١١٠]=Uويژگي ها اختصاص داده شده است در بازه مي توانيم بيان کنيم :
خيلي کم يعني يکي از ويژگي ها مثلا ضخامت توده مي باشد)
کم يعني
متوسط کم يعني متوسط يعن
زياد يعني
خيلي زياد يعني
اما از آنجا که با توجه به واژه ها و بيانات ذهني و زباني نمي توان مجموعه ها را کاملا از هم تفکيک کرد، در چنين حالتي متغيرهاي فازي بوجود مي آيند.
تعريف ١: فرض کنيدx R و را يک متغير فازي روي x گويند اگر
مي دانيم که اجتماع متغير فازي مجموع مرجع را ايجاد مي کند ولي بر خلاف مجموعه هاي حقيقي اشتراک بين متغيرهاي فازي تهي نيست .
« شکل ٢ » متغير فازي مورد استفاده در اين تحقيق را نشان مي دهد.