بخشی از مقاله

خلاصه

خوشه بندی K-means یکی از روشهای پایه خوشهبندی است. این روش بر اساس کمترین فاصلهی هر داده از مرکز یک خوشه - میانگین - خوشهبندی را انجام میدهد. الگوریتم K-means دارای یک پارامتر K است که نمایندهی تعداد خوشهها میباشد. شبکههای همگشتی با الهام از نتایج بدست آمده از مطالعه بر روی لایه بینایی مغز حیوانات طراحی شده است. این شبکهها از سه نوع لایه مختلف تشکیل شدهاند که به ترتیب عبارتند از لایه همگشت، لایه تابع غیر خطی و لایه ادغام. در این مطالعه خوشه بندی تصاویر MR مغزی با استفاده از خوشهبندی K- Means انجام شده و در فرآیند آموزش از یک شبکه عصبی همگشتی سه لایه برای تشخیص تصاویر MR مغزی استفاده شد. نتایج حاصل از شبیهسازی بر روی بستر سخت افزاری GPU نشان از عملکرد مناسب این مدل در تشخیص تصاویر MR مغزی داشت.

کلمات کلیدی: خوشه بندی، خوشه بندی K-means، شبکه عصبی همگشتی، MRI، تصاویر MR

.1 مقدمه

خوشهبندی را میتوان به عنوان مهمترین مسئله در یادگیری بدون نظارت در نظر گرفت.[1] خوشه به مجموعهای از دادهها گفته میشود که به هم شباهت داشته باشند. در خوشهبندی سعی میشود تا داده ها به خوشههایی تقسیم شوند که شباهت بین دادههای درون هر خوشه حداکثر و شباهت بین دادههای درون خوشههای متفاوت حداقل شود K- .[2] Means یکی از ساده ترین الگوریتم های یادگیری بدون نظارت است که مسائل کلاسترینگ معروف را حل می کند .[3] این الگوریتم از یک شیوه ساده برای خوشه بندی یک مجموعه داده در یک تعداد از پیش مشخص شده - k - خوشه، استفاده می کند. ایده اصلی تعریف k مرکز برای هر یک از کلاسترها میباشد.

شبکههای عصبی همگشتی 1 - CNN - ، نوعی شبکه چند لایه پرسپترونی - 2MLP - هستند. در شبکههای MLP هر واحد یک محاسبه ساده، یعنی جمع وزندار همه واحدهای ورودی را انجام میدهد. این شبکهها بصورت لایهای سازماندهی شده و هر واحد به همه واحدهای لایه قبل متصل میشود .[4]اساس CNNها عمل همگشتاست. خاصیت اصلی عمل همگشت، استفاده از اتصالات تُنُک3 و در نتیجه دوری جستن از مشکل پارامترهای فراوان است. در اینجا برخلاف MLP هر واحد، فقط به ناحیه محدودی از لایه قبل که میدان پذیرش4 نام دارد متصل است. میدان پذیرش واحدهای مجاور با یکدیگر همپوشانی دارند. به این ترتیب همبستگی مکانی محلی در مدل بکارگرفته میشود. علاوه بر این همه واحدهای متعلق به یک زیرلایه، وزنهای خود را به اشتراک میگذارند.

به این ترتیب هر زیرلایه ویژگی منحصر به فرد خود را آشکارسازی میکند. بنابراین در هر لایه همگشت بمنظور آشکارسازی ویژگیهای متعدد از چند زیرلایه استفاده میشود که هر یک ضرایب فیلتر مختص به خود را دارد. تابع غیر خطی که عموماً در CNNها استفاده می شود، تابع ReLU است که بصورت یکسوساز عمل میکند، بعبارت دیگر به ازایورودی منفی، خروجی صفر و به ازای ورود مثبت، خروجی با ورودی یکسان است [.5]عموماً با افزایش تعداد لایههای همگشت و عمیق کردن شبکه، نتایج بهتری حاصل میشود. لازم به ذکر است، این امر درصورتی محقق میگردد که تمهیدات تنظیمسازی ویژهای مانند تضعیف وزنها و حذف تصادفی در شبکه بکارگرفته شود. مفهوم مهم دیگری که در طراحی CNNها استفاده میشود، ادغام5 است .[6] از ادغام به منظور خلاصهسازی ابعاد استفاده میشود.

برای این منظور مقدار فعالیتها در هر همسایگی بررسی شده و یک مقدار مناسب مانند مقدار بیشینه یا متوسط به عنوان نماینده هر همسایگی درنظر گرفته میشود. با این عمل اطلاعات کم ارزش دور ریخته شده و اطلاعات پر ارزش6 نگاه داشته میشود و کاهش ابعاد بصورت هوشمندانه ایجاد میشود. فوایدی که ادغام میتواند داشته باشد عبارتند از مستقل شدن از تغییرات در مکان و روشنایی سوژهها، مقاوم شدن در برابر شلوغی تصویر و بازنمایی فشرده تصویر ورودی و در نتیجه کاهش محاسبات. از ادغام معمولا بهصورت موردی در خروجی لایههای همگشت استفاده میشود .[7] در این مطالعه از ترکیب روش K- Means و شبکه عصبی همگشتی برای خوشه بندی تصاویر MR مغزی استفاده میشود. سازمان دهی این مطالعه به این ترتیب می باشد که در بخش 2 ، روش پیشنهادی ارائه شده است، نتایج تجربی ارزییِاب روش پیشنهادی در بخش 3 نمایش داده شده است و نتیجه گیری حاصل از این مطالعه در بخش 4 قرار دارد.

.2 روش پیشنهادی

مرحله اول از این مطالعه به معرفی الگوریتم خوشه بندی K-means پرداخته و گام های اجرایی این الگوریتم دربخش 1-2 بحث می شود، سپس پیاده سازی شبکه عصبی همگشتی مغزی دربخش 2-2 به طور کامل مورد بررسی قرار می گیرد.

1-2الگوریتم خوشهبندی K-means

این روش علیرغم سادگی آن یک روش پایه برای بسیاری از روشهای خوشهبندی دیگر - مانند خوشهبندی فازی - محسوب میشود. این روش روشی انحصاری و مسطح محسوب میشود .[8] در نوع ساده ای از این روش ابتدا به تعداد خوشههای مورد نیاز نقاطی به صورت تصادفی انتخاب میشود. سپس در دادهها با توجه با میزان نزدیکی - شباهت - به یکی از این خوشهها نسبت داده میشوند و بدین ترتیب خوشههای جدیدی حاصل میشود. با تکرار همین روال میتوان در هر تکرار با میانگینگیری از دادهها مراکز جدیدی برای آنها محاسبه کرد و مجدادأ دادهها را به خوشههای جدید نسبت داد. این روند تا زمانی ادامه پیدا میکند که دیگر تغییری در دادهها حاصل نشود. تابع زیر به عنوان تابع هدف مطرح است .[9]که معیار فاصله بین نقاط و cj مرکز خوشه j ام است.الگوریتم زیر الگوریتم پایه برای این روش محسوب میشود 10]و .[11

-1 در ابتدا K نقطه به عنوان نقاط مراکز خوشهها انتخاب میشوند.

-2 هر نمونه داده به خوشهای که مرکز آن خوشه کمترین فاصله تا آن داده را داراست، نسبت داده میشود.

-3 بعد از تعلق تمام دادهها به یکی از خوشهها، برای هر خوشه یک نقطه جدید به عنوان مرکز محاسبه میشود. - میانگین نقاط متعلق به هر خوشه -

-4 مراحل 2 و 3 تکرار میشوند تا زمانی که دیگر هیچ تغییری در مراکز خوشهها حاصل نشود.

2-2    پیاده سازی شبکه همگشتی عصبی

شبکههای همگشتی با الهام از نتایج بدست آمده از مطالعه بر روی لایه بینایی مغز حیوانات طراحی شدهاند .[12] این شبکهها از سه نوع لایه مختلف که به ترتیب پشت سر هم قرار داده شده و به دفعات تکرار میشوند، تشکیل شده است .[13] این سه لایه به ترتیب عبارتند از لایه همگشت، لایه تابع غیر خطی و لایه ادغام. در لایه همگشت چند نوع هسته مختلف روی ورودی اعمال میشود و نکته مهم اینکه هستههای مذکور بصورت پراکنده اعمال میشوند و پارامترهای مربوطه به اشتراک گذاشته میشوند. بنابراین بار محاسباتی نسبت به شبکههای عصبی معمولی بشدت کاهش مییابد. استفاده از لایه غیرخطی منجر به تصمیمات غیرخطی شده و به تبع آن توانایی ماشین یادگیرنده بالا میرود.

در اینجا باید تابعی استفاده شود که در عین داشتن خاصیت غیرخطی بالا، مدت زمان آموزش مطلوبی را هم فراهم کند. و بالاخره در لایه ادغام، در محدوده مشخصی ویژگیها بصورتهای مختلف خلاصه میشوند. با این عمل علاوه بر کاهش حجم محاسبات، تحملپذیری ماشین، نسبت به نویز و تغییرات اندک بالا میرود.در این مطالعه شبکه عصبی همگشتی برای آموزش از پنج لایه همگشت، یک لایه خوشه بند و یک لایه اتصال کامل1 تشکیل شده است. در هر لایه همگشت علاوه بر همگشت، از ادغام، یکسوساز ReLU و حذف تصادفی2 بهره گرفته میشود. این معماری در شکل زیر آورده شده است.

دادههای ورودی

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید