بخشی از مقاله

چکیده

روش توموگرافی رایانهای تکفوتونی - SPECT - به عنوان یک ابزار تشخیصی برای بیماران مبتلا به نارسایی عروق کرونری قلب استفاده میشود. تجربه نشان داده است که تجزیه و تحلیل بصری از تصاویر قلبی اغلب به دلیل خستگی و بیتجربگی فرد متخصص متناقض و همچنین مستعد خطا است. به این ترتیب، نیاز به ابزارهایی برای کمک در تشخیص وجود دارد که مبتنی بر تشخیص کامپیوتری با هدف کمک به پزشک است.

دادهکاوی پزشکی با تکیه بر اطلاعات موجود در سوابق پزشکی، به کشف روابط میان دادهها جهت پیشبینی، پیشگیری، تعیین عوامل موثر و درمان بیماریها میپردازد. به این منظور در این مقاله به کمک تکنیکهای دادهکاوی و جستجو، الگوریتمی بر پایه کاهش تعداد نمونهها بر اساس تکنیک خوشهبندی K-means و یافتن عوامل موثر بر پایه الگوریتم جستجوی کرم شبتاب باینری و الگوریتم نزدیکترین همسایه برای تشخیص نارسایی عروق کرونری قلب از روی تصاویر SPECT قلبی بیماران با دقت79,47 درصد ارائه شده است.

مقدمه

توموگرافی رایانهای تکفوتونی - Single Photon Emission Computed Tomography - یا به اصطلاح SPECT، روشی است که در علوم تشخیصی در فیزیک پزشکی بویژه پزشکی هستهای کاربرد فراوانی دارد. به کمک توموگرافی رایانهای تکفوتونی - SPECT - ، میتوان تصاویر سه بعدی از عملکرد یک اورگان مانند قلب را بدست آورد. در تصویربرداری قلبی عروقی SPECT از مواد رادیو اکتیو برای مشخص کردن جریان خون در قلب و رگ-های خونی استفاده میشود. این کارمعمولاٌ در دو مرحله و در یک یا دو روز متفاوت انجام میگیرد. در فاز استراحت ماده رادیو اکتیو در حالت استراحت به بیمار تزریق میشود و پس از گذشت مدت زمانی، تصویربرداری صورت میگیرد.

در فاز فعالیت ابتدا قلب در وضعیت فعالیتی قرار میگیرد. وضعیت فعالیتی میتواند توسط تست ورزش و یا استفاده از داروی محرک قلب صورت گیرد و در حداکثر فعالیت، رادیو دارو تزریق میشود و سپس تصویربرداری مجدد از قلب صورت میگیرد و پس از باز سازی تصاویر توسط سیستم کامپیوتری، جریان خون عضله قلب در حالت فعالیت و استراحت مقایسه میشود و اطلاعاتی در رابطه با گرفتگی عروق، اهمیت بالینی گرفتگی عروق، پیش آگهی بیماران قلبی، وجود یا عدم وجود نسج زنده قلب، امکان و سودمندی اقدام درمانی نظیر عمل جراحی باز قلب و آنژیوپلاستی ارائه میدهد - - Kurgan et al, 2001 - خلیل زاده شرقی و همکاران، . - 1387

بسیاری از روشهای بصری برای کمک به تفسیر تصاویر SPECT توسعه یافتهاند، اما نشان داده شده است که تجزیه و تحلیل بصری از تصاویر به دلیل خستگی و بیتجربگی فرد متخصص اغلب متناقض و مستعد خطا است . - Cuaron et al, 1980 - طب مدرن مقدار بسیار عظیمی از دادههای تصویری را تولید میکند که میتواند تنها با استفاده از نرمافزارهای کامپیوتری تخصصی مورد تجزیه و تحلیل و پردازش قرار بگیرد؛ زیرا تکنیکهای تصویر-برداری مانند توموگرافی رایانهای تکفوتونی - SPECT - ، PET و MRI میتوانند ده هزار بایت از دادهها را در هر روز تولید کنند.

با توجه به حجم عظیم و پیچیدگی دادههای جمعآوری شده، وجود ابزاری کارا به منظور کشف دانش سودمند بیش از پیش مهم جلوه میکند و دادهکاوی یکی از بهترین سناریوها جهت تحقق این هدف است - مشیریان و همکاران، . - 1395 با وجود پیشرفتهایی در دادهکاوی پزشکی، طبقهبندی دادههای پزشکی با چالشهایی مواجه است. در مسائل پردازش تصاویر پزشکی، مجموعه اولیه ویژگیها شامل مجموعه وسیعی از ویژگیهاست که خود بسیاری از ویژگیهای بدرد نخور را نیز شامل میشود. چنین ویژگیهایی نه تنها در طبقه-بندی استفاده نمیشود بلکه گاهی اوقات بازده طبقهبندیکنندهی طراحی شده را کاهش میدهد.

در چنین مواردی، حذف ویژگیهای بدرد نخور دقت طبقهبندی را بهبود میدهد - صدوقی و میکائیلی، . - 1386 در این مقاله الگوریتمی جدید جهت کاهش تعداد نمونهها و ویژگیها، الگوریتم کرم شبتاب باینری، الگوریتم نزدیکترین همسایه با اعتبار سنجی ضربدری ارائه شده است که جهت طبقهبندی دادههای SPECT قلبی به دو دسته نرمال و غیرنرمال با متوسط دقت 79,47 بکار می رود. این مقاله در شش بخش آمده است: بخش دوم شامل مروری بر کار-های انجام شده در رابطه با مجموعه داده SPECT است. در بخش سوم به معرفی پیشنیازهای لازم در رابطه با الگوریتم پیشنهادی میپردازیم. سپس در بخش چهارم روش تحقیق و الگوریتم پیشنهادی بیان میشود. یافتهها و نتایج در بخش پنجم مطرح میشود. بحث و نتیجهگیری در بخش ششم آمده است.

مروری بر کارهای انجام شده
الگوریتم FSFS که مخفف Feature selection using feature similarity میباشد، توسط پابیترا و همکاران در سال 2002 ارائه شد - . - Pabitra et al, 2002 این روش بر اساس اندازهگیری شباهت بین ویژگیهاست که به موجب آن افزونگی در آن حذف شده است. معیار تشابه شاخص تراکم حداکثر اطلاعات نام دارد. در - Sanghamitra et al, - 2014 این الگوریتم برای مجموعه داده SPECT قلبی بکار گرفته شده است و دقتی به میزان%66 در رابطه با طبقه بند نزدیکترین همسایه بدست آمده است.

زایوفی و همکاران در سال 2005 الگوریتم Laplacian - LSFS - Score for Feature Selection را ارائه دادند . - Xiaofei et al, 2005 - در این روش ویژگیها با رتبه بالاتر که بر اساس حداکثر حفظ قدرت محلی توسط نمره لاپلاس محاسبه و انتخاب میشوند. ایده اساسی برای LSFS ایناست که به ساختار محلی داده اولویت بیشتری نسبت به ساختارسراسری مسائل طبقهبندی متعدد داده شده است. در مجموعه داده SPECT قلبی، الگوریتم LSFS برای طبقه بند نزدیکترین همسایه متوسط دقت %69,63 بدست آمده است - Multi  Cluster  Feature  Selection - MCFS - . - Sanghamitra  et  al,  2005 الگوریتم دیگری است

که توسط دنگ و همکاران در سال 2010 پیشنهاد شد . - Deng et al, 2010 - ایده اصلی MCFS این است که بصورت کارا همبستگی بین و ویژگیهای مختلف از یک زیر مجموعه ویژگی کاندید را محاسبه میکند. MCFS برای مجموعه داده SPECT قلبی با الگوریتم نزدیکترین همسایه معیار دقت را با میزان %66,38 ارزیابی میکند. Correlation based Feature Selection - CFS - یا همبستگی بر اساس انتخاب ویژگی، الگوریتمی شامل یک معیار همبستگی مناسب و یک استراتژی جستجوی اکتشافی است. فرضیه اصلی این است که مجموعه ویژگیهای خوب دارای خصوصیاتی است که همبستگی بسیار بالایی با کلاس دارند و با یکدیگر همبستگی ندارند.

دقت این الگوریتم برای دادههای SPECT قلبی %70,21 میباشد . - Bandyopadhyay et al, 2014 - داس و همکاران در سال 2017 یک الگوریتم ژنتیک دو هدفه با آموزش گروهی را برای یافتن زیرمجموعه ویژگی بهینه معرفی نمودند و آن را Ensemble-FSGA نامیدند . - Das et al, 2017 - متوسط دقت بدست آمده برای الگوریتم نزدیکترین همسایه در این مقاله%72,30 میباشد. در مرجع - Das et al, 2017 - برای مجموعه داده SPECT با طبقه بند نزدیکترین همسایه و الگوریتم ازدحام ذرات جهت جستجوی فضای زیر مجموعه ویژگی، زیرمجموعه ویژگی بهینه با دقت %70,11 ارزیابی شده است. همچنین در همان مرجع با الگوریتم ژنتیک و معیار دقت طبقهبند نزدیکترین همسایه به عنوان ارزیاب برای مجموعه داده SPECT میانگین دقت%63,35 را نشان میدهد.

پیشنیازها
در ادامه به معرفی پیشنیازهای مورد نیاز برای الگوریتم پیشنهادی میپردازیم. الگوریتم خوشه بند k-means خوشهبندی یکی از روش های دادهکاوی است که بر اساس یک معیار تشابه نمونههای مختلف را در خوشهها قرار میدهند بطوریکه نمونههای یک گروه مشابهند و نمونههای متعلق به گروههای مختلف مشابه نیستند. الگوریتم K-means با هدف مینیممسازی کمترین مربعات خطا، توسط مک کوئین ارائه شد. ابتدا k عضو - که k تعداد خوشهها است - بصورت تصادفی از میان n عضو به عنوان مراکز خوشهها انتخاب میشود. سپس n-k عضو باقیمانده به نزدیکترین خوشه - بر اساس معیار فاصله - تخصیص مییابند. بعد از تخصیص همه اعضا مراکز خوشه مجدداً محاسبه میشوند و با توجه به مراکز جدید به خوشهها تخصیص مییابند و این کار تا زمانی که مراکز خوشهها ثابت بماند ادامه مییابد . - Augstein, 2011 -

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید