بخشی از مقاله

خلاصه

امروزه شاهد افزایش روزافزون دادههای پزشکی هستیم؛ اما دادهها به صورت خام قابل استفاده نیستند. یکی از اهداف جمعآوری این دادهها یافتن روابط و الگوهای مفید از میان آنها میباشد. از آنجایی که دادهکاوی تکنیکی جهت کشف دانش جدید از پایگاه داده می باشد، میتوان از طریق دادهکاوی به این روابط و الگوها دست یافت. استفاده از تکنیکهای دادهکاوی در زمینههای مختلف پزشکی کمک بسیاری به این علم کرده است.

یکی از جنبههای مهم این کاربرد تشخیص بیماریها است. تشخیص بیماری و انتخاب یک درمان مناسب برای بیماران از اهمیت بسیار بالایی در علم پزشکی برخوردار است. در این مقاله ما کاربردهای مختلف دادهکاوی در پزشکی را بیان میکنیم و هدف از این مقاله بررسی و مقایسه عملکرد چند الگوریتم دادهکاوی در تشخیص بیماریهای خاص از جمله، بیماریهای قلبی و عروقی و سرطان پستان میباشد.

1.    مقدمه

دادهکاوی1 یک روش برای کشف الگوهای پنهان از مجموعه دادههای عظیم میباشد .[1] به بیان دیگر، داده کاوی فرایندی است که با استفاده از تکنیکهای هوشمند، دانش را از مجموعهای از دادهها استخراج میکند که تحلیلهای ساده آماری قادر به انجام آن نیستند. دادهکاوی از الگوریتمهای بسیار پیچیده ریاضی جهت تقسیمبندی دادهها و پیشگویی رویدادها استفاده میکند. دادهکاوی در حال حاضر بهطور گسترده در بسیاری از حوزهها استفاده میشود و نقش مهمی را در زمینه بالینی بازی میکند. روز به روز به تعداد بیمارانی که به بیمارستانها به منظور درمانهای مختلف مراجعه میکنند، اضافه میشود و به تبع آن تعداد پروندههای بیماران در هر بخش از بیمارستانها در حال افزایش است. در زمینه پزشکی، الگوریتمهای دادهکاوی برای کشف دانش مخفی در مجموعههای داده حوزه پزشکی استفاده میشوند. الگوهای کشف شده ممکن است به تصمیمگیری و نجات زندگی افراد کمک کنند .[2]

2.    روشهای کشف دانش در دادهکاوی

دادهکاوی از ساخت مدلهای تحلیلی، دستهبندی و پیشبینی اطلاعات و ارائه نتایج با استفاده از ابزارهای مرتبط استفاده میکند. برای اینکه الگوریتم دادهکاوی بتواند عمل استخراج دانش را بهخوبی انجام دهد، نیاز به یک سری پیشپردازشها بر رویدادها و یک سری پس پردازشها بر روی الگوهای استخراج شده دارد. از تکنیکهایی که برای دادهکاوی استفاده میشود میتوان به روشهای زیر اشاره نمود:

▪    دستهبندی1 - تکنیک پیشگویانه - : در این روش یک نمونه به یکی از چند دسته از پیش تعریف شده دستهبندی میشود.

▪    رگرسیون2 - تکنیک پیشگویانه - : پیشبینی یک مقدار متغیر مبنی بر متغیرهای دیگر.

▪    خوشهبندی3 - تکنیک توصیفی - : یک دسته داده را به یکی از چند خوشه نگاشت میکند. خوشهها گروهبندیهای دستههای دادهای هستند که بر اساس شباهت برخی از معیارها به وجودمیآیند.

▪    کشف قواعد وابستگی4 - تکنیک توصیفی - : روابط وابستگی بین خصیصههای مختلف را بیان میکند.

▪    تحلیل دنباله: الگوهای دنبالهای همچون سریهای زمانی را مدل میکند.

3.    کاربردهای دادهکاوی پزشکی

امروزه پزشکی حجم انبوهی از اطلاعات ذخیره شده در پایگاههای داده را تولید میکند. دادهکاوی میتواند کاربردهای بسیار زیاد و متنوعی در حوزه پزشکی و بهداشت و درمان داشته باشد که در ادامه، به برخی از مهمترین کاربردها اشاره میکنیم:

▪ پیشبینی و تشخیص بیماریها

روشهای شناسایی الگوها و طبقهبندی در دادهکاوی تکنیکهایی هستند که اکثر موارد در تشخیص و پیشبینی بیماریها مورد استفاده قرار میگیرند در واقع میتوان با بکارگیری الگوریتمهای دستهبندی تشخیص داد که یک شخص با شرایط خاص ممکن است به چه بیماری مبتلا باشد. البته باید از روشهایی استفاده شود که از درصد اطمینان بالایی برخوردار باشند .[3]

▪ کشف تقلب و سوءاستفاده

تکنیکهای دادهکاوی میتوانند تقلب و سوءاستفاده از قوانین وضعشده را شناسایی کرده و الگوهای غیرعادی و ناهنجار در درخواستهای بیماران، پزشکان، آزمایشگاهها، کلینیکها و سایرین را پیدا کنند. کاوش بر روی حجم انبوه نسخهها، عملیات و سیر معالجات باعث شناسایی الگوهای غیرعادی و کشف تقلبها، از جمله کلاهبرداریهای بیمهای و درخواستهای پزشکی غیرقانونی میگردد .[4]

▪ اثربخشی معالجات

دادهکاوی با مقایسه عوامل، علائم و سیر درمان یک بیماری تحلیلی از سیر عملیات مؤثر و کارا ارائه میکند و می تواند برای ارزیابی میزان اثربخشی معالجات پزشکی استفاده شود. بهعنوان مثال مقایسه نتایج گروهبندی بیماران درمان شده با ردههای دارویی متفاوت برای یک بیماری خاص می تواند بهترین روش معالجه با کمترین هزینه و عارضه را تعیین کند و یا دادهکاوی میتواند به شناسایی معالجات موفق برای یک بیماری خاص کمک کند .[4]

از جمله سایر کاربردهای دادهکاوی در این زمینه، میتوان به پیداکردن وابستگی و رابطه بین اثرات جانبی مختلف یک روش معالجه، رابطه بین روش معالجه بیمار و واکنش او، تعیین مؤثرترین ترکیبات دارویی مناسب برای درمان زیرمجموعهای از بیماران یک بیماری خاص که واکنش متفاوتی در برابر داروهای تجویز شده در سیر درمان برای مجموعه بیماران آن بیماری از خود نشان میدهند و تعیین مراحل بازدارنده که میتوانند باعث کاهش درد شوند، اشاره کرد .[4]

▪ مدیریت خدمات بهداشتی و درمانی

داده کاوی با گسترش شناسایی و پیدا کردن بهتر حالات بیماری مزمن و بیماران پرخطر، برنامهریزی اقدامات مناسب و کاهش تعداد درخواستها و مراجعین به مراکز درمانی میتواند به مدیریت خدمات بهداشتی درمانی و پزشکی کمک مؤثری نماید .با کاوش در دادههای یک مرکز درمانی میتوان باعث بهبود کیفیت خدمات ارائهشده، گردید. از جمله میتوان وضعیت بیمار را سریعتر بهبود داد و مدت زمان بستری بیمار را کاهش داد، از عوارض بالینی اجتناب کرد، اطلاعات مفید مورد نیاز را به پزشکان ارائه نمود. همچنین تعداد نیروی انسانی مورد نیاز برای عملیات مختلف، میزان ساعات کاری، تعداد مراجعین، تعداد جراحیها، داروها و تجهیزات مورد نیاز برای آینده را پیشبینی کرد .[4]

4.    بررسی الگوریتمهای نوین دادهکاوی در پیشبینی بیماریهای قلبی و عروقی

در اینجا به کاربرد الگوریتم ارائهشده توسط آقایان ایلایاراجا1 و میاپان[5] 2 در پیشبینی بیماریهای قلبی و عروقی پرداخته میشود. کشف قواعد وابستگی یکی از کارآمدترین الگوریتمها برای استخراج مجموعه اقلام پرتکرار در میان دادههای عظیم است. برای استخراج مجموعه اقلام پرتکرار، حداقل مقدار پشتیبانی استفاده شده است. اگر مقدار پشتیبانی مجموعه اقلام بزرگتر یا مساوی حداقل تعداد پشتیبانی باشد، اقلام پرتکرار نامیده میشوند. اگر یک مجموعه پرتکرار باشد، تمام زیرمجموعههای آن نیزالزاماً پرتکرار هستند.

در ایالات متحده آمریکا، اولین عامل مرگ و میر هم در بین مردان و هم در میان زنان، بیماری قلبی شناخته شده است. این قاتل طبق شواهد، سالانه حدود 1 میلیون زندگی را میگیرد. در هر 30 ثانیه یک نفر تحت حمله قلبی قرار میگیرد و هر 60 ثانیه یک نفر به خاطر مشکلات مربوط به قلب میمیرد. در این مقاله نویسندگان یک روش دادهکاوی جدید برای پیشبینی سطح خطر بیماری قلبی، بر اساس انتخاب علائم بهوسیله تجزیه و تحلیل مجموعه اقلام بیماری قلبی ارائه میدهند. پیشبینی این روش به پزشکان در تصمیمگیریهای تشخیص برای نجات جان بیماران در معرض خطر، کمک میکند. شبیهسازی اقلام داده بیماری قلبی، شامل سوابق 1000 بیمار است که برای این کار تحقیقاتی استفاده میشود. این اقلام داده حاوی 19 علامت است که در جدول1 نمایش داده شده است. این علائم علامتهای مشکلات قلبی مختلف هستند که مشکل تصلب شراین، مشکل ریتم غیر نرمال، گشادی ماهیچه کرونیک، مشکل دریچه قلب و عفونتهای قلبی نامیده میشوند.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید