بخشی از مقاله
چکیده:
در عصر حاضر با جمع آوری دادههای بسیار و پیادهسازی تکنیکهای مختلف دادهکاوی بر روی آنها میتوان نقش مهمی را در دنیای پزشکی در جهت تشخیص و درمان بیماریهای صعب العلاج ایفا کرد. نظر به رشد روزافزون ابتلا به بیماری سرطان، بالاخص سرطان ریه که بهزعم محققان یکی از شایعترین نوع سرطان میباشد، پیشگیری از آن از اهمیت ویژهای برخوردار است. بعد پاتولوژیکی سرطان ریه بر اساس گزارش توصیفی از اندازه سلولهای سرطانی و همچنین میزان گسترش آن پایهریزی شده است.
آگاهی از مرحله بندی پاتولوژیک سرطان ریه از جهت تخمین پیشآگاهی بیماری و ارائه راهکار به پزشکان در برنامه ریزی یک درمان مناسب و مؤثر بسیار حائز اهمیت میباشد. در فرآیند مرحله بندی پاتولوژیک به یک نمونه از بافت ریه سرطانی به منظور تکمیل گزارش آسیب شناسی نیاز است که در این راستا جراحی نمونهبرداری انجام میپذیرد که متعاقب آن سلامتی بیمار را به مخاطره میاندازد بنابراین میتوان حتی الامکان اطلاعات بالینی بیمار را جایگزین عمل جراحی و گزارش پاتولوژی کرد. در این مقاله سعی بر آن شده است تا با پیدا کردن یک ارتباط مناسب بین اطلاعات بالینی و گزارش پاتولوژی بیمار بر اساس الگوریتم Apriori به تشخیص مرحلهبندی پاتولوژیک سرطان ریه بپردازد.
.1 مقدمه
در دهههای اخیر، سرطان بهطور چشمگیری افزایش یافته است. سرطان ریه یکی از سرطانهای رایج در سراسر جهان است که در مردان و زنان به یکمیزان رشد داشته است. این نوع شایعترین علت مرگ ناشی از سرطان است و 19,4٪ از کل این بیماری را به خود اختصاص داده است. بروز سرطان ریه به طور قابلتوجهی از اوایل قرن 19 افزایش یافته است
حدود 90 درصد از موارد سرطان ریه به قرار گرفتن فرد در معرض دود سیگار مربوط بوده است چراکه دود سیگار حاوی بیش از 70 مورد مواد شیمیایی سرطانزا است. امروزه شمار افراد سیگاری به طور چشمگیری افزایش یافته و به همین میزان سرطان ریه نیز افزایش پیدا کرده است
مؤثرترین راه برای کاهش مرگ ناشی از سرطان ریه تشخیص زودهنگام آن است. از این رو نیاز به یک روش تشخیص دقیق و قابل اعتماد است که پزشکان بتوانند از آن برای تشخیص و متمایز کردن این بیماری به دو نوع خوشخیم - غیر سرطانی - و بدخیم - سرطانی - استفاده کنند. یکی از این روشها استفاده از آزمایشات غربالگری و پاتولوژیک است .[4] آزمایشهای غربالگری شامل آزمونهای فیزیکی، بررسی سابقه مصرف سیگار، آزمایش خلط، تصویربرداری اشعه X قفسه سینه، و سیتیاسکن اسپیرال و غیره میشود. پزشکان میتوانند برخی از اطلاعات اولیه برای تشخیص اینکه آیا فرد مشکوک به سرطان ریه است یا خیر را فراهم کنند. پس از اینکه یک مورد سرطان ریه بر اساس آزمایشهای غربالگری تشخیص داده شد، نمونهای از بافت ریه بیمار برای تست آسیبشناسی برداشته میشود. بهطورکلی، بیوپسی - نمونهبرداری - ریه توسط جراحی از نوع بیوپسی سوزنی یا روش بیوپسی برونکوسکوپی برای برداشتن بافت انجام میگیرد
آسیب شناسان سلولهای ریه بیمار را بررسی کرده و پزشکان میتوانند بر نتایج به دست آمده در گزارش پاتولوژی، برای تأیید تشخیص و تعیین مرحلهبندی پاتولوژیک سرطان تکیه کنند. مرحلهبندی پاتولوژیک سرطان ریه بر اساس نتایج حاصل از گزارش پاتولوژی انجام میگیرد و اندازه یا میزان تومور اصلی و اینکه، آیا سرطان گسترش یافته است یا خیر، - متاستاز - را توصیف میکند. آگاه بودن از مرحلهبندی پاتولوژیک سرطان ریه مهم است، زیرا برای تخمین پیشآگهی بیماری مناسب است و همچنین میتواند به پزشکان در برنامهریزی برای درمان کمک کند.
بااینحال، اغلب به زمان و منابع زیادی برای گزارش پاتولوژی بهمنظور تشخیص مرحلهبندی پاتولوژیک سرطان ریه نیاز است. اگر بتوان اطلاعات بالینی برای تشخیص مرحلهبندی پاتولوژیک سرطان را اعمال کرد مزایای بسیاری به دست میآید، بهعنوانمثال، صرفهجویی در منابع پزشکی، افزایش بهرهوری از درمانهای پزشکی، ترویج تشخیص زودرس و پیشگیری اولیه و کاهش زبالههای پزشکی و غیره؛ بنابراین، این مطالعه بر به دست آوردن اطلاعات بالینی، که میتواند بدون نیاز به جراحی برای تعویض گزارش پاتولوژی به دست آید، تمرکز دارد. دادههای تجربی از اطلس ژنوم سرطان - TCGA - به دست آمده است
در این آزمایش تکنیکهای دادهکاوی برای پیدا کردن ارتباط بین اطلاعات بالینی و گزارش پاتولوژی بهمنظور حمایت از تشخیص مرحلهبندی پاتولوژیک سرطان ریه مورد استفاده قرار میگیرد.هدف از این مقاله نشان دادن امکان استفاده از اطلاعات بالینی به جای گزارش پاتولوژی بهخصوص در تشخیص مرحلهبندی پاتولوژیک سرطان ریه است. این مقاله به شرح زیر سازماندهی شده است: کاربردهای دادهکاوی مختلف در زمینه تشخیص سرطان در بخش 2 بررسی میشود. چارچوب پیشنهادی سیستم مرحلهبندی پاتولوژیک سرطان در بخش 3 توضیح داده میشود. در بخش 4 عملکرد طراحی ارزیابی و نتایج مورد تجزیه و تحلیل قرار میگیرد و در نهایت نتیجهگیری مقاله در بخش 5 انجام میشود.
.2 کارهای مربوطه
دادهکاوی شامل تکنیکهای مختلف، ازجمله درخت تصمیمگیری، استخراج قانونهای مربوطه، شبکههای عصبی، و غیره است. هر کدام از این تکنیکها دادهها را به روشهای مختلف تجزیه و تحلیل میکنند. در این بخش، چند پیشنهاد برای دادهکاوی در حوزه تشخیص سرطان مورد بررسی قرار میگیرد. در سال 2013 کاربرد AprioriTid و درخت تصمیم برای استخراج الگوهای مکرر قابلتوجه کشف شد که هدف آن استفاده از الگوهای قابلتوجه برای توسعه یک سیستم پیشبینی سرطان ریه بود.
سیستم پیشبینی قادر به تشخیص استعداد یک فرد برای ابتلا به سرطان ریه بوده که در آن دادههای 400 بیمار سرطانی و غیر سرطانی جمعآوری شده و مورد بررسی قرار گرفت .[4] روش پیشنهادی نشاندهنده امکان پیدا کردن مجموعه آماری معنیدار از مجموعه دادههای جمعآوری شده میباشد. بااینحال، نتیجه ارزیابی روش پیشنهادی، سطح بالایی از اعتماد آماری را نشان نمیدهد. در سال 2011 طبقهبندی، تعمیم و قانون رابطه روش القاء قوانین مربوطه بهمنظور طبقهبندی فیلم دیجیتال اشعه X قفسه سینه برای گروههای طبیعی و غیرطبیعی مورد استفاده قرار گرفت. هدف اصلی توسعه یک سیستم طبقهبندی تصویری برای حمایت از پزشکان در تصمیمگیری بود. 300 فیلم قفسه سینه پایگاه دادههای چندرسانهای بهعنوان یک مجموعه دادههای آموزشی در نظر گرفته شد.
اهداف پیشپردازش اولیه توضیح و روش القاء دادهکاوی مورد استفاده در این مقاله نشان داده شد. همچنین در سال 2011 گروهی تجزیه، تحلیل و استخراج قانون رابطه بر روی دادههای سرطان ریه از SEER را انجام دادند SEER .[6] یک منبع اطلاعاتی در بروز سرطان و بقا در ایالات متحده است. الگوریتم HotSpot برای شناسایی زمان زنده ماندن بیماران استفاده شد. با افزایش تعداد زیاد قوانین محققان از یک روش نیمه دستی 2 مرحلهای برای حذف قواعد کهنه و قدیمی، استفاده کردند.
در مرحله اول قوانین عمومی مربوط به گرههای برگی حفظ شد و قوانین مربوط به گره غیر برگی بهمنظور حفظ بهترین هدف در مقایسه با تمام گرهها در مسیر خود دور انداخته شد. در مرحله دوم با تخصصی شدن دامنه قواعد کهنه و قدیمی به روش دستی حذف گردید. از طریق روش 2 مرحلهای بیش از 90 درصد از قوانین قدیمی حذف شدند
نتایج آزمایش نشان داد قوانین به دست آمده قادر به ارائه دیدگاههای جالب برای سرطان ریه بودند. بااینحال، محققان تنها اندازهگیری قوانین عمومی را که نمیتوانست دلایل متقاعدکنندهای عرضه کند مورد استفاده قرار میدادند. پژوهشگران روش استخراج را با استفاده از ابزار WEKA به استخراج الگوهای گسترش سرطان با توجه به ویژگیهای از پیش تعریف شده طبقه بندی کرده و تعمیم دادند.