بخشی از مقاله

چکیده

سرطان ریه یکی از عمده ترین سرطان ها برای هر دو جنسیت در سرتاسر جهان می باشد. این نوع سرطان شایع ترین دلیل مرگ و میر بر اثر سرطان بوده و تا 20 کل آن را در برمی گیرد. وقوع سرطان ریه بصورت قابل توجه از ابتدای قرن 19 ام افزایش یافته است. در این متن - مقاله - ، ما تکنیک های داده کاوی مختلفی را مورد مباحثه قرار داده ایم که برای تشخیص سرطان استفاده شده اند. استقرار - نمایش - آسیب شناسی سرطان ریه بر اساس گزارش آسیب شناسی بمنظور توصیف اندازه ویا گستردگی تومور اصلی و خواه اینکه سرطان توسعه - گسترش - یافته یا خیر - دگردیسی - می باشد.

آگاه بودن از استقرار آسیب شناسی سرطان ریه ، بدلیل اینکه می تواند برای تخمین پیش بینی وضعیت بیمار مورد استفاده قرار بگیرد ، همچنین می تواند به پزشکان کمک نماید تا درمانی مناسب را برنامه ریزی کنند ، امری مهم است. نمونه بافت از ریه بیمار لازم بوده تا بدین منظور گزارش آسیب شناسی برای تشخیص استقرار آسیب شناسی سرطان ریه تکمیل گردد. در این رویه ، جراحی بیوپسی - بافت برداری - ضروری است ، اما ممکن است که وضعیت سلامتی بیمار را در معرض خطر قرار دهد. بنابراین ، این مطالعه متمرکز بر گرفتن اطلاعات بالینی ای بوده که می توان بدون جراحی برای جایگذاری گزارش آسیب شناسی فراهم نمود. تکنیک های داده کاوی برای یافتن ارتباط مابین اطلاعات بالینی و گزارش آسیب شناسی بمنظور پشتیبانی از تشخیص استقرار آسیب شناسی سرطان ریه ، استفاده شده است.

واژگان کلیدی: سرطان ریه ، تشخیص استقرار سرطان ، داده کاوس ، کاوش قانون انجمنی

مقدمه

در دهه های اخیر ، سرطان بشدت افزایش یافته است. سرطان ریه یکی از عمده ترین سرطان ها برای جفت جنسیت ها در سرتاسر جهان می باشد. این مقوله یکی از شایع ترین دلایل مرگ و میر سرطانی بوده و 19,4 از کل آن را در بر میگیرد . وقوع سرطان ریه از اوایل قرن 19 ام بصورت قابل ملاحظه ای افزایش یافته است. چیزی در حدود 90 موارد سرطان ریه مرتبط به در معرض قرار گرفتن دود تنباکو - دخانیات - بوده ، زیرا دود سیگار حاوی بیش از 70 نوع ماده شیمیایی سرطان زا است. مصرف کنندگان دخانیات بشدت افزایش یافته اند و از همین روی سرطان نیز گسترش شگرفی داشته است.

کارامد ترین شیوه برای کاهش مرگ و میر بر اثر سرطان ریه ، کشف آن در اوایل ابتلا است. این مقوله نیازمند رویه تشخیص قابل اطمینان و صحیحی بوده که پزشکان برای تمیز دهی و الحاق بیمار به گروه های خوش خیم - غیر سرطانی - و یا بدخیم - سرطانی - از آن استفاده می کنند. در این رویه ، آزمایش های نظارتی و تست های آسیب شناسانه اعمال شده اند. ازمایشات نظارتی ، شامل آزمایش های فیزیکی - جسمانی - ، سابقه مصرف دخانیات ، تست های خلط - بزاق دهان - ، و CT اسکن های مارپیچی - نخاعی - و غیره - قادر به فراهم آوردن برخی از اطلاعات اولیه برای پزشکان بوده تا بدین منظور تصمیم بگیرند که خواه مورد تحت نظر مشکوک به سرطان است یا خیر.

بعد از اینکه این مقوله مورد سوء ظن مبنی بر ابتلای به سرطان ریه بر اساس آزمایشات نظارتی قرار گرفت ، نمونه ای از بافت ریه بیمار برداشته می شود تا مورد تست های آسیب شناسی قرار بگیرد. بصورت کلی ، بیوپسی های ریه ای بوسیله جراحی های دردناک - مانند بیوپسی سوزنی ، تکنیک های بیوپسی برونکوسکپی ، یا جراحی برداشت بافت - صورت می گیرد. آسیب شناسان سلول های ریه بیمار را بررسی خواهند نمود و پزشکان قادر به اتکا بر نتایج نمایش داده شده در گزارش آسیب شناسی بوده تا بدین منظور استقرار آسیب شناسی سرطان را تشخیص و تایید کنند. استقرار آسیب شناسی سرطان ریه بر اساس نتایج گزارش آسیب شناسی معین می شود. این مقوله اندازه ویا گستردگی تومور اصلی وهمچنین خواه اینکه سرطان توسعه یافته - دگردیسی - یا خیر را توصیف می کنند.

آگاه بودن از استقرار آسیب شناسی سرطان ریه ، بدلیل اینکه می توان آن را برای تخمین و پیش بینی وضعیت بیمار استفاده نمود و اینکه همچنین می تواند به پزشکان کمک نماید تا درمانی مناسب را برنامه ریزی کنند ، امری ضروری و مهم است. هرچند ، این مقوله غالبا نیازمند زمان و منابع بسیار زیادی بوده تا گزارش آسیب شناسی استقرار آسیب شناسانه سرطان ریه را تشخیص دهند. اگر ما قادر به اعمال اطلاعات بالینی برای تشخیص استقرار آسیب شناسانه سرطان باشیم ، از بسیاری از سودمندی های آن می توان بهره برد. بعنوان مثال ، ذخیره منابع پزشکی ، تقویت کارایی درمان پزشکی ، ارتقا تشخیص اولیه و اجتناب پیش از موعد ، و کاهش دور ریزهای پزشکی و غیره. بنابراین ، این مطالعه متمرکز بر دریافت اطلاعات بالینی ای بوده که می توان بدون نیاز به جراحی برای جایگزینی گزارش آسیب شناسانه فراهم نمود.

داده تجربی از اطلس ژنوم سرطانی - TCGA - تهیه شده است. در آزمایش تکنیک های داده کاوی برای یافتن ارتباط مابین اطلاعات بالینی و گزارش آسیب شناسی بمنظور پشتیبانی از تشخیص استقرار آسیب شناسانه سرطان ریه استفاده شده است.هدف این مقاله ، نشان داده امکان اعمال اطلاعات بالینی برای جایگزینی گزارش آسیب شناسی ، خصوصا در تشخیص استقرار آسیب شناسانه سرطان ریه می باشد. ادامه این مقاله بصورت ذیل سازماندهی شده است. ما در بخش 2 به بررسی کاربردهای داده کاوی مختلف در حوزه تشخیص سرطان می پردازیم. در بخش 3 چارچوب کاری مطروحه برای سیستم استقرار آسیب شناسانه سرطان را توضیح می دهیم. در بخش 4 عملکرد طراحی ما و تجزیه و تحلیل نتایج را ارزیابی می کنیم. در نهایت ، مقاله در بخش 5 جمع بندی می شود.

.2 پژوهش های مرتبط

داده کاوی دربرگیرنده تکنیک های متعددی همچون درخت تصمیم ، کاوش قانون انجمنی و شبکه های عصبی و غیره می باشد. هرکدام از این تکنیک ها ، داده را به طرق مختلف تجزیه و تحلیل و بررسی می کنند. در این بخش ، ما به بررسی کاربردهای داده کاوی مختلف در حوزه تشخیص سرطان می پردازیم.در Mukti & Ahmad ، مولفان کاربرد - قابلیت اجرا - ی AprioriTid ، و درخت تصمیم را برای کشف الگوهای مکرر قابل ملاحظه - محسوس - کاوش نموده اند. هدف استفاده از الگوهای قابل ملاحظه برای توسعه سیستم پیش بینی سرطان ریه بوده است. سیستم پیش بینی قادر به کشف استعداد - آمادگی به ابتلا - شخص برای سرطان ریه می باشد. داده های 400 بیمار سرطانی و غیر سرطانی جمع آوری شده و مورد ارزیابی قرار گرفته بود.

با روش شناسی مطروحه ، مولقان نشان داده اند که یافتن ارتباط های محسوس به لحاظ آماری از مجموعه داده گردآوری شده ممکن است. هرچند ، نتیجه ارزیابی شده از طریق روش شناسی مطروحه درجه بالایی از اعتماد آماری رانشان نمی دهد. Zubi و Saad از شبکه عصبی و روش های القای کاوش قانون انجمنی طبقه بندی شده و عمومی سازی شده ای بمنظور دسته بندی فیلم های دیجیتال اشعه ایکس سینه در دسته های عادی و غیرعادی - ناهنجار - استفاده نموده اند.هدف اصلی توسعه سیستم طبقه بندی تصویر برای پشتیبانی از پزشکان در تصمیم گیری بوده است. آنها پایگاه داده چندرسانه 300 فیلم اشعه ایکس را بعنوان مجموعه داده آزمایشی - تمرینی - در نظر گرفته بودند. وظایف پیش پردازشی پایه توضیح داده شده و روش های القای داده کاوی استفاده شده در این مقاله نشان داده شده بود. با این اوصاف ، مولفان نتایج ارزیابی پژوهشان را فراهم نمی آورند.

Agarwal و Choudhary تجزیه و تحلیل قانون انجمنی را بروی داده سرطان ریه از SEER انجام داده بودند. SEER منبعی از اطلاعات در وقوع سرطان و نجات یافتن از آن در ایالات متحده می باشد. الگوریتم HotSpot برای شناسایی مقادیر - ارزش ها - بالاتر و پایین تر زمان نجات - بقا - بیمار استفاده شده بود. مولفان از رویه نیمه دستی 2 مرحله ای برای حذف قوانین زائد - حشو - استفاده کرده بودند. در اولین مرحله ، قوانین تولید شده متناظر با گره های برگ حفظ شده بوده و قوانین در گره های غیر برگ بمنظور نگهداری بهترین ارزش - مقدار - هدف در مقایسه با تمامی گره های مسیرش حذف شده بودند.

در دومین مرحله ، دامنه خبرگی بمنظور حذف دستی قوانین زائد مشارکت کرده بودند. از طریق رویه 2 مرحله ای ، بیش از 90 قوانین زائد حذف شده بودند. نتایج آزمایش نشان داده است که قوانین فراهم شده قادر به فراهم سازی بینش های جالبی برای نجات - بقا - از سرطان ریه بوده است. هرچند مولفان تنها از برداشتن برای اندازه گیری قوانین تولید شده استفاده استفاده نموده بودند که قادر به تامین متقاعد کنندگی قدرتمندی نمی باشد.در Ramachandran، Girija ، Bhuvaneswari ،Enathur و Ponneri ، مولفان روش کاوش طبقه بندی و عمومی سازی شده ای را با ابزار WEKA ، بمنظور استخراج الگوهای گستردگی سرطان و طبقه بندی آنها مطابق با صفات از پیش تعین شده ، اعمال نموده اند.

هدف این پژوهش فراهم سازی دانش ارزشمندی درباره الگوی گسترش سرطان و عواملش برای افزایش برنامه کنترل سرطان می باشد. تقریبا 15000 مورد سرطان جمع آوری شده بوده و به گروه های سنی مختلف و گونه های مختلف سرطان دسته بندی شده اند. نتایج آزمایشات نشان داده که الگوهای گسترش سرطان طبق پیش بینی استخراج شده ، و برخی از دانش های ناشناخته پیشین بوسیله روش کاوش طبقه بندی و عمومی سازی شده ، کاوش شده بودند. در نهایت ، پژوهش آنها شیوه ای کارامد و مشاهده ای ارزشمند برای برنامه ریزی و تقویت برنامه کنترل سرطان را بوسیله اعمال تکنیک داده کاوی پایه ای ، فراهم نموده است.

.3 چارچوب کاری مطروحه برای سیستم استقرار آسیب شناسی سرطان

در این بخش ، ما به مباحثه درباره تکنیک های داده کاوی و روش شناسی استفاده شده در پژوهشمان می پردازیم. چارچوب کاریب سیستم استقرار سرطان مطروحه در شکل 1 نشان داده شده است.

.1-3 پیش پردازش داده و مجموعه داده آسیب شناسی
پیش پردازش داده بزرگترین بخش این مطالعه را دربرمی گیرد. ما تقریبا 500 مورد سرطان ریه ، شامل 497 گزارش آسیب شناسی و 458 گزارش بالینی ، از اطلس ژنوم سرطان - TCGA - دریافت نموده ایم. TCGA پروژه ای بوده که توسط دانشمندان و مدیرانی از موسسه ملی سرطان و موسسه پژوهشی ملی ژنوم انسانی - دو موسسه از 27 موسسه و مراکز موسسات ملی سلامت ، و دپارتمان خدمات انسانی و سلامتی ایالات متحده - انجام شده است. از پرتال داده TCGA ، پژوهشگران قادر به جستجو ، دریافت ، و تجزیه و تحلیل مجموعه داده ها تولید شده توسط TCGA هستند.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید