بخشی از مقاله

-1چکیده

روش های داده کاوی به طور موفقیت آمیز در زمینه های مختلفی بکار گرفته شده است که صنعت هوانوردی یکی از آنهاست. داده های زیادی در صنعت هوانوردی وجود دارد این داده ها به شکلهای مختلفی مانند گزارش های خلبان، گزارش های واحد تعمیر و نگهداری هواپیما، گزارش های همجواری و گزارش های تاخیر ذخیره میشوند. این مقاله کاربرد داده کاوی در داده های حوادث هوایی به منظور پیش بینی سطح خطرات را بیان می کند.

هر حادثه که به عنوان یک مشکل دیده میشود باید از آن جلوگیری شده و یا عواقبش را به حداقل برسانیم. در صنعت هوانوردی ما چندین کار مهم توسط روش های داده کاوی را می توانیم انجام دهیم. مانند پیش بینی پدیده های هواشناسی مثل مه و ابرهای ارتفاع پایین، پیش بینی همجواری های بالقوه و یا موقعیت های مشکل.

هدف ما تولید یک مدل پیش بینی میباشد که قادر خواهد بود وقوع خطرات ممکن را از روی فاکتورهای ورودی مهم از دیتاست با بهترین دقت شناسایی کند. مدل ما بعدا برای کاهش تعداد همجواری هایی که نتایج مرگباری را به دنبال دارد استفاده می شود. در اینجا هدف ما پیدا کردن ویژگی های موثر به منظور کاهش دادن تعداد سوانح مرگ آور میباشد

-2 مقدمه

خطر و ایمنی همواره ملاحظات مهمی در صنعت حمل و نقل هوایی بوده اند. استفاده از داده کاوی در صنعت هواپیمایی یک راه جالب برای بهینه سازی ترافیک هوایی به منظور جلوگیری از خطرات ممکن در مجموعه داده های جمع آوری شده می-باشد. در این مقاله کاربرد داده کاوی در داده های سوانح هوایی به منظور پیش بینی سطح خطرات بیان میشود. هر حادثه که به عنوان یک مشکل دیده میشود باید از آن جلوگیری شده و یا عواقبش را به حداقل برسانیم. در صنعت هوانوردی ما چندین کار مهم توسط روش های داده کاوی میتوانیم انجام دهیم. مانند پیش بینی پدیده های هواشناسی مثل مه و ابرهای ارتفاع پایین، پیش بینی همجواری های بالقوه و یا موقعیت های مشکل.

ایمنی هوا نوردی1 اصطلاحی کلی است که شامل فرضیه، تحقیق و طبقه بندی اختلالات پرواز و جلوگیری از چنین اختلالاتی از طریق فراگیر نمودن مقررات و تحصیلات هوانوردی و طی دوره های آموزشی جامع می باشد و به عنوان ایمنی مسافرت هوایی شناخته می شود. داده کاوی ایمنی، یک راه حل مهمی را نشان میدهد که چگونه از وقوع خطرات بالقوه و مشکلات در بسیاری از دامنه ها جلوگیری کنیم. ضبط همه همجواری هایی که اتفاق میافتد

لازم است که تا با اطلاعات مربوطه به بررسی و شناسایی روابط پنهان و دلایلی که باعث همجواری ها میشود، بپردازیم. این رویکرد به عنوان مثال برای صنعت هوانوردی به منظور جلوگیری از همجواری های ممکن براساس ارزیابی داده های قبلی، اعمال میشود. این هدف سیستم داده های حوادث اداره هوانوردی فدرال میباشد. اداره فدرال مدام ایمنی هوانوردی را بهبود میبخشد. پایگاه داده حوادث، یک منبع خیلی مهمی را برای آزمایش های داده کاوی ایجاد میکند، که میتواند به تعدادی از جواب های زیر پاسخ دهد:

1 -     آیا این امکان وجود دارد تا قوانینی را استخراج کنیم که این قوانین منجرشدن به یک نوع خاصی از همجواری را به نشان دهد؟

- 2 آیا ممکن است حوادث را به چندین خوشه براساس خصوصیات مشابه تقسیم کرد؟

- 3 آیا کاربرد روش های داده کاوی در ایمنی هوانوردی از پتانسیل بالایی برخوردار میباشد و چگونه در طول چند سال آینده افزایش خواهد یافت؟

فلسفه ی داده کاوی این است که آینده بسیار به گذشته شبیه است. اگر گذشته را خوب بشناسید می توانید آینده را پیش بینی کنید. اصلی ترین دلیلی که باعث شد داده کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، مساله در دسترس بودن حجم وسیعی از دادهها و نیاز شدید به اینکه از این داده ها، اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بهدست آمده در کاربردهای وسیعی از مدیریت کسب و کار و کنترل تولید و تحلیل بازار تا طراحی مهندسی و تحقیقات علمی مورد استفاده قرار میگیرد.

داده کاوی را میتوان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده میباشد. نظیر عملیات: جمع آوری دادهها و ایجاد پایگاه داده، مدیریت داده و تحلیل و فهم دادهها. با داده کاوی شما مجبور می شوید تصمیمات احساسی را فراموش کنید و بر اساس واقعیت ها تصمیم بگیرید. بنابراین ضرر های ناشی از نا آگاهی مدیران حذف میشود. داده کاوی همچنین فضای سال های گذشته ی شرکت شما را بازبینی میکند و در نهایت نشان میدهد کدام تصمیمات منجر به سود شده است در حالی که شما از آن ها بیخبر هستید.

-3 مررور ادبیات

داده کاوی یک فرآیند با هدف الگوهای جالب و مفید و یا روابط پنهان در حجم زیادی از داده ها است. این فرآیند تعاملی و تکرار شونده با فازهای اصلی شامل عملیات زیر می باشد:

الف - عملیات پیش پردازش با داده ها شامل تمیز کردن، تبدیل، کاهش، انبوهش و گسسته سازی داده ها می باشد.

ب - مدل سازی با استفاده از الگوریتم هایی برای اهداف تحلیلی مانند شبکه های عصبی، درخت های تقسیم، رگرسیون، KNN و موارد دیگری می باشد.

انواع وظایف داده کاوی شامل پیش بینی، طبقه بندی، خوشه بندی و استخراج قوانین انجمنی می باشد.

فرآیند داده کاوی توسط متدولوژی های مختلفی مانند SEMMA و CRISP-DM مدیریت می شوند. ما در اینجا CRISP-DM2 را اعمال کرده ایم. این متدولوژی براساس تجارب عملی شرکت های مختلف در سال های گذشته برای حل مسائل داده کاوی طراحی شده بود.

در اینجا ما روش های داده کاوی مختلفی را برروی دادههای همجواری اعمال کردهایم. ما وابستگیهایی بین ویژگیها توسط درخت تصمیم، الگوریتم های طبقه بندی پیدا کرده تا ارتباط و قوانینی که منجر به حوادث مرگ آور میشود را شناسایی کنیم.

ما همچنین میتوانیم ابزار Rosetta را، به عنوان یک ابزار پیش پردازش به منظور انتخاب ویژگیهایی که در تجزیه و تحلیل استفاده خواهد شد انتخاب کنیم .در این راستا طبقه بندی درخت تصمیم یک روش سریع و موثر برای طبقه بندی کردن دیتاست ها فراهم میکند. Aitkenhead یک روشی ارائه داده که برای ایجاد یک متدولوژی طبقه بندی، می توان نمونه درخت تصمیم را با مفاهیم تکاملی مختلفی ترکیب کرد. در این قسمت طبقه بندی توسط درخت تصمیم انجام شده است

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید