بخشی از مقاله

چکیده

امروزه سرویس محاسبات ابری به یکی از متودولوژی های توسعه پذیر در صنعت کامپیوتر مبدل گشته است. این سرویس، یک روش جدیدی به منظور تحویل سرویس های IT بر روی فضای وب است. این مدل، منابعی محاسباتی را از طریق اینترنت در اختیار مشتری قرار میدهد. و از طرفی داده کاوی، پایگاهها و مجموعههای حجیم دادهها را در پی کشف واستخراج دانش، مورد تحلیل و کند و کاوهای ماشینی - و نیمهماشینی - قرار میدهد. این گونه مطالعات و کاوشها را به واقع میتوان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. ما در این مقاله ابتدا به بحث داده کاوی پرداخته و سپس به مدل های پیاده سازی ، سرویس های رایانش ابری و همچنین ابر کاوی که داده کاوی تحت ابر را تفسیر میکند، پرداخته ایم.

در بخش اصلی این مقاله تکنولوژی RAID و سطوح آن را معرفی کرده ایم تا نشان دهیم چطور بر اساس این تکنولوژِی معماری می توان معرفی کرد که از تهدیدها و حملات که داده کاوی بر حریم خصوصی کاربران رایانش ابری دارد جلوگیری کنیم. و این معماری که از تکنولوژی RAID استفاده میکند این چنین عمل می کند که به جای ذخیره سازی تمامی داده های یک مشتری بر روی یک سرویس دهنده، داده ها می تواند بر روی چندین سرویس دهنده توزیع گردد .مزیت این سیستم توزیعی زمانی تجسم میشود که مهاجم یک کاربر را برای حمله انتخاب می کند ولی مجبور است تا چندین سرویس دهنده را مورد هدف قرار دهد.در نتیجه، مهاجمین خارجی که به چندین سرویس دهنده دسترسی دارند، نمی توانند از کاوش به طور موثر استفاده کنند.که تهدیدها و حملات آنها با شکست مواجه می شود.

واژه های کلیدی: رایانش ابری، داده کاوی، ابر کاوی، RAID

-1 مقدمه

حجم بالای دادههای دائماً در حال رشد در همه حوزهها و نیز تنوع آنها به شکل داده متنی، اعداد، گرافیکها، نقشهها، عکسها، تصاویر ماهوارهای و ...، از یک طرف نمایانگر پیچیدگی کار تبدیل دادهها به اطلاعات و در نتیجه دشواری استخراج دانش نهفته در میان دادهها و از طرف دیگر نشانگر تنوع حوزههای کاربرد داده کاوی است . - Kantardzic et al , 2003 - داده کاوی تحلیل مجموعه داده های مشاهده ای - عمدتا بزرگ - برای یافتن روابط غیر قابل انتظار و خلاصه نمودن اطلاعات در روشهای نوین که قابل درک و مفید برای مالک اطلاعات می باشند. داده کاوی استخراج اطلاعات پیشگویانه از پایگاه داده بزرگ ، یک روش جدید قدرتمند با انرژی عظیم است و به کمک شرکت ها می رود که روی مهمترین اطلاعات در پایگاه داده شان تمرکز کنند. ابزارهای داده کاوی رفتارها و گرایش های آینده را پیش بینی می کنند و این امکان را به تجارت ها می دهد تا بر اساس دانش تصمیم گیری کنند. - Venkatadri et al, 2011 -

تحلیل های اتوماتیک و آینده نگر که توسط داده کاوی پیشنهاد می شود فراتر از تحلیل هایی قرار می گیرند که طبق رویدادهای گذشته توسط ابزارهای قبلی سیستم های تصمیم گیری انجام شده اند. موقعی که اندازه و پیچیدگی مجموعه داده افزایش می یابد ، تحلیل های دستی تقویت کننده فرآیندهای اتوماتیک می شوند و این توسط روش های دیگر در علوم کامپیوتر حمایت می شود مثل شبکه های عصبی ، تحلیل خوشه ، الگوریتم ژنتیک - 1950 - ، درخت های تصمیم گیری - 1960 - و ماشین های بردار پشتیبان . - 1990 - داده کاوی فرآیند کاربرد این متد ها روی داده با هدف کشف الگوهای پنهان در مجموعه عظیم است. هدف داده کاوی مرتب سازی داده برای شناسایی الگوها و ایجاد ارتباطات است. - - Jing et al, 2009

-2 داده کاوی کانون توجهات در صنعت اطلاعات

اصلی ترین دلیلی که باعث شد داده کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، مساله در دسترس بودن حجم وسیعی از داده ها و نیاز شدید به اینکه از این داده ها اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بدست آمده در کاربردهای وسیعی از مدیریت کسب و کار وکنترل تولید و تحلیل بازار تا طراحی مهندسی و تحقیقات علمی مورد استفاده قرار می گیرد. داده کاوی را می توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده می باشد، نظیر عملیات: جمع آوری داده ها وایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده ها. - Jing et al, - 2009 تکامل تکنولوژی پایگاه داده و استفاده فراوان آن در کاربردهای مختلف سبب جمع آوری حجم فراوانی داده شده است. این داده

های فراوان باعث ایجاد نیاز برای ابزارهای قدرتمند برای تحلیل داده ها گشته، زیرا در حال حاضر به لحاظ داده ثروتمند هستیم ولی دچار کمبود اطلاعات می باشیم. - Hun et al, 2001 - ابزارهای داده کاوی داده ها را آنالیز می کنند و الگوهای دادهای را کشف می کنند که می توان از آن در کاربردهایی نظیر: تعیین استراتژی برای کسب و کار، پایگاه دانش1 و تحقیقات علمی و پزشکی، استفاده کرد. شکاف موجود بین داده ها و اطلاعات سبب ایجاد نیاز برای ابزارهای داده کاوی شده است تا داده های بی ارزش را به دانشی ارزشمند تبدیل کنیم. - Venkatadri et al, 2011 -

1؛2 اشاره ای به پارامترهای داده کاوی و کاربردهای آن پارامترهای داده کاوی شامل موارد زیر می باشد که می توان اشاره کرد:
✓اجتماع : جستجو برای نگاشت ها به طوریکه یک رویداد به رویداد دیگر متصل می شود.

✓توالی یا مسیر تحلیل ها : جستجو برای نگاشت ها به طوریکه یک رویداد منجر به رویداد بعدی می شود.

✓طبقه بندی : جستجو برای الگوهای جدید

✓خوشه بندی : یافتن و مشاهده گروه هایی از حقایق که قبلا ناشناخته بودند.

✓پیش بینی : کشف الگوها در داده که می تواند منجر به پیش بینی های منطقی در مورد آینده شود ، این زمینه از داده کاوی به عنوان تحلیل های پیشگویانه شناخته شده است.

روش های عددی قابل مشاهده ، در راه حل های پیشرفته داده کاوی و پیش بینی فراهم کرده در صنعت های گسترده مثل فضای هوایی ، دولت ، ارتباطات ، سرویس های مالی و مراقبت پزشکی به کار می رود. راه حل های پیش بینی عددی، خبرگان تکنیکی ، تجربه های دستی چند دهه و محصولات قدرتمند را برای خلق با کیفیت ترین راه حل ممکن برای تحلیل داده ترکیب می کنند. به همین صورت کاربردهای مختلفی از داده کاوی در جهان واقعی وجود دارد. کاربردهای فراوانی از داده کاوی در دنیای واقعی وجود دارد نظیر بیمارستان ، مدیریت دانش آموز ، رزرو هواپیما ، پیش بینی ، زیست سنجی ، ریاضی ، جغرافیا ، وب کاوی ، پردازش موازی ، سازمان دهی فضا ، یکپارچگی داده. همچنین از کاربردهای بسیار مفید هستند که می توان به مورد محاسبات ابری و چگونگی استفاده از داده کاوی در این زمینه صحبت می کنیم. - Kantardzic et al, 2003 -

2؛2 مراحل کشف دانش

هر مرحله داده کاوی باید با کاربر یا پایگاه دانش تعامل داشته باشد. الگوهای کشف شده به کاربر ارائه می شوند و در صورت خواست او به عنوان دانش به پایگاه دانش اضافه می شوند. توجه شود که بر طبق این دیدگاه داده کاوی تنها یک مرحله از کل فرآیند است، البته به عنوان یک مرحله اساسی که الگوهای مخفی را آشکار می سازد کشف دانش دارای مراحل تکراری زیر است:

-1 پاکسازی داده ها2 - از بین بردن نویز و ناسازگاری داده ها - .

-2 یکپارچه سازی داده ها3 - چندین منبع داده ترکیب می شوند - .

-3 انتخاب داده ها4 - داده های مرتبط با آنالیزازپایگاه داده بازیابی می شوند - .

-4 تبدیل کردن داده ها5 - تبدیل داده ها به فرمی که مناسب برای داده کاوی باشد مثل خلاصه سازی6 و همسان سازی7 -5 داده کاوی - فرایند اصلی که روالهای هوشمند برای استخراج الگوها از داده ها به کار گرفته می شوند. -

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید