بخشی از مقاله

چکیده

در این مقاله ضمن معرفی تکنولوژی رایانش ابری ، داده کاوی و وب داده کاوی ، بیان مزایای رایانش ابری و مقایسه داده کاوی و وب کاوی مورد توجه قرار گرفته است . سپس به معرفی الگوریتم SPRINT پرداخته شده است که بمنظور ایجاد پیوند از القای قابلیت موازی سازی مقیاس پذیر این الگوریتم در محاسبات ابری ، می توان جهت ارائه خدمات قابل اعتماد در داده کاوی وب استفاده نمود. وب کاوی ابزاری موثر برای آنالیز داده ها از زوایای مختلف بمنظور استخراج اطلاعات مفید از مقادیر گسترده اطلاعات موجود در وب می باشد و استفاده از رایانش ابری بر اساس الگوریتم هایی که باعث افزایش سرعت و دقت در مدیریت و بازیابی داده ها می شوند ، دارای اهمیت ویژه ای است .از آنجایی که امروزه ، محاسبات فشرده داده در وب بعنوان الگوی چهارم در کشف علمی پس از علوم نظری ، تجربی و محاسباتی در نظر گرفته شده است تا پاسخگوی چالش های مطرح در ذخیره سازی و انتقال حجم بالای اطلاعات باشد و بتواند به صورت کارآمد مدیریت منابع و جریان مجموعه داده های بزرگ را انجام دهد ، لذا معرفی الگوریتمی کارآمد بنام SPRINT در رایانش ابری در این مقاله مورد توجه قرار گرفته است .

واژه های کلیدی : وب کاوی ، داده کاوی ، رایانش ابری ، محاسبات ابری ، الگوریتم SPRINT

-1 معرفی تکنولوژی رایانش ابری :
در موسسه فناوری و استانداردها "NISI" تعریف زیر از رایانش ابری ذکر شده است :

» رایانش ابری مدلی است جهت فراهم نمودن دسترسی آسان براساس تقاضای کاربر از طریق شبکه به مجموعه ای از منابع محاسباتی قابل تغییر مثل شبکه ها، سرورها، فضای ذخیره سازی ،برنامه های کاربردی وسرویس ها که این دسترسی ها همراه با کمترین نیاز به مدیریت منابع یا دخالت مستقیم فراهم کننده سرویس با سرعت فراهم یا آزاد گردد.« این تعریف که در برگیرنده جنبه های مهم و اساسی رایانش ابری می باشد شامل 4عنصر کلیدی زیر است :

-1سخت افزار و نرم افزار منابع هستند که در قالب خدمت از طریق بستر اینترانت به کابران عرضه می شوند.

-2این منابع به صورت نسبتا پویا گسترش یافته و پیکربندی شده اند.

-3این منابع از نظر فیزیکی توزیع شده و به اشتراک گذاشته شده اند.

-4کاربر هزینه استفاده از منابع را پرداخت و هزینه ای جهت مدیریت منابع نمی پردازد.

رایانش ابری مدلی است که تمامی سرویس های آن از طریق بستر اینترنت و یک مرکز داده با قابلیت دسترسی آسان در اختیار کاربران قرار می گیرد، هدف اصلی این فناوری کاهش هزینه ها ، افزایش کیفیت خدمات بدون نیاز به دانش مدیریتی بالا، برای کاربران است. از آنجایی که پیاده سازی زیر ساخت های رایانش ابری بر پایه تکنولوژی مجازی سازی است ، رابطه بین سیستم عامل و سخت افزار با اضافه کردن لایه مجازی ساز تغییر می کند ، لذا این لایه به طوری مناسب توسط ارائه دهندگان خدمات ابری که سرویس هایشان را از طریق نرم افزار، پلت فرم و زیر ساخت ارائه می دهند، پیکربندی ، مدیریت و امن سازی می شود.X به عنوان یک سرویس - XaaS - بیانگر معماری رایانش ابری است که شامل سه دسته از خدمات نرم افزار - SaaS1 - ، پلت فرم یا بستر - PaaS2 - و زیرساخت - Iaas3 - می باشد.

تکنولوژی مدرن رایانش ابری به سرعت در حال رشد و توسعه می باشد،در فناوری ابر 0 - ، - 1 که بر پایه تجمیع لایه های TCP / IP بود تجهیزات شبکه بدون اطلاع از جزئیات هم از طریق پروتکل TCP / IP با هم ارتباط داشتند، در فناوری ابر 0 - ، - 2 کاربران از طریق دسترسی به اینترنت اقدام به انتشار برنامه های کاربردی و برقراری ارتباط با سایرین می کردند ، در فناوری ابر 0 - ، - 3 نرم افزارهای کاربردی ، سرورها و سخت افزارهای ناهمگن بدون اطلاع از موقعیت مکانی مورد استفاده کاربران قرار می گیرند.جدول - 1 - ویژگی های شاخص این فناوری را بیان می کند:[2],[1]
1 Software as a Service 2 Platform as a Service 3 Infrastructure as a Service

2-عنوان ویژگی    شرح ویژگی    
خود سرویسی بر حسب نیاز 4 استفاده از منابع محاسباتی در هر زمانی بدون نیاز به برقراری ارتباط با ارائه دهنده امکان پذیر است.دسترسی از طریق شبکه حاضر در استفاده از منابع محاسباتی موجود بر روی شبکه از طریق همه جا 5 هر نوع دستگاه با قابلیت اتصال به وب امکان پذیر است.امکان استفاده از منابعی که توسط گروهی از کاربران به تجمیع منابع 6 و چند مستاجری اشتراک گذاشته شده را فراهم می سازد و سبب کاهش چشمگیر هزینه ها می شود. انعطاف پذیری سریع و خودکار، امکان دسترسی به منابعی قابلیت ارتجاعی سریع 7بیشتر را با سرعت دسترسی بالاتری برا کاربران خود فراهم می آورد.

کنترل ها به صورت خودکار انجام و گزارشی کاملا شفاف پرداخت هزینه به میزان مصرف8 از میزان استفاده منابع توسط کاربر با استفاده از توانایی اندازه گیری فضای ذخیره سازی،توان پردازشی و پهنای باند و تعداد کاربران فعال صورت می پذیرد.واژه ابر در مفهوم رایانش ابری بیانگر تصور انتزاعی از شبکه ای وسیع شامل فناوری های جدید ،فناوری های مجازی سازی، پردازشگرها، سیستم توزیع شده و شبکه های میتنی بر فضای ذخیره سازی است که به کاربران این امکان را می دهد که به جای ذخیره سازی اطلاعات در رایانه شخصی آن را در سروری موجود در اینترنت ذخیره کنند. از آنجایی که کاربران در مورد حجم ابعاد زمانی و مکانی اجزا، میزان منابع پردازشی و سخت افزارها و نرم افزارهای مورداستفاده اطلاعاتی ندارند لذا استعاره می شود به این که "اطلاعات جایی در هوا داخل ابرهاست".براساس تعریف ارائه شده در NISI گونه های رایانش ابری یا مدل های استقرار ابر عبارتند از:

-1ابرعمومی یا خارجی Public Cloud

-2ابرخصوصی Private Cloud

-3ابرگروهی  Community Cloud

-4ابر آمیخته یا ترکیبی Hybrid  Cloud

-2 مقایسه داده کاوی و وب کاوی

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید