بخشی از مقاله
چکیده
در قرن حاضر ما با بخش عمده ای از اطلاعات کاربران سروکار داریم که این اطلاعات هم از لحاظ تجاری می باشد و هم از لحاظ شخصی، که این داده ها را می توانیم پدیده ای به نام داده های عظیم بنامیم. برای دسته بندب و یا خوشه بندی این داده ها ما نیازمند ابزارهای تحلیل گر هستیم که علاوه بر خوشه بندی بتواند کیفیت سرویس را برای کاربران فراهم سازد. در این پژوهش معماری پیشنهاد شده سعی می کند که براساس زمانبندی و خوشه بندی مناسب، کیفیت سرویس را تا حد امکان مهیا کند.
این معماری برای روی داده های توزیع شده استفاده می شود که ابتدا داده ها در حوزه زمانبندی سراسری نزدیکترین مرکز داده را برای ذخیره و بازیابی پیدا می کند.در حوزه زمانبندی محلی سعی براین است که نوع پیش بینی اطلاعات را برای شما مشخص کند این موارد شامل اطلاعات حافظه ای، عمومی، ورودی و خروجی و محاسباتی هستند. این الگوریتم پیش بینی توسط الگوریتم بیز انجام می شود که در هر مرکز داده توسط الگوریتم نقشه خودسازماندهی یک سری خوشه ایجاد می کند تا اطلاعات دسته بندی شوند.هدف از انجام این پژوهش مرتب سازی مراخل ساختار مرکز داده و افزایش کیفیت سرویس آن است.
.1 مقدمه
محاسبات ابری بحثی نوین در حوزه سیستم های توزیع شده است که در چندین سال اخیر جز ده فناوری برتر دنیا قرار گرفته است
یکی از مواردی که توجه به محاسبات ابری را افزایش می دهد مقیاس پذیر بودن است.اما مهیا کردن کیفیت سرویس برای کاربر نهایی یکی از چالش های محاسبات ابری است.در این فناوری ما با داده های بسیاری مواجه هستیم که پدیدآورنده حوزه ای نوین به نام داده های عظیم می باشد.اگر بخواهیم تعریفی از داده های عظیم داشته باشیم داده هایی هستند که پردازش انها خارج از توان سیستم های کنونی است
برای ذخیره داده ها ما نیازمند مرکز داده هستیم.مرکز داده های در جاهای مختلف جغرافیایی ممکن است وجود داشته باشند که به مرکز داده غیر متمرکز شناخته می شوند.یکی از چالش ها برای داشتن کیفیت سرویس در محاسبات ابری، شرکت ارائه دهنده خدمات است اما این همه موضوع نیست زیرا موارد دیگر هم دخالت دارند.برای مثال یک کاربر میخواد اطلاعات را برای مرکز داده ارسال کند و برای ارسال از بستر ارتباطی اینترنت استقاده میکند شرکت خدمات ممکن است پهنای باند GB/s 5 را برای ارسال در نظر گرفته باشد اما کاربری که در کشور جهان سوم قصد ارسال دارد که از پهنای باند GB/s 1 ی که وجود دارد استفاده میکند و ممکن است کیفیت مد نظر شرکت خدمات بدست نیاید.
هدف در اینجا دسترسی سریع به نزدیک ترین مرکز داده است و سپس در مرکز داده یافت شده داده ها پیش بینی می شوند سپس دسته بندی میشوند و درنهایت در چهار دسته مورد نظر نگهداری می شوند.به طور کلی یک داده میتواند عمومی ،ورودی و خروجی ،حافظه ای و محاساباتی باشد.پس در اینجا دو نوع زمانبندی داریم سراسری و محلی است.درادمه چهار چوب پیشنهادی را بررسی میکنیم.
.2 چهار چوب پیشنهادی
در شکل شماره 1 ابتدا کاربر از بستر شبکه برای ارسال اطلاعات استفاده می کند و سپس از طریق زمانبندی سراسری که توسط الگوریتم knn که هدفش یافتن نزدیک ترین همسایه است وارد می شود.
شکل:1چهارچوب پیشنهادی
در ادامه نزدیک ترین مرکز پیدا میشود و سپس وارد زمان بندی محلی میشود که در زمان بندی محلی توسط الگوریتم بیز ،خوشه بندی، درخواست های کاربر را انجام میدهد.
.3 زمانبندی سراسری
در زمانبندی سراسری پارامترهایی که بسیار مهم هستند میانگین فاصله فیزیکی و توان عملیاتی شبکه و دسترس بودن منابع است.[3]اگر یکی از پارامترهای بالا بدست نیاید کیفیت سرویس مهیا نخواهد شد.عملکرد الکوریتم knn به این صورت می باشد که یک فضای nبعدی را در نظر میگیرد که هر گره دارای صفت و به نزدیک ترین گره همسایه اشاره می کند.هر ووردی جدید از داده های عظیم نشان دهنده یک اشاره گردر فضای بعدی KNNاست که فاصله این اشاره گر را با فاصله اقلیدسی محاسبه می کند.فاصله فیزیکی وتوان عملیاتی شبکه که توسط مرکز داده ارائه شده ثابت است اما دسترسی به منابع پویا و خیلی سریع است.
.4زمانبدی محلی
داده های عظیم بعد از عبور کردن از زمانبندی سراسری و پیدا کردن نزدیک ترین مرکز داده برای ذخیره داده ای عظیم وارد زمانبندی محلی می شوند.در این زمانبدی ما ابتدا چهار گروه را برای خوشه بندی مجازی انتخاب میکنم عمومی، حافظه ای ، محاسباتی ،ورودی و خروجی است.جدول1 انواع خوشه بندی را نمایش میدهد.
جدول شماره :1انواع خوشه بندی
این خوشه بندی مجازی توسط نگاشت خود سازماندهی شده انجام میشود.قبل از خوشه بندی مجازی ما با الگوریتم بیز داده عظیم را دسته بندی می کنیم.