بخشی از مقاله
خلاصه
یکی از مسائل مطرح در رایانش ابري، مساله مکانیابی است و ازجمله عوامل موثر در طراحی مکانهاي مراکز داده، میزان حجم داده و مراجعات به آن مرکز داده است. این امر وابسته به تعداد مشتریان و یا کاربرانی است که قرار است از آن مرکز داده استفاده نمایند که یک موضوع احتمالی است. در این مقاله با درنظر گرفتن سیستم پهناي باند به عنوان یک سیستم صفی و شبیه سازي آن به روش مونت کارلو نحوهي شبیه سازي پهناي باند بیان شده است. نحوه محاسبه میزان پهناي باند مصرفی در حالتهاي مختلف شبیه سازي ایستا و پویا و براي سیستم واقعی بیان شده و نشان دادهایم که میزان پهناي باند مورد نیاز در یک نقطه پایانی در رایانش ابري را می توان با پارامترهاي مختلف توزیع گاما محاسبه نمود.
.1 مقدمه
مفهوم رایانش ابري ترکیبی از شبکههاي باظرفیت هاي مختلف و محاسبات توزیعشدهي دیتاست که امروزه به یکی از مباحث مطرح در مباحث علمی و تحقیقاتی و نیز در تجارت تبدیل شده است. مفهوم رایانش ابري به صورت عام بحث جدیدي نیست ولی به دلیل رشد و بلوغ روشهایی که در سالهاي اخیر براي آن مطرح شده است، مباحث پیچیدهي پردازش موازي1 و محاسبات شبکهاي2را در خود ﺟﺎ داده است. در حقیقت رایانش ابري را میتوان از یک نظر شامل دو قسمت عمده دانست، پردازشهاي ابري و شبکههاي مبتنی بر ﻣﺤﺘﻮي3، که محتوي شامل ترکیب یا به اشتراكگذاري منابع موجود در حوزه فناوري اطلاعات شامل انواع فایلهاي رایانهاي، فیلم، صوت، تصویر و یا هر نوع دادهايکه قابلیت ذخیرهشدن را دارا باشد.[1]
یکی از نیازهاي اولیه در طراحی مراکز داده در شبکه هاي ابري محاسبه میزان پهناي باند مصرف کنندههاست . در این مقاله قصد داریم با نگاه سیستمی به مفهوم پهناي باند و شبیهسازي آن میزان پهناي باند مورد نیاز یک سیستم به عنوان پایه محاسبات در رایانش ابري را محاسبه کنیم. تعریف .1 رایانش ابري مدلی براي ایجاد امکان دردسترس بودن همیشگی ویک شبکهي دردسترس براي به اشتراكگذاري منابع مختلف پردازنده که قابل تنظیم و پیکربندي باشند. - ازجمله شبکه سرویس دهنده ها، منابع ذخیره سازي، نرم افزارها و سرویس ها - که می تواند درحداقل زمان ممکن پیکربندي گردد و توسط سرویس دهنده ها به سرعت آماده و ارائه گردد. [2,9]
تعریف.2 آمار ترافیک مبادله شده در دنیاي اینترنت با مقیاس »سرعت رشد دیتاي سامانه هاي ترکیبی« و یا به اختصار 4 CAGRنمایش داده میشود. دلیل اصلی بالا رفتن ترافیک عمومی در شبکه اینترنت، نرم افزار ها و سرویس دهنده ها - شامل انواع محتواهاي اﻟﮑﺘﺮوﻧﯿﮑﯽ از جمله فیلم، موزیک، متن و سایر نرم افزارهاي توزیع شده آن ها - می باشد.[3] آمارها نشان می دهدتعداد مشتریان اینترنت که متقاضی محتوي بوده اند، از سال 2014 تا 2019 به میزان 100% افزایش داشته اند.
به همین دلیل این موضوع از نظر مراکز علمی تحقیقاتی و تجاري حائز اهمیت شده است. یک تعریف از »شبکه هاي تحویل محتوي« یا به اختصار5CDN به صورت زیر می باشد: تعریف: 3 یک شبکه تحویل محتوي، مجموعه اي از سرویس هاي توزیع شده در یک محدوده ي جغرافیایی است که اطلاعات توزیع شده را با دسترسی آسان از طریق وب، به دقت و اثر بخش ارائه می کند. [5] با توجه به تعاریف بیان شده، یکی از مسائلی که براي موسسات و شرکت ها مطرح می باشد، مکان یابی در طراحی مراکز داده خود می باشد.
بیان مساله:
به داده هاي آماري و برآورد میزان پهناي باند مصرف کننده دارد. براي بررسی این موضوع مصرف پهناي باند را به عنوان یک سیستم در نظر می گیریم و این سیستم را شبیه سازي می کنیم. شبیه سازي ابزار و روشی است براي تجزیه و تحلیل، مقایسه و بهینه سازي سیستم هاي پیچیده اي که تکرار پذیر می باشند گاهی اوقات به دلیل روابط ساده بین اجزاي یک سیستم امکان استفاده از مدل هاي دقیق ریاضی براي تحلیل روابط وجود دارد. دراین صورت نتایج به دست آمده دقیق یا قطعی است. اما غالب مدل هاي واقعی به اندازه اي پیچیده هستند که استفاده از مدل هاي ریاضی براي آنها دشوار یا ناممکن است. لذا شبیه سازي به ما کمک می کند تا نتایج مورد نظر را با سهولت به دست آوریم. اولین مفهومی که شاید در شبیه سازي مطرح باشد مفهوم سیستم است.
تعریف.4 سیستم مجموعه اي از اشیاء است که براي رسیدن به اهداف از پیش تعیین شده با هم در تعاملند. یک سیستم علاوه بر اثرپذیري از اجزاي خود تحت تاثیر محیط اطراف نیز می باشد. به طور کلی اجزاي یک سیستم عبارتند از: ورودي، پردازش، خروجی، بازخورد و محیط .[6] براي شبیه سازي این موضوع ابتدا یک مساله واقعی را در نظر می گیریم. یک شرکت بزرگ که در سطح کشور شعب و دفاتر مختلفی دارد در نظر دارد براي یکی از دفاتر کوچک خود که به انجام امور اداري و دفتري مشغول است، براي تعداد N کارمند خود که همه ي کارهاي این کارکنان با احتمال یکسان توسط رایانه انجام می دهند بستر ارتباطی مناسبی تهیه نماید.
تمام سرویس هاي مورد نیاز از طریق صفحات اینترنتی در دسترس می باشد. با توجه به هزینه بر بودن بسترهاي ارتباطی، شرکت در نظر دارد با توجه به اینکه ساعات کاري آن دفتر 7 ساعت در روزهاي غیر تعطیل است، میزان پهناي باند مورد نیاز آن دفتر را به گونه اي تامین نماید که هم نیاز سیستم اداري آن دفتر تامین شود و هم نیاز شخصی کارکنان به مطالعه سایت هاي غیر کاري و هم نیاز رایانه هاي آن مجموعه به بروزرسانی برخی نرم افزارهاي ضروري نصب شده روي رایانه ها تامین گردد به گونه اي که رضایتمندي هر سه گروه از سرعت باز کردن صفحات و دریافت لحظه اي اطلاعات به حداکثر برسد. در این مساله سه نوع داده براي رایانه درنظر گرفته شده است که این موضوع می تواند به شکل هاي دیگري نیز دسته بندي گردد. براي شناخت سیستم پهناي باند در رایانش ابري، نیاز به مقدماتی در مفاهیم پایه در نظریه اطلاعات داریم که در ادامه ارائه می دهیم و پس از آن به شبیه سازي سیستم و محاسبات آن می پردازیم.
.2 مفاهیم پایه ي نظریه اطلاعات و نحوه شبیه سازي مساله
نظریه ریاضی ارسال، دریافت، و ذخیرهسازي بهینهي دادهها و اطّلاعات را نظریهاطّلاعات مینامند. در این نظریه، کلود شانون نحوه مدلسازي مسأله ارسال اطلاعات در کانالهاي مخابراتی را بهصورت پایهاي بررسی کرده و مدلی کامل براي مدلسازي ریاضی منبع اطلاعات، کانال ارسال اطلاعات و بازیابی آن ارائه داده است. کلود شانون، در سال 1948، نظریه مهم خود را با عنوان نظریه ریاضی ارتباطات د ر مقاله اي با همین نام عرضه کرد. در این مقاله، انتقال پیام، در سیستم ارتباطی - مثل تلفن یا تلگراف - که متشکل از فرستنده، رسانه، گیرنده و فرایندهاي رمزگذاري و رمزگشایی است، تحلیل و توصیف آماري شده و سه عامل مورد تاکید و توجه قرار گرفته است:
.1 چگونگی رمزگذاري پیام؛
.2 وجود اختلال؛
.3 ظرفیت کانال. او مساله ارسال اطلاعات از یک منبع به یک مقصد را به کمک علم احتمالات بررسی و تحلیل نمود. دو نتیجه بسیار مهم، معروف به قضیه هاي شانون، عبارتند از: -1 حداقل میزان نرخی که می توان نرخ فشرده کردن اطلاعات یک منبع تصادفی اطلاعات را به آن ﻣﺤﺪود نمود برابر با آنتروپی1آن منبع است؛ به عبارت دیگر، نمی توان دنبالهي خروجی از یک منبع اطلاعات را با کمتر از آنتروپی آن منبع ارسال نمود. -2 حداکثر میزان نرخی که میتوان بر روي یک کانال مخابراتی اطلاعات ارسال نمود به نحوي که قادر به آشکارسازي اطلاعات در مقصد، با احتمال خطاي در حد قابل قبول - خطاي کم - باشیم، مقداري ثابت و وابسته به مشخصات کانال است، که به آن ظرفیت کانال2میگوئیم.
با این توضیحات شکل فنی مساله تقریبا مشخص گردید. به عبارت دیگر اگر رایانه مستقر در دفتر کار بخواهد به سرور مستقر در دفتر اصلی شرکت وصل شود باید مسیریاب موجود در دفتر کار با پهناي باند مناسب، سرویس مورد نظر را در اختیار کاربر قرار دهد. جهت روشن تر شدن مساله اجازه دهید با یک مثال توضیح دهیم. فرض کنید آدرس سرور شرکت www.company.com باشد. اگر کاربر رایانه ي مفروض آدرس را وارد نماید و یا بر روي آدرس سایت کلیک نماید، یک درخواست با پهناي باند مشخص، به سمت روتر ارسال می شود و سپس روتر در یک مدت زمان مشخص به بررسی آن بسته می پردازد که از چه سمتی درخواست باز شدن سایت که از طرف رایانه آمده را به سایت مورد نظر هدایت کند.
سپس براي بازشدن سایت بر روي رایانه شخص چه میزان اطلاعات را منتقل ﻧﻤﺎﯾﺪ تا صفحه مورد نظر با سرعت مناسب روي نمایش گر فرد نمایش داده شود - یا صفحه بار گذاري1گردد - بنابر این هر کلیک به منزله یک پیشامد در نظر گرفته می شود و چون تمام کلیک ها که سایتی خارج از ش بکه محلی را تقاضا می کنند به سمت روتر می روند و روتر آن ها را بررسی و هدایت می کند، بنابر این سیستم مورد شبیه سازي این مساله باید روتر در نظر گرفته شود.
در اینجا باید به رابطه کلیک و پهناي باند اشاره کرد. چون در یک سیستم یک کلیک می تواند درخواست یک دانلود باشد و یا یک لینک داخل یک سایتی که هم اکنون باز است باشد، لذا دانلود مستقیما به حجم فایل مورد تقاضاي کاربر بر می گردد و می تواند بسته به پهناي باند آن مجموعه، زمان طولانی را در بر داشته باشد ولی یک کلیک داخل صفحه یک سایت بازشده بر روي رایانه می تواند کمتر از یک ثانیه باشد. باتوجه به صورت مساله احتمال باز شدن یا درخواست چهار دسته سایت از طرف هر رایانه وجود دارد.
دسته اول: مجموعه سایت هاي مربوط به سرورهاي کاري شرکت
دسته دوم: مجموعه سایت هاي غیر کاري همچون سایت هاي خبري و غیره.
دسته سوم: مجموعه سایتهاي بروز رسانی اطلاعات سیستم رایانه
دسته چهارم: سایتها یا سرورهایی که به هر دلیل از دسترس خارج شده و دسترسی به آن ها امکان پذیر نمی باشد. قبل از اینکه مدل مساله را طراحی کنیم، ذکر چند نکته لازم است:
نکته :1 چون در مساله عنوان شده است که N کارمند دفتر با احتمال یکسان با رایانه کار می کنند، لذا هر رایانه با احتمال پهناي باند را اشغال می کند. لذا براي جمع آوري داده ها نیازي به آنالیز داده هاي همه N رایانه نمی باشد.و می توانیم فقط داده هاي یک رایانه را بررسی نماییم.
نکته :2 با توجه به فرمول - 1 - زمان در سیستم مورد نظر را می توان با حجم نشان داد. این یعنی می توان زمان شبیه سازي را رسیدن به سطح خاصی از حجم اطلاعات نیز عنوان کرد و برعکس.
نکته :3 احتمال اینکه کاربر در یک لحظه ي خاص کدام دسته از اطلاعات را درخواست کند نیز مشخص نیست، این به این معنی است که کاربر می تواند چند صفحه اینترنتی را به صورت هم زمان باز کرده و در صفحات مختلف کلیک کند، بنابر این همزمانی کلیک ها بر روي رایانه کاربر مشخص نیست و این احتمال سایت مورد تقاضا در دسترس نیست. 1 ، 2 و 3 می باشد. و با موضوع بر روي روتر مشخص می شود. لذا احتمال اینکه کاربر دسته اول، دوم و یا سوم را از روتر درخواست کند به ترتیب،
نکته:4 منظور از سرویس گیرنده در این سیستم درخواست هاي کاربر یا کل یک ها می باشد، و سرویس دهنده، سرعت یا پهناي باندي است که هر کلیک نیاز دارد. یعنی اگر پهناي باند کاملا پر باشد، در خواست منتظر می ماند، در غیر اینصورت به سمت سایت مورد نظر هدایت شده و تبادل اطلاعات صورت می گیرد. پردازش توسط سرویس دهنده در این مساله دونوع پردازش است، سرویس دهنده اول مسیر حرکت بسته را مشخص می کند، که با توجه به سرعت بالاي پردازشگرهاي موجود و مفاهیم و جداول مسیریابی موجود در مسیریاب هاي فعلی، زمان بسیار ناچیزي صرف این موضوع می شود و لذا زمان پردازش سرویس دهنده اول را ناچیز فرض کرده و از آن صرفنظر می کنیم.
اما منظور از سرویس دهنده دوم و سوم و چهارم، زمانی است که ارتباط برقرار شده و سرویس دهنده و سرویس گیرنده در ارتباط هستند. مشغول بودن این سرویس دهنده ها به معنی زمان دانلود صفحه یا باز شدن فایل م ورد نظر می باشد. - با توجه به فرمول - - 1 - در طول شبیه سازي براي اینکه بدانیم چه میزان پهناي باند باید براي هر دسته از سایت ها پیکربندي کنیم، ابتدا براي یافتن توزیع هاي احتمال هر دسته، فرض می کنیم پهناي باند موجود، آزاد و در اختیار همه ي دسته ها قرار دارد. با توجه به این نکات می توان مساله را به صورت سیستمی بیان کرد. تعریف سیستمی مساله: در یک سرویس دهنده - یک کانال ارتباطی - چهار دسته اطلاعات مبادله می شود.