بخشی از مقاله
چکیده
طبقه بندی ترافیک شبکه بر حسب پروتکل لایه کاربرد، اطلاعات مورد نیاز بخش زیادی از وظایف مدیریتی مانند: برنامه ریزی شبکه، مهندسی ترافیک و تضمین کیفیت سرویس را فراهم می آورد. معرفی شبکه مبتنی بر نرمافزار مسیری درجهت تحقق افزایش تعامل بین شبکهها و کاربردها باز میکند. شبکه مبتنی بر نرمافزار یک معماری ابتکاری و برنامهپذیر شبکه است که سمت و سوی تکامل شبکه در آینده را نشان میدهد.
دستهبندی دقیق ترافیک برروی شبکه های مبتنی بر نرمافزار اهمیت اساسی در فعالیتهای مختلف شبکه از امنیت مانیتورینگ تا مدیریت حساب، از کیفیت سرویس تا فراهم آوردن اپراتورها با پیشبینیهای کارآمد برای تامین طولانی مدت دارد. در این مقاله، یادگیری عمیق برای دستهبندی ترافیک شبکه های مبتنی بر نرم افزار اعمال شده است. دقت کلی این مدل در طبقه بندی ترافیک 96/2% می باشد . برتری این روش به روش های موجود سربار پردازشی پایین، حجم اندک ترافیک تحمیلی به شبکه و قابلیت اجرا بصورت زمان اجرا می باشد.
مقدمه
شبکه های مبتنی بر نرم افزار2 به عنوان پدیده ای نوظهور در حوزه شبکه های مخابراتی و کامپیوتری به شمار می روند. هدف اصلی ارائه این نوع شبکه ها غلبه و رفع مشکلاتی نظیر مدیریت دشوار و پیچیده در شبکه های مبتنی بر پروتکل IP که شبکه رایج در ارتباطات امروزی است می باشد
در شبکه های فعلی، مدیران شبکه جهت پیکربندی، تغییر سیاست های مدیریتی شبکه ها، بررسی و آزمایش پروتکل ها و ایده های جدید و مدیریت پویای شبکه ناگزیر به اعمال تغییرات و پیکربندی بر روی تجهیزات فعال شبکه هستند. شبکه مبتنی بر نرم افزار به عنوان یک مفهوم بسیار جامع و کلی با تفکیک سطح داده ای3 - هدایت بسته های اطلاعاتی - و سطح کنترلی4 - مسیریابی، مهندسی ترافیک و اعمال سیاست های مدیریتی - شبکه، بسیاری از محدودیت ها و مشکلات شبکه های فعلی را مرتفع می سازد . - Rowshanrad, 2016 - در شکل 1 معماری شبکه های مبتنی بر نرم افزار نشان داده شده است:
شکل -1 معماری کلی SDN
پروتکل OpenFlow - OF - یکی از مهمترین و کاربردی ترین پروتکل های ارتباط کنترلر با سوئیچ ها است که امروزه استاندارد قالب اغلب شبکه های مبتنی بر نرم افزار است. سوییچ های OF دارای جداولی به نام flow table هستند که هر جدول دارای تعدادی مدخل5 است که هر مدخل شامل قانون 6 و عمل7 است. مقادیر این جداول توسط کنترلر پر می شود.
هر قانون شامل تعدادی فیلد می باشد که مرتبط با سرآیند بسته های ورودی نظیر آدرس MAC مبدا و مقصد، آدرس IP مبدا و مقصد، شماره پورت و سایر فیلدهای ضروری است. هر عمل نیز تعیین می کند که با بسته ای که منطبق با فیلدهای بخش قانون است چه عملی انجام شود. منفک بودن سطح داده ای از سطح کنترلی سبب می شود تا یک مدیر شبکه بتواند به راحتی سیاست های مورد نظر خود را در قالب یک برنامه به کنترلر اعلام نموده و کنترلر نیز آن را به سطح داده ای اعلام کند. همچنین پیکربندی مجدد، خطایابی و آزمایش پروتکل ها و ایده های جدید نیز به کمک شبکه های مبتنی بر نرم افزار به راحتی قابل انجام است
یک گام ضروری در فرایند مدیریت شبکه به منظور دستیابی به خدمات شبکه با کارایی و دسترسپذیری8 بالا، طبقهبندی9 ترافیک شبکههای کامپیوتری است. امروزه از روشهای گوناگونی برای انجام طبقهبندی ترافیک استفاده میشود
1. روش های استفاده از شماره پورت که به منظور تشخیص برنامه کاربردی و پروتکل لایه کاربرد هستند ولی این روش ها از دقت کافی برخودار نمیباشد.
2. روشهای مبتنی بر وارسی عمیق محتوی بسته10، که طبقهبندی ترافیک را با دقت بالایی انجام میدهند، اما این روشها در شبکههای کنونی از کاستیهایی در مقابل پورتهای دینامیک و ترافیکهای رمزگذاری شده، رنج میبرند، سربار قابل توجهی به سیستم وارد مینمایند و نیز ناقض حریم خصوصی کاربران میباشند.
این روش ها مشکلات خاص خودشان را دارند و به همین دلیل تحقیقات اخیر بیشتر بر روی روشهایی متمرکز هستند که از تکنیکهای یادگیری ماشین11، برای طبقهبندی ترافیک بر پایهی ویژگیهای آماری جریان ترافیک، بهره بردهاند. با توجه به اینکه کاستیها و چالشهای زیادی بر سر راه طبقهبندی ترافیک در شبکههای امروزی وجود دارد و از طرفی در SDN دید سراسری کنترلر به شبکه و سادگی امکان استخراج اطلاعات آمارهای ترافیک از سوئیچهای شبکه، امکان انجام بهتر وظایف مدیریتی از جمله طبقهبندی ترافیک شبکه را در اختیار قرار میدهد
هانگیان کوی و همکاران - Cui, 2014 - با استفاده از تکنیکهای رایج طبقهبندی ترافیکی بر پایه وارسی عمیق بسته - DPI - ، اقدام به بررسی جریانها به منظور تشخیص پروتکل لایه کاربرد آنها در یک شبکه مبتنی بر نرمافزار در زمان اجرا شده است. هدف این امر توانایی کنترلر در تمایز و ایزوله نمودن جریان کاربردهای مختلف، مدیریت و برنامهریزی جریانهای ترافیک و تضمین کیفیت سرویس کاربردهای حساس به زمان میباشد. در مواقعی که شبکه شلوغ است بخش اعظم منابع پردازشی کنترلر باید به ابزار DPI اختصاص یابد و در نتیجه عملکرد کل شبکه تحتالشعاع قرار میگیرد.
ارسلان و همکاران - Arsalan, 2013 - یک framework برای تعیین نوع application جریانهای موجود در یک شبکه بیسیم که از تعدادی دستگاه سیار، متصل به یک سوئیچ Open Flow تشکیل شده است، ارائه دادند. در سطح کنترل یک آموزشدهنده مبتنی بر یادگیری ماشین این اطلاعات را دریافت میکند.
از سوی دیگر سوئیچ OF موجود در شبکه، ویژگی های مرتبط با جریانهای مختلف را جمعآوری و به سطح کنترل میفرستد تا یک مدل برای شناسایی پروتکل لایه کاربرد تشکیل شود. پس از تشکیل این مدل وقتی که یک دستگاه مهمان به شبکه وارد میشود، سوئیچ OF خصیصههای جریان این دستگاه را به مدل طبقهبندی ترافیک بر پایه یادگیری ماشین ارسال میکند و application منبع این جریانها شناسایی میشود. مدل طبقهبندی ترافیک در این روش با کمک الگوریتم درخت تصمیمگیری C5.0 ساخته شده است.