بخشی از مقاله

چکیده

روشهای تشخیص تغییرات روند1 خط سیر داده ها را در یک مجموعه داده پیدا میکنند. تجزیه و تحلیل مجموعهدادههای مبتنی بر توزیع پوآسون2 بسیار مهم است زیرا کاربردهای بسیار متنوعی مانند شبکههای کامپیوتری از آنها تقلید میکنند. مدل کاربرد استفاده شده در این مقاله شبیه ساز شبکههای کامپیوتری هستند.

آخرین- مهمترین روند غالب در مجموعه داده های سری زمانی3 روند غالبی است که داده ها با آن تمام می شوند. روش ما تشخیص تغییر روند مبتنی بر ماتریس است که میتوان مجموعه دادههایی با اندازهی متغیر را بررسی کند. کاهش پیچیدگی زمانی و افزایش دقت اهداف روش پیشنهادی می باشد. روش پیشنهادی با RuLSIF که یکی از روش های پایه ای تشخیص نقطهی تغییر4 است، مقایسه شده تا مزایای رویکرد خود را نشان دهیم.

.1 مقدمه

تحلیل رفتار شبکه همواره به عنوان موضوعی مهم در شبکههای کامپیوتری در نظر گرفته شده است. انواع مختلف شبکههای کامپیوتری باید خود را مانیتور کنند تا بتوانند هرگونه وضعیت غیر عادی یا مساله امنیتی را تشخیص داده و از مدیریت کارایی پشتیبانی کنند. با تعیین رفتار شبکه، میتوان برخی گرهها یا کل شبکه را برای پشتیبانی از کاربردهای مختلف و اجتناب از مسائل مشخص شده مجددا تنظیم نمود. استفاده از روشی که بتواند اطلاعاتی را که از رفتار شبکه گردآوری شده است تحلیل کند میتواند در تعیین هرگونه وضعیت غیر عادی بدون تحلیل عمیق بسته که نوعی مسالهی نقض حریم خصوصی قلمداد میشود کمک کرده و داده ها را با سرعت بالا تحلیل کند

برای بررسی وضعیت شبکههای کامپیوتری، لازم است تا جریانهای داده5 و روند آنها را بررسی کرد. تعداد زیادی از عوامل وجود دارند که روی جریانهای دادهی یک شبکه تاثیر میگذارند. حملات امنیتی6 مختلف، گرههای متحرک7، خرابی گره یا جریان بسته های انفجاری برخی از نمونههایی هستند که جریانهای داده را تحت تاثیر قرار میدهند. تاثیر رخدادها روی جریانهای داده میتواند رفتار آنها را تغییر دهد که مسائل جدیدی مانند مدیریت منابع را در پی دارد. مطابق بر جزئیات شبکههای کامپیوتری، جریان دادههای بسیار زیادی وجود دارند که از توزیع پوآسون پیروی میکنند

بر اساس مدل پوآسون، جریان دادههای شبکهی کامپیوتری حرکات نامنظم غیرفصلی و تغییرات روند کوتاه مدت غیر فصلی دارند که باعث میشود تحلیل آنها در مقایسه با سایر توزیع های داده دشوار باشد. بطور کلی، روند داده الگویی از تغییرات تدریجی و تمایل مجموعه داده به یک الگوی خاص در راستای حرکت در طول زمان است. تحلیل روند دادهها به ارزیابی نحوهی تغییرات مجموعه دادهی ورودی در طول زمان کمک میکند. توزیع پوآسون میتواند باعث رفتارهای دادهای جدید شود که روشهای تشخیص روند معمولی نمیتوانند آنها را بررسی کنند.

مهمترین مشکل این است که برخی حرکات نامنظم تغییرات روند غالب را در مجموعه داده پنهان میکنند. همچنین، شبکههای کامپیوتری نیاز به توان محاسباتی بالایی برای تحلیل جریاندادههایی دارند که بیشتر این شبکهها مانند شبکههای موردی نمیتوانند آن را براساس منابع خود تامین کنند. شبکههای حسگر بیسیمWSN - 8ها -   و اینترنت اشیاء - IoT - 9 به عنوان نسلهای جدیدی از شبکههای کامپیوتری توان پردازش بالایی برای تحلیل شبکه ندارند؛ لذا، روشهای جدید باید بتوانند دادهها را بدون نیاز به توان پردازشی بالا تحلیل کنند.

در این مقاله، روش جدیدی مبتنی بر ماتریس پیشنهاد شده است تا آخرین نقطهی تغییر - CP - بسیار مهم را در یک مجموعه داده بیابد که نقطهای است که مجموعه داده را به دو قسمت با دو روند داده متفاوت تقسیم می کند. این روش میتواند اندازهی مختلفی از مجموعه دادههای آفلاین10 را تحلیل کند که آن را برای کاربردهای متنوع انعطافپذیر میکند. هرچند این روش برای شبکههای کامپیوتری پیشنهاد شده است، میتوان مجموعهدادههای کاربردی مختلف مبتنی بر پوآسون را بررسی کرد که از سایر کاربردها گردآوری شدهاند.

روش تشخیص تغییر روند به عنوان روش پیشنهادی میتواند در یافتن آخرین تغییر روند بسیار مهم در مجموعه داده سری زمانی با تامین وزن دادهها کمک کند. آخرین روند بسیار مهم آخرین روند غالب در سری زمانی است. به بیان دیگر، هرچند آخرین روند غالب ممکن است شامل حرکات نامنظم کوچک و روندهای کوتاه مدت باشد، روش پیشنهادی روند های غالب را خواهد یافت.

حرکات نامنظم کوچک و روندهای کوتاه مدت آن تغییراتی هستند که نمیتوانند روند غالب دادهها را تغییر دهند. روند غالب به معنای روندی است که ممکن است برای لحظهای یک خطی، روند رو به بالا یا روند رو به پایین باشد. پارامترهای خیلی زیادی برای ورودی این روش مانند نرخ ورودی گره، طول صف، تاخیر سر به سر و غیره وجود دارد. با در نظر گرفتن این که روش پیشنهادی در شبکهی کامپیوتری بصورت روشی متمرکز عمل خواهد کرد، از روش تاخیر نقطه به نقطه11 به عنوان ورودی برای تعیین رفتار شبکه استفاده خواهیم نمود؛ اما، بر اساس کاربردهای متنوع، پارامترهای دیگر را میتوان به عنوان ورودی در نظر گرفت.

استفاده از پارامتر تاخیر نقطه به نقطه در یافتن هر گونه مسالهی عملکردی یا امنیتی در شبکههای ادهاک12 مانند سایر شبکههای چند پرشه کمک خواهد کرد. بخش 2 تحقیقات مرتبط با تحلیل رفتار شبکه و روشهای تشخصی تغییر روند را ارائه خواهد داد.

در بخش 3، توزیع پوآسون و ارتباط بین روش پیشنهادی و توزیع پوآسون بیان شده است. روش پیشنهادی در بخش بعدی توضیح داده خواهد شد که روابط ریاضی را توصیف میکند. در بخش 5، عملکرد روش پیشنهادی ارزیابی خواهد شد و این روش با >5@ RuLSIF به عنوان روش تشخیص نقطهی تغییر ارزیابی    میگردد در نهایت در بخش 6، خلاصهای ارائه میگردد و نکاتی را در مورد تحقیقات آتی بیان خواهیم کرد.

.2 تحقیقات مرتبط

به عنوان چالشی مهم در راه مانیتور شبکههای کامپیوتری، تلاشهای متعددی برای تعیین حالات غیر عادی انجام شده است .سیستمهای تشخیص حریمگذری IDS - ها - تلاش میکنند تا هرگونه شرایط غیر عادی را با نظارت بر ترافیک تشخیص دهند و هرگونه انحراف از وضعیت عادی را بیابند 

نویسندگان روش آماری چند پنجرهای مولتیگرهی سلسله مراتبی را برای تعیین حالات غیر عادی در شبکههای سیمی و بیسیم ارائه دادهاند. روش Shiryaev-Roberts به عنوان روشی معمولی در تعیین نقطهی تغییر در چند مقاله بکار برده شده است.

نویسندگان از روشهای تشخیص نقطهی-تغییر متوالی برای تعیین هرگونه حریمگذری در شبکههای کامپیوتری بسیار بزرگ استفاده میکنند.

Tartakovsky et al نیز از روشهای تشخیص نقطهی تغییر برای ارائهی تشخیص حالت غیر عادی چندسیکلی مبتنی بر امتیاز آنلاین استفاده کردند. نویسندگان در یک روش مبتنی بر تکنیکهای طیفی را برای تحلیل ترافیک شبکه در گلوگاهها و استخراج الگوهای دورهای پیشنهاد دادهاند. همچنین  روش از راه دوری برای تعیین الگوهای دورهای با ترکیب روشهای طیفی و اماری حاصل شده است. 

Branch روش تشخیص جدیدی را در شبکههای حسگر بیسیم برای کاهش پهنای باند و مصرف انرژی و کمک به یافتن الگوهای نادر معرفی کردند. نویسندگان روش تخمین واگرایی پارامتری جدیدی را ارائه دادند که از واگرایی پیرسن برای تعیین نقاط تغییر استفاده میکند و تلاش میکند روش آنها را توسط مجموعه دادههای دنیای واقعی مانند

حس کردن فعالیت بشری، سخنرانی و غیره ارزیابی کند. Soo-Yeon Ji et al روش تشخیص حریم گذری چند سطحی جدیدی را با یافتن الگوی پنهان با استفاده از مدل پیشبین و یکپارچهسازی ابزار تحلیل بصری برای تایید حریم گذری های مشخص شده معرفی کردند. همچنین نویسندگان روش تشخیص حالت غیر عادی را بصورت تست آماری مبتنی بر تئوری مجموعهی فازی در سری های زمانی ارائه دادند. آنها روشهای مبتنی بر مجموعهی فازی13 و روشهای آماری را ترکیب کردند تا حالات غیر عادی را تعیین کنند.

.3 توزیع پوآسون و شبکههای کامپیوتری

شبکههای کامپیوتری اغلب از بستهها بجای جریانهای بیت برای انتقال دادهها استفاده میکنند. برای انتقال داده-ها از مبدا به مقصد، چند گره میانی وجود دارد که میتواند به شبکه در انتقال بسته کمک کند. هر گره منبع و مقصد یک صف برای پردازش بستهها دارد که باعث تاخیر در انتقال دادهها میشود. چند نوع از صفها وجود دارند، اما M/M/1 یکی از معمولترین مدلهای صف در شبکههای کامپیوتری برای پردازش و انتقال دادهها هستند

این مدل یک سرویس دهنده دارد که نرخ ورودی ان بر مبنای توزیع پوآسون است. توزیع پوآسون یکی از فرآیندهای شمارش پرکاربرد برای مدلسازی زمانهای ورودی سیستم های مختلف مانند شبکههای حسگر بیسیم، اینترنت، WAN و غیره است

از این توزیع در زمان بیان رخدادهای خاصی استفاده میشود که در نرخ خاصی بصورت تصادفی ظاهر میشوند. در اینجا، توزیع نرخ ورود بدون حافظه است که به معنای این است که هیچ رابطهای بین زمان مورد انتظار برای نرخ ورود بعدی و آخرین رخداد وجود ندارد. باید اشاره شود که در فرآیند پوآسون، ورودیها ممکن است در هر زمان مثبتی - کاملا تصادفی - رخ دهد لذا، میتوان آن را این گونه تفسیر کرد که هیچ روش خاصی برای توصیف توزیع پوآسون بر حسب احتمال ورود در هر لحظهی معین وجود ندارد. در نتیجه، در نظر گرفتن توزیع پوآسون برحسب توالی زمانهای ورود بهتر است.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید