بخشی از مقاله
چکیده
پیشرفت جامعه بشری و پیچیده شدن محاسبات، سیستم ها و دستگاه ها را نیازمند کنترل هوشمند کرده است.یکی ازروش ها برای کنترل هوشمند، جمع آوری اطلاعات از محیط می باشد.که سنسورهای بی سیم یکی از ابزارهای مهم در جمع اوری دیتا از محیط های مختلف با شرایط گوناگون می باشند.یکی از عوامل تاثیر گذار بر روی جمع آوری داده، ناهنجاری می باشد.در این مقاله یک روش مبتنی بر چگالی را معرفی می کنیم.این روش با طبقه بندی دیتا ناهنجاری را با دقت 95,1 درصد تشخیص می دهد.
مقدمه
پیشرفتهای اخیر در زمینه الکترونیک و مخابرات بیسیم توانایی طراحی و ساخت حسگرهایی را با توان مصرفی پایین، اندازه کوچک، قیمت مناسب و کاربریهای گوناگون داده است. این حسگرهای کوچک که توانایی انجام اعمالی چون دریافت اطلاعات مختلف محیطی - بر اساس نوع حسگر - پردازش و ارسال آن اطلاعات را دارند، موجب پیدایش ایدهای برای ایجاد و گسترش شبکههای موسوم به شبکههای بیسیم حسگر WSNشدهاند.یک شبکه حسگر متشکل از تعداد زیادی گرههای حسگری است که در یک محیط به طور گسترده پخش شده و به جمعآوری اطلاعات از محیط میپردازند. لزوماً مکان قرارگرفتنگرههای حسگری، از قبلتعیینشده و مشخص نیست.
چنین خصوصیتی این امکان را فراهم میآوردکه بتوانیم آنها را در مکانهای خطرناک و یا غیرقابل دسترس رها کنیم.از طرف دیگر این بدان معنی است که پروتکلها و الگوریتمهای شبکههای حسگری باید دارای تواناییهای خودساماندهی باشند. دیگر خصوصیتهای منحصر به فرد شبکههای حسگری، توانایی همکاری و هماهنگی بین گرههای حسگری است. هر گره حسگر روی برد خود دارای یک پردازشگر است و به جای فرستادن تمامی اطلاعات خام به مرکز یا به گرهای که مسئول پردازش و نتیجهگیری اطلاعات است، ابتدا خود یک سری پردازشهای اولیه و ساده را روی اطلاعاتی که به دست آورده است، انجام میدهد و سپس دادههای نیمه پردازش شده را ارسال میکند.
با اینکه هر حسگر به تنهایی توانایی ناچیزی دارد، ترکیب صدها حسگر کوچک امکانات جدیدی را عرضه میکند. در واقع قدرت شبکههای بیسیم حسگر در توانایی بهکارگیری تعداد زیادی گره کوچک است که خود قادرندپیکرهبندی و سازماندهی شوند و در موارد متعددی چون مسیریابی همزمان، نظارت بر شرایط محیطی، نظارت بر سلامت ساختارها یا تجهیزات یک سیستم به کار گرفته شوند - - Rajasegarar et al,2008 ضعف اصلی این گرههای حسگر در ابزار محدود به منبع نفهته است مثل نیرو و واحدهای پردازش به همین دلیل، نفوذ پذیری برای تهدیدات مختلف امینتی بالاست.
در همینحال ، متخاصمین ممکن است تواناییهای فعال و غیرفعال - خاموش - داشته باشندتا در جمع آوری اطلاعات یا انتقال آن اختلال ایجاد کنند بنابراین، وسیله بیسیم اشغال میشود و احتمال تلاقی های بسته کوچک را در سیگنال مزاحم افزایش میدهد و در هر دو نمونه مصرف اضافی انرژی گره حسگر را موجب میشود. برای کاهش ناهنجاری امنیتی، شیوههای محاسبه نرم،یکی از کارامدترین سیستمهای کشف ناهنجاری هوشمند را نشان میکند تا الگوهای ترافیک غیرطبیعی را کشف وممانعت کند.
این الگوها از رفتار مدلبندی شده و ترافیک نرمال انشعاب مییابد. مکانیزم بسته کوچک بازبینی ساده را سونادا و دیگران پیشنهاد دادند تا از بازبینی وضعیت در برابر حملات ردّ خدمات توزیعی و انعکاسی اجتناب کند. میسرا و دیگران از اتوماسیون یادگیری، به منظور اجتناب از رد خدمات استفاده کرد. در حالیکه شیوههای محاسبه مبتنی بر کشف شامل سوء استفاده، ناهنجاری و ترکیبی، عملکرد نسبتاً منطقی را با توجه به صحت کشف و مصرف منبع حداقلی نشان می دهند، نمیتوانند ناهنجاری را کشف کنند.
در اینجا بکاربردن تکنیک بهینه که شالوده و اساس شبکه حسگر بیسیم را با حداکثر رساندن صحت کشف محافظت میکند میتواند نوعی چالش محسوب شود. به همین ترتیب، از طریق این تحقیق برای نشان دادن مشکل امنیتی - با بکاربردن مکانیزم دستهبندی بهینه محور - ،تلاشهایی صورت گرفته است - . - Yick et al,2008 در این مقاله هدف رسیدن به روشی است که با ترکیب دو روش و استفاده از ابزار محاسبات نرم بتوانیم بصورت هوشمند ناهنجاری را تشخیص داده و کنترل کند:
· استفاده از الگوریتم های یادگیری به جای کنترل تجربی ناهنجاری
· بدست اوردن رابطه برای چگونگی تعیین پارامترهای ورودی الگوریتم
· بدست آوردن الگوریتمی عمومی برای تشخیص ناهنجاری در شبکه های مختلف
طرح پیشنهادی
طرح پیشنهادی روشی مبتنی بر پایه چگالی می باشد و بعد از اعمال بر روی دیتا ست دریافتی خوشه بندی بر پایه چگالی را انجام می دهد.ایده اصلی این مقاله خوشهی با چگالی بالا را به عنوان نرمال و خوشه های دیگر را بعنوان ناهنجاری شناخته می شوند و دیتا هایی که در خوشه بندی قرار نداشته باشند به عنوان نویز شناخته می شوند.سپس با SVM الگویی رای جداسازی دیتاها برای هر گره بصورت مجزا تعریف می کند.
انتخاب ویژگی
مسئله انتخاب ویژگی یکی از مسائلی است که در مبحث یادگیری ماشین و همچنین شناسایی آماری الگو مطرح است. این مسئله در بسیاری از کاربردها مانند طبقهبندی اهمیت به سزایی دارد. زیرا در این کاربردها تعداد زیادی ویژگی وجود دارد که بسیاری از آنها یا بلااستفاده هستند و یا اینکه بار اطلاعاتی چندانی ندارند. حذف نکردن این ویژگیها مشکلی ازلحاظ اطلاعاتی ایجاد نمیکند ولی بار محاسباتی را برای کاربرد موردنظر بالا میبرد. و علاوه بر این باعث میشود که اطلاعات غیرمفید زیادی را به همراه دادههای مفید ذخیره کنیم. انتخاب ویژگی اشاره به مسئله انتخاب آن دسته از ویژگیهایی دارد که دارای اهمیت بیشتری هستند. همانطور که بسیاری از سیستمها در انواع زمینهها دارای مجموعه دادههایی با ابعاد بزرگ هستند، ازاینرو انتخاب ویژگی اهمیت و کاربرد گستردهای پیداکرده است.