بخشی از مقاله


داده کاوي در شبکه هاي حسگر بی سیم

چکیده

در هیج یک از تکنیک هاي داده کاوي که تمرکز بر استخراج اطلاعات و تجزیه و تحلیل از داده هاي شبکه گیرنده بی سیم است ، مورد بررسی قرار نگرفته است .

این مقاله به بررسی الگوریتم ها و روش هاي ویژه براي شبکه گیرنده بی سیم داده ها پرداخته است ، نه تنها منجر به طبقه بندي هاي مختلف ، ارزیابی، و بحث در حوزه هاي مختلف بلکه باعث ارائه گزینه هاي مختلف از یک راه حل شده است .

واژه کلیدي: شبکه هاي حسگر بی سیم- داده کاوي- الگوریتم کاوش ارتباط

-1 مقدمه


تکنیک هاي داده کاوي متعارف براي دست زدن به میزان عظیم، ابعاد بالا و ماهیت توزیع شده داده هاي تولید شده توسط شبکه گیرنده بی سیم مناسب نیست.با توجه به حجم زیادي و هزینه ذخیره سازي بالا، انجام آن ها را غیر ممکن ساخته است براي ذخیره تمام داده هاي شبکه گیرنده بی سیم هاي روش انجام آن را در چند مرحله پردازش بایست کرد.این ویژگی از داده هاي حسگر و مسائل هاي خاص طراحی شبکه هاي حسگر تکنیک هاي داده کاوي سنتی را چالش برانگیز کرده است .از این رو، روشی مهم براي توسعه روش هاي داده کاوي است که می تواند به تجزیه و تحلیل و پردازش داده هاي شبکه گیرنده بی سیم در چند بعد، چند تک پاس و روش آنلاین ، صورت پذیرد.کاوش الگوي مکرر براي پیدا کردن گروهی براساس متغیرهایی است که شرکت میکنند در مجموعه اي از داده مورد استفاده قرار میگیرد .هدف پیدا کردن روابط جالب توجه بین متغیرها می باشد.الگوي الگوریتم هاي کاوش سنتی مکرر پردازنده و ورودي / خروجی فشرده هستند، که به کاوش طبیعت دینامیک اطلاعات شبکه هاي حسگر بی سیم که ساخت آن گران است منجر می گردد.بر خلاف کاوش پایگاه هاي استاتیک، طبیعت دینامیکی اطلاعات هاي شبکه هاي حسگر بی سیم منجر به مطالعه استخراج آنلاین از مجموعه اقلام مکرر می گردد.به عنوان یک نتیجه، الگوي مکرر الگوریتم هاي

کاوش سنتی با توجه به ماهیت اطلاعات هاي شبکه هاي حسگر بی سیم تغییر یافته است.

-2 روش کاوش الگوي مکرر بر اساس روش کاوش ارتباط

در هر تکرار، الگوهایی یافت می شود که مکررا مورد استفاده براي تولید الگوهاي مکرر قرار می گردد (کاندیداها) که در تکرار بعدي محسوب می شود. رویکرد اساسی دیگر از کاوش ارتباط قاعده رشد FP است که می توانند الگوهاي مکرر را با کاهش پایگاه داده کشف کنند با استفاده از دو اسکن و سپس نسل کاندید در مقایسه با پیشینی را از بین ببرد.با اولین اسکن پایگاه داده ، الگوریتم به مجموعه از اقلام مجزا با شمارش پشتیبانی مربوطه (به عنوان مثال، فرکانس) در پایگاه داده دست می یابد.سپس با اسکن دوم از پایگاه داده ، خلاصه اسکن الگوریتم پایگاه داده را در شکل یک درخت فرکانس نزولی (به عنوان مثال، درخت (FP که مجموعه کاملی از الگوي مکرر است نمایش می دهد، پس استخراج از درخت-FP به صورت بازگشتی با استفاده از مجزا کردن و رویکرد غلبه مبتنی بر الگوي رشد، به نام الگوریتم رشد FP، بدون اسکن اضافی پایگاه داده انجام می پذیرد. ساختار درختی FP به شدت فشرده یک شاخه جدید از تحقیقات در کاوش الگوهاي مکرر معرفی شده است.به تازگی، چند راه حل متمرکز و توزیع که با هدف به حداکثر رساندن عملکرد شبکه هاي حسگر بی سیم و به حداکثر رساندن عملکرد مبتنی بر نرم افزار می باشد با استفاده از پیشینی مانند

1



روش هاي رشد FP در اطلاعات شبکه هاي حسگر بی سیم پیشنهاد شده است.

-3 هدف رویکردهاي متمرکز حل مسائل مربوط به برنامه مبتنی بر شبکه گیرنده بی سیم

استفاده از یک الگوریتم کاوش ارتباط ، مانند پیشینی ، به طور مستقیم به داده هاي حسگر امکان پذیر نیست.این وضعیت منجر به پیشنهاد چارچوب DSARMکه سازگار با الگوریتم پیشینی با جریان داده هاي دریافت شده از گره هاي حسگر بودند گردید.

نتایج نشان می دهد که DSARMنیاز به فضاي حافظه و به زمان بیشتري براي موارد تولید شده نسبت به برآورد روش هاي جایگزین در نظر گرفته شده دارند،که آن با دقت بهتري از مقدار برآورد شده از روش هاي جایگزین بدست می آید.ایده اصلی روش ارائه شده براي بدست آوردن تکرار همه سنسورهاي تشخیص رخداد ، یک درخت پیشوندي بر اساس یک نظم استاندارد تولید میکند وسپس درخت را به یک ترتیب نزولی سازماندهی مجدد میکند Fp براي پیدا کردن مجموعه سنسورتشخیص رخداد مکرر به کار برده میشود به آزمایش هاي انجام شده به منظور بررسی بهبود در مصرف حافظه و زمان اجرا نشان میدهد که درخت sp به Plt دست یافته است. آزمایشات نشان میدهد که درختsp در مصرف حافظه وزمان plt بهتري دارد . نتایج الگو هاي مکرر تبدیل به قوانین انجمنی می شود که یک رخداد از نوع Eو با N رخ داده وبا پشتیبانی S اطمینان به C را توصیف می کند .

شده ،این روش با متدولوژي متمرکز بر روي مجموعه مقادیر واقعی مقایسه می شود.نتایج گزارش شده یک کاهش در تعداد پیام ها و اندازه داده ها را نشان می دهد در حالی که مقادیر پشتیبانی افزایش یافته است. مسئه اصلی در این متدولوژي افزایش هزینه براي بافر گره و همچنین تاخیر در پیام هاي حیاتی در خالت مقادیر پشتیبانی بالا می باشد.

2-4 کاوش الگوي ترتیبیSPM

کاوش الگوهاي تکرار براي پیدا کردن ساختارهاي پیچیده تر گسترش یافت مثل کاوش الگوهاي ترتیبی .دنیاي واقعی مانند:کاربرپروفایل،طب پیش بینی آب وهواي محلی،بیوانفورماتیک ،تمایل ذاتی براي استفاده از مدل شیء/رخداد مرتبط به یکدیگر را نشان می دهد .

3-4 تکنیک هاي کاوش الگوي ترتیبی در شبکه حسگر براساس دو الگوریتم

الگوریتم هاي مرسوم کاوش ترتیبی مانند Apriori_like (روشهاي مبتنی psp,gsp:Apriori و روش رشد الگويfreespan وPrefixspan )یا بعضی الگوریتم هاي جدید ابداع شده براي کار در محیط شبکه هاي حسگر میباشد.

-5 هدف روش هاي متمرکز براي حل مسائل کاربردي

WSN ها

-4 هدف رویکردهاي توزیع شده براي حل مسائل wsnهاي برپایه کاربرد

رومر یک تکنیک داده کاوي درون شبکه اي را براي شناسایی الگوهاي تکراري رخدادها با خصوصیات زمانی و فضایی خاص مطرح کرده است. در این روش کاربر حدبالاي maxscope و maxhistory (متغییرهایی که باید در لحظه اندازه گیري شوند)را براي الگوي مورد نظر تعیین می کند. سنسور این رویدادها را جمع آوري می کند و یک الگوریتم کاوش براي کشف الگویی که با پارامترهاي داده شده صدق کند را به کار می برد

1-4 هدف رویکردهاي توزیع شده براي افزایش کارایی wsn

ها

SamaraوBoukerche یک متدولوژي استخراج داده را براي متراکم ساختن داده ها در گره سنسور نشان دادند که تعداد پیغام ها را درطول انتقال کاهش میدهد براي ارزیابی درستی روش توزیع

2

Esposito و همکاران ،یک چهارچوب کاوش ترتیبی رابطه اي چندبعدي را براي شناسایی روابط زمانی مکرر مخفی بین گره هاي سنسور،ارائه دادند .الگوریتم براساس روش جستجوي عمومی سطح دانایی((level-wise به نامApriori براي شناسایی سنسورهاي مرتبط به هم می باشند.هرسنسور اطلاعات توپولوژي با مقادیر رطوبت،درجه حرارت ،نور ومقدارولتاژرادرهر31ثانیه یک بارجمع آوري کرد.نتایج یک رابطه قوي بین برخی از اندازه گیري ها رانشان داد که براي تشخیص ناهنجاریها مفید است.یک ویژگی مهم معماري مطرح شده ،توانایی تصمیم گیري براساس فعالیت هاي پیش بینی شده است.نقطه ضعف کلیدي این واقعیت است که کل سابقه فعالیتها باید به صورت offline ذخیره وپردازش شوند که براي کارهاي بزرگ پیش بینی برروي دوره زمانی طولانی ،عملی نیست.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید