بخشی از مقاله
استفاده از يادگيري ماشين مبتني بر ژنتيک براي ايجاد خودکار قوانين فازي در امنيت RFID
چکيده
سيستم هاي فازي توانايي خود را براي حل انواع مختلف مسائل در حوزه ي برنامه هاي کاربردي نشان داده اند در حال حاضر علاقه ي وافري براي تکميل و تقويت سيستم هاي فازي با استفاده از يادگيري و تطبيق قابليت ها وجود دارد. دو مورد از موفق ترين رويکردهايي که براي ترکيب سيستم هاي فازي و روش هاي يادگيري که در عرصه محاسبات نرم ارائه شده اند، سيستم هاي فازي -عصبي و سيستم هاي فازي - ژنتيکي هستند.
برنامه هاي کاربردي مختلفي از تکنولوژي شناسايي اجسام توسط فرکانس راديويي ٢ (RFID) ايجاد شده اند، با اين حال تکنولوژي RFID مستعد ابتلا به انواع مشکلات امنيتي مانند استراق سمع ، محروميت از خدمات ، رديابي کاربر و شبيه سازي برچسب ٣ است . يکي از روش هاي ممکن براي رسيدگي به شبيه سازي برچسب ، سيستم تشخيص نفوذ است . ما در اين تحقيق به توصيف يک سيستم فازي مبتني بر ژنتيک ، براي تشخيص نفوذ در سيستم هاي RFID مي پردازيم که در آن از الگوريتم ژنتيکي ٤، براي ايجاد قوانين اگر-آنگاه فازي مورد استفاده در تشخيص ناهنجاري استفاده مي کنيم .
واژه هاي کليدي
سيستم هاي فازي - شناسايي اجسام توسط فرکانس راديويي - شبيه سازي برچسب - الگوريتم ژنتيکي
مقدمه
همسان سازي هويت شي ء، به خاطر اثر اجتماعي و اقتصادي جهاني اش مسئله جدي است . بر طبق نتايج بدست آمده از گروه تحقيق آبردين [١]، زيان هاي سرقتي هويت جهاني در سال ٢٠٠٢، ٧٣.٨ بيليون دلار بودند که تا پايان سال ٢٠٠٥ به ٢ تريليون دلار [٢] و انتظار مي رفت که اين عدد در سال هاي آينده افزايش رسيد يابد.
بر طبق گزارش ارائه شده توسط سازمان بهداشت جهاني (WHO)، تعداد محصولات جعلي که وارد بازارهاي جهاني مي شوند هر سال افزايش مي يابد [٣]. تعداد رويدادهاي جعلي در سال ٢٠٠٧ ده برابر سال ٢٠٠٠ شده بود. جعل کردن محصولات پزشکي براي بيماران خطرات سلامتي جدي و يا حتي مرگ به دنبال دارد و همچنين باعث زيان هاي اقتصادي بالايي براي صنايع توليدکننده محصولات اصل مي شود.
RFID يک تکنولوژي نويدبخش است ، که براي مبارزه با همسان سازي هويت شي ء، در کاربردهايي مثل زنجيره هاي عرضه دارو استفاده مي شود، زيرا قابليت ديد رديابي و پيگيري را افزايش مي دهد. RFID در کاربردهاي مختلفي مثل پرداخت خودکار که ايمني بالايي مورد نياز است ، نيز به طور افزايشي استفاده مي شود.
براي اين که يک سيستم RFID به طور موفقيت آميزي در يک محيط استفاده شود، هزينه برچسب يکي از عوامل مهمي است که بايد در نظر گرفته شود. هزينه برچسب هاي RFID بايد پايين باشد تا در بسياري از موارد کاربرد عملي داشته باشند. بعضي از برآوردها پيشنهاد مي دهند که با توليد مقياس بزرگ ، هزينه برچسب EPC تا کمتر از پنج سنت مي تواند پايين بيايد. هرچند، به خاطر مبادله ي بين هزينه و توانايي محاسباتي ، ايمن سازي سيستم هاي RFID کم هزينه ، يک چالش چشمگير، در جامعه تحقيق شده است . اين عمدتا بدان علت است ، که کاهش در ذخيره سازي برچسب و ظرفيت پردازش توانايي برچسب را، براي فراهم کردن منابع کافي ، براي اجراي الگوريتم هاي رمزي نگاشتي فشرده محاسباتي اما امن تر، محدود مي کند.
اجزاي سيستم هاي تشخيص نفوذ در RFID يک رويکرد نويدبخش ، به عنوان يک لايه امنيتي اضافي ، در بالاي پروتکل هاي ايمني ، موجود است . در اين مقاله ما به توصيف يک مکانيزم جهت ايجاد خودکار قواعد فازي با استفاده ازالگوريتم ژنتيک مي پردازيم ، که به نرخ شناسايي بالا و نرخ هشدار غلط پاييني در تشخيص نفوذ سيستم RFID برسد، سپس نتايج حاصل از اين مکانيزم را بررسي مي کنيم .
شکل ١ نمودار جريان فرآيند که ، يک سيستم تشخيص نفوذ مبتني بر منطق فازي به کار رفته در سيستم RFID است را نشان مي دهد.
يادگيري ماشين مبتني بر ژنتيک فازي
يک الگوريتم يادگيري ماشين مبتني بر ترکيب فازي و ژنتيک ، دو الگوريتم يادگيري ماشين مبتني بر ژنتيک که به عنوان رويکردهاي پيتسبورگ و ميشيگان معروف هستند را براي طراحي سيستم طبقه بندي که از قواعد پايه فازي استفاده مي کنند، ترکيب مي کند [٤]. اين الگوريتم از مزاياي الگوريتم هاي سازنده براي ارائه سيستم طبقه بندي با عملکرد بهتر استفاده مي کند.
مزيت رويکرد ميشيگان نسبت به رويکرد پيتسبورگ اين است که توانايي جستجوي کلي ، براي کشف بهترين قاعده فازي را در نمونه هاي آموزشي دارد. ضعف اين رويکرد، اين است که توانايي بهينه سازي پاييني براي قواعد پايه استفاده شده در سيستم دارد. به عبارت ديگر، رويکرد پيتسبورگ مي تواند قواعد پايه استفاده شده براي سيستم طبقه بندي را بهينه کند. هرچند، رويکرد پيتسبورگ توانايي جستجوي کلي پايين تري براي قواعد فازي در نمونه هاي آموزشي دارد.
رويکرد ترکيبي از مزيت هر دو رويکرد استفاده کند.
مي عملگرهاي ژنتيک براي ايجاد قواعد فازي جديد با استفاده از رويکرد ميشيگان انجام مي شوند تا به طور مکاشفه اي بهترين قواعد فازي را جستجو کنند در حالي که کل الگوريتم بر اساس رويکرد پيتسبورگ است . نشان داده شده است که رويکرد ترکيبي نسبت به اجزاء سازنده اش يعني رويکردهاي پيتسبورگ و ميشيگان توانايي عملکرد بهتري دارد [٤].
ايجاد قواعد پايه فازي اوليه
قواعد پايه فازي معمولا با استفاده از دانش افراد خبره ساخته مي شوند که حيطه اي را که سيستم براي آن طراحي مي شود را خيلي خوب مي شناسند. هرچند، به دست آوردن دانش از کارشناسان طاقت فرسا و گران قيمت است يا هنگام طراحي سيستم پيچيده اي که در آن مقدار اطلاعات مورد نياز خيلي زياد است خطا در آن زياد مي شود. براي فائق آمدن بر اين چالش ، روش هاي مختلفي براي يادگيري خودکار قواعد فازي از داده ها پيشنهاد شده اند[٥][٦][٧].
براي ايجاد قواعد فازي از داده هاي عددي در اين تحقيق ، ما از روش پيشنهاد شده توسط ايشيبوچي و همکاران [٨] براي مشکلات طبقه بندي استفاده مي کنيم .
طراحي مجموعه فازي مرجع
براي مشکل طبقه بندي ، نوزاکي و همکاران [٧] فرآيند ساخت قواعد فازي از داده هاي آموزش را به دو مرحله تقسيم مي کنند. در مرحله اول يک فضاي الگو به صورت نشان داده شده در شکل ٢، به فضاهاي فرعي فازي تقسيم بندي مي شود.
تقسيم بندي فضاي الگو به فضاهاي فازي به گونه اي انجام می شود که باعث ایجاد بخش های فازی خیلی کم یا خیلی زیاد نمی شود. تقسیم بندی خیلی ظریف (دقیق) و خیلی ضخیم (غیر دقیق) یک فضای الگو نامطلوب است زیرا باعث عملکرد ضعیف مدل می شود. اگر تقسیم بندی خیلی ظریف باشد، مدل به خاطر کمبود داده های آموزشی، قواعد را برای بعضی از بخش ها ایجاد نمی کند. اگر بخش خیلی ضخیم است، پس مدل چند قاعده را ایجاد می کند که خیلی کلی هستند و باعث عملکرد ضعیف مدل میشوند.
در شکل 2، ما مجموعه های فازی ۵×۵ داریم که ۲۵ بخش فازی در فضاهای دو بعدی دارند. بالانویس ، در مجموعه فازی مرجع حداکثر تعداد فضای فرعی را در هر محور نشان می دهد و i بخش فعلی را در محور معین نشان می دهد. نوزاکی و همکاران [S] دو رویکرد ممکن را برای اجتناب از مشکل بخش های فازی خیلی کم یا خیلی زیاد پیشنهاد میدهند. یکی از روش ها، استفاده از تکنیک مکاشفه ای را بر اساس تراکم مجموعه دادهها در نظر می گیرد. روش دیگر از چندین بخش فازی به طور همزمان استفاده می کند. با کاربرد همزمان چندین بخش فازی، مدل همه احتمالات تقسیم بندی فضای الگو را در نظر می گیرد. این رویکرد در شکل ۳ نشان داده شده است. رویکرد دوم توسط نوزاکی و همکاران [7] برای مشکل طبقه بندی الگو استفاده شده است. در این تحقیق، ما از رویکرد دوم استفاده می کنیم که در آن چندین بخش فازی به طور همزمان استفاده می شوند.
رويکردي که همزمان از چندين بخش فازي استفاده مي کند نيز هنگام طبقه بندي الگو با ابعاد بالا، نقص هايي دارد. اين بدان علت است که تعداد قواعد فازي ايجاد شده مي تواند زياد باشد و باعث ايجاد يک مدل پيچيده تر شود.
وقتي فضاي الگو به فضاهاي فرعي تقسيم مي شود و هر فضاي فرعي فازي مشخص مي شود، گام بعدي استفاده از هر ويژگي به عنوان يک بخش مرجع از قواعد فازي است . براي مثال ، در شکل
٣، ما ترکيب ٢(١+١٤) مجموعه ي فازي را به عنوان قسمت مرجع قواعد فازي داريم . تعداد کل بخش هاي هر ويژگي ١٤ است و ١ براي کاراکتر "بي اهميت ١" است . بالانويس ٢ تعداد ويژگي در يک الگو است (بعد فضاي طبقه بندي الگو). در قسمت بالا (به شکل ٣ مراجعه کنيد)، اگر n بعد در مسئله وجود داشته باشد، تعداد کل قواعد اگر - آنگاه فازي ايجاد شده n15 هستند.