چکیده

با توسعه شبکه های اجتماعی مانند فیس بوک و تیوتر، پیشرفت تکنولوژی دادهکاوی در شـبکههـای اجتمـاعی منجـر بـه تهدیـدات امنیتی برای حریم خصوصی کاربران و افشای اطلاعات های محرمانه میشود. بنابراین قبل از به اشـتراک گـذاری یـا انتشـار دادههـا، این اطلاعات خصوصی باید پنهان شوند تا از دسترسی غیرمجاز کاربران در امان بمانند. در این مقاله جهت حفاظت از حریم خصوصـی کاربران و امنیت اطلاعات محرمانه یک روش جدید برای پنهان سازی مجموعه عناصر تکرار شونده حساس مبتنی بر سیسـتم ایمنـی مصنوعی پیشنهاد شده که این الگوریتم تراکنشی با کمترین طول مسیر و بیشترین حساسیت را انتخاب می کنـد و عناصـر مناسـب را حذف میکند، ارزیابی نتایج آزمایشات کارایی روش پیشنهادی را نشان می دهد.

کلمات کلیدی: حفاظت از حریم خصوصی، شبکههای اجتماعی، جلوگیری از افشای اطلاعات حساس، سیستم ایمنی مصنوعی((AIS

.۱ مقدمه

همانطور که تکنولوژی داده کاوی به سرعت پیشرفت میکند و سالها تلاش در زمینه داده کاوی باعـث ایجـاد تکنیکهـای مـوثر گوناگونی شده است. به دست آوردن اطلاعات خصوصی کاربران از طریق این تکنولوژی بیشـتر مـی شـود. اطلاعـات خصوصـی شامل برخی از اطلاعات محرمانه از قبیل کد امنیت اجتماعی، اطلاعات مربوط به آدرس، شماره کارت های اعتباری وغیره اسـت. بر اساس اهداف تجاری، برخی از اطلاعات مشترک بین شرکت ها ممکن است توسـط شـرکت هـای دیگـر اسـتخراج و تحلیـل شوند، که این امر نه تنها سود شرکت ها را افزایش می دهد بلکه همچنین باعث دستیابی اطلاعات خصوصی نیـز مـی شـود. بـه اشتراک گذاری داده و یا دانش ممکن است باعث دسترسی افراد غیر مجاز به اطلاعات خصوصـی شـوند. بنـابراین نـه تنهـا بایـد جلوی کشف اطلاعات خصوصی گرفته شود بلکه نباید اجازه داد تا تکنیکهای داده کاوی بتوانند دانش حساس را کشف کنند. بـه همین علت تحقیق در زمینه حفظ حریم خصوصی در دادهکاوی یک موضوع مهم میباشد. حفظ حریم خصوصی معمولا اجرا مـی شود تا اطلاعات حساس را پنهان کند.

بنابراین قبل از به اشتراک گذاری یا انتشار پایگاه داده، این اطلاعات خصوصی و حساس باید پنهان شوند تا از دستیابی هـای غیـر مجاز دیگران در امان بمانند. به همین دلیل حفظ حریم خصوصی در داده کاوی یک موضوع مهـم در زمینـه داده کـاوی و امنیـت پایگاهداده است .[۱۰] در [۱] بیان کرد که حل مساله مربوط به حفظ حریم خصوصی از درجه سختیNP است.

هدف این مقاله ارائه الگوریتمی مبتنی بر سیستم ایمنی مصنوعی است که بتواند تمام مجموعه عناصر تکرار شـونده حسـاس را بـا تعداد مجموعه عناصر غیر حساس گمشدهی کاهش یافته، پنهان کند. آزمایشات انجام شده کارایی الگوریتم را نشان می دهد. ادامه مطالب این مقاله به صورت زیر سازماندهی شده است. بخش ۲ مربوط به معرفی برخی از کارهای مرتبط میباشد. در بخش ۳ به توصیف مساله این مقاله پرداخته شده است. الگوریتم پیشنهادی در بخش ۴ مطرح شده است. در بخش ۵ بـه معرفـی یـک مثال پرداخته شده است. نتایج آزمایشات در بخش ۶ مطرح شده است. بخش ۷ مربوط به نتیجه گیـری و پیشـنهادات آینـده مـی باشد.

.۲ مروری بر مقالات مرتبط

در [۱] اولین الگوریتم تجربی برای پنهان کردن قواعد انجمنی حساس از طریق کاهش پشـتیبانی مجموعـه هـای عناصـر تولیـد کننده قواعد حساس به کمتر از حداقل پشتیبانی تعیین شده توسط کاربر ارایه شد.

در [۲] سه الگوریتم تجربی برای پنهان کردن قواعد انجمنی حساس بر مبنای کاهش یا پشتیبانی یا اطمینان قواعـد و نـه هـر دو مطرح شد که هر بار تنها یک قاعده را پنهان میکنند. دو الگوریتم اول اطمینان قواعد حسـاس را کـاهش مـی دهنـد، توسـط (۱ افزایش پشتیبانی مقدم قاعده تا زمانی که اطمینان قاعده کمتر از حداقل اطمینان شود یا (۲ توسط کاهش پشتیبانی نتیجه قاعـده تا زمانی که اطمینان قاعده کمتر از حداقل اطمینان شود. سومین الگوریتم، پشتیبانی قاعده حساس را توسط کـاهش پشـتبانی یـا مقدم یا نتیجه قاعده کاهش میدهد تا زمانی که یا پشتیبانی کمتر از حداقل پشتیبانی یا اطمینان قاعده کمتـر از حـداقل اطمینـان قاعده شود. عیب این روشها این است که قواعد حساس نباید با هم همپوشانی داشته باشند.

مولفان در [۳] اولین کسانی بودند که روش های برای پنهان کردن چند قاعده حساس بـه صـورت همزمـان را ارئـه دادنـد. ایـن الگوریتم ها بدون بدون توجه به تعداد مجموعه عناصر حساس، نیاز به دو پویش پایگاه داده دارند. در اولین پویش، بـرای افـزایش سرعت یافتن تراکنش های حساس یک فایل اندیس ایجاد می شود و در دومین پـویش، پایگـاه داده اصـلی بـرای پنهـان کـردن دانش حساس ایمنسازی می شود.