بخشی از مقاله
خلاصه
حفظ محرمانگی اطلاعات در پایگاه دادههای برونسپاری شده جهت تامین حریم خصوصی کاربرانی که دادههای مربوط به آنها در این پایگاه دادههای برونسپاری شده نگهداری میشوند همچنان بخش وسیعی از کارهای محققین در این زمینه را به خود اختصاص داده است. اکثر قریب به اتفاق روشهای ارائه شده برای حفظ محرمانگی اطلاعات برون سپاری شده از تکنیکهای مبتنی بر رویکرد رمزنگاری دادههای برونسپاری شده استفاده میکنند که دارای سریار محاسباتی و ارتباطی غالبا سنگینی هستند. درسالهای اخیر رویکردی جدید تحت عنوان رویکرد بخشبندی دادههای برونسپاری شده برای حفظ محرمانگی اطلاعات مطرح شده است.
ایده اصلی این رویکرد استفاده حداقلی از رمزنگاری و حذف ارتباط های حساس بین دادهها میباشد. در این مقاله با ارائه یک روش جدید مبتنی بر ماتریس پیوستگی و افزودن فاکتور شرطپذیری به این ماتریس و استفاده از ترکیب رویکرد بخشبندی و رمزنگاری، سعی در پایین آوردن سربار محاسباتی و ارتباطی ناشی از اجرای پرسوجوهاروی دادههای برونسپاری شده باحفظ محرمانگی اطلاعات در دادهها داریم.
.1 مقدمه
تکامل سریع فناوریهای ذخیره سازی، پردازشی و ارتباطی باعث تغییر در معماری سیستمهای اطلاعاتی سنتی شده است. این تغییر به دو دلیل عمده صورت میگیرد[1]، اول اینکه میزان اطلاعات تولید و ذخیره شده توسط سازمانهای بزرگ و شرکتهای کوچک دولتی و خصوصی به سرعت در حال افزایش است - به لطف همه گیر شدن وسایل ارتباط جمعی و امثال آن - . دوم اینکه داده های موجود در یک سازمان می توانند شامل اطلاعات حساس باشند.
به عنوان مثال اطلاعات شناسایی افراد، اطلاعات مالی، اطلاعات پزشکی و غیره. به هر حال طراحی، اجرا و مدیریت سیستمی امن در درون سازمان که قادر به حفظ محرمانگی اطلاعات حساس باشد میتواند بسیار پرهزینه باشد. در سالهای اخیر سرویسهای انتشار و برونسپاری دادهها رشد قابل ملاحضهای داشتهاند و جزء لاینفک وب شدهاند. چون از یکطرف دیگر دسترسپذیری دادههای برونسپاری شده به شدت افزایش مییابد.این سناریو را سناریوی برونسپاری داده میگویند.
در سناریوی برونسپاری 1داده ها که اولین بار توسط هاسیگوموس در[1] معرفی شد، مدیریت دادهها به شخص سومی واگذار شده است، این سناریو به اندازهای با استقبال مواجه شد که مفهوم پایگاه داده به عنوان سرویس 2مطرح گردید. مدل اصلی استفاده شده در این سناریو، در شکل 1 نمایش داده شده است . کار ما بر روی پایگاه داده رابطهای میباشد، دلیل استفاده از پایگاهداده رابطهای نیز روشن است، زیرا در حال حاضر شایعترین نوع مدیریت دادههاست و همچنین دارای یک زبان پرسوجوی ساده و قاعدهمند است.
در بخش 2 توضیحی کلی راجع به موجودیتهای شکل1 بیان میکنیم. علاقه روبه رشد جامعه پژوهشی را میتوان از حجم عظیم کارهای صورت گرفته در این حوزه را شاهد بود - به طور مثال،[ 16]،[15]،[14]،[13]،[12]،[8]،. - [9] با این وجود، برونسپاری دادهها، چالشهای امنیتی جدیدی به همراه دارد. در این سناریو اطلاعات حساس سازمان در محلی نگهداری میشوند که تحت کنترل مستقیم مالک دادهها نیست. در نتیجه محرمانگی دادهها میتواند توسط مهاجمان به خطر بیافتد.
مهاجمان میتواند شامل مهاجمان خارجی و کاربران غیرقابل اعتماد در سمت سرویسدهنده باشد. اطلاعات امروزه شاید مهمترین و با ارزشترین منابع هر سازمانی باشند، اولین طرحهای پیشنهادی که برای حفظ محرمانگی اطلاعات ارائه شدند، مبتنی بر این فرض ضمنی بودند، همه داده های برونسپاری شده به یک اندازه حساساند. بنابراین محرمانگی را از طریق رمزنگاری همه دادهها تامین میکردند، - به طور مثال [11] و . - [12]استفاده از تکنیکهای رمزنگاری3 ساده برای تامین محرمانگی اطلاعات در پایگاهداده برونسپاری شده، عملی نیست. چرا که امکان انجام پرسوجو4 بر روی دادهها را از سرویسدهنده خارجی سلب میکند.
البته در [1] - و - [7 ]، راهحلهایی نیز توسعه داده شد، تا بتوان قادر به اجرای پرس وجو روی دادههای رمزگذاری شده باشیم، چنین راهحلهایی از تکنیکهایی نظیر شاخصگذاری5 استفاده میکنند، سرور ذخیره سازی دادهها میتواند با استفاده از شاخصها، به طیف خاصی از پرسوجوها پاسخ دهد. روشهای مبتنی بر شاخص از نظر سربار محاسباتی و ارتباطی بسیار پرهزینه میباشند. برای بهبود کارایی اجرای پرسوجوها و پوشاندن نقصهای رویکرد رمزنگاری، جامعه پژوهشی، پیشنهاد استفاده از رویکرد بخش بندی دادهها6 را ارائه کرد .
[2] دیدگاه اصلی این رویکرد بر دو فرض استوار است، اول اینکه همه داده های موجود در پایگاه داده برونسپاری شده به یک اندازه حساس نیستند،.[15] دوم اینکه دادهها به خودی خود حساس نیستند، این ارتباط7 بین آنهاست که حساس بوده و منجر به افشای اطلاعات میشود. از این رو ایده اصلی این رویکرد برای حفظ محرمانگی اطلاعات این است که، به جای رمزنگاری دادهها، ارتباطهای حساس بین دادهها حذف شود، شکل2 استفاده از بخش بندی برای محافظت از داده ها را نشان می دهد. - مقالههای [3]،[4]،[6]،[14] در این حوزه ارائه شدهاند - .
نکتهای کلیدی که در پیشنهادهای قبلی تحت رویکرد بخشبندی دادهها به آن اشاره نشده است و تاثیر مستقیمی بر پایین آوردن سربار محاسباتی و ارتباطی ناشی اجرای پرسوجوها بر روی دادههای بخشبندی شدهی برونسپاری شده دارد، این است که بسته به نوع سازمان و کاربران مربوط به آن، نوع پرسوجوهای کاربران، اغلب شبیه به هم هستند، حال اگر بتوانیم با ایجاد یک سازوکار، یک صفت8 که دارای بیشترین تکرار9 در بخش شرط 10پرسوجوهاست، را حتی الامکان بصورت غیر رمزگذاری شده، در سمت سرور خارجی ذخیره کنیم، بالطبع سرعت و دقت اجرای پرسوجو روی یک صفت که غیررمزگذاری شده است، نسبت به صفتای که رمزگذاری شده بسیار بیشتر است.
در این مقاله ما به این مسئله اشاره میکنیم و روش خود را براساس روشهای قبلی، منطبق بر محدودیتهای محرمانگی و دیدپذیری و با درنظر گرفتن فاکتور شرطپذیری برای هر صفت، ارائه میکنیم. در این روش از ترکیب رویکرد بخشبندی و رویکرد رمزنگاری برای پوشاندن ضعفهای هریک به صورت همزمان استفاده میکنیم، در نتیجه به یک مدل جامعتر از مسئله بخشبندی برای حل مشکلات سربارهای محاسباتی و ارتباطی میرسیم. این مقاله به چهار قسمت تقسیم شده است، بخش دوم که مفاهیم پایه را تعریف میکند، بخش سوم که به تعریف مسئله میپردازد، بخش چهارم نیز به ارائه روشپیشنهادی میپردازیم. در بخش پنجم هم به ارائه نتایج و آزمایشات میپردازیم.
.2 مفاهیم پایه
مدلی که سناریوی برونسپاری دادهها از آن پیروی میکند و به نام پایگاه داده به عنوان سرویس، شناخته میشود، توسط هاسیگوموس در [1] ارائه شده است. این مدل که در شکل 1 نشان داده شده است، از چند موجودیت تشکیل شده است، مالک1 داده، صاحب اصلی دادههاست و دادهها را تولید، برونسپاری و بروزرسانی میکند. در بسیاری از روشهای مطرح شده کلاینت و مالک دادهها را، یکی در نظر میگیرند. کاربر، میتواند کاربر انسانی یا برنامهای کاربردی باشد، که بر روی دادهها پرسوجو میزند، کاربر از نحوه برونسپاری اطلاعی ندارد.