بخشی از مقاله
خلاصه:
امروزه بحث داده های عظیم و شبکه های اجتماعی در دنیا به عنوان یک مطلب داغ برای جستجو در اینترنت و فضای مجازی و همچنین در سطح معاملات شده است و در بسیاری از صنعت ها در کشورهای پیشرفته برای افزایش سود و به تبع آن زیان و ضرر کم تر استفاده می شود [1,2,10] کلمه ی big data یا همان داده های عظیم شامل مقداری بسیار بزرگ و پیچیده از داده های طبقه بندی شده است که پردازش آنها توسط دستگاه ها و نرم افزارهای پردازش سنتی امکان پذیر نیست.[2] می توان گفت داده های عظیم نسل تازه ای از تکنولوژی و معماری را توصیف می کند که به صورت اقتصادی طراحی شده اند و امکان کشف و آنالیز سریع از داده های موجود را فراهم می آورند.
مسلما کشف و آنالیز سریع داده ها نیازمند نوع جدیدی از پردازش با سرعت بالا می باشد . داده هایی با این وسعت و حجم بالا در هر زمان نیاز به مراقبت و حفاظت خواهند داشت . چون با اینکه داده های عظیم یک منبع رایگان از اطلاعات است ، اما اغلب دارای اطلاعات حساس است که نیازمند محافظت از دسترسی های غیر مجاز و حذف و پاک شدن است [4,6,8]. می توان گفت شاید مهم ترین چالش مطرح شده و مهم و حساس همین مبحث امنیت و حریم خصوصی به خصوص در حوزه ی شبکه های اجتماعی باشد . نمایندگی های دولت ، کارکنان بخش مراقبت های بهداشتی ، محققان پزشکی و شرکت های خصوصی روی داده های عظیم سرمایه گذاری می کنند و خواهان سود های کلان از سمت داده های عظیم هستند.
لذا در این باره کارهای متعددی برای امنیت و حفاظت از حریم خصوصی در داده های عظیم انجام شده است.[6] از جمله این روش ها می توان به رمز نگاری ، نرم افزارهای نظارت و ردیابی ، روش iRODS ، محافظت ناشناخته شایع ، منشا داده ، قطعه بندی و خرد کردن داده ، روش های چند مستاجری ، توزیع شدگی در سطح گره ها و ارتباط آنها ، ممیزی با دانه بندی مناسب ، کنترل دسترسی دانه بندی شده ، امنیت بر پایه توانایی و حفظ جامعیت اشاره کرد [6,8,12,13,16]
.1مقدمه
داده های عظیم به طور کلی شامل اکتساب داده و آماده سازی آن ، ذخیره سازی ، مدیریت ، آنالیز، کاوش و تفسیر آن است.[1] در عصر داده های عظیم با توانایی های محاسباتی در حال رشد ، شبکه های ارتباطی نیازمند رشد همگام با ظرفیت های بالا می باشد. امروزه با حضور گسترده ی اشخاص در شبکه های اجتماعی، و تولید روز افزون داده توسط آنها با به اشتراک گذاشتن فایل ها، تصاویر و فیلم های با حجم قابل توجه، میزان افزایش داده را به صورت تصاعدی رو به رشد قرار داده است.
در حالی که رشد شبکه محدود است و نمی تواند در سرعت پردازش و توان ذخیره سازی همگام با رشد توانایی های محاسباتی رشد و توسعه یابد. یکی از دلایل بسیار مهم که این روزها مبحث داده های عظیم را تبدیل به یک مبحث داغ در دنیای تکنولوژی کرده است ، این است که با تحلیل حجم زیادی از داده ها ، می توان به تحلیل های دقیق تری و پیشرفته تری در مقاصد مختلف پزشکی ، تجاری و امنیتی رسید که خود باعث می شود نتایج به دست آمده دقیق تر ، مناسب تر و مقبول تر باشد.[7,4,9]
یکی از مهم ترین چالش های مطرح در بحث داده های عظیم ، مسئله امنیت و حریم خصوصی است . چون همزمان با رشد و توسعه ی داده ها ، باید امنیت آنها نیز فراهم شود . می توان به بحث امنیت از این دید نگاه کرد که اگر کوچکترین آسیبی به داده ها برسد ، به دلیل مقیاس بزرگ داده ها ، می تواند خسارات بزرگی را به همراه داشته باشد . و از بعد دیگر یعنی بعد حریم خصوصی می توان چالش ها را این طور دید که وقتی از اطلاعات شخصی یک شخص استفاده می شود تا به نتایج دقیق تری در مورد آن شخص رسید ، ممکن است آن شخص خاص علاقه ای به کشف اطلاعات خود توسط مدیر داده ها که به اطلاعات دسترسی دارد یا هر شخص مرتبط با داده های عظیم مربوط ، نباشد و اطلاعات شخصیش برای او جنبه سری یا مثل یک راز باشد.
- - 8,10 و از طرفی جمع آوری اطلاعات از کاربران برای افزایش ارزش اطلاعات موجود در داده های عظیم ، ممکن است بدون اطلاع شخص باشد و شخص مذکور غافل از این دیدزنی در اطلاعات شخصی خودش باشد . از طرفی دیگر و می توان گفت چالشی دیگر که در این زمینه مطرح است ، برخورد افراد مختلف و در واقع طرز تفکر آنها نسبت به داده های عظیم است . یک شخص با سواد و تحصیل کرده که مزایای داده های عظیم را می داند و از پیشگویی های آن نهایت استفاده و لذت را می برد ، در مقابل شخصی با سواد پایین که استفاده از اطلاعات شخصی اش به هر دلیلی او را ناراحت و آزرده خاطر خواهد کرد و مسلما دید جالبی نسبت به داده های عظیم نخواهد داشت.
در واقع شاخه ی حریم خصوصی در داده های عظیم را می توان شامل دسته ای از چالش ها از جمله : تعامل با اشخاص حقیقی ، حملات ، نتایج احتمالی و قابل اثبات و تاثیرات اقتصادی [4,5,9,11]. یکی از مهم ترین کارهای انجام شده در این زمینه تکنولوژی iRODS نام دارد . این تکنولوژی به عنوان روشی جدید برای امنیت و حریم خصوصی در داده های عظیم مطرح شد. این روش یکی از چندین برنامه های مدیریت داده است که توسط بسیاری از موسسات علمی به تصویب رسیده است و در سراسر جهان بسیاری از نشریات این موضوع را شرح می دهند که راههای بی شماری در تکنولوژی iRODS که برای حل بسیاری از چالش های مبتنی بر حریم خصوصی عملی شده است.
روش دیگر محافظت ناشناخته شایع می باشد که یک تکنولوژی کلیدی برای رسیدن به حفاظت از حریم خصوصی به شمار می رود که هنوز در مرحله توسعه و پیشرفت است . طرح اولیه و بهینه محافظت ناشناخته شایع تمرکز دارد بر داده های ساکن و محل لحظه ای داده های در حال حرکت ، چون داده های در حال حرکت مدام با موقعیت های گوناگون و گاها تکراری مواجه هستند 12].و[14 یکی دیگر از مهم ترین کارها تکنولوژی منشا داده است که باید گفت این تکنولوژی نخست و قبل از ضرورت مفهوم داده های عظیم به طور وسیع تر در شاخه کاری پایگاه داده ها مطالعه شد.
روش قطعه بندی و خرد کردن داده که تقسیم داده ها بین گره های مختلف است نیز از روش های مهم در زمینه امنیت و حریم خصوصی شناخته می شود.اما روش های کلی که ما در این مقاله به آنها اشاره خواهیم کرد از سه بعد ساخت پلت فرم امنیت داده های عظیم ، تسریع ایجاد سیستم تکنولوژی اطلاعات و اجرای قوانین و مقررات مربوط و آگاه سازی مردم نسبت به موضوع امنیت اطلاعات ، به مسئله خواهیم نگریست و توضیحات کافی در این باره داده خواهد شد.
.2روشهای مطرح شده در بحث امنیت و حریم خصوصی شبکه های اجتماعی با رویکرد داده های عظیم: داده های عظیم در واقع طبیعت عادی امنیت و حریم خصوصی در داده ها را تغییر داده است. طبقه بندی و ذخیره سازی اطلاعات زیادی که مثلا می تواند شامل اطلاعات آی پی مشتریان ، کاربران ، بودجه شرکت ها یا اطلاعات کلیدی از نتایج تحقیقات ادارات دولتی باشد ، همواره تحت آسیب هکرها ، نفوذ و تغییر به علت ارزش بالایشان خواهند بود. می توان بحث در مورد امنیت داده ها را از چند بعد بررسی کرد:
.2,1داده های عظیم ریسک به خطر افتادن و نفوذ و فاش شدن اطلاعات را افزایش می دهد:
میزان و مقدار داده های موجود در داده های عظیم بسیار وسیع و گسترده هستند و رنج بسیار زیادی از داده ها شامل سنسورها ، شبکه های اجتماعی ، ایمیل ها و ... می شود. حجم زیاد داده ها ، شانس به خطر افتادنشان را افزایش می دهد . کلیه ی داده های موجود ، داده های حساس و حیاتی هستند و این کار ما را در حفظ کردن آنها از خطرها و حملات سخت تر می کند.[1,2,6] در واقع با فاش شدن اطلاعات شخصی ، حریم خصوصی شخص رعایت نمی شود و ممکن است بسیاری از اطلاعات شخصی که افراد روی آن حساس هستند ، مثل شماره تلفن ها ، آدرس منزل و محل کار ، رمزهای عبور ، رمز کارت های بانکی به هنگام معاملات و ... فاش شود که می تواند اتفاقات ناخوشایندی را به دنبال داشته باشد.