بخشی از مقاله

خلاصه

داده های بزرگ عبارتی است که مدتهاست درباره آن میشنویم اما هنوز ابهاماتی در رابطه با ماهیت حقیقی این بزرگدادهها وجود دارند. در حقیقت، دادهها بزرگ نیروی محرکه اصلی در ظهور تکنولوژیهای جدید از جمله هوش مصنوعی، علم دیتا و اینترنت اشیاء در عصر دگرگونی دیجیتالی هستند. با درنظر گرفتن این تعاریف، بر آن شدیم که تعریفی جامع و ابتدایی از ماهیت داده های بزرگ داشته باشیم. بنابراین در این مقاله در ابتدا داده های بزرگ را تعریف می کنیم و سپس به بررسی چالش ها و خصوصیات و کاربردهای این موضوع می پردازیم، در انتها به نتیجه گیری در این حوزه می پردازیم.

کلمات کلیدی: داده های بزرگ، چالش ها، کاربرد، خصوصیات.

.1 مقدمه

داده های بزرگ 2یا کلان داده چندسالی است که در ادبیات فناوری اطلاعات به یک اصطلاح فراگیر تبدیل شده است. اگر بخواهیم تعریفی از داده های بزرگ ارائه کنیم می توانیم آن را مجموعه دادههایی بدانیم که اندازه آنها فراتر از حدی است که با نرم افزارها و روشهای معمول بتوان آنها را در یک زمان قابل قبول، دریافت، ذخیره، مدیریت و پردازش کرد. در این تعریف، حجم داده مشخص نشده است چون میزان کلان بودن داده همزمان با پیشرفت فناوریهای ذخیرهسازی و پردازش اطلاعات روز به روز و عموماً بهخاطر تولید داده توسط تجهیزات و ابزارهای مختلف دیجیتال در حال افزایش است. گوشیهای موبایل، حسگرهای محیطی، لاگ نرمافزارهای مختلف، دوربینها، میکروفونها، دستگاههای تشخیصRFID ، شبکههای حسگر بیسیم، ایستگاههای هواشناسی، سامانههای امواج رادیویی، مبادلات شبکههای اجتماعی آنلاین، متون و اسناد اینترنتی، دادههای نجوم، اطلاعات پزشکی و سلامت بیماران، اطلاعات سامانههای خرید از فروشگاهها، پژوهشهای زمینشناسی و غیره نمونههایی از دادهها در مقیاس کلان هستند. مقیاسی که امروزه از گیگابایت و ترابایت به پتا بایت و اگزا بایت و زتا بایت در حال حرکت است برای ایجاد یک دید مناسب در خصوص داده های بزرگ و اهمیت آن، جامعه ای را تصور کنید که در آن جمعیت بطور نمایی در حال افزایش است، اما خدمات و زیرساخت های عمومی آن نتواند پاسخگوی رشد

جمعیت باشد و از عهده مدیریت آن برآید. چنین شرایطی در حوزه داده در حال وقوع است.[2] [1] بنابراین نیازمند توسعه زیرساخت های فنی برای مدیریت داده و رشد آن در بخش هایی نظیر جمع آوری، ذخیره سازی، جستجو، به اشتراک گذاری و تحلیل می باشیم. دستیابی به این توانمندی معادل است با شرایطی که مثلا بتوانیم “هنگامی که با اطلاعات بیشتری در حوزه سلامت مواجه باشیم، با بازدهی بیشتری سلامت را ارتقا دهیم” ، “ در شرایطی که خطرات امنیتی افزایش پیدا میکند، سطح امنیت بیشتری را فراهم کنیم”، “وقتی که با رویدادهای بیشتری از نظر آب و هوایی مواجه باشیم، توان پیش بینی دقیق تر و بهتری بدست آوریم ”، “در دنیایی با خودروهای بیشتر، آمار تصادفات و حوادث را کاهش دهیم”، “تعداد تراکنش های بانکی، بیمه و مالی افزایش پیدا کند، ولی تقلب کمتری را شاهد باشیم”، “با منابع طبیعی کمتر، به انرژی بیشتر و ارزانتری دسترسی داشته باشیم” و بسیاری موارد دیگر از این قبیل که اهمیت پنهان داده های بزرگ را نشان می دهد.

.2 داده های بزرگ

داده های بزرگ در حقیقت بیانگر حجم زیادی از داده می باشد که آنالیز و دسته بندی آن ها به وسیله زیرساخت ها و دیتابیس های رایج مشکل می باشد. سازمان های بزرگ با انبوه اطلاعات متنوعی چون ایمیل، عکس، ویدیو، گزارشات روزانه، نوشته و اطلاعات روزانه مواجه هستند که می بایست به صورت هوشمندانه ای طبقه بندی گردند تا به سرعت و در زمان کوتاهی قابل بررسی و دستیابی باشند.[4] [3]

دانشمندان و محققان بر این باورند که داده بزرگ امروزه به اصطلاحی فراگیر و مبحثی مهم تبدیل شده در ادبیات فناوری اطلاعات است که مورد توجه دانشگاه ها، دولت ها و صنایع قرار گرفته شده. همان طور که سازمان ها بزرگ میشوند، اطلاعات مرتبط با آن ها نیز به صورت تصاعدی رشد می نماید و به تبع پیچیدگی های مرتبط با دادهها افزایش می یابد. سرعت دادههای جدید در حال تولید سرسام آور است. بسیاری از سازمان های بزرگ در برنامه های کاربردی متفاوتشان دادههای زیادی در فرمت های مختلفی را دارند. به همان میزان که دادهها گسترش می یابند، دسته بندی آن ها با یک الگوریتم یا منطق مشخص بسیار دشوار می گردد. سازمان های بزرگ در واقع با این چالش مواجه هستند که تمامی اطلاعات را در یک پلتفرم نگهداری نمایند و یک دیدگاه ثابت به آن ها داشته باشند. این چالش منحصر به فرد برای درک تمامی دادههایی که از منابع متفاوت به دست می آیند و استخراج اطلاعات علمی مفید از آن ها، انقلاب داده بزرگ جهانی نامیده می شود. از سویی انجام کسب و کار بر خلاف گذشته نیازمند تصمیم گیری هوشمند است.[5]

امروزه، داده بزرگ به یکی از مباحثی تبدیل شده است که در روند توسعه تکنولوژی بسیار به آن پرداخته میشود. در حقیقت چالش واقعی با سازمان های بزرگ دریافت حداکثر اطلاعاتی است که در حال حاضر در دسترس است و همچنین پیش بینی این موضوع که چه نوعی از دادهها در آینده جمع آوری می شود. در واقع چگونه می توان به اطلاعات موجود، دست یافت و به آن معنا بخشید و به علاوه دستیابی به بینش دقیقی در مورد دادههای گذشته یکی از نقاط کلیدی در بحث هایی است که در بسیاری از جلسات اجرایی در سازمانها مورد انتظار است .[7] [6] با انفجار دادهها، داده بزرگ به یک واقعیت در بسیاری از سازمان ها تبدیل شده است. در واقع داده بزرگ یک اصطلاح در حوزه فن آوری اطلاعات است که به منظور توصیف حجم بالای اطلاعات ساخت یافته و غیر ساخت یافته استفاده می شود و به منظور تحلیل های مختلف و تصمیمات هوشمند در جهت بهبود کسب و کار شرکتها و سازمانها مورد استفاده قرار می گیرد .[9] [8]

تاکنون، هیچ تعریف جهانی پذیرفته شده ای از داده بزرگ بیان نشده است اگر بخواهیم تعریفی از داده بزرگ ارائه کنیم می توانیم آنرا مجموعه دادههایی بدانیم که اندازه آنها فراتر از حدی است که با نرم افزارها و روشهای معمول بتوان آنها را در یک زمان قابل قبول، دریافت، ذخیره، مدیریت و پردازش کرد. داده بزرگ در اصل به معنای حجم داده ای است که نمی تواند با روش ها و ابزارهای سنتی پایگاه دادهها بصورت موثر پردازش شود. دراین تعریف، حجم داده مشخص نشده است چون میزان کلان بودن داده همزمان با پیشرفت فناوریهای ذخیرهسازی و پردازش اطلاعات روز به روز و عموماً بهخاطر تولید داده توسط تجهیزات و ابزارهای مختلف دیجیتال در حال افزایش است. در واقع داده بزرگ اصطلاحی است که دسترسی به دادههای بزرگ اعم از دادههای همگون و ناهمگون در حال رشد با ضریب فزاینده را توصیف می نماید و به مجموعه دادههایی اطلاق میشود که مدیریت، کنترل و پردازش آنها فراتر از توانایی ابزارهای نرم افزاری در یک زمان پذیرفتنی و مورد انتظار است.
برای نمونه یک فروشگاه×اینترنتی را در نظر بگیرید که بتواند با بررسی کلیک بازدیدکنندگان بر روی لینک های مختلف وب سایت، به علایق و سلیقه مشتریان یی ببرد و بدین سان کس و کار خود را  بهبود بخشد . یا دولت یک کشور می تواند با درصد شبکه های اجتماعی به مقابله و ییشگیری از ناهنجاری های جامعه بپردازد. نمونه بارز آن موتور جستجوی گوگل است که به دسته بندی و اولویت بندی علایق کاربران در کشورهای مختلف می پردازد و کاربران را در دستیابی×به×اطلاعات مورد  نظرشان راهنمایی می نماید؟همچنین  شهرداری یکی از شهرهای بزرگ آمریکا توانسته با جمع آوری داده ها و اطلاعات در  بیش از 30 نقطه جغرافیایی شهری و آنالیز×این×اطلاعات، به منظور کاهش جرم و جنایت و نیز ارایه خدمات بهتر شهری استفاده کند.

.3 چالش ها و خصوصیات داده بزرگ

تاکنون چالش های زیادی در حوزه داده بزرگ مطرح شده است که تا حدودی از جنبه تئوری ابعاد مختلفی از مشکلات این حوزه را بیان میکنند. این چالش ها در ابتدا سه بعد اصلی حجم داده، نرخ تولید و تنوع به عنوان سه بعدی مطرح شدند ولی در ادامه چالش های بیشتری در ادبیات موضوع توسط محققان مطرح شده است:

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید