مقاله کلان داده ، کاربردها و چالش های آن

word قابل ویرایش
6 صفحه
دسته : اطلاعیه ها
12700 تومان
127,000 ریال – خرید و دانلود

کلان داده ، کاربردها و چالش های آن
چکیده
با توجه به افزایش و گسترش روزافزون حجم انتقال اطلاعات در فضای مجازی اینترنت به خصوص در حوزه بانکداری و تجارت الکترونیکی، مسأله کلان داده ، ورود و ذخیره سازی حجم زیادی از اقلام اطلاعاتی داده ها و مدیریت آن ، پیش پردازش و پس پردازش ، سرعت ، دقت و امنیت اطلاعات از اهمیت بسیار زیادی برخوردار شده و توجه بسیاری از محققان و متخصصین در حوزه فناوری اطلاعات را به خود معطوف کرده است . در این مقاله پس از معرفی کلان داده ، موقعیت هاوکاربردهای آن در فناوری، روش ها و چالش های مطرح در این حوزه را، مورد بررسی قرار خواهیم داد.
کلید واژه : کلان داده (big data)، هادوپ ، شبکه های اجتماعی، ذخیره سازی، امنیت اطلاعات
مقدمه
باگسترشروزافزوناستفادهاز خدماتفناوریاطلاعات ،وهم چنینفراگیرشدنابزارهایدیجیتالی،هر فرد به واسطه حضور خود در فضای مجازی باعث تولید حجم زیادی از داده هامی شود. این داده هامیتواند در دو دسته بندی کلی قرار بگیرد، یک قسمت اطلاعاتی است که انسان آن را تولید کرده و قسمت بعدی اطلاعاتی است که توسط ماشین های مختلف (همانند مسیریاب ها، دوربین ها مدار بسته ، حسگرهای مختلف و …) در حال تولید است .
کلان داده « بهحجم ١ عظیمی از داده هااطلاقمی شود که که پردازش آن ها به وسیله پایگاه داده های سنتی و ابزارهای آن یرقابل انجام است ». این حجم از داده بیش از چندین اگزابایت ٢ (١٠١٨) بوده و شامل انواع مختلفی از داده هایچندرسانه ای، متن و … میشود که به شکل غیرقابل تصوری حجم آن در حال افزایش است .
حجم عظیم اطلاعات تنها یک جنبه از کلان داده را نشان می دهد، گوناگونی ٣ اطلاعات ذخیره سازی شده ،سرعت ۴ ورود اطلاعات جدید به سیستم ،مقادیر۵ اطلاعات ،وپیچیدگی ۶ آن ها همگی از ویژگیهای این حوزه از فناوری بوده که مفهوم کلان داده را نمایان می سازد. چالش های این حوزه صرفاًً منوط به ذخیره سازی و مدیریت آن نمی شود، بلکه مبحث تحلیل و پردازش کلان داده و به دست آوردن دانش ارزشمند از مهم ترین مسائل آن است .
تا سال ٢٠٠٣ میلادی ۵ اگزابایت (١٠١٨ بایت ) اطلاعات توسط انسان تولیدشده بود اما امروزه این حجم از داده تنها در دو روز توسط انسان تولید می شود. شرکت IBM در گزارش خود اعلام کرد هر روز ٢/۵ اگزابایت اطلاعات به داده های دنیا افزوده میشود که ٩٠ درصد مقدار اطلاعاتی که در حال حاضر در دست داریم فقط در دو سال گذشته تولیدشده است (٢٠١٢ Singh).
برای مثال یکی از شبکه های اجتماعی محبوب در دنیا بیش از یک میلیارد کاربر دارد که روزانه بیش از ٣٠٠ میلیون تصویر را در این شبکه اجتماعی با یکدیگر به اشتراک میگذارند، تا کنون تعداد این تصاویر بیش از ٢۴٠ میلیارد گزارش شده است و به طور میانگین روزانه ۵٠٠ ترابایت به حجم اطلاعات این شبکه اجتماعی افزوده می شود.(٢٠١٢ Tam)
امروزه کلان داده و کاربردهای آن در فناوری، بازار و صنعت ، امنیت ، پزشکی و … به اثبات رسیده و بشر به کمک تحلیل این حجم از عظیم از داده توانسته به دانش کارآمدی در مدیریت بهتر و مؤثرتر کسب و کار خود دست پیدا کند.
مدیریت و آنالیز اطلاعات همواره برای تمامی شرکت ها در هر حیطه کاری از اهمیت خاصی برخوردار است . آن ها همواره تلاش دارند راه کارهای عملی در جهت به دست آوردن اطلاعات از مشتریان ، محصولات و یا خدمات خود انجام دهند.
زمانی که یک شرکت تعداد محدودی مشتری و یک محصول خاص دارد، تحلیل این اطلاعات کار سختی نیست اما در ططول زمماان ممسسللمماًًًًًًًًًاً ااططلالاععاات ززیاددیی از فروش بازار، سلیقه مشتری و … تولید خواهد شد و دیگر با آن حجم ابتدایی از داده ها مواجه نیستیم .
در بازار رقابتی، مدیران به طور متداوم نیاز دارند با علایق و سلایق مشتری و یا کاربران شان آشنا شوند و سیاست های جدید را طراحی کنند. حتی کاربرد کلان داده به مسائل بازار کار محدود نمیشود بلکه امروزه با استفاده از تحلیل اطلاعات شبکه های اجتماعی میتوانند انتخابات یک کشور را با درصد خطای بسیار پایین پیش بینی نموده ( .Mahmood, Iqbal et al
٢٠١٣) و یا تبلیغات نامزدهای انتخاباتی را در جهت افکار مردم و بالارفتن محبوبیت وی سمت و سو دهند (٢٠١٣ Bensrhir).
حجم و پیچیدگی اطلاعات بسیار بالا است ، بخشی از اطلاعات در پایگاه های داده سنتی ذخیره سازی شده ، برخی دیگر به شکل اسناد ، مجموعه سرویس هایی که به مشتری یا کاربر داده شده ، حتی تصاویر و ویدئوهای مرتبط که هیچ طبقه بندی روی آن صورت نگرفته است .
در این مقاله ابتدا کلان داده ، کاربردها و چالش های آن را معرفی نموده و در قسمت بعدی، یکی از ابزارهای قدرتمند نگه داری و پردازش اطلاعات در این حوزه معرفی می گردد و در پایان موضوعاتی که در آینده فرصت پژوهشی مناسبی در زمینه کلان داده دارند بیان خواهد شد.
۷ کلان داده
اگر بخواهیم معادلی فارسی برای ”Big Data“ در نظر بگیریم می توان به “کلان داده “، “بزرگ داده “یا “حجیم داده ” اشاره نمود که در مفهوم هیچ اختلافی با یکدیگر ندارند. کلان داده به معنی مجموعه عظیمی از داده هامیباشد که پردازش آن ها به وسیله پایگاه داده های سنتی و ابزارهای آن غیرقابل انجام است (٢٠١٣ .Kaisler, Armour et al).
در بیش تر منابع و مقالات (٢٠١۴ Gartner ,٢٠١٣ Sagiroglu and Sinanc ,٢٠١٢ Singh ,٢٠١٢ B.Gerhardt) برای کلان داده سه ویژگی اصلی بیان نموده اند ١- حجم ٢٨- گوناگونی ٣-سرعت ١٠ که اصطلاحاً به آن Vs٣ نیز میگویند. البته در منابعی دیگر( Sagiroglu and,٢٠١٣ .Katal, Wazid et al ,٢٠١٣ .Kaisler, Armour et al٢٠١٣ Sinanc) علاوه بر سه ویژگی اصلی گفته شده مقدار داده و پیچیدگی داده را نیز به وِِِِِیژگیهای آن اضافهکرده اند. اما واضح است در صورتی که یک محیط جریان اطلاعاتی یا یک شبکه بتواند هر سه مورد نام برده شده را احراز کند به آن مجموعه کلان داده گفته می شود.
البته تشخیص وجه تمایز یک مجموعه اطلاعاتی که آن را کلان داده نام گذاری میکنیم و یک سیستم اطلاعاتی حجیم که ظاهرً شرایط آن را دارد بسیار مهم است . برای مثال یک سامانه داده ای که تمامی اطلاعات مردم ایران را در خود ذخیره می کند (نام ، نام خانوادگی، شماره ملی و …) نمیتواند کلان داده به شمار آید در صورتی که ظاهرً حجم بالایی از اطلاعات را در دل خود دارد.
حجم داده

شاید مهم ترین ویژگی کلان داده را بتوان حجم عظیم داده برشمرد، امروزه شرکت های صاحب نام در عرصه فناوری اطلاعات خصوصا شبکه های اجتماعی به تنهایی میتوانند روزانه ۵٠٠ ترابایت اطلاعات جدید تولید کنند، به عنوان مثال سرویس اشتراک ویدئویگوگل در هر دقیقه بیش از ١٠٠ ساعت ویدئوبارگذاری شده توسط کاربران خود را دریافت و مدیریت می کند.(٢٠١۴ smith , ٢٠١٢ Tam)

گوناگونی داده
اطلاعات مربوط به حسگرهای مختلف ، تلفن های هوشمند، ارتباطات در شبکه های اجتماعی، گوناگونی اطلاعاتی که به صورت ساختاری و بدون ساختار ذخیره میشوند بسیار پیچیده است ، زیرا تمام این اطلاعات در پایگاه داده هایرابطه ای سنتی ذخیره نشده است ، علاوه بر این داده ها خام ، نیمه ساختاری ١١، و یا کاملاًًً بدون ساختار است مانند ایمیل های ارسالی و دریافتی، اطلاعات شبکه های اجتماعی و … همگی از نمونه های اطلاعات بدون ساختار است زیرا هیچ قالب از پیش تعیین شده ای برای ورود اطلاعات ندارند ( ,٢٠١٢ Zikopoulos .(Katal, Wazid et al. 2013
سرعت داده
سرعت داده به معنی است که داده ها از طریق منابع اطلاعاتی مختلف با چه سرعتی تولید و منتقل میشوند، برای مثال داده هایی که توسط یک حسگرهایRFID١٢ در یک مجموعه تولید میشود بسیار بالا بوده که علاوه بر ذخیره سازی این اطلاعات در لحظه ، باید اطلاعات مورد تجزیه و تحلیل نیز قرار بگیرند، واضح است سیستم های سنتی ذخیره سازی و تحلیل اطلاعات به سادگی نمی توانند این جریان از اطلاعات را در لحظه مورد بررسی و نمایش قرار دهند (٢٠١٣ .Katal, Wazid et al ,٢٠١٢ Zikopoulos).
اهمیت و کاربرد کلان داده
دولت آمریکا اعلام نمود تا سال ٢٠١٢ ، بر روی زمینه های کاربردی کلان داده در حوزه سلامت ، امنیت فضای مجازی، نظامی و دفاعی، انرژی و فعالیت های تحقیقاتی مرتبط بیش از ٢٠٠ میلیون دلار هزینه نموده (٢٠١٣ .Kaisler, Armour et al) و نتایج آن را در جهت بهبود تصمیم گیری و سیاست گذاری در زمینه های نام برده شده به کار گرفته است .
در واقع هدف اصلی سرمایه گذاران و سازمان ها در زمینه کلان داده و کاربردهای آن تصمیم گیری دقیق و صحیح از طریق تحلیل حجم بیش تر داده ها است .
روش های تجزیه تحلیل کلان داده زمانی قدرت خود را نسبت به الگوریتم هایداده کاوی و یا سیستم هایپرس وجو پیشرفته در پایگاه داده هایرابطه ای سنتی نمایان میسازد که مجموعه ای از داده های ساختاری، نیمه ساختاری و بدون ساختار از منابع مختلف اطلاعاتی وارد سیستم شود. در ادامه با چند مورد از کاربردهای کلان داده در کسب و کار، اقتصاد و .. بیش تر آشنا می شویم .
فناوری اطلاعات
از مهم ترین موقعیت های کاربردی کلان داده در عرصه فناوری اطلاعات می توان به تجزیه و تحلیل وقایع ١٣ شبکه در جهت کشف خطا و یا کشف نفوذ به شبکه اشاره نمود. از دیگر کاربردها بالا بردن عملکرد نوشتن در شبکه ، دست یابی سریع کلید- مقدار به داده ها، شماتیکقابل انعطافداده ای در عرصه فناوری اطلاعات است ( ,٢٠١٣ .Katal, Wazid et al

این فقط قسمتی از متن مقاله است . جهت دریافت کل متن مقاله ، لطفا آن را خریداری نمایید
word قابل ویرایش - قیمت 12700 تومان در 6 صفحه
127,000 ریال – خرید و دانلود
سایر مقالات موجود در این موضوع
دیدگاه خود را مطرح فرمایید . وظیفه ماست که به سوالات شما پاسخ دهیم

پاسخ دیدگاه شما ایمیل خواهد شد