بخشی از مقاله

چکیده

از داده عظیم بعنوان موضوعی جذاب در حوزه فناوری اطلاعات اخیرا یاد می شود. داده عظیم، واژه ای برای توصیف پایگاه داده هایی با حجم بسیار حجیم می باشد که روش های سنتی در پردازش پایگاه داده ها، قادر به تجریه و تحلیل آن ها نمی باشند. شناسایی موضوعات نوظهور در این حوزه و خوشه بندی این موضوعات، به پژوهشگرانی که قصد دارند وارد این حوزه جذاب شوند، کمک بسزایی می نماید. یکی از تکنیک هایی که به ما در نیل به رسیدن به اهدافمان کمک می نماید، استفاده از ابزار های متن کاوی و تجریه و تحلیل شبکه های اجتماعی می باشد.

در این مطالعه، در ابتدا تمامی مقالات مرتبط با حوزه های داده عظیم جمع آوری شدند و سپس بر روی کلمات کلیدی آنها، شبکه هم بستگی لغات تشکیل شد. بعد از این گام، خوشه های برتر شناسایی شدند و با اعمال تکنیک قواعد انجمنی، روابط بین کلید واژه ها شناسایی شد. در بخش نتیجه گیری، پیشنهاداتی در راستای تحقیقات آتی ارائه شده است.

مقدمه

پس از فراگیر شدن اینترنت در اویل دهه 1990 توسط کاربران خانگی و کاربران شاغل در سازمان ها، و همچنین در سال های اخیر، افزایش استفاده از شبکه های اجتماعی و یا تکنولوژی های مربوط به اینترنت اشیا رفته رفته منجر به افزایش داده ها گردید، تا جایی که در زمان حال ، ذخیره سازی و آنالیز این داده ها، یکی از چالش های بحث برانگیز میان مدیران شرکت ها بوده است.

ذخیره سازی و آنالیز چنین داده هایی ، منجر به تعریف واژه ای به نام داده عظیم گردید که هم اکنون این دانش، پیشرفت چشم گیری داشته است و مورد توجه مجامع علمی و صنعتی مختلف بوده است. واژه داده عظیم اینگونه تعریف می شود:"داده عظیم به مجموعه هایی عظیم از داده ها اطلاق می شود که حاصل استفاده از رفتار مشتری، پست های شبکه های اجتماعی، تگ کردن و خروجی های سنسورها می باشد

بر این اساس، اکتشاف دانش مورد نظر از چنین مجموعه داده هایی کاری آسان به نظر نمی رسد که می توان با استفاده از تکنیک های یادگیری ماشینی نظیر داده کاوی یا تحلیل احساسات، به هدف مورد نظر رسید.در محیط آکادمیک، داده عظیم در سالیان اخیر به شدت مورد توجه محققان دانشگاهی و صنایع مختلف قرار گرفته است. مجلاتی نظیر Big Data Research ، Journal of Big Data و یا International Journal of Big Data ، و کنفرانس های سالیانه ای نظیر Big Data Congress 2016 به صورت تخصصی به این حوزه نوظهور می پردازند که پژوهشگران علاقه مند به این موضوع، مقالات خود را در آنها به چاپ می رسانند و به بحث و گفتگو می پردازند.

پژوهش حاضر، به شناسایی موضوعات به روز و جذاب حوزه داده عظیم با استفاده از کلیدواژه های مقالات علمی این حوزه می پردازد. ما در این پژوهش، به دنبال پاسخ به سوال های زیر هستیم.

·    سوال - 1 چه موضوعاتی در مرکز خوشه ها - مهم ترین بخش - حوزه داده عظیم قرار می گیرند؟ برترین خوشه ها، کدام موضوعات را به خود اختصاص داده اند؟

·    سوال -2 روابط انجمنی، چه موضوعاتی را با حوزه داده عظیم مرتبط می نماید؟

·    سوال - 3 ساختار شبکه همبستگی کلمات کلیدی حوزه داده عظیم چگونه است؟

مرور ادبیات

در این بخش به مرور ادبیات پیشین در حوزه داده عظیم و تجریه و تحلیل شبکه های اجتماعی پرداخته می شود. پیشینه داده عظیم به سال 1974 بر می گردد هنگامی که آقای نور در کتاب خود از آن بعنوان یاد کرد - نور، . - 1974 اما - روسیو، - 2012 سال 1990 را بعنوان سال ظهور داده عظیم یاد نمود. همانگونه که در مقدمه ذکر گردید، داده عظیم به تجزیه و تحلیل داده های پایگاه داده های بسیار بزرگ مربوط می شود که اغلب تجزیه و تحلیل آنها بسیار سخت می باشد. روزانه یک کوئینتلیون بایت داده یا عددی معادل با عدد یک با 18 صفر بتوان دو داده و یا بهتر بگوییم اطلاعات تولید می کنیم که طبق پیشبینی ها این عدد همواره رو به افزایش است - اشتیمل، . - 2015 منابعی که داده عظیمداده های عظیم را تولید می کنند بعنوان نمونه می توان به رسانه های اجتماعی و یا داده های دریافتی از ایستگاه های هواشناسی نام برد.از جهت دیگر، آنالیز و استخراج دانش چنین داده هایی برای مدیران ، به آنها در امر تصمیم گیری کمک شایانی می کنند. علاوه بر فرایند بهبود تصمیم گیری، داده عظیم به امر تشخیص تقلب و یا شناسایی بازارهای نوظهور یاری می رساند.

داده عظیم از دید محیط آکادمیک مخفی نمانده است. اغلب تحقیقات محققان به حوزه علوم کامپیوتر ، مهندسی، ارتباطات راه دور و یا اقتصاد کسب و کار بر می گردد که بالغ بر 7000 مقاله تاکنون در این حوزه از دیدگاه آکادمیک منتشر شده اند که در 5 سال اخیر، رشد قابل توجهی داشته است. شناسایی روندها و موضوعات کلیدی موضوعات مختلف از یک سو به محققان علی الخصوص محققانی که قصد دارند درباره یک حوزه علمی دید کلی بدست بیاورند و از سوی دیگر، به مدیران و فعالان بخش صنعت که قصد دارند از موضوعات بروز یک حوزه علمی با خبر شوند، کمک شایانی می کنند.

همچنین یکی از تکنیک های متن کاوی ، تجزیه و تحلیل شبکه های اجتماعی است که در شناسایی دانش و الگو های نهان یک حوزه علمی از میان ادبیات مربوط به آن موضوع نقش عمده ای ایفا می کند. - خان و وود، . - 2015 تاکنون تحقیقات گوناگونی بر روی شناسایی موضوعات علمی علوم مختلف انجام شده است

. باشنال، - 2015 که داده عظیم از این منظر بی نصیب نبوده است. Xian و همکاران، مقالات مربوط به داده عظیم در حوزه مهندسی را بین سال های 2000 تا 2011 با در نظر گرفتن شبکه همکاری های علمی محققان بررسی کردند که متد مورد استفاده آنها بیبلومتریک بود. - سورجاندری و همکاران، - 2015، مقالات استخراجی پنج سال - 2014-2010 - حوزه داده عظیم محققان اندونیزایی را از پایگاه داده اسکوپوس با روش تجزیه و تحلیل همکاری لغات بررسی نمودند که مجموعا تحقیق آنها منجر به شناسایی پانزده موضوع اصلی گشت. - هالوی و موئد، - 2012، با اعمال کلیدواژه بر روی پایگاه داده اسکوپوس، تحول علمی حوزه داده عظیم را مورد بررسی قرار داد. - ایساسی و همکاران، - 2015، با تلفیق روش های بیبلوکتریک و تجزیه و تحلیل سیستمی، روندهای کلیدی حوزه داده عظیم در حوزه زنجیره تامین را مورد بررسی قرار دادند.

بررسی ها نشان داد که تحقیقات پیشین دیگر حوزه های داده عظیم و فناوری های مربوط به آن را مورد بررسی قرار نداده اند زیرا واژه داده عظیم به خودی خود، موضوعات و یا واژه های دیگری را در دل خود دارد.تحقیق حاضر با اعمال کلمات کلیدی مربوط به حوزه داده عظیم بر روی مجلات برتر حوزه سیستم های اطلاعاتی، سعی دارد تا به پرسش های مطرح شده در قسمت مقدمه پاسخ دهد.

جمع آوری داده ها

در تاریخ اول ماه مارچ 2016 میلادی ، جستجویک جستجو بر روی وبگاه پایگاه داده علمی Web of Science بر مبنای فهرست لغات زیر اعمال شد .در ابتدا لازم است تا چگونگی انتخاب لغات کلیدی را شرح داده شد. از آنجا که نتایج بررسی برای یافتن منبعی برای پوشش دادن تمامی لغات مهم و کلیدی حوزه داده عظیم بی نتیجه ماند، با اعمال کلمه کلیدی "big data" بر روی قسمت موتور جستجوگر پایگاه علمی Web of Science تمام مقالات مرتبط استخراج شدند. سپس فراوانی لغات را بررسی کردیم و پس از آن، شبکه همبستگی لغات را تشکیل دادیم که ما حصل این دو قسمت، لغات اعمال شده در جستجوجستجوی زیر می باشند.همچنین مجلات برتر حوزه سیستم های اطلاعاتی بر اساس شاخص تاثیر انتخاب شدند. جستجو زیر شامل لغات کلیدی مهم حوزه داده عظیم بر روی 40 مجله برتر حوزه سیستم های اطلاعاتی می باشد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید