بخشی از مقاله

چکیده

سازمان ها به دنبال راه هایی برای مهار توان داده های بزرگ - BD - برای بهبود تصمیم گیری های خود هستند. علیرغم اهمیت BD، اثراتی که روی کیفیت تصمیم گیری دارد در مقاالت نیز مورد توجه بسیاری قرار گرفته اند. در این مقاله عوامل تأثیرگذار بر تصمیم گیری مبتنی بر BD با استفاده از یک مطالعه موردی شناسایی شده اند. BD از منابع مختلفی جمع آوری شده که کیفیت های داده ای متنوعی دارند و توسط هویت های سازمانی مختلفی پردازش شده اند که حاصل آن خلق زنجیره داده ای بزرگ است.

صحت، تنوع و شتاب تقویت شده بواسطه اندازه داده های بزرگ برای این به کار می رود که مکانیسم های مدیریت منطقی و قراردادی از کیفیت BD اطمینان یابند و قادر به مفهوم سازی داده ها باشند. مطالعه موردی مشخص می کند که بهره بردن از داده های بزرگ فرایندی تکاملی است که در آن درک تدریجی پتانسیل داده های بزرگ و روتین سازی فراندها نقش مهمی بازی می کنند.

-8 مقدمه

داده های بزرگ - BD - به سرعت در حال تبدیل شدن به فعالیت روند اصلی سازمان ها هستند. بهره برداری از مقیاس بزرگ، حرکت سریع، روندهای پیچیده مجموعه های داده ای، پتانسیل الزم برای تبدیل بنیادین شیوه ای که سازمان ها تصمیمات خود را به آن روش اتخاذ می کنند را فراهم می نماید. داده های بزرگ اشاره به مجموعه های داده ای دارند که هم بزرگ هستند و هم تنوع و شتاب آن ها باالست، که باعث می شود کنترل آن ها با استفاده از ابزارها و تکنیک های مرسوم سخت شود. توانایی بهره بردن از تمام اطالعات موجود به قابلیت اصلی برای موفقیت سازمان تبدیل شده است. خلق ارزش از داده های مستلزم تلفیق محموعه های داده ای بزرگ است که از منابع داده ای مختلف و ناهمگون نشأت می گیرند. داده های بزرگ ارتباط بسیار نزدیکی با علم تجزیه و تحلیل داده های بزرگ - BDA - دارد که برای خلق ارزش از داده ها الزم و ضروری است.

در اغلب موارد داده ها توسط سازمان های دیگر و یا توسط کاربران شبکه اجتماعی تولید شده اند. تنوع منابع داده ای، نیاز به تلفیق انواع منابع، و استفاده از BDA اغلب مستلزم همکاری میان سازمان ها و دپارتمان ها برای خلق جریانی از فعالیت هاست. انبار سازمان ها استفاده از داده های بزرگ برای تصمیم گیری را دچار مشکل کرده اند. جمع آوری، پردازش و استفاده از داده ها در یک دپارتمان یا سازمان منفرد انجام نمی شود. در عوض داده ها توسط اعضا و سازمان مختلفی جمع آوری می شوند که ممکن است از همکاری ها و شراکت ها برای اکتساب منابع و توانایی های تحلیل BD استفاده کنند. تمام این عوامل و مراحل در استفاده از BD برای تصمیم گیری نقش ندارند.

ارزش - مقدار - BD در اغلب موارد از توانایی تصمیم گیری های بهتر نشأت می گیرد. توانایی منحصراً وابسته به داده ها نیست، بلکه عالوه بر آن وابسته به فرایندی است که در آن داده ها جمع آوری شده اند و شیوه ای که داده های پردازش شده اند BD و BDA در اغلب موارد مستلزم کنار هم قرار دادن چندین عامل از مقدمات و برازش های متنوع مختلف برای آزمودن روابط کاوش نشده میان انواع داده ها هستند. هر فعالیت می تواند توسط عوامل مختلف با توانایی ها و مهارت های مختلف انجام شود.

درگیری انواع مختلف سازمان ها باعث ایجاد جریان یا زنجیره ای از فعالیت ها می شود که می توان روی آن ها نام "زنجیره داده های بزرگ" گذاشت. یک زنجیره BD با جمع آوری داده ها از منابع و مقاصد آغاز می شود، زمانی که تصمیمات مبتنی بر تصمیم اتخاذ شده اند. عبارت "زنجیره" اشاره به دید تحلیل اتخاذ شده بر مبنای همکاری دارد. در واقع، منابع داده ای متعدد، انواع جریان ها و تصمیمات وجود دارند.در چنین زنجیره ای تالش های متعددی در جهت افزایش کمیت و کیفیت داده های منتشر شده در طول زمان می شود. این موارد شامل حذف نویز، تبدیل مجموعه داده های منتخب به ماشین قابل خوواندن و داده های مرتبط و اضافه کردن ابر داده ها می باشد.

این فعالیت ها می توانن روی این که چگونه BD می تواند برای تصمیم گیری استفاده شود تأثیر بگذارند. دیدگاه زنجیره به سختی به عنوان دید تحلیل نگریستن به BD اتخاذ شده است. جستجو با استفاده از واژگان کلیدی داده های بزرگ و زنجیره تنها حاصل چند موفقیت است. Brown ، Chui و Manyika - 2111 - تنها افرادی هستند که به زنجیره موجود در روابط با داده های بزرگ برای شرح نیاز به همکاری با شرکای زنجیره تأمین و نقشی که دیگر اعضا می توانند در تولید داده ها بازی کنند اشاره کرده اند.

هدف این تحقیق شناسایی عوامل تأثیرگذار بر کیفیت تصمیم BD است. در اغلب موارد فرض بر این است که BD باعث تصمیم های بهتری می شود، اما مشخص نیست کدام عوامل بر گیفیت تصمیم گیری و چگونگی بهبود کیفیت تصمیم گیری توسط سازمان ها تأثیر دارند. وقتی BD و BDA معمول تر می شود، درک زنجیره داده های بزرگ و عوامل تأثیر گذار بر زنجیره کیفیت تصمیم گیری از اهمیت ویژه ای برای سازمان ها برخوردار می شود.

این ساختار از این مقاله به شرح زیر است:

ابتدا، عوامل تأثیرگذار بر BD و کیفیت تصمیم گیری به صورتی که در مقاالت یافته شده اند ارائه می شوند. پس از آن روش تحقیقی ارائه می شود که در آن یک زنجیره BD در یک سازمان بزرگ و مدیریت تجزیه و تحلیل شده است. بر مبنای مطالعه موردی عوامل تأثیرگار بر کیفیت تصمیم گیری حاصل شده اند. در نهایت، تأثیرات تجاری مورد بحث قرار گرفته و نتایجی اتخاذ شده اند.

-2 داده های بزرگ برای تصمیم گیری

چندین مرحله برای پردازش BD وجود دارد که با ضبط داده ها آغاز می شوند و حاصل آن تصمیم گیری است که می توان در مقاالت مختلف آن را یافت. به عنوان مثال، Bizer، Boncz، Brodie و - 2112 - Erling شش مرحله مشخص می کنند؛ ثبت و ضبط داده ها، ذخیره داده ها، جستجوی داده ها، اشتراک داده ها، تحلیل داده ها و تجسم داده ها. در مقابل Chen و - 2112 - Liu تنها از سه مرحله استفاده می کنند؛

کنترل داده ها، پردازش داده ها، و حرکت داده ها. - 2112 - Marx پنج مرحله پیشنهاد می کند؛ تعریف مسأله، جستجوی داده ها، دگرگونی داده ها، تحلیل هویت داده ها، پاسخ به / qury حل مسأله. در حالی که دیگران از نام های دیگری برای اشاره به مراحل مشابه با این مراحل استفاده کرده اند. به عنوان مثال Zhou، Chawla، Jin و - 2112 - Williams از گردآوری داده ها، ذخیره داده ها، مدیریت داده ها، دستکاری داده ها، تمیز کردن داده ها، و دگرگونی داده ها استفاده کرده اند. هر چند این مراحل شناخته شده اند، توجه اندکی به این مسأله می شود که چه کسی این مراحل را اجرا می کند و اثر یک مرحله روی دیگر مراحل چیست.

BDمعموالً بواسطه سه یا چند V توصیف شده است: حجم، شتاب، تنوع. Gandomi و - 2112 - Haider سه V دیگر به این لیست اضافه کرده اند؛ ارزش، تغییرپذیری و صحت. این V ها اداره مجموعه داده ها را به شیوه های مرسوم - قدیمی - مشکل می کنند.

در اغلب موارد BD از منابع متعددی نشأت می گیرد که اغلب فرای کنترل یک بازیگر منفرد نظیر شبکه و دستگاه های اجتماعی است. صحت به این اشاره می کند که ممکن است آن داده ها ناقص، منسوخ و حاوی نویز باشند. منابع BD انواع مختلف کیفیت داده ها را دارا هستند. کیفیت داده ها یک مفهوم چند بعدی است که توصیف گر ویژگی های اطالعاتی نظیر دقت، بی انتهایی، کامل بودن، سازگاری، ارتباط و تناسب برای استفاده می باشد. کیفیت داده ها می تواند به عنوان مجموعه ای از ابعادی در نظر گرفته شود که کیفت اطالعات تولید شده توسط سیستم اطالعاتی را تشریح می کند. تحقیق قبلی در مورد استفاده از داده ها نشان می دهد که کیفیت داده ها روی کیفیت تصمیم گیری تأثیر می گذارد، به همین دلیل، ممکن است کیفیت BD روی کیفیتت تصمیم گیری هم تأثیر بگذارد.

یک زنجیره BD کارآمد باید توانایی ها و ظرفیتی برای مدیریت داده ها و BDA ایجاد کند. قابلیت های BDA شامل تکنیک های تشریحی، توصیفی، استنتاجی، پیش بینی کننده، سببی و مکانیکی می باشند. به همین دلیل، انواع روش ها نظیر پردازش زبان طبیعی، کاوش زمانی، محاسبه زبانی، یادگیری ماشین، الگوریتم های جستجو و مرتب سازی، تحلیل نحو و لغوی و غیره به کار گرفته شده اند. در اغلب موارد BD مرتبط با تحلیل پیش بینی کننده ای است که متشکل از انواع مختلف تکنیک هاست که پیامدهای آینده را برای کشف الگوها و یافتن روابطی در داده ها پیش بینی می کنند. تحقیقات قبلی در پردازش داده ها نشان می دهند که قابلیت سازمانی در پردازش اطالعات روی کیفیت تصمیم گیری تأثیر می گذارد. فعالیت هایی برای پردازش BD و قابلیت های BDA بر کیفیت تصمیم گیری نیز تأثیر می گذارند.

- 1111 - Raghunathan کیفیت تصمیم گیری را به عنوان دقت و صحت تصمیم ها تعریف می کند. کیفیت تصمیم می تواند در زمان بهبود کیفیت اطالعات و پردازش کیفیت را بهبود یا تنزل دهد. با بزرگتر شده داده ها، پیچیده تر شدن و غیر قابل توضیح شدن آن ها توانایی های ذهنی محدود انسان ها متحمل مشکالتی در کشف و تفسیر یک محیط ناشناخته می شوند. در BD ممکن است درک کمی از آن چه داده ها معنی می کنند و این که داده های در چه زمینه ای جمع آوری شده اند، وجود داشته باشد. فقدان دانش در مورد منابع BD روی کیفیت تصمیم گیری تأثیر می گذارد.

بررسی قبلی نشان می دهد که کیفیت تصمیم بسته به کیفیت ورودی ها و کیفیت فرایند است که ورودی ها را به خروجی ها تبدیل می کند. عوامل تأثیرگذار بر کیفیت تصمیم گیری BD شامل مشخصه ها و کیفیت منابع BD ، کیفیت فایند BDA، توانایی BDA و توانایی فرد درگیر جمع آوری و پردازش BD و دسترس پذیری یک زیرساختار BD می باشد. به عالوه، تحقیق در پردازش داده های نشان می دهد که توانایی تصمیم گیرنده در درک داده ها و همکاری با دیگران در زنجیره BD باعث بهبود کیفیت تصمیم گیری می شود.

-9 رویکرد پژوهش

مقاالت نشان می دهند که طیف وسیعی از عوامل وجود دارند که بر روی تصمیم گیری BDتأثیر می گذارند. خصوصاً در موقعیت هایی که در آن ها چندین عامل شامل شده اند و پیش بینی تمام مراحل زنجیره BD سخت است و کیفیت تصمیمات می تواند توافق شده باشد. درک عمیقی از زمینه برای درک عوامل تأثرگذار بر آن الزم است. در حالت مشابهی، درک عمیقی از زنجیره BD برای درک عوامل تأثیرگذار بر کیفیت تصمیم گیری الزم است. بنابراین یک مطالعه موردی عمقی در سازمان پردازش اطالعات بزرگ انجام شده است.

رویکرد کیفی مبتنی بر تحقیق مطالعه موردی، برای بدست آوردن درک عمیقی از عوامل تأثیرگذار بر کیفیت تصمیم گیری اتخاذ شد. متدلوژیث پژوهش مطالعه موردی خصوصاً مناسب بررسی موصوعات سازمانی است. یک مطالعه موردی منفرد می تواند در توسعه علمی از طریق درک عمیقی از زمینه و بواسطه ثبت و ضبط تجارب مشارکت داشته باشد. درک عمیق برای شناسایی طیف گسترده ای از عوامل تأثیرگذار بر کیفیت تصمیم گیری ضروری است، در حالی که درک تجارب باعث شناسایی مکانیسم های موجود برای بهبود کیفیت تصمیم گیری می شود. چون کیفیت تصمیم گیری وابسته به تصمیم گیرنده، جمع آوری و پردازش داده هاست، تمامی این جنبه ها هنگام تحلیل مطالعه موردی در نظر گرفته شده اند.

تعداد مواردی که می توانند عوامل تأثیرگذار بر BD را برای کیفیت تصمیم گیری و استفاده از BDA برای تصمیم گیرنده را آشکار نمایند، محدود بودند. این مسأله زمانی که برخی از موارد در نظر گرفته شده مایل به افشای برازش های خود نبودند، پیچیده تر هم شد. سازمان امور مالیاتی انتخاب شد چون این سازمان مایل به تسهیم برازش ها بود و مقدار بسیاری از اطالعات در دسترس عموم قرار گرفته بود. به عالوه، این سازمان پردازش اطالعات بزرگ به عنوان پیشقدم در استفاده از BD و BDA در دولت هلند در نظر گرفته شده است.

سازمان مالیات یک زنجیره BD پیچیده را مدیریت می کند و قبالً از BDA در فرایندهای تصمیم گیری خود استفاده کرده که حاصل آن ایجاد بینش های جدید و صرفه جویی زیاد در هزینه ها بوده است. این مثال ها در اخبار گزارش شده اند. مطالعه مورد با استفاده از مصاحبات و بررسی وب سایت ها، اسناد، گزارش ها و رسانه بررسی شد. هر دو در شناسایی عوامل تأثیرگذار بر تصمیم گیری موفق بودند.

-4 پیشنه تحقیق

- 2112 - Gamage یک بررسی از دولت های دنیا ارائه می کند که استراتژی های داده های بزرگ را اتخاذ کرده اند. سازمان های بخش عمومی به صورت روتین حجم های بزرگی از داده ها را در حوزه هایی نظیر سالمت - بهداشت - ، فعالیت های تجاری، جرم، ایمنی، امنیت، آب و هوا، آلودگی، ترافیک، مالیات و درآمد جمع آوری می کنند. سازمان مالیات مقادیر بی کرانی از داده هایی را پردازش می کنند که مرتبط با میلیون ها فرد و کمپانی است که مالیات پرداخت می کنند. زنجیره BD از وظایف متعددی تشکیل شده که توسط اعضای مختلفی انجام شده اند و باید مدیریت شوند.

-8-4 زنجیره داده های بزرگ

بسیاری از سازمان های عمومی داده های ساختار یافته و ساختار نایافته را برای اهداف خود جمع آوری می کنند که می تواند برای غنی سازی داده های داخلی سازمان مالیات استفاده شود. سازمان مالیات زنجیره BD را با جمع آوری داده ها از دیگر سازمان های عمومی و خصوصی و تلفیق داده ها با سیستم های داخلی مدیریت می کند.

استفاده از BD و BDA در ابتدا فاقد عمومیت و پویا بود. داده ها در دسترس بودند، اما این که چطور می شد از داده ها استفاده کرد مشخص نبود. در اغلب موارد چهار سازمان درگیر می شدند که به ترتیب داده ها را جمع آوری، آماده سازی، تجزیه و تحلیل کرده و تصمیماتی اتخاذ کنند - ب هشکل 1 مراجعه نمایید - . فرایند بدون ساختار و فاقد عمومیت برای جمع آوری داده ها الزامات زیادی به کیفیت داده ها و قابلیت های پردازش داده ها تحمیل می کردند.

سپس داده ها بواسطه دپارتمان جداگانه ای آماده سازی می شدند که مسئول کیفیت داده ها و فعالیت های انجام شده در رابطه با بهبود کیفیت داده ها، غنی سازی داده ها و ایجاد مجموعه داده ای بود که برای استفاده تحلیل مناسب بود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید