بخشی از مقاله
چکیده
ساختار سلسله مراتبی سیستم های انباره داده، نقش کلیدی در پردازش و کنترل اطلاعات دارد. این ساختار حجم عظیمی از داده در سیستم های انبار داده در سطوح مختلف دانه بندی با استفاده از OLAP در عملیاتی مانند roll-up و drill-down را تجزیه و تحلیل می کند. از طریق این عملیات به جمع بندی جزئیات داده ها و تجزیه و تحلیل آنها برای فرآیندهای تصمیم گیری دست می یابیم. محققین ساختارهای سلسله مراتبی متعددی که از دنیای واقعی برآمده اند را تعریف کرده اند که کاربرد گسترده ای در تجارت دارند. اما برای دستیابی به یک مدل مناسب می بایست دسته بندی این ساختار های سلسله مراتبی به درستی صورت گیرد. در این مقاله مقایسه ای جامع بین این ساختارهای مختلف مبتنی بر پارامترهای خاص ارائه شده است.
کلید واژه ها: طراحی انبار داده؛ OLAP،BIG DATA،داده کاوی
.1 مقدمه
انبار داده مخزن مرکزی نگهداری اطلاعاتی است که مدیران سطح بالا و تحلیلگران اقتصادی یک سازمان برای تصمیم گیری به آن نیاز دارند و موضوع گرایی، یکپارچگی و مانایی از ویژگی های آن است. عموما، ساختار یک انباره داده به کمک یک شمای چند بعدی از حقایق نشان داده می شود. حقیقت یک مقدار عددی، یک ماهیت افزایشی است. حقایق مورد تجزیه تحلیل قرار گرفته و مجموعه ای از مقادیر اندازه گیری شده نشان داده می شوند. این ابعاد به کاربر اجازه می دهد که معیارها را از دیدگاه های مختلف مورد تجزیه و تحلیل قرار دهد . ساختار سلسله مراتبی مبتنی بر ویژگی های مختلف نقش ضروری در تجزیه تحلیل داده ها دارد.
بعد سلسله مراتب در یک انبار داده برای نمایش داده ها در سطوح مختلف دانه بندی استفاده می شود. این سلسله مراتب به کاربران اجازه می دهد با یک نمای کلی از داده شروع و تا دستیابی به یک نمای تفصیلی با رفتن به لایه های پایینی کار را ادامه دهند. از سوی دیگر، عملیات جمع بندی و تبدیل جزئیات اندازه گیری شده به داده های خلاصه شده انجام میگیرد.از نقطه نظر فنی، یک سلسله مراتب مجموعه ای از روابط باینری موجود بین سطوح است که متشکل از سطوح مختلفی می باشد. در دو سطح متوالی از یک سلسله مراتب، سطح بالاتر پدر و یا والد و سطح پایین تر فرزند نامیده می شود .[3] ساختار سلسله مراتبی برای نمایش برخی ساختارهای سازمانی، جغرافیایی، و یا دیگر ساختارهای مهم که مورد تجزیه وو تحلیل قرار می گیرند، استفاده می شود .[15]
بنابراین، انعطاف پذیری ابعاد ساختار سلسله مراتبی اجازه می دهد طیف وسیعی از مدل های کسب و کار بوسیله این ساختار مدل سازی شوند .[16]در این مقالات 12]،11،10،9،8 ،7،6،5،4،3،2،[1، انواع مختلف سلسله مراتب ارائه شده اند که در هر کدام بخشی از تجزیه و تحلیل اطلاعات صورت گرفته است. در 10]،7،[1، ابعاد سلسله مراتب برای OLAP تعریف شده است. هدف از این مقاله ارائه یک نظرسنجی از تلاش های انجام شده توسط محققان مختلف برای طبقه بندی سلسله مراتب در زمینه DW است. ساختار مقاله به شرح زیر است. بخش 2 در مورد انواع مختلف سلسله مراتب از جمله نمادهای آن است که توسط نویسندگان مختلف ارائه شده است. بخش 3 جدول تجزیه و تحلیل مقایسه ای بر اساس پارامترهای خاص می باشد و در نهایت، بخش 4 نتیجه گیری و چشم انداز آینده را ارائه می دهد.
.2 دست آوردهای مورد بررسی
در بخش زیر در مورد طبقه بندی های مختلف سلسله مراتب بحث می شود.
.1.2 نیمی و همکاران [2001] در مقاله [1]، سلسله مراتب داده های مختلف - لیست شده در جدول شماره یک - را بر اساس عمومیت استفاده در OLAP دسته بندی کرده است. شایع ترین آنها گراف بدون دور و سخت گیرانه ترین آنها درخت متعادل و یکپارچه است.
.2.2 آکوکا و همکاران [2001] در مقاله [2]، خلاصه ای از سلسله مراتب چند بعدی را ارائه داده اند.
نویسندگان قواعد مهم و اصلی برای تعریف سلسله مراتب چند بعدی از طرح UML را بر اساس دانه بندی و تعمیم سلسله مراتب شرح داده اند.
.3.2 مالینوسکی و زیمانی [2004] در مقاله [3]، یک طبقه بندی مفهومی از سلسله مراتب OLAP و نمادگذاری گرافیکی پیشنهادی بر اساس مدل ER ارائه کرده اند، که در جدول 3 خلاصه شده است.
.4.2 لین یوان [2006] در مقاله [4]، سلسله مراتب ابعاد داده ها در OLAP را بیان کرده اند. در اینجا یک استراتژی
مبتنی بر تکرار ارائه شده است که هدف آن افزایش سرعت عمل roll-up در سلسله مراتب بازگشتی در OLAP است. از این منظر تنها دو سلسله مراتب که به شرح زیر می باشد که در جدول 4 بحث شده است.
.5.2 مانسمن و همکاران [2006] در مقاله [5]، سلسله مراتب مختلف - مورد بحث در جدول - 5 را بر اساس سطح دانه بندی طبقه بندی کرده است. این چارچوب برای مدل سازی ابعاد پیچیده سلسله مراتبی ارائه شده است