بخشی از مقاله
طراحي Data mart
مقدمه
متأسفانه انباره دادهاي متمركز تا حدي كه از آن انتظار ميرفت، رشد نكرده است. در مقابل تا ميزان زيادي با ريسكها، مدت زمان طولاني براي پياده سازي وهزينه بالا پرشده است. مايه حيات يك سازمان توانايي توسعه بخشيدن به برنامههاي كاربردي است كه به طور سريع اطلاعات ارزشمند را به تصميم گيرندههاي تجاري انتقال ميدهد. با اين وجود، انباره دادهاي متمركز سعي دارد تا با صورت بر پايه شده براساس معماري مشخص و عدم تواناييهاي مناسب و تغيير كاربردهاي جديد كه مورد نياز است، عمل نمايد.
بسياري از سازمانها انفجار دادهها را گزارش ميدهند كه حجم قابل توجهي از ميزان دادهها اصلي را در بر دارد، و اين به علت نياز شديد و سريع به گزارشهاي جديد و جداول خلاصه دادهاي ميباشد. اين مسئله در هزينه هاي هنگفت نهايي و بار سنگين گزارشهاي مديريتي خود را نشان ميدهد. انباره داده متركز به اين منظور طراحي شدهاند تا بتوانند گزارشهاي از قبل پيشبيني شده را پاسخگو باشند. انباره دادهها در عين حال همان طور كه Bill Inmon اشاره كرده است، «به منظور كشف فعاليتها طراحي شده است» و نيز در اكثر موارد «كاربران نميدانند چه اطلااتي را در درجه اول نياز دارند.»
بخش عمده هزينه يك انباره داره اي معمولي به علت روش brute force ميباشد، كه در اثر اساس و طرح پردازش موازي مطرح شده است. با وجود اينكه پردازش موازي بسيار هزينه در بردارد ولي هيچ كمكي به توليد پاسخهاي پرس و جوي سريع و adhoc نميكند. در نتيجه مجبور خواهيم بود، به روشهاي جديدي به منظور ارضاء اين خواست resort نماييم.
اكثر دانشمندان به اين منظور معماري data mart وزني enterprise را آزمايش مينمايند datamart تكنولوژيي است كه Poised شده تا dra stically كاربردها و جنبههاي اقتصادي انباره دادهاي را دوباره شكل دهد و نيز مقايسه ديدگاههاي مختلف در رابطه با ويژگيها و سودمنديهاي معماري data mart در مقابل انبارههاي دادهاي قديمي به منظور ساخت، deploy، و مديريت راه حلهاي datamart وزني enterprisk.
The Corporate Data Warehouse
در گذشته پياده سازيهاي شركتهاي انباره دادهاي بر پايه main frameها عمل كرده است و مديريت گستردهاي را در محدوده خود نياز داشته است و نيز به وسيله مديريت MIS اطلاعات از بالا به پائين قابل دسترسي بودهاند. در زير اين معماري همه چيز در سطح مديريتي ساخته شده است. اين مسئله معمولاً به يك انباره دادهاي معمولي و ساده تبديل ميشود كه تمامي نتايج لازم جداگانه براي سيستمهاي عملكردي تمامي شركتهاي مناسب خواهند بود.
اين پيادهسازيهاي انباره دادهاي بايد با جنبههاي پيچيده كه توسط طبيعت مديريت گسترده خودشان توليد شده است مواجه شوند. همه چيز مجبور است در مسير لايههاي مختلف مورد موافقت قرار گيرد. زيرا انباره دادهاي طراحي شده است تا همه بتوانند از آن استفاده كنند در نتيجه همه افراد سازمان بايد در نحوه طراحي آن موافقتنظر داشته باشند. در چنين مواقعي نتيجه يك تغيير ساده ممكن است بسيار بزرگ و سرنوشت ساز باشد زير تغيير يك چيز در انباره داده همه چيز را تغيير ميدهد.
ديدگاههاي مختلف از راه حلهاي انباره دادهاي
چالشهاي مختلف موجود در ارتباط با انباره داده نتيجه شد. اما هنوز همان هدف سابق در رابطه با انتقال دادههاي مختلف جهت پشتيباني از تصميميگيريها به كاربران انتهايي مورد نظر بود.
خوشبختانه روش more pragmatic و جديدترين در حال حاضر در اختيار ماست. اين راه حل تحت نام انبارههاي دادهاي توزيع شده قابل دسترسي ميباشد. نقطه مركزي در اين روش بر روي كاربردها و datamartها ميباشد. همچنين اين كار توسط تكنولوژي پايگاه دادههاي وزني، و به صرفه انجام ميشود. امروزه data mart ها سودهاي قابل توجهي را به سازمانهاي خود باز ميگردانند، بدون آنكه هزينه زيادي را دربر داشته باشند و يا ريسك موجود در انباره هاي داده اي متمركز مديريتي را در پروژهها ايجاد نمايند و نيز ميتوانند براساس اينكه پروژه چه چيزي را ميطلبد خود را رشد دهند و يا تغيير نمايند.
يك clata mart سيستم كاربردي پشتيباني از تصميمگيري ميباشد، كه بر روي رفع و حل يك مشكل تجاري خاص متمركز ميشود و اين كار را در يك محيط موضوعي يا دپارتمان انجام ميدهد. يك clatamart بايد با يك مدل دادهاي مديريتي ساخته شود تا از شكل گرفتن سيستمهاي پشتيباني تصميمگيري غير مجتممع اطلاعات ناسازگار تجارتي و توانايي رشد در ذهن جلوگيري نمايد.
اما يك انباره دادهاي يك پيش نياز غيرقابل اجتناب براي clatamart نميباشد.
Clatamartها به وسيله سرعت پاسخگويي كه براي پرس و جوهاي چند بعدي و adhoc توليد ميكنند و نيز براي قيمت پائينشان در ساخت و بازيابي مشهور شدهاند. در بسياري از موارد هزينه كمتر از نصف هزينه يك انبار دادهاي مجتمع بزرگ ميباشد. چند جزء كليدي براي پيادهسازي موفقيت آميز يك datamart وجود دارد.
راه حلهاي Data mart
به طور واضح data Martها به تنهايي نميتوانند تمام نيازهاي تجاري را رفع نمايند خصوصاً به منظور پشتيباني تصميمگيريهاي گسترده مديريتي. همان طور كه تاجران clat mart ميسازند و با نيازهاي كاربردي كاربران مواجه ميشوند، ياد ميگيرند كدام بخشهاي داده ارزشمندتر هستند، كدام بخشهاي داده نياز دارند به جديدترين فرم درآيند و كدام بخشها دادههاي جزئي نهايي و يا دادههاي خارجي مورد نياز هستند. همچنين MIS ممكن است مناطقي را مشخص كند تا دادهها را متمركز نمايد كه بتواند بين چندين clata Mart به طور اشتراكي مورد استفاده قرار گيرند. اين اصليترين نقش انبارههاي دادهاي اشتراكي ميباشد. Data Martها در نهايت محلي شدند تا اطلاعاتي كه به وسيله چندين كاربر مورد نياز هستند در آنها متمركز شود.
انباره هاي دادهاي اشتراكي به كندي ساخته شدهاند و در هر مرحله براساس نيازهاي تجاري اين طراحي انجام شده است. همان طور كه نيازهايشان رشد كرده است، شركتها چندين data mart ساختهاند و جالب است كه در نهايت، خيلي از تجارتها معماري چند لايهاي پشتيباني از تصميمگيري را توسعه خواهند داد.
در بسياري از سازمان ها، تصميمگيري به شكل غيرمجتمع انجام ميپذيرد و چندين data mart ممكن است هيچگاه consolidode نشود. در بعضي ديگر، جاهايي كه تصميمگيري بالا به پائين به شكل قدرتمندي انجام ميشود، يك انباره دادهاي مديريت نيز كمك بسيار زيادي مينمايد. اين كار به MIS اجازه ميدهد تا نتايج سريعتري را به كاربر برساند.
اساسي كه از اين حقيقت يعني هر كاربر انفرادي به ميزان محدودي از داده و اطلاعات نياز دارد. با وجود اينكه مقداري نياز براي توابع ضربي آناليزي وجود دارد، محدوده نيازهاي دادهاي به ذاته كاهش مييابد اگر ما محدوده انباره بسازيم، ميتوانيم مشكلات را در روشهاي متمركزتر و هدفمندتر به طور سادهتر انجام دهيم. شكل زير دو پيادهسازي كاربردي مشخص را نشان ميدهد كه هر كدام از انباره دادهاي مشتق شدهاند و زير مجموعهاي از سيستمهاي مديريتي هستند و هركدام كاربردهاي جداگانه را به دپارتمانهاي مختلف اعلام ميدارند.
يك Data Mart چيست؟
يك data mart همان انباره دادهايي است كه براساس كاربرد متمركز شده است و به سرعت ساخته شده است تا به سرعت كاربردهاي تك منظوره تجارتي را پشتيباني نمايد. Data Martها همچنان داراي ديگر خصوصيات انبارههاي دادهاي نيز ميباشند. كه از جمله آنها ميتوان دادههاي subject-oriented كه غير volatile ميباشند، متغيرهاي زماني و مجتمع بودن را نام برد. با وجود اين علاوه بر نمايش يك تصوير از دادهها مديريتي data mart شامل زيرمجموعهاي از دادههاست كه علايق خاصي از يك دپارتمان با يك بخش مديريتي را ارضا ميكند.
انباره دادهاي مركز جهان پشتيباني تصميمگيري ميباشد. انباره دادهاي شامل دادههاي تاريخي (histonical) و مجتمع (integrated) ميباشد كه مسئلهداري براي تمام شركت ميباشد. انباره دادهاي شامل همة اطلاعات خلاصه شده ميباشد و هم اطلاعات جزئي و توضيح داده شده است. انباره دادهاي داراي متادادهاي است كه محتويات و منابع داده را توضيح ميدهد و آنها را به داخل انباره دادهاي هدايت مينمايد.
از انباره دادهاي، دادهها به دپارتمانهاي مختلفي جاري ميشود و اين كار به علت موارد مشخص شده استفادهشان صورت ميپذيرد. پايگاه دادههاي پشتيباني از تصميم گيري كه به صورت مخصوص طراحي ميشود را data mart مينامند. Data mart بخشي از بدنه دادههاست در يك دپارتمان كه داراي پايه و اساس شامل معماري ميباشد كه اين معماري حتماً مختص انباره دادهاي ميباشد.