طراحي Data mart

مقدمه
متأسفانه انباره داده‌اي متمركز تا حدي كه از آن انتظار مي‌رفت، رشد نكرده است. در مقابل تا ميزان زيادي با ريسكها، مدت زمان طولاني براي پياده سازي وهزينه بالا پرشده است. مايه حيات يك سازمان توانايي توسعه بخشيدن به برنامه‌هاي كاربردي است كه به طور سريع اطلاعات ارزشمند را به تصميم گيرنده‌هاي تجاري انتقال مي‌دهد. با اين وجود، انباره داده‌اي متمركز سعي دارد تا با صورت بر پايه شده براساس معماري مشخص و عدم توانايي‌هاي مناسب و تغيير كاربردهاي جديد كه مورد نياز است، عمل نمايد.

بسياري از سازمانها انفجار داده‌ها را گزارش مي‌دهند كه حجم قابل توجهي از ميزان داده‌ها اصلي را در بر دارد، و اين به علت نياز شديد و سريع به گزارش‌هاي جديد و جداول خلاصه داده‌اي مي‌باشد. اين مسئله در هزينه هاي هنگفت نهايي و بار سنگين گزارش‌هاي مديريتي خود را نشان مي‌دهد. انباره داده متركز به اين منظور طراحي شده‌اند تا بتوانند گزارش‌هاي از قبل پيش‌بيني شده را پاسخگو باشند. انباره داده‌ها در عين حال همان طور كه Bill Inmon اشاره كرده است، «به منظور كشف فعاليت‌ها طراحي شده است» و نيز در اكثر موارد «كاربران نمي‌دانند چه اطلااتي را در درجه اول نياز دارند.»

بخش عمده هزينه يك انباره داره اي معمولي به علت روش brute force مي‌باشد، كه در اثر اساس و طرح پردازش موازي مطرح شده است. با وجود اينكه پردازش موازي بسيار هزينه در بردارد ولي هيچ كمكي به توليد پاسخ‌هاي پرس و جوي سريع و adhoc نمي‌كند. در نتيجه مجبور خواهيم بود، به روش‌هاي جديدي به منظور ارضاء اين خواست resort نماييم.

اكثر دانشمندان به اين منظور معماري data mart وزني enterprise را آزمايش مي‌نمايند datamart تكنولوژيي است كه Poised شده تا dra stically كاربردها و جنبه‌هاي اقتصادي انباره داده‌اي را دوباره شكل دهد و نيز مقايسه ديدگاههاي مختلف در رابطه با ويژگي‌ها و سودمندي‌هاي معماري data mart در مقابل انباره‌هاي داده‌اي قديمي به منظور ساخت، deploy، و مديريت راه حلهاي datamart وزني enterprisk.

The Corporate Data Warehouse
در گذشته پياده سازي‌هاي شركت‌هاي انباره داده‌اي بر پايه main frameها عمل كرده است و مديريت گسترده‌اي را در محدوده خود نياز داشته است و نيز به وسيله مديريت MIS اطلاعات از بالا به پائين قابل دسترسي بوده‌اند. در زير اين معماري همه چيز در سطح مديريتي ساخته شده است. اين مسئله معمولاً به يك انباره داده‌اي معمولي و ساده تبديل مي‌شود كه تمامي نتايج لازم جداگانه براي سيستم‌هاي عملكردي تمامي شركت‌هاي مناسب خواهند بود.

اين پياده‌سازي‌هاي انباره داده‌اي بايد با جنبه‌هاي پيچيده كه توسط طبيعت مديريت گسترده خودشان توليد شده است مواجه شوند. همه چيز مجبور است در مسير لايه‌هاي مختلف مورد موافقت قرار گيرد. زيرا انباره داده‌اي طراحي شده است تا همه بتوانند از آن استفاده كنند در نتيجه همه افراد سازمان بايد در نحوه طراحي آن موافقت‌نظر داشته باشند. در چنين مواقعي نتيجه يك تغيير ساده ممكن است بسيار بزرگ و سرنوشت ساز باشد زير تغيير يك چيز در انباره داده همه چيز را تغيير مي‌دهد.

 

ديدگاههاي مختلف از راه حلهاي انباره داده‌اي
چالش‌هاي مختلف موجود در ارتباط با انباره داده نتيجه شد. اما هنوز همان هدف سابق در رابطه با انتقال داده‌هاي مختلف جهت پشتيباني از تصميمي‌گيري‌ها به كاربران انتهايي مورد نظر بود.

خوشبختانه روش more pragmatic و جديدترين در حال حاضر در اختيار ماست. اين راه حل تحت نام انباره‌هاي داده‌اي توزيع شده قابل دسترسي مي‌باشد. نقطه مركزي در اين روش بر روي كاربردها و datamartها مي‌باشد. همچنين اين كار توسط تكنولوژي پايگاه داده‌هاي وزني، و به صرفه انجام مي‌شود. امروزه data mart ها سودهاي قابل توجهي را به سازمان‌هاي خود باز مي‌گردانند، بدون آنكه هزينه زيادي را دربر داشته باشند و يا ريسك موجود در انباره هاي داده اي متمركز مديريتي را در پروژه‌ها ايجاد نمايند و نيز مي‌توانند براساس اينكه پروژه چه چيزي را مي‌طلبد خود را رشد دهند و يا تغيير نمايند.

يك clata mart سيستم كاربردي پشتيباني از تصميم‌گيري مي‌باشد، كه بر روي رفع و حل يك مشكل تجاري خاص متمركز مي‌شود و اين كار را در يك محيط موضوعي يا دپارتمان انجام مي‌دهد. يك clatamart بايد با يك مدل داده‌اي مديريتي ساخته شود تا از شكل گرفتن سيستم‌هاي پشتيباني تصميم‌گيري غير مجتممع اطلاعات ناسازگار تجارتي و توانايي رشد در ذهن جلوگيري نمايد.
اما يك انباره داده‌اي يك پيش نياز غيرقابل اجتناب براي clatamart نمي‌باشد.

Clatamartها به وسيله سرعت پاسخگويي كه براي پرس و جوهاي چند بعدي و adhoc توليد مي‌كنند و نيز براي قيمت پائين‌شان در ساخت و بازيابي مشهور شده‌اند. در بسياري از موارد هزينه كمتر از نصف هزينه يك انبار داده‌اي مجتمع بزرگ مي‌باشد. چند جزء كليدي براي پياده‌سازي موفقيت آميز يك datamart وجود دارد.

راه حل‌هاي Data mart
به طور واضح data Martها به تنهايي نمي‌توانند تمام نيازهاي تجاري را رفع نمايند خصوصاً به منظور پشتيباني تصميم‌گيري‌هاي گسترده مديريتي. همان طور كه تاجران clat mart مي‌سازند و با نيازهاي كاربردي كاربران مواجه مي‌شوند، ياد مي‌گيرند كدام بخش‌هاي داده ارزشمندتر هستند، كدام بخش‌هاي داده نياز دارند به جديدترين فرم درآيند و كدام بخشها داده‌هاي جزئي نهايي و يا داده‌هاي خارجي مورد نياز هستند. همچنين MIS ممكن است مناطقي را مشخص كند تا داده‌ها را متمركز نمايد كه بتواند بين چندين clata Mart به طور اشتراكي مورد استفاده قرار گيرند. اين اصلي‌ترين نقش انباره‌هاي داده‌اي اشتراكي مي‌باشد. Data Martها در نهايت محلي شدند تا اطلاعاتي كه به وسيله چندين كاربر مورد نياز هستند در آنها متمركز شود.

انباره هاي داده‌اي اشتراكي به كندي ساخته شده‌اند و در هر مرحله براساس نيازهاي تجاري اين طراحي انجام شده است. همان طور كه نيازهايشان رشد كرده است، شركت‌ها چندين data mart ساخته‌اند و جالب است كه در نهايت، خيلي از تجارت‌ها معماري چند لايه‌اي پشتيباني از تصميم‌گيري را توسعه خواهند داد.

در بسياري از سازمان ها، تصميم‌گيري به شكل غيرمجتمع انجام مي‌پذيرد و چندين data mart ممكن است هيچگاه consolidode نشود. در بعضي ديگر، جاهايي كه تصميم‌گيري بالا به پائين به شكل قدرتمندي انجام مي‌شود، يك انباره داده‌اي مديريت نيز كمك بسيار زيادي مي‌نمايد. اين كار به MIS اجازه مي‌دهد تا نتايج سريع‌تري را به كاربر برساند.

اساسي كه از اين حقيقت يعني هر كاربر انفرادي به ميزان محدودي از داده و اطلاعات نياز دارد. با وجود اينكه مقداري نياز براي توابع ضربي آناليزي وجود دارد، محدوده نيازهاي داده‌اي به ذاته كاهش مي‌يابد اگر ما محدوده انباره بسازيم، مي‌توانيم مشكلات را در روشهاي متمركزتر و هدفمندتر به طور ساده‌تر انجام دهيم. شكل زير دو پياده‌سازي كاربردي مشخص را نشان مي‌دهد كه هر كدام از انباره داده‌اي مشتق شده‌اند و زير مجموعه‌اي از سيستم‌هاي مديريتي هستند و هركدام كاربردهاي جداگانه را به دپارتمان‌هاي مختلف اعلام مي‌دارند.

 

يك Data Mart چيست؟
يك data mart همان انباره داده‌ايي است كه براساس كاربرد متمركز شده است و به سرعت ساخته شده است تا به سرعت كاربردهاي تك منظوره تجارتي را پشتيباني نمايد. Data Martها همچنان داراي ديگر خصوصيات انباره‌هاي داده‌اي نيز مي‌باشند. كه از جمله آنها مي‌توان داده‌هاي subject-oriented كه غير volatile مي‌باشند، متغيرهاي زماني و مجتمع بودن را نام برد. با وجود اين علاوه بر نمايش يك تصوير از داده‌ها مديريتي data mart شامل زيرمجموعه‌اي از داده‌هاست كه علايق خاصي از يك دپارتمان با يك بخش مديريتي را ارضا مي‌كند.

انباره داده‌اي مركز جهان پشتيباني تصميم‌گيري مي‌باشد. انباره داده‌اي شامل داده‌هاي تاريخي (histonical) و مجتمع (integrated) مي‌باشد كه مسئله‌داري براي تمام شركت مي‌باشد. انباره داده‌اي شامل همة اطلاعات خلاصه شده مي‌باشد و هم اطلاعات جزئي و توضيح داده شده است. انباره داده‌اي داراي متاداده‌اي است كه محتويات و منابع داده را توضيح مي‌دهد و آنها را به داخل انباره داده‌اي هدايت مي‌نمايد.

از انباره داده‌اي، داده‌ها به دپارتمان‌هاي مختلفي جاري مي‌شود و اين كار به علت موارد مشخص شده استفاده‌شان صورت مي‌پذيرد. پايگاه داده‌هاي پشتيباني از تصميم گيري كه به صورت مخصوص طراحي مي‌شود را data mart مي‌نامند. Data mart بخشي از بدنه داده‌هاست در يك دپارتمان كه داراي پايه و اساس شامل معماري مي‌باشد كه اين معماري حتماً مختص انباره داده‌اي مي‌باشد.