Baza danych - Data mart

Omówienie hurtowni danych z hurtowniami danych pokazanymi w prawym górnym rogu.

Mart danych jest strukturą / dostęp wzór specyficzny dla hurtowni danych środowiskach, używane do pobierania danych od strony klienta. Data mart jest podzbiorem hurtowni danych i jest zwykle zorientowany na konkretną linię biznesową lub zespół. Podczas gdy hurtownie danych mają zasięg obejmujący całe przedsiębiorstwo, informacje w hurtowniach danych dotyczą jednego działu. W niektórych wdrożeniach każdy dział lub jednostka biznesowa jest uważana za właściciela swojej bazy danych, w tym całego sprzętu , oprogramowania i danych . Dzięki temu każdy dział może wyizolować wykorzystanie, manipulację i rozwój swoich danych. W innych wdrożeniach, w których używane są wymiary zgodne, własność jednostki biznesowej nie będzie obowiązywać w przypadku wymiarów współdzielonych, takich jak klient, produkt itp.

Magazyny i hurtownie danych są budowane, ponieważ informacje w bazie danych nie są zorganizowane w sposób, który czyni je łatwo dostępnymi. Ta organizacja wymaga zapytań, które są zbyt skomplikowane, trudno dostępne lub wymagające dużej ilości zasobów.

Podczas gdy transakcyjne bazy danych są przeznaczone do aktualizacji, hurtownie danych lub marty są tylko do odczytu . Hurtownie danych są zaprojektowane tak, aby uzyskiwać dostęp do dużych grup powiązanych rekordów. Magazyny danych poprawiają czas reakcji użytkowników końcowych, umożliwiając użytkownikom dostęp do określonego typu danych, które muszą przeglądać najczęściej, poprzez dostarczanie danych w sposób wspierający zbiorczy widok grupy użytkowników.

Data mart to w zasadzie skondensowana i bardziej skoncentrowana wersja hurtowni danych, która odzwierciedla przepisy i specyfikacje procesów każdej jednostki biznesowej w organizacji. Każdy data mart jest dedykowany do konkretnej funkcji biznesowej lub regionu. Ten podzbiór danych może obejmować wiele lub wszystkie funkcjonalne obszary tematyczne przedsiębiorstwa. Powszechnie stosuje się wiele zbiorczych baz danych w celu zaspokojenia potrzeb każdej jednostki biznesowej (różne zbiorcze zbiorcze dane mogą być wykorzystywane do uzyskiwania określonych informacji dla różnych działów przedsiębiorstwa, takich jak księgowość, marketing, sprzedaż itp.).

Powiązany termin spreadmart jest pejoratywnym określeniem sytuacji, która ma miejsce, gdy jeden lub więcej analityków biznesowych opracowuje system połączonych arkuszy kalkulacyjnych w celu przeprowadzenia analizy biznesowej, a następnie powiększa go do rozmiaru i stopnia złożoności, które sprawiają, że jest on prawie niemożliwy do utrzymania. (Termin tego warunku to „Excel Hell”).

Data mart a hurtownia danych

Hurtownia danych:

  • Posiada wiele obszarów tematycznych
  • Zawiera bardzo szczegółowe informacje
  • Działa w celu integracji wszystkich źródeł danych
  • Niekoniecznie używa modelu wymiarowego, ale zasila modele wymiarowe.

Baza danych:

  • Często obejmuje tylko jeden obszar tematyczny – na przykład Finanse lub Sprzedaż
  • Może zawierać bardziej podsumowane dane (chociaż może zawierać pełne szczegóły)
  • Koncentruje się na integracji informacji z danego obszaru tematycznego lub zestawu systemów źródłowych
  • Jest zbudowany z ukierunkowaniem na model wymiarowy przy użyciu schematu gwiazdy.

Schematy projektowe

Powody tworzenia data mart

  • Łatwy dostęp do często potrzebnych danych
  • Tworzy zbiorczy widok przez grupę użytkowników
  • Poprawia czas reakcji użytkownika końcowego
  • Łatwość tworzenia
  • Niższy koszt niż wdrożenie pełnej hurtowni danych
  • Potencjalni użytkownicy są wyraźniej zdefiniowani niż w pełnej hurtowni danych
  • Zawiera tylko niezbędne dane biznesowe i jest mniej zaśmiecony.
  • Ma kluczowe informacje o danych

Zależna baza danych

Zgodnie ze szkołą hurtowni danych Inmon , zależna data mart to logiczny podzbiór ( widok ) lub fizyczny podzbiór (wyciąg) większej hurtowni danych , wyodrębniony z jednego z następujących powodów:

  • Konieczność odświeżenia dla specjalnego modelu danych lub schematu : np. restrukturyzacja dla OLAP
  • Wydajność: przeniesienie bazy danych na oddzielny komputer w celu uzyskania większej wydajności lub wyeliminowanie konieczności zarządzania tym obciążeniem w scentralizowanej hurtowni danych.
  • Bezpieczeństwo: selektywne oddzielanie autoryzowanego podzbioru danych
  • Celowość: ominięcie nadzoru nad danymi i autoryzacji wymaganych do włączenia nowej aplikacji w Enterprise Data Warehouse
  • Proving Ground: aby wykazać rentowność i potencjał ROI (zwrotu z inwestycji) aplikacji przed migracją do Enterprise Data Warehouse
  • Polityka: strategia radzenia sobie dla IT (technologii informatycznych) w sytuacjach, w których grupa użytkowników ma większy wpływ niż finansowanie lub nie jest dobrym obywatelem w scentralizowanej hurtowni danych.
  • Polityka: strategia radzenia sobie dla konsumentów danych w sytuacjach, gdy zespół hurtowni danych nie jest w stanie stworzyć użytecznej hurtowni danych.

Według szkoły hurtowni danych Inmon, kompromisy związane z hurtowniami danych obejmują ograniczoną skalowalność , duplikację danych , niespójność danych z innymi silosami informacji oraz niemożność wykorzystania korporacyjnych źródeł danych.

Alternatywną szkołą hurtowni danych jest szkoła Ralpha Kimballa . Jego zdaniem hurtownia danych to nic innego jak połączenie wszystkich zbiorczych baz danych. Ten widok pomaga obniżyć koszty i zapewnia szybki rozwój, ale może tworzyć niespójną hurtownię danych, zwłaszcza w dużych organizacjach. Dlatego podejście Kimballa jest bardziej odpowiednie dla małych i średnich korporacji.

Zobacz też

Bibliografia

Bibliografia

Zewnętrzne linki