Master Data Management vs. Metadane

Kategoria II

W ramach serwisu ArchitekturaKorporacyjna.pl stosunkowo mało miejsca poświęcałem zagadnieniom związanym z Data Governance. Stwierdziłem, że jest to poważny brak, który chciałbym szybko uzupełnić. Zacznę od zagadnienia, które często budzi zażarte dyskusje. Oczywiście chodzi o stwierdzenie, że Master Data Management jest pojęciem równoważnym z Matadata Management. Sprawa nie jest taka prosta jeżeli chodzi do rozstrzygnięcia, bo pojawiają się dosyć fundamentalne problemy definicyjne. Termin metadane (ang. matadata) jest stosunkowo dobrze zdefiniowany. Zgodnie z Wikipedią są to dane o danych, czyli ustrukturalizowane dane stosowane do opisu zasobów informacji lub obiektów informacji w celu ułatwienia ich znalezienia, identyfikacji, a także zarządzania tymi zasobami. 

W szczególności metadane można wykorzystywać również do:

  • przeszukiwania obiektów nietekstowych,
  • klasyfikacji,
  • definiowania relacji między obiektami,
  • dystrybucji informacji,
  • kojarzenia obiektów informacyjnych posiadających wspólne cechy.

Metadane można podzielić według kategorii jako opisowe, strukturalne i administracyjne:

  • Metadane opisowe – dostarczają informacji na temat takich danych jak tytuł, streszczenie, autor oraz słowa kluczowe, opisujące zasób informacji lub obiekt.
  • Metadane strukturalne – dostarczają informacje o relacjach między zasobami informacyjnymi lub obiektami informacyjnymi.
  • Metadane administracyjne – dostarczają informacji dotyczących zarządzania zasobem informacji lub obiektem, takich jak: data i sposób jego utworzenia, typ dokumentu, informacje dotyczące dostępu do zasobu.

Dobre metadane muszą:

  • mieć strukturę,
  • być czytelne dla maszyn (nie jest to zawsze  spełnione),
  • być czytelne dla ludzi (nie zawsze jest to spełnione),
  • być niezależne od języka (gdzie jest to możliwe),
  • być niezależne od form gramatycznych,
  • być wstawione automatycznie, gdzie to możliwe.

O wiele trudniej jest zdefiniować pojęcie Master Data Management. Pierwsza wątpliwość związana jest z tym jak przetłumaczyć ten zwrot. Najczęściej jest on tłumaczony jako “zarządzanie danymi referencyjnymi” lub “zarządzanie danymi podstawowymi”.

Dane podstawowe mają charakter danych nietransakcyjnych, które opisują kluczowe pojęcia biznesowe organizacji lub zewnętrznych jednostek z nią związanych. Do najczęściej podawanych przykładów danych referencyjnych należą:

  • informacje o klientach,
  • informacje o produktach,
  • informacje o strukturze organizacyjnej.

Dane podstawowe są niezbędne do efektywnego działania systemów transakcyjnych i do zapewnienia skutecznego działania mechanizmów raportująco-analitycznych.

Według  Tomasza Mierzwy Master Data Management obejmuje “zestaw działań organizacyjnych wspartych specjalizowanymi rozwiązaniami informatycznymi w celu zapewnienia wysokiej jakości, wiarygodności, aktualności i dostępności najważniejszych danych referencyjnych, wykorzystywanych w różnych procesach biznesowych, przez poszczególne jednostki organizacji”.

Najważniejszymi działaniami podejmowanymi w ramach MDM są według Tomasza Mierzwy:

  • Zarządzanie jakością informacji – zapewnienie, iż kluczowe informacje referencyjne są aktualne, zgodne z rzeczywistością, spójne i dostępne na czas w skali całej organizacji.
  • Zarządzanie identyfikacją – umiejętność jednoznacznego rozpoznania danego obiektu niezależnie od systemu czy procesu biznesowego w którym dany obiekt uczestniczy, jak również zapobieganie duplikacji informacji, czyli niepotrzebnemu powielaniu danych o tym samym obiekcie.
  • Grupowanie danych – umiejętność łączenia obiektów w grupy i hierarchie, pozwalające na realizację bardziej złożonych procesów i analiz.
  • Wzbogacanie danych – działania mające na celu wykorzystanie różnorodnych źródeł zewnętrznych do uzupełnienia danych istniejących w organizacji o nowe informacje, istotne z punktu widzenia realizowanych procesów biznesowych.
  • Synchronizacja i zarządzania procesami – zapewnienie mechanizmów synchronizacji informacji jak również zarządzania procesami (Business Process Management), realizowane często w oparciu o oprogramowanie klasy middleware i BPM, pozwalają na znaczące uporządkowanie i optymalizację przepływu danych i realizacji procesów biznesowych w skali całej organizacji.

Jak widać z powyższej próby definicji tych pojęć – MDM i Metadata Management nie są koncepcjami tożsamymi. Zdecydowanie są to różne zagadnienia.Kluczowe według Roba Karela z Forrester Research jest to, że MDM adresuje problemy biznesowe, zaś zarządzanie metadanymi jest bardziej skoncentrowane na ujęciu IT. Jednocześnie pomiędzy tymi mechanizmami występuje efekt synergii.  R. Karel stwierdza wręcz, że bez metadanych nie można mówić o efektywnych mechanizmach MDM, bo to właśnie metadane powodują, że dane pierwotne są wiarygodne od strony biznesowej.