Data governance er den samlede ramme af processer, roller, politikker og standarder der styrer, hvordan en organisation håndterer sine data. I en tid hvor danske virksomheder indsamler mere data end nogensinde, er behovet for struktureret datastyring ikke bare et teknisk anliggende. Det er en forretningskritisk disciplin.
Mange virksomheder oplever det samme mønster: afdelinger opretter deres egne regneark, definerer KPI'er forskelligt, og ingen kan blive enige om hvad "omsætning" faktisk betyder. Salgsafdelingen tæller ordrer fra afsendt dato, finans bruger fakturadato, og marketing måler fra den dag kunden klikkede. Resultatet er modstridende rapporter og mistillid til data. Data governance løser dette ved at etablere fælles definitioner, ejerskab og kvalitetsstandarder.
Et governance-framework bygger typisk på fire søjler. Den første er dataejerskab. Hver datakategori tildeles en data owner, som regel en forretningsleder der har ansvar for dataens kvalitet og adgangsregler. En data steward fungerer som den daglige forvalter der implementerer politikkerne i praksis. Uden klart ejerskab ender data som alles ansvar og dermed ingens.
Den anden søjle er datakvalitet. Kvalitet måles på seks dimensioner: nøjagtighed, fuldstændighed, konsistens, aktualitet, validitet og unikhed. For hvert kritisk datasæt defineres kvalitetsmål og automatiserede kontroller. Et dansk e-commerce firma kan eksempelvis kræve at kundeadresser er valideret mod DAR (Danmarks Adresseregister), at produktpriser aldrig er negative, og at ordredata er komplet inden for 24 timer efter transaktion.
Den tredje søjle er datasikkerhed og compliance. Med GDPR er danske virksomheder juridisk forpligtede til at vide hvor persondata befinder sig, hvem der har adgang, og hvordan den beskyttes. Data governance kortlægger dataflows, klassificerer data efter følsomhed, og etablerer adgangspolitikker baseret på roller. Personfølsomme data som CPR-numre, helbredsoplysninger og økonomiske data kræver særlig beskyttelse og logning af adgang.
Den fjerde søjle er metadata management. Metadata er data om data: definitioner, oprindelse, transformationer og relationer. Et data catalog giver organisationen et fælles opslagsværk hvor analytikere kan finde datasæt, forstå deres indhold og vurdere deres kvalitet. Værktøjer som Apache Atlas, Alation eller Microsoft Purview automatiserer indsamling af teknisk metadata og lader forretningsbrugere tilføje kontekst og dokumentation.
Implementering af data governance starter ikke med teknologi. Det starter med at identificere de mest smertefulde dataproblemer i organisationen. Hvilke rapporter stoler ledelsen ikke på? Hvor bruger afdelinger tid på at afstemme tal manuelt? Hvilke datasæt mangler dokumentation? Start med et afgrænset pilotprojekt der løser et konkret problem og demonstrerer værdien.
Organisatorisk forankring er afgørende. Et data governance council med repræsentanter fra forretning, IT og compliance mødes regelmæssigt for at prioritere initiativer, løse konflikter og godkende politikker. Uden ledelsens opbakning og et klart mandat bliver governance hurtigt bureaukrati uden gennemslagskraft.
Modenheden i data governance kan måles på en skala fra ad hoc til optimeret. I den laveste modenhed eksisterer ingen formelle processer, og datakvalitet afhænger af individuelle medarbejderes omhyggelighed. I den højeste modenhed er governance integreret i alle forretningsprocesser, datakvalitet måles automatisk, og organisationen behandler data som et strategisk aktiv på linje med finansielle ressourcer.
For danske virksomheder der arbejder med business intelligence er data governance fundamentet. Et Power BI dashboard er kun så troværdigt som de data der ligger bag det. Uden fælles definitioner af nøgletal, uden kvalitetskontrol af kildedata, og uden klare regler for dataadgang, bygger man avancerede visualiseringer på et usikkert fundament. Investér i governance før du investerer i det næste BI-værktøj.
Praktiske første skridt inkluderer at udarbejde et data dictionary med definitioner af virksomhedens 20 vigtigste begreber, at udpege data owners for de mest kritiske datasæt, og at etablere en simpel datakvalitetsrapport der måler fuldstændighed og aktualitet på de data der driver virksomhedens vigtigste dashboards.