En åpenbar trend som har vist seg siden midten av forrige tiår er en eksplosiv årlig økning i datamengder som produseres – og denne trenden viser ingen tegn til å stoppe.
Med forventninger om at dette på ingen måte vil avta er det naturlig å finne alternative arbeidsmetoder og løsninger for både håndtering og lagring av data.
Database vs. Datavarehus
Tradisjonelt sett har data blitt lagret i databaser. Dataanalytikere henter så data direkte herfra, bearbeider dem, analyserer og frambringer resultat for konsument i form av f.eks. rapporter eller presentasjoner.
Et datavarehus er kort forklart en samling av et selskaps ulike data på én plass. Dataen blir samlet og katalogisert på en måte som tillater enklere tilgang for dataanalytikere, kunder, beslutningstakere og andre – slik at de bruker mindre tid på praktikaliteter, og mer tid på å hente ut dyrebar innsikt.
Database |
Datavarehus |
Spesifikk data med relasjonelle forhold |
Data fra mange og ulike kilder. Databaser, regneark, APIer og andre eksterne data |
Applikasjonsorientert. Spesifikt fokusert på et gitt formål eller «applikasjon» (e.g. timefangst) |
Datavarehus kan sies å være subjekt-orienterte. Økt fleksibilitet i data gir et mer forretningsorientert bilde |
Normaliserte tabeller og relasjonelle regler fører med økt kompleksitet |
Tabeller, som i datavarehus ikke trenger relasjonsregler og som ikke er normaliserte, er stort sett enklere |
Designet for henting og lagring av data (Online Transactional Processing - OLTP) |
Designet for analytiske prosesser (Online Analytical Processing - OLAP) |
Oversikt over behov som vanskelig dekkes uten et datavarehus
- Dataintegrasjon: Selskaper har ofte data lagret i forskjellig format og over flere systemer og avdelinger. Datavarehus samler de nødvendige datagrunnlagene på én plass.
- Datakvalitet: Data som lagres i databaser er ofte ubehandlet rådata. Datavarehus tilbyr verktøy til rengjøring, transformering og validering av data og bruken av disse verktøyene forsikrer data av god kvalitet som er klar for videre analyseprosesser.
- Skalering: Datavarehus er designet med tanke på skalering. Etter hvert som selskapet ditt vokser og mengden av data øker er datavarehuset ditt klart til å håndtere disse dataene uten degradering i ytelse.
- Forbedret innsikt: Informerte beslutninger basert på innsikt er nøkkelen til å drive en god butikk og datavarehus gir selskaper enklere og mer nøyaktig tilgang til oppdaterte, historiske og prediktive data for rapporterings- og analyseformål.
Fordeler ved datavarehus
- Kostnadssparing: Sentralisering av datalagring kan redusere behov for overflødige lagringsløsninger som igjen fører til sparte penger for selskapet
- Datagrunnlaget vil være klart for analyser, og disse kan sømløst gjøres på tvers av datakilder
- Med datavarehus kan vi enkelt ta i bruk nye bruksområder i form av rapportering, automatisering og varsling m.m.
- Separerer historiske data fra kilden
- Raskere generering av rapporter
- Standardisert tilgangsstyring gjør det enkelt, oversiktlig og sikkert å gi passende tilganger til medarbeidere og kunder
- En plattform for salg av data til tredjeparter (om ikke i dag, gjerne i fremtiden)
Hvem bør vurdere datavarehus?
- Dataen ligger spredt over flere plattformer, databaser og/eller avdelinger
- Selskapet holder på vesentlige mengder med data (eller observerer en rask vekst i datamengde)
- Selskapet er avhengig av datadrevne beslutninger
- Ønske om solid datastruktur for langsiktig bruk
Selskap som kjenner seg igjen i et eller flere av disse punktene gjør lurt i å vurdere opprettelse av et datavarehus. Datavarehus er en strategisk investering som bør føre til store gevinster framover i tid.