En åpenbar trend som har vist seg siden midten av forrige tiår er en eksplosiv årlig økning i datamengder som produseres – og denne trenden viser ingen tegn til å stoppe.
Med forventninger om at dette på ingen måte vil avta er det naturlig å finne alternative arbeidsmetoder og løsninger for både håndtering og lagring av data.
Tradisjonelt sett har data blitt lagret i databaser. Dataanalytikere henter så data direkte herfra, bearbeider dem, analyserer og frambringer resultat for konsument i form av f.eks. rapporter eller presentasjoner.
Et datavarehus er kort forklart en samling av et selskaps ulike data på én plass. Dataen blir samlet og katalogisert på en måte som tillater enklere tilgang for dataanalytikere, kunder, beslutningstakere og andre – slik at de bruker mindre tid på praktikaliteter, og mer tid på å hente ut dyrebar innsikt.
Database |
Datavarehus |
Spesifikk data med relasjonelle forhold |
Data fra mange og ulike kilder. Databaser, regneark, APIer og andre eksterne data |
Applikasjonsorientert. Spesifikt fokusert på et gitt formål eller «applikasjon» (e.g. timefangst) |
Datavarehus kan sies å være subjekt-orienterte. Økt fleksibilitet i data gir et mer forretningsorientert bilde |
Normaliserte tabeller og relasjonelle regler fører med økt kompleksitet |
Tabeller, som i datavarehus ikke trenger relasjonsregler og som ikke er normaliserte, er stort sett enklere |
Designet for henting og lagring av data (Online Transactional Processing - OLTP) |
Designet for analytiske prosesser (Online Analytical Processing - OLAP) |
Selskap som kjenner seg igjen i et eller flere av disse punktene gjør lurt i å vurdere opprettelse av et datavarehus. Datavarehus er en strategisk investering som bør føre til store gevinster framover i tid.