15. november 2018

Er datavarehuset ditt en dumpingplass av data, eller gir det din bedrift forretningsmessig verdi?

Kanskje har din bedrift allerede et datavarehus og moderne Business Intelligence systemer med fine dashboards og nøkkeltall? Eller vurderer din bedrift å investere i dette? Er det et ønske om å «samle alle data» for å få bedre oversikt?

Her er det absolutt fallgruver! Dersom datavarehuset oppleves som en dumpingplass av data uten at det bidrar med ny innsikt fra dine data – da er det smart å lese litt videre!

I et tidligere blogginnlegg («Å forstå ditt marked og kunder kan gi enorme gevinster») beskrev vi noen svært enkle basisteknikker for analyse av dine forretningsdata – for å identifisere effektive markedstiltak som kan gi din bedrift salgsvekst. I denne forbindelse har jeg mottatt ulike og veldig motstridende tilbakemeldinger fra ulike bedrifter. Noen «har dette under kontroll» gjennom sine datavarehusløsninger og Business Intelligencesystemer. Andre – som har samme type systemer – beskriver utfordringer med å gjennomføre denne type viktige analyser.

Hvorfor er det egentlig sånn?

Vår erfaring tilsier at svaret på dette er sammensatt, men det er helt klart at noen lykkes bedre enn andre. Utgangspunktet for datavarehusløsninger er jo ikke å ende med en dumpingplass av data, men å faktisk oppnå en verdiøkende effekt gjennom ny og forbedret innsikt. Dette krever en grunnleggende forståelse, og vi ønsker å ta opp noen av temaene som det er viktig å huske på! (Kom gjerne med innspill rundt dette – er det viktige elementer som du opplever mangler – ta kontakt!)

Informasjonsbehov og informasjonsflyt

Før du igangsetter et stort prosjekt for opprettelse eller revidering av et datavarehus, bør du sørge for en grundig gjennomgang av dine ulike systemer og datakilder. Sørg for å gjennomføre en prosess for å finne ut hvilke spørsmål du har i dag – eller forventer å få i fremtiden – som du ikke kan besvare på en god måte! Finnes det «siloer» i din organisasjon, eller mellom ulike systemer – hindre for å se på ting i sammenheng? I så fall er et datavarehus en god anledning for å se ting på tvers, og sikre god informasjonsflyt (se også kopling av data under!)

Dine faktiske behov er utgangspunkt for hvilke datakilder ditt datavarehus skal bestå av. Enkelte ganger «skal alt inn» – også data fra irrelevante datakilder som ikke har forretningsverdi, eller som ikke er mulig å kople sammen med andre datakilder. Dette gir normalt lite verdi – start derfor med forretnings- og produksjonskritiske data som kan gi fremtidig verdi i form av ny innsikt. Det vil alltids være mulig å utvide datagrunnlaget fra ulike kilder over tid!

Hva med eksterne datakilder?

Vi har satt opp eksterne kilder som et eget punkt i denne listen fordi det ofte fokuseres kun på interne data. Dersom du «glemmer» muligheten for å vurdere eksterne datakilder som kan berike ditt datavarehus, ignorerer du også muligheten for god analyse. Innen data science er det helt sentralt med kontrollvariabler i mange sammenhenger. Om din bedrift selger iskrem eller grillmat, vil en prediksjon/forecasting av salg være umulig uten samtidig å ta hensyn til værmeldingene!

Eksempler på eksterne datakilder som kan være verd å vurdere (selvfølgelig avhengig av bedrift, marked og produkter):

  • Værdata
  • Mediaspending (både egen og konkurrenters)
  • Demografi og geografisk informasjon
  • Konkurrentoversikter og markedsdata som er tilgjengelig
  • For retailkjeder vil det være interessant med dekningsområder, avstander til konkurrenter etc.
  • Google trends data for trendutvikling
  • etc.

Kopling av data

Uten kopling av data i datavarehuset, har det ingen ny verdi å inkludere datakilden i datavarehuset! Da kan data like gjerne forbli i ditt eksisterende bedriftssystem. Eventuelle rapporter, analyser eller datautdrag kan normalt gjøres vel så enkelt i dette systemet direkte, og du får ingen ekstra verdi av å flytte dette til datavarehuset.

Hele formålet med et datavarehus er å samle data for å kunne se på ulike datakilder på tvers av systemene dine. Når vi likevel inkluderer dette som et eget viktig punkt i denne listen, er det fordi jobben normalt starter i det enkelte systemet. Du er nødt til å ha nøkler (unike identifikatorer) som kopler dine data sammen på tvers av ulike systemer! Om dette er kundenr, organisasjonsnummer, adresser, e-postadresser, dato eller noe annet, så må du se til at de er kompatible (mulige å kople sammen). Alternativt må det gjennomføres en prosess for konvertering ved integrasjon i ditt datavarehus. Èn nøkkel som ofte kan skape utfordringer er dato (både fordi ulike systemer kan lagre disse i dine transaksjonsdata på ulike måter i form av DD.MM.YY, DD.MM.YYYY, MM/DD/YY etc) og fordi kalkulerte verdier fra en dato har ulike standarder i ulike land (f.eks. beregning av ukenummer som har ulike regler…). Pass på at su har unike nøkler som kan koples sammen!

Opprydding og datakvalitet

Data kan normalt ikke tas direkte fra en systemdatabase og rett inn i et datavarehus – i alle fall ikke om du ønsker å sikre deg de analysemulighetene du har behov for. Vi nevnte behovet for nøkler og kopling av data over – tilsvarende vil ulike datakilder måtte ryddes opp om de skal ha reell verdi i et datavarehus.

Har du fritekst i ulike systemer som egentlig kun har verdi dersom de blir kategorisert, så vil du måtte inkludere en jobb for automatisk (eller manuell) tekstanalyse om du skal kunne rapportere eller analysere disse datafeltene. Har du rot i CRM-systemet ditt, tekst i nøkkelfelt (har eksempelvis ofte erfart at et organisasjonsnummer består av «SLETT – kunden har fått nytt organisasjonsnummer», eller at enkelte organisasjonsnummer inkluderer MVA og andre ikke…). Dette kan variere fra system til system og gjøre koplinger vanskelig eller umulig uten en opprydding.

Opprydding bør i størst mulig grad automatiseres. Dersom dette ikke er mulig – og behovet finnes for å inkludere dataene – så må de manuelt behandles! Opprydding handler om datakvalitet, og prosessen rundt opprydding ved igangsettelse av et datavarehus, vil for mange være en virkelig realitetssjekk!

Datakvalitet bør fortrinnsvis forbedres i dine ulike bedriftssystemer når dette er mulig, og ikke i en prosess for opprettelse av et datavarehuset. Husk at rot i systemene ofte skyldes kompetanse- eller kulturproblemer. Forbedrede opplæringsprogrammer eller utvikling av forbedrede rutiner (=god informasjonskultur), kan være nødvendige tiltak for å sikre god datakvalitet over tid.

Data må være nøyaktig, tilgjengelig, relevant og ikke til å misforstå (utvetydig). I de fleste tilfeller vil du også unngå hull i datasettet (komplette data) og at de er oppdatert/aktuelle for de forretningsproblemer du søker svar på. Datakvalitet er et enormt tema i seg selv, men du vil få et elendig datavarehus om du ikke har kontroll på dine data! GIGO – Garbage In, Garbage Out.

Business Intelligence vs analyser (dypdykk, data science & modellering)

Ikke misforstå dine virkelige behov. Å sette opp et datavarehus med et tilknyttet Business Intelligence system, er ikke det samme som å få ny verdi eller innsikt! Ofte er det spennende å se på koplede data, nye grafikker, mulighet for å drille deg ned i kubedata på tvers av datakilder, men det er ofte ikke her du får virkelig forretningsverdi!

Dersom du ikke benytter ditt datavarehus til faktiske analyser, går du glipp av innsikten du ofte er ute etter. Å sette opp KPI´er uten å vite hvilke som faktisk er relevante gir jo liten verdi? I tillegg til å tilrettelegge informasjonsspredning gjennom Business Intelligencesystemer, bør du også utnytte ditt datavarehus til utvikling av ny innsikt og informasjon som gir svar på hvilke markedstiltak (eller andre tiltak) som faktisk gir verdi!

Noen dypdykk du vil ha anledning til i gode datavarehus vil kunne inkludere:

  • Identifisering av tapte kunder (churn/frafallsanalyse), hvorfor og hva skal til for å beholde fremtidige kunder?
  • Effektanalyser (Marketing Mix Modeling, salgsmodellering, kampanjeeffekter?)
  • Kundesegmentering (hvilke kunder, hvordan å nå ut til dem, kommunikasjontilrettelegging 1-1)
  • Geografisk optimalisering/lokalisering
  • Salgsprediksjon, forecasting
  • Adferdsanalyser web & salgseffekt av ulik adferd
  • Værets påvirkning på ditt salg
  • etc.

Gode analyser vil kunne inkludere utvikling av algoritmer eller modeller for forbedrede forretningsprosesser – endret eller automatisert kundekommunikasjon, scoringmodeller (oppfølging og prioritering), mediaspending, produksjonsplanlegging osv. Disse kan enten implementeres som separate modeller, men kan i mange tilfeller også implementeres i dine øvrige bedriftssystemer.

Toveis dataintegrasjon

Legg til rette for at ditt datavarehus ikke bare er en samling av data fra dine interne bedriftssystemer, men at du også sikrer at data kan gå ut igjen fra  datavarehuset og tilbake til ulike bedriftssystemer. Det være seg resultatvariabler, scoringmodeller, segmenteringskategorier, forecastverdier og liknende.

Selvfølgelig vil mange bedriftssystemer ha mulighet for direkte implementering av algoritmer/modeller (som kjøres mot datavarehuset), men det er ofte relativt enkelt å benytte bedriftssystemenes mulighet for tilføring av variabler (som kan «eksporteres»  fra ditt datavarehus til ditt bedriftssystem).

Faktisk vil arbeidet med kopling av data i et datavarehus i en del tilfeller også redusere behov for duplisering av data der ulike bedriftssystemer kan få tilført nødvendig informasjon fra andre bedriftssystemer (via datavarehuset). Dette kan redusere behov for 1-1 integrasjoner mellom ulike bedriftssystemer og gjøre enkelte integrasjoner enklere å gjennomføre.

Den virkelige verdien ligger i kalkulerte eller modellerte variabler som har fått tilført forretningsverdi og som kan bety effektivitet i det daglige arbeidet (om det er bedre produksjon, forecasting eller målretting/oppfølging av dine kunder med økt salg som konsekvens). Innen markedsføring vil det i tiden som kommer bli mer og mer vanlig med vesentlige forbedringer i segmentert eller 1-1 kommunikasjon – både i forhold til automatisering av kundeoppfølging, kundepleie, kundeklubber eller faktisk 1-1 tilpassing av websider. Følg med – her skjer det mye!

ETL – prosess (Extract, Transform, Load)

Ikke undervurder arbeidet med opprettelse eller modernisering av ditt datavarehus! Punktene over er sentrale i å kunne lykkes, og spesialiser innen ETL vil kunne tilføre verdi i en slik prosess og svært sannsynlig også effektivisere arbeidet. Vi innledet med at du er nødt til å prioritere hvilke spørsmål du ikke får svar på i dag for å idenifisere hvilke datakilder du skal prioritere – start enkelt og bygg ut over tid.

Valg av infrastruktur

Mange leverandører av datavarehusløsninger vil antakelig rive seg i håret over at infrastruktur nevnes mot slutten av denne artikkelen. Dette er bevisst, og årsaken er rett og slett at punktene over er viktigst! Så lenge du sikrer deg at disse kan gjennomføres i de løsninger du velger, vil serverteknologi, databaseløsninger, valg av Businessintelligence-system og datavarehus være underordnet.

I essens vil et datavarehus oftest være en relasjonsdatabase (eksempelvis SQL) som muliggjør kopling av data, analyser/modellering, rapportering (BI) og integrasjon (både inn og ut av datavarehuset). Til forskjell fra en tradisjonell transaksjonsbasert database (de fleste systemdatabaser), er selvfølgelig formålet til datavarehuset nettopp å oppnå berikelsen av koplede data og analysemulighetene.

Viktigere enn selve infrastrukturen, er normalt derfor valg av leverandør (både med hensyn til verktøy for effektiv håndtering av elementene over samt kompetansen som stilles tilgjengelig for bedriften i utviklingen av ønskede løsninger!)

IKKE glem personvernet/GDPR!

Husk at du ikke har lov til å gjøre akkurat hva du vil! Husk at du er nødt til å ha berettiget/legitim interesse og/eller samtykke ved kopling av data eller bruk av data til nye formål. Det kan være du har data i ulike systemer som er innhentet eller registrert basert på et formål, men der formålet fort endres når du kopler data sammen med ulike (nye) kilder ved innføring av datavarehus i din bedrift. Her vil personvernombudet være en viktig ressursperson – alternativt ta kontakt med juridisk ekspertise dersom du er i tvil.

Har du virkelig behov for et datavarehus?

Før du eventuelt tar en beslutning rundt innføring av datavarehus i din bedrift – gjør også en analyse av hvorvidt det faktisk er behov. Kanskje har du kun kortsiktige behov for ad hoc analyser eller kanskje det er tilstrekkelig med integrasjon mellom enkelte av dine bedriftssystemer? Ditt formål med et slikt prosjekt er det siste vi nevner, men det første du bør tenke på!

Vi er spesialister på informasjonsflyt, integrasjon og analyse!

Ta kontakt med oss i dag for en samtale rundt dette! Vi er ikke en leverandør av datavarehus eller Business Intelligencessystemer, men vi brenner for at markedsføring og salg skal fungere optimalt sammen. Til dette kreves muligheter for å studere og analysere data på tvers av systemer. Vi samarbeider med selskapet CPM AS, og kan levere rådgivning og ekspertise innen ETL, definisjon av informasjonsbehov/infoflyt, data science og modellering. I praksis settes det opp et datavarehus (=»analysedatabase») for de fleste av analyseprosjektene som gjennomføres – kanskje dette er akkurat hva din bedrift har behov for? La oss ta en prat om akkurat dine behov!

 

Se gjerne også en fin artikkel som omhandler deler av det samme temaet (ekstern kilde): «What the Hell is a Data Warehouse»

Lo Brenna

>