Brugbare resultater fra dine data på få dage
Virksomheder og offentlige organisationer får hele tiden at vide, at data er værdifulde. Men mange ved ikke, hvordan værdien bedst udnyttes. Hvordan får man værdi ud af de store datamængder? Datasprints er en metode til at udforske data systematisk og hurtigt. Michael Hockenhull er forsker på IT-Universitetet og giver her en gennemgang af metoden.
Institut for Business ITEfteruddannelsebig dataforretning
Skrevet 6. december 2016 12:39 af Ninna Gandrup
- Jeg plejer at sammenligne datasprints med hackatons, fordi de to metoder har mange ligheder: man arbejder intensivt over få dage med data. I et datasprint sætter man et hold af personer med forskellige roller, som arbejder tæt sammen om at udforske data i en periode på fx to-tre dage. Holdet rengør, analyserer og visualiserer data i en iterativ proces og forholder hele tiden resultaterne til de forretnings- og projektmæssige målsætninger, som man har sat sig for at udforske med data, forklarer Michael Hockenhull.
I et datasprint sætter man et hold af personer med forskellige roller, som arbejder tæt sammen om at udforske data i en periode på fx to-tre dage.
Michael Hockenhull
I et datasprint kan man opstille en konkret udfordring, eller man kan vælge en mere åben tilgang, hvor man undersøger, om data kan gemme på helt nye indsigter. Et Data Sprint, der for nylig blev afholdt på IT-Universitetet af Novo Nordisk, IBM og Deloitte, er et eksempel på sidstnævnte. Her brugte studerende en weekend på at lede efter nye indsigter om folkesygdommen diabetes i offentligt tilgængelige datasæt. De studerende undersøgte blandt andet, hvorvidt man kan forudse, hvem der bliver ramt af diabetes, og om der er sammenhæng mellem søvnvaner og diabetes.
Brugbare resultater på kort tid
Der er flere fordele ved at arbejde i datasprints:
- Det kræver ikke faste ressourcer til tekniske analyser af data
- Forskellige it-kompetencer arbejder tæt sammen og intensivt med store mængder data
- Man får brugbare resultater på meget kort tid, som kan forstås af ikke-teknikere
- Særligt, når man har rigtig meget data, kan det være utilstrækkeligt bare at lave et dataudtræk, da de ikke i sig selv fortæller særlig meget om den situation, der har skabt data. Dataudtræk er som orakler. De giver tvetydige svar. Med datasprints kan man lave hurtige prototyper på datamodeller og diskutere mønstre i de data, der trækkes ud. Man kan også arbejde systematisk med data fra kilder udenfor virksomheden som fx sociale medier, offentlige registre eller data, som man køber sig adgang til. Det spændende er, når man forholder forskellige datatyper til hinanden, hvilket kan give nye indsigter, fordi de forskellige datatyper kræver, at man vover pelsen og tolker mere på data, og på hvordan datakilderne komplimenterer hinanden, fortæller Michael Hockenhull.
Datasprint metoden er tænkt som en måde at styrke kommunikation mellem specialister og ledelse. Metoden hjælper derved til, at ledelsen kommer med helt ind i kernen af dataudtrækkene, men i første omgang på lige fod med specialisterne.
Michael Hockenhull
Datasprints styrker kommunikation mellem ledelse og specialister
Hele pointen med et datasprint er at få forskellige folks kompetencer til at mødes omkring nogle centrale spørgsmål. Flerfagligheden stiller krav til, at data præsenteres, så alle deltagere kan analysere resultaterne. Derfor har holdet også en designer med, der skal sikre overskuelighed og formidling af resultaterne.
- I det øjeblik, at programmøren bare så meget som kigger på data, er han allerede i gang med at tage beslutninger. Datasprint metoden er tænkt som en måde at styrke kommunikation mellem specialister og ledelse. Metoden hjælper derved til, at ledelsen kommer med helt ind i kernen af dataudtrækkene, men i første omgang på lige fod med specialisterne. Datasprintholdet stiller desuden med en storyteller, der har særlig analytisk tæft, siger Michael Hockenhull.
6 trin til et vellykket Data Sprint i en virksomhed
Et datasprint kan sikre en vigtig kontakt mellem specialister og beslutningstagere, og derfor er der også nogle rammer, der skal være på plads, for at opnå et vellykket datasprint.
1: Sæt et hold
Først vurderer man, hvilke kompetencer og hvor mange folk, man har til rådighed. Derefter sætter man sit hold. Afhængig af datasættets størrelse, virksomheden størrelse og formålet med sprintet, kan holdet være på mellem fem og 20 mennesker. Man uddeler opgaver og italesætter holdets forskellige kompetencer og ekspertise. Det vigtige er, at følgende roller er udfyldt, men en person kan godt have flere roller:
- Programmør: kan lave udsnit af data
- Analytiker: kan analysere data
- Domæneekspert: en der kender det fænomen, men har data på
- Projektleder/storyteller: styrer processen, afdækker behov og interesser
- Designer: der laver prototyper på visualisering af data, så data kan formidles til organisationen
- Ledelse: skal sikre buy in i organisationen og retningslinjer for Data Sprintet
2: Eksplorativt eller ej
Man skal finde ud af, hvad man vil bruge datasprintet til. Vil man arbejde eksplorativt med at udforske og undersøge data i relation til fx nye forretningsmuligheder? Eller har man mere specifikke behov for informationer, som skal styre processen? Her skal beslutningstagerne være med til at vurdere, hvad formålet med datasprintet er.
3: Kræver tid og ressourcer
Et datasprint kræver tid og ressourcer til at fordybe sig i processen. Derfor skal man sikre, at organisationen er med. Holdet skal bestå af personer, der går helhjertet ind i opgaven, og som kan lide at sidde og nørde med data. Endelig kræver det en koncentreret indsats fra start til slut, hvilket typisk vil sige to til tre dage.
4: Så går man i gang
I datasprintet går de forskellige aktører i gang med deres roller. Metoden minder om en agil Scrum-proces, hvor man over to til tre dage laver en række kontrollerede analyser i forsøget på at finde de udsnit af data, som er mest interessante at arbejde videre med.
- Projektlederen har til opgave at facilitere en dialog mellem dem, der har spørgsmål og dem, der har ekspertisen. Vedkommende skal sørge for, at gruppen fortsætter ad den rette sti.
- Programmøren laver et udsnit af data på baggrund af input fra projektlederen/storytelleren
- Analytikeren analyserer data
- Designeren laver visualiseringer og formidler data
- Processen gentager sig indtil alle vinkler af datasprintets mål er afdækket
Under datasprintet tjekker projektlederen løbende ind hver anden eller tredje time for at sikre dialogen mellem holdet og beslutningstagerne. Vedkommende vurderer, om holdet finder noget interessant og udstikker retningen, hvis processen udvikler sig.
5: Storytelling er centralt
I datasprints er storytelling afgørende, fordi det er det, der formidler resultaterne til beslutningstagerne. Når analytikerne har lavet dataudtræk, og designeren har lavet visualiseringer, er det storytellerens opgave at præsentere dem og matche dem med datasprintets mål. Visualisering er en essentiel måde at forstå data på, som gør det nemmere for storytelleren at sikre samspil mellem forskellige lag i fx en organisation.
6: Hvornår ved man, om man har nok?
Ofte sætter tid og ressourcer en naturlig begrænsning for arbejdet. Det er holdets opgave at finde de data, der har værdi inden for rammerne. Det kan både være forretningsmæssig værdi i form af nye forretningsmuligheder, men det kan også være værdi i form af nye perspektiver, som man ellers ikke ville have opdaget. I sådanne tilfælde er det ikke sikkert, at man finder et entydigt svar, eller det kan være, at man ender et helt andet sted, end man havde forestillet sig.