Data Science – hvad skal vi bruge det til?

Data science er det nye, hotte buzzword i IT-branchen. Det er et forholdsvist nyt begreb som dækker over forskellige former for data-analyse. Helt grundlæggende handler data science om at trække viden ud af data på den ene eller anden måde. At “lære” af data, med andre ord. Præcis som “science” er processen at lære om den verden vi lever i, er “data science” processen at lære af data.
Virksomheder har længe anvendt forskellige former for statistisk analyse i f.eks. business intelligence for at se hvordan virksomheden klarer sig, eller at se hvilke annoncer som konverterer bedst, eller hvilke produkter som sælger bedst. Efter internethandel og smartphones er blevet mainstream kan virksomhederne indsamle langt større mængder data om deres kunder, og om deres egen virksomhed. Disse data kan virksomhederne bruge til at lære meget mere, og derved tjene eller spare flere penge. Derfor er det blevet et strategisk kerneområde i moderne virksomheder.
 
Universiteterne er også begejstrede for data science. Det giver jobs med cool titler og høje lønninger til fag som ellers traditionelt ikke har haft den store afsætning efter uddannelsen. F.eks. matematik og kunstig intelligens. Men det er ved at ændre sig. Både KU, ITU, DTU og AAU har nu uddannelser relateret til data science.

Data science kategorier

Data science er et felt i konstant forandring, så det kan være udfordrende at kategorisere teknikkerne og anvendelsesområderne. Overordnet set kan det dog opdeles i følgende kategorier:
  •  Descriptive
  •  Predictive

Descriptive data science

Descriptive data science handler om at analysere fortiden. Med andre ord, at beskrive hvad der allerede er sket.
 
Descriptive data science omfatter typisk statistisk analyse af indsamlet data, f.eks. kunders købsvaner, annoncers konverteringsrater, test-personers tilbagemeldinger, spilleres adfærd på forskellige levels, in app purchases osv.

Predictive data science

Predictive data science handler om at forsøge at forudsige fremtiden. Det kan f.eks. omfatte at forsøge at gætte hvad man kunne mersælge til en kunde, ud fra hvad andre kunder med samme varer i kurven har købt tidligere.
 
Predictive data science anvender typisk forskellige machine learning algoritmer, som f.eks. decision trees eller neurale netværk. Disse algoritmer trænes ud fra indsamlede data, og danner på baggrund af disse en model. Denne model anvendes så til at forsøge at forudsige fremtiden.
Med andre ord, man forsøger at forudsige fremtiden ud fra data fra fortiden.

Data science i praksis

I praksis anvendes typisk både descriptive og predictive data science, enten hver for sig eller i kombination med hinanden. Der er allerede mange virksomheder som anvender business intelligence systemer i forskellige former, f.eks. SAS, Tableu osv. – og mange virksomheder er igang med at udvide anvendelsen til at måle på flere og flere dele af forretningen, efterhånden som det bliver muligt at indsamle data om disse dele.
 
Data science anvendes også i det offentlige. F.eks. har Danmark fået en ny offentlig organisation kaldet Styrelsen for Dataforsyning og Effektivisering (SDFE): http://sdfe.dk/
 
Derudover har f.eks. UK en strategi om, at offentlige data i højere grad skal være tilgængelige for offentligheden.

Braintrust

Her hos Lund&Bendsen anser vi data science for at være en af de store trends i vores branche de næste 5-10 år. Der sker f.eks. store fremskridt indenfor artificial intelligence i øjeblikket, og der er også mange store gevinster som kan høstes ved blot at tage statistisk analyse mere struktureret i brug hos mange virksomheder. Derfor er data science et at de emner vi har fokus på i vores BrainTrust-netværk.
 
Vi har allerede haft Thomas Bolander fra DTU ude at fortælle om anvendelsesmulighederne for artificial intelligence. Foredraget handlede om hvad AI-algoritmerne kan på nuværende tidspunkt, og hvad de endnu ikke kan.
 
Næste begivenhed i BrainTrust-netværket er et seminar om machine learning hvor vi får besøg af Morten Sørup fra DTU. Morten Sørup forsker i machine learning algoritmer i sit daglige arbejde på DTU. 
 
BrainTrust-netværket ser også på andre trends fremover. Bl.a. har emner som blockchain, 3D-printning, robot-teknologi, decentral fabrikering, drone-teknologi og meget andet spændende været nævnt som mulige emner for braintrust-netværket i fremtiden. Hvis du har lyst til at følge med i de nye trends, så er BrainTrust-netværket en god mulighed for dig!

Jakob Jenkov

Seniorkonsulent | Instruktør

Softwarearkitekt / seniorudvikler med ekspertise indenfor Java, data streaming og distribuerede systemer generelt (inkl. web), både cloud, hybrid cloud og on-premise. Erfaring med teknologier som Kafka, Kafka Streams, Docker, Kubernetes, Azure, AWS etc. Vant til at arbejde efter agile processer som Scrum eller Kanban. Jakob Jenkov har udviklet og vedligeholdt adskillige Open Source Javaprojekter og har gennem årene publiceret mere end 850 tutorials, artikler og bøger om blandt Java, AngularJS, Maven, Gradle, Ant, Git, HTML5, CSS, JavaFX og JQuery.