Datarevolution og paradigmeskift — Nye tider for den officielle statistik?
16/02/2021 Kommentarer
Ingen tvivl om at alle, der beskæftiger sig med officiel statistik, fornemmer at der i disse år foregår en udvikling, der fuldstændigt kan ændre vilkårene for den officielle statistikproduktion. Store ændringer er allerede sket, og flere er i vente. Nogle af ændringerne har været beskrevet i mange indlæg i denne blog, f.eks. 1/12-2020, 17/11-2020 og 17/9-2019. Stærke ord som datarevolution og paradigmeskift har været anvendt i beskrivelsen af udviklingen.
Naturligvis er denne fornemmelse af en verden i hastig forandring ikke speciel for den officielle statistiks interessenter, Det er nok en udbredt fornemmelse for interessenter i alle, eller næsten alle, fag. Det er muligvis også en fornemmelse man har haft på andre tidspunkter i historien, uden af eftertiden har set det på samme måde. Måske er fornemmelsen af at stå midt i noget stort blot en form for manglende historisk overblik, hvor man uden at der egentlig er grund til det, ser sin egen tid, som historisk enestående. Men er der, når det kommer til stykket, dækning for at anvende stærke begreber som datarevolution og paradigmeskift? Det spørgsmål har Steve MacFeely — chefstatistiker hos UNCTAD — underkastet en nærmere og grundigere belysning (MacFeely 2020).
MacFeely går meget grundigt til værks. Han indleder med at definere definere begrebet paradigmeskift ud fra Thomas Kuhn’s bog “The Structure of Scientific Revolutions”, og begrebet datarevolution ud fra en rapport, A World that Counts, udarbejdet i 2014 af en FN-ekspertgruppe. På det grundlag identificerer han fire udviklinger, som han ser som kandidater til betegnelsen datarevolution:
1. Definitionen af data udvides til at omfatte flere fænomener
Ordet data betyder det givne, og blev oprindeligt anvendt som betegnelse for den information, det er til rådighed i forbindelse med løsningen af en opgave. For en statistikproducent var data den information, der var indsamlet i form af spørgeskemaer o.lign. til brug for fremstillingen af et statistikprodukt. De teknikker, der var til rådighed, krævede at data var velstrukturerede og umiddelbart egnede som grundlag for optællinger. Objekter, der ikke opfyldte disse krav, f.eks billeder, breve, rapporter og bøger, blev ikke opfattet som mulige data for statistikproduktion.
Det har informationsteknologien ændret på. Billeder og alle skrevne dokumenter kan digitaliseres og derved gøres til genstand for computerbehandling, og både maskinel og det tilhørende programmel er blevet så effektivt, at udledning af struktur i komplekse objekter er blevet mulig. Det har ført til, at billeder og skrevne dokumenter nu er omfattet af statistikbureauernes databegreb.
En anden udvidelse af databegrebet er sket sket ved at teknologien har medført, at mange aktiviteter nu sætter digitale spor i form af organiske data (eller Big Data). Det gælder f.eks. kredit- og dankorttransaktioner, hvert enkelt varekøb i supermarkedet, browsersøgning og aktivitet på sociale medier. Disse digitale spor kan direkte gøres til genstand for behandling af kraftige computere, og bliver således også omfattet af de nye udvidede databegreb.
2. Øget anvendelse af sekundære fremfor primære data.
Til brug for produktionen af officiel statistik har statistikbureauerne altid indsamlet primære data, dvs data der var tilpasset statistisk brug. Det kunne f.eks. være udfyldte folketællingsskemaer eller prisoplysninger fra butikker. Tidligt i udviklingen af den officielle statistik begyndte statistikbureauerne også at anvende sekundære data, dvs. data, der var indsamlet af andre myndigheder, og som ikke var tilpasset statistisk anvendelse. I de nordiske lande tog den udvikling for alvor fart i løbet af 1960’erne, hvor skattevæsenets og andre myndigheders registre blev gjort til sekundære data for den officielle statistikproduktion. I begyndelsen blev der uden for Norden set med skepsis på denne udvikling, men denne skepsis er for længst forsvundet. I dag betragtes anvendelse af sekundære data for helt nødvendigt, for at officielle statistikproducenter kan løse deres opgave.
3. Opfattelse af data og statistik som offentlige goder
Den officielle statistikproduktion har bevæget sig fra næsten udelukkende at have til til formål at understøtte regeringerne i deres administration, til at spille en vigtig rolle som leverandør af viden om samfundet for alle borgere, virksomheder og institutioner. Det giver sig bl.a. udtryk i, at internationale retningslinjer om officiel statistik lægger vægt på, at officiel statistik skal være pålidelig og stilles til rådighed for alle på lige vilkår.
Denne udvikling er dog kun entydig, for producenter af officiel statistik, men ikke for de private aktører, der ofte er ejere af de nye datatyper, der blev omtalt i forbindelse med udvidelsen af databegrebet, specielt de organiske data. Her er spørgsmålet om offentlighedens adgang mere kompliceret, bl.a fordi disse data betragtes som et økonomisk aktiv, samtidig med at det er under diskussion, hvem der ejer eller hvem der bør eje dem, og dermed have retten til at anvende dem kommercielt.
4. Data og statistik som grundlag for informeret beslutningstagning
Bevidstheden om og kravet til at statistiske data skal indgå som en central del af grundlaget for politiske beslutninger har vundet frem. Udviklingen har været tydelig efter anden verdenskrig, men er accelereret omkring årtusindskiftet, hvor begreber som datadrevet beslutningstagning og new public management kom på mode.
Efter en grundig gennemgang af hver af de fire udviklinger konkluderer MacFeely, at de alle opfylder kriterierne for at kunne betegnes som både datarevolutioner og paradigmeskift. Vi har med andre ord grund til at antage, at fornemmelsen af at stå midt i en betydningsfuld omvæltning ikke blot er udtryk for en forblændelse af vores egen tid, men faktisk er en afspejling af virkeligheden.
Referencer:
Steve MacFeely: “ In search of the data revolution: Has the official statistics paradigm shifted?”, Statistical Journal of the IAOS, December 2020 (link, 12/1-2021)
UN : “A World that counts”, November 2014 (link)