Trusted Smart Statistics

17/09/2019          Taleboble Kommentarer

Et nationalt statistikinstitut, som f.eks. Danmarks Statistik, indsamler og bearbejder data, og offentliggør de bearbejdede data i form af statistik. Kontrollen med både indsamlingen og bearbejdningen er en hjørnesten i institutternes bestræbelser på at opbygge tillid hos brugerne. Garantien for anvendelse af anerkendte metoder og for åbenhed om både metoder og prioritering bygger bl.a. på, at institutterne har fuld kontrol over hele processen. Denne kontrol over data kan fungere så længe indsamling af data er kostbar og ofte afhængig af lovhjemmel, f.eks. i form af krav om at virksomheder skal besvare statistikinstituttes spørgeskemaer. Men den teknologiske udvikling har medført, at de traditionelt indsamlede datas rolle er blevet mindre. Til gengæld er de data, der mere eller mindre automatisk opstår i forbindelse med f.eks. nethandel, aktivitet på sociale medier og overvågning af trafiksikkerhed — de såkaldte organiske data — blevet meget omfangsrige.

I modsætning til de indsamlede data, der ofte ejes og kontrolleres af officielle statistikinstitutter, så er de organiske data ofte ejet og kontrolleret af private virksomheder som Google, Nets og teleselskaberne. De private ejere er meget bevidste om værdien af deres organiske data og udnytter dem i høj grad forretningsmæssigt. Men de organiske data rummer også megen information, der kan være af samme almene interesse som den traditionelle officielle statistik, og de giver i mange tilfælde muligheder for billigere og/eller bedre statistik, end de traditionelle metoder. Der kan også ligge store muligheder i kombination af et organisk datasæt med traditionelle datasæt eller med andre organiske datasæt. De private ejere vil sjældent have økonomisk interesse i udnyttelse af disse muligheder, og hvis de har, så vil databeskyttelseslovgivningen oftest forhindre det.

Men der er intet i vejen for, at de nationale statistikinstitutter kan udnytte disse muligheder, selv om der naturligvis er en række etiske spørgsmål om omfang af og grænser for anvendelsen, som skal være afklaret. Faktisk har institutterne taget hul på sådanne anvendelser. For Danmarks Statistiks vedkommende kan nævnes anvendelse af stregkodedata i forbrugerprisindekset.

I Eurostat, EU’s officielle statitstikinstitut, er man meget opmærksom på de nye muligheder og på den rolle statistikinstitutterne kan komme til at spille. Som samlet betegnelse for disse processer og deres resultater har Eurostat introduceret begrebet Trusted Smart Statistics(TSS).  

Et centralt træk i TSS er at ejerskabet til data ikke længere ligger hos statistikinstituttet, men instituttet kan gennem kontrol med og ejerskab af de redskaber i form af programmel, der anvendes ved bearbejdningen, sikre kvalitet og åbenhed. Da de organiske data kan have en langt større detaljeringsgrad end traditionelt indsamlede data, kan det være en del af datasikkerheden, at ejerskab og kontrol er fordelt på mange aktører. Det bliver så de officielle statistikintitutters opgave gennem TSS at opbygge systemer og redskaber, der gør forsvarlig og pålidelig anvendelse mulig. 

Referencer:
CROS: “Trusted Smart Statistics in a nutshell”, (link)
Fabio Ricciato & Albrecht Wirthmann: “Trusted Smart Statistics: how new data will change official statistics”, 20/5-2019 DOI:10.5281/zenodo.3066061 (link)

 

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *


Besøg Offstat's hovedside