Kategori: Statistiksystemet

  • Danmarks Statistiks arbejdsplan for 2023

    Danmarks Statistik har ambitiøse planer for udviklingen af statistikken i 2023. Det fremgår af Arbejdsplanen for 2023, der netop er udkommet. Arbejdsplanerne er en konkret udmøntning af institutionens strategi, som er beskrevet i Strategi 2025 (se tidl. indlæg). I forbindelse med arbejdsplanen udgives også statistikprogrammet, som er en kort gennemgang af alle de eksisterende statistikprodukter.

    Det efter min opfattelse mest interessante punkt i arbejdsplanen har overskriften Fokus på fordelingsaspekter i Nationalregnskabet. Den overskrift dækker over opfyldelsen af en gammel statistisk drøm om at knytte det noget abstrakte nationalregnskab til de lidt mere konkrete personstatistikker — det såkaldte mikro/makro-link (se tidl. indlæg). Ideen er, at nationalregnskabets opgørelser af nationens samlede indkomst og forbrug skal fordeles ud på forskellige husholdningstyper. Det vil øge mulighederne for mere direkte at belyse hvordan forskellige husholdningstyper — f.eks pensionister, lønmodtagere selvstændige og studerende — påvirkes af den generelle økonomiske udvikling. Mulighederne for at belyse udviklingen i uligheden i indkomst og forbrug vil også blive forbedret.

    Nationalregnskabet har i det hele taget en central plads i årsberetningen. Der loves forbedringer i det eksisterende regnskab i form af bedre opgørelser af aktiviteten i de største globaliserede danske virksomheder, der hidtil har voldt problemer, og en fortsat udbygning af det grønne nationalregnskab i form af de såkaldte økosystemregnskaber. På lidt længere sigt arbejdes med mulighederne for en bedre belysning af  den økonomiske aktivitet, der foregår i verdensrummet uden for jordkloden, f.eks. i form af satellitbaseret kommunikation. En plan om at undersøge mulighederne for at finde data til en bedre statistik om frivilligt arbejde og donationer til aktiviteter inden for kultur, idræt, socialt arbejde mv, vil også kunne få stor betydning for for nationalregnskabet.

    Men naturligvis er det ikke kun nationalregnskabet, der er tilgodeset i arbejdsplanen. På kulturområdet tales om en udbygget statistik om kulturlivet — bl.a. en belysning af udøvende kunstneres vilkår — og en kortlægning af mediebranchen med henblik på en ny mediestatistik, Den eksisterende mediestatistik betegnes nærmest som forældet. Blandt de øvrige planlagte udvidelser og forbedringer skal her blot nævnes forbrugsundersøgelsen, og statistikken over udenrigshandel med tjenester.

    Referencer
    Danmarks Statistik (2023A): “Arbejdsplan 2023”, januar 2023 (link, 16/1-2023)
    Danmarks Statistik (2023B): Statistikprogram 2023”, januar 2023 (link, 16/1-2023)
    Danmarks Statistik (2022): “Strategi 2025”,  2022  (link, 16/1-2023)

  • Danmarks Datavindue

    Kort efter sin tiltræden som rigsstatistiker i oktober 2020 præsenterede Birgitte Anker sin ide om Danmarks Datavindue — en samlet national indgang til samfundsdata, fortrinsvis rettet mod forskere og analytikere. Danmarks Statistik gik hurtigt i gang med forberedelserne, støttet af en bevilling fra Carlsbergfondet på 10 mio.kr., og i juni 2022 blev der åbnet for en begrænset brugerkreds. Efter planen skal der åbnes for alle brugere i løbet af efteråret 2022.

    Der er ikke tale om en umiddelbart offentligt tilgængelig datakilde, som det kendes fra Danmarks Statistikbank. Brug af datavinduet kræver at der oprettes et projekt, som skal godkendes af Danmarks Statistik, og brugeren skal have en brugeraftale med en institution, der er autoriseret til adgang til Danmarks Statistiks mikrodata. Herudover skal brugeren certificeres, og certificering kræver dokumenteret kendskab til de gældende datasikkerhedsregler.

    Kernen i Danmarks Datavindue er naturligvis de mikrodata, der i forvejen findes i Danmarks Statistik, men vil også omfatte data fra andre dataejere. Gennem datavinduet får brugerne en samlet overblik over hvilke data, der er til rådighed, og data vil være kvalitetssikrede og dokumenterede.

    Datavinduet er ikke blot en samling mikrodatasæt, men også et automatiseret administrativt system til håndtering af projekterne, under hensyntagen til kravene om fortrolighed og datasikkerhed, og redskaber til behandling og analyse af data. I den forbindelse arbejdes der på, at gøre det muligt at knytte såkaldt high performance faciliteter — dvs. meget store og meget hurtige computere — til projekterne.  

    Referencer:
    Danmarks Statistik: “Danmarks Datavindue” (link 15/6-2022)
    Danmarks Statistik: “Arbejdsplan 2022”, januar 2022 (link 15/6-2022)
    Birgitte Anker:Et fælles vindue til Danmarks data vil give stor værdi for alle”, Danmarks Statistik, Rigsstatistikerens Klumme 17/6-2021 (link15/6-2022)
    Carlsbgfondet: “Bevillingsoversigt: Danmarks Datavindue”, 2021 (link 16/6-2022)

  • Danmarks Statistik: Strategi 2025 og arbejdsplan 2022

    Ifølge Walter Radermacher — forsker ved Sapienza Universitetet i Rom og generaldirektør for Eurostat 2008-2016 — har vilkårene for den officielle statistik siden 2010 været præget af tre centrale udviklingstræk (se indlæg fra 18/8-2020) :

    1. Globalisering
    2. Stærkt stigende udbredelse af organiske data (Big Data)
    3. Stærk fokus på evidensbaseret beslutningstagning
    4. Faldende tillid til den officielle statistik 

    At man i Danmarks Statistiks er fuldt bevidst om denne udvikling fremgår tydeligt af institutionens strategi frem til 2025, som blev godkendt af bestyrelsen 6/12-2021. Her fremhæves øget relevans af statistikkerne — herunder udvikling af hurtigere indikatorer og nye formidlingskanaler — og  sikring af høj statistikkvalitet.  Der loves også en indsats for at opsøge og afteste nye muligheder for statistik. På dataområdet lægges op til at finde nye datakilder, og på personaleområdet lægges op til styrkelse af kompetenceniveauet.

    Den mere konkrete implementering af strategien beskrives i de årlige arbejdsplaner, hvor planen for 2022 , som er den første under Strategi 2025, udkom  i januar 2022. Mest direkte afspejler strategien sig i forbedringer og udvidelser af de konkrete statistikprodukter. Blandt planerne kan nævnes udvidelse af ledighedsstatistikken (bl.a. med en månedlig indikator) og nye bolig- og ejendomsstatistikker (bl.a et prisindeks for andelsboliger). Lidt mere abstrakt, men mindst lige så vigtigt er den planlagte indsats for at vedligeholde og forbedre kvaliteten af statistikprodukterne. Helt central bliver gennemførelse af EU’s såkaldte peer review i marts,  der skal vurdere statistikkernes overensstemmelse med reglerne i EU’s adfærfdskodeks for officiel statistik (se indlæg fra 8/2-2022). Vigtig er også en annonceret indsats til imødegåelse af problemerne i forbindelse med de faldende svarprocenter i spørgeskemaundersøgelser.

    Referencer:
    Danmarks Statistik: “Strategi 2025”, januar 2022. (link 1/3-2022)
    Danmarks Statistik:Arbejdsplan 2022”, januar 2022, (link 18/2-2022)

  • Datarevolution og paradigmeskift — Nye tider for den officielle statistik?

    Ingen tvivl om at alle, der beskæftiger sig med officiel statistik, fornemmer at der i disse år foregår en udvikling, der fuldstændigt kan ændre vilkårene for den officielle statistikproduktion. Store ændringer er allerede sket, og flere er i vente. Nogle af ændringerne har været beskrevet i mange indlæg i denne blog, f.eks. 1/12-2020, 17/11-2020 og 17/9-2019. Stærke ord som datarevolution og paradigmeskift har været anvendt i beskrivelsen af udviklingen. 

    Naturligvis er denne fornemmelse af en verden i hastig forandring ikke speciel for den officielle statistiks interessenter, Det er nok en udbredt fornemmelse for interessenter i alle, eller næsten alle, fag. Det er muligvis også en fornemmelse man har haft på andre tidspunkter i historien, uden af eftertiden har set det på samme måde. Måske er fornemmelsen af at stå midt i noget stort blot en form for manglende historisk overblik, hvor man uden at der egentlig er grund til det, ser sin egen tid, som historisk enestående. Men er der, når det kommer til stykket, dækning for at anvende stærke begreber som datarevolution og paradigmeskift? Det spørgsmål har Steve MacFeely — chefstatistiker hos UNCTAD —  underkastet en nærmere og grundigere belysning (MacFeely 2020).

    MacFeely går meget grundigt til værks. Han indleder med at definere definere begrebet paradigmeskift ud fra  Thomas Kuhn’s bog “The Structure of Scientific Revolutions”, og begrebet datarevolution ud fra en rapport, A World that Counts, udarbejdet i 2014 af en FN-ekspertgruppe. På det grundlag  identificerer han fire udviklinger, som han ser som kandidater til betegnelsen datarevolution:

    1. Definitionen af data udvides til at omfatte flere fænomener
    Ordet data betyder det givne, og blev oprindeligt anvendt som betegnelse for den information, det er til rådighed i forbindelse med løsningen af en opgave. For en statistikproducent var data den information, der var indsamlet i form af spørgeskemaer o.lign. til brug for fremstillingen af et statistikprodukt. De teknikker, der var til rådighed, krævede at data var velstrukturerede og umiddelbart egnede som grundlag for optællinger. Objekter, der ikke opfyldte disse krav, f.eks billeder, breve, rapporter og bøger, blev ikke opfattet som mulige data for statistikproduktion.

    Det har informationsteknologien ændret på. Billeder og alle skrevne dokumenter kan digitaliseres og derved gøres til genstand for computerbehandling, og både maskinel og det tilhørende programmel er blevet så effektivt, at udledning af struktur i komplekse objekter er blevet mulig. Det har ført til, at billeder og skrevne dokumenter nu er omfattet af statistikbureauernes databegreb.

    En anden udvidelse af databegrebet er sket sket  ved at teknologien har medført, at mange aktiviteter nu sætter digitale spor i form af organiske data (eller Big Data). Det gælder f.eks. kredit- og dankorttransaktioner, hvert enkelt varekøb i supermarkedet, browsersøgning og aktivitet på sociale medier. Disse digitale spor kan direkte gøres til genstand for behandling af kraftige computere, og bliver således også omfattet af de nye udvidede databegreb.

    2. Øget anvendelse af sekundære fremfor primære data.
    Til brug for produktionen af officiel statistik har statistikbureauerne altid indsamlet primære data, dvs data der var tilpasset statistisk brug. Det kunne f.eks. være udfyldte folketællingsskemaer eller prisoplysninger fra butikker. Tidligt i udviklingen af den officielle statistik begyndte statistikbureauerne også at anvende sekundære data, dvs. data, der var indsamlet af andre myndigheder, og som ikke var tilpasset statistisk anvendelse. I de nordiske lande tog den udvikling for alvor fart i løbet af 1960’erne, hvor skattevæsenets og andre myndigheders registre blev gjort til sekundære data for den officielle statistikproduktion. I begyndelsen blev der uden for Norden set med skepsis på denne udvikling, men denne skepsis er for længst forsvundet. I dag betragtes anvendelse af sekundære data for helt nødvendigt, for at officielle statistikproducenter kan løse deres opgave.

    3. Opfattelse af data og statistik som offentlige goder
    Den officielle statistikproduktion har bevæget sig fra næsten udelukkende at have til til formål at understøtte regeringerne i deres administration, til at spille en vigtig rolle som leverandør af viden om samfundet for alle borgere, virksomheder og institutioner. Det giver sig bl.a. udtryk i, at internationale retningslinjer om officiel statistik lægger vægt på, at officiel statistik skal være pålidelig og stilles til rådighed for alle på lige vilkår.

    Denne udvikling er dog kun entydig, for producenter af officiel statistik, men ikke for de private aktører, der ofte er ejere af de nye datatyper, der blev omtalt i forbindelse med udvidelsen af databegrebet, specielt de organiske data. Her er spørgsmålet om offentlighedens adgang mere kompliceret, bl.a fordi disse data betragtes som et økonomisk aktiv, samtidig med at det er under diskussion, hvem der ejer eller hvem der bør eje dem, og dermed have retten til at anvende dem kommercielt.

    4. Data og statistik som grundlag for informeret beslutningstagning
    Bevidstheden om og kravet til at statistiske data skal indgå som en central del af grundlaget for politiske beslutninger har vundet frem. Udviklingen har været tydelig efter anden verdenskrig, men er accelereret omkring årtusindskiftet, hvor begreber som datadrevet beslutningstagning og new public management kom på mode.

    Efter en grundig gennemgang af hver af de fire udviklinger konkluderer MacFeely, at de alle opfylder kriterierne for at kunne betegnes som både datarevolutioner og paradigmeskift. Vi har med andre ord grund til at antage, at fornemmelsen af at stå midt i en betydningsfuld omvæltning ikke blot er udtryk for en forblændelse af vores egen tid, men faktisk er en afspejling af virkeligheden.

    Referencer:
    Steve MacFeely: “ In search of the data revolution: Has the official statistics paradigm shifted?”, Statistical Journal of the IAOS, December 2020 (link, 12/1-2021)
    UN : “A World that counts”, November 2014 (link)

  • Præsident Bidens første beslutninger vedrørende officiel statistik

    Blandt de mange bekendtgørelser (executive orders) som Joe Biden, USA’s nytiltrådte præsident, udstedte i de første timer efter sin edsaflæggelse, var også en vedrørende den folketælling, der blev afholdt i USA i 2020 (link). Bekendtgørelsen omgør to kontroversielle bekendtgørelser udstedt af den netop afgåede præsident, Donald Trump. Donald Trump havde, som beskrevet i flere tidligere indlæg (bl.a. 7/2-2017 og 19/9-2017), et noget anstrengt forhold til folketællingen, og til andre grene af statistikken for den sags skyld. 

    Den ene omgjorte bekendtgørelse vedrører den rolle ulovlige immigranter skal spille i forbindelse med fordelingen af pladser i de folkevalgte forsamlinger, herunder forbundsparlamentet (Repræsentanternes Hus) og  delstaternes parlamenter. Trump havde i en bekendtgørelse besluttet, at ulovlige immigranter ikke skulle indgå i disse optællinger. Da den almindelige antagelse er, at antallet af ulovlige immigranter er størst i de områder, hvor demokraterne står stærkest, betød det en styrkelse af republikanernes stilling i fordelingen. Demokraterne så Trumps bekendtgørelse som et brud på en lang tradition for fortolkningen af forfatningens regler om folketællingen, der gik ud på at alle skulle medregnes, uanset lovligheden af opholdsgrundlaget. Med præsident Bidens omgørelse er man vendt tilbage til den traditionelle tolkning.

    Den anden af de to omgjorte bekendtgørelser vedrører registrering af statsborgerskab. Trump-administrationen havde oprindeligt besluttet, at der i folketællingsskemaet skulle indgå et spørgsmål om statsborgerskab. Der var blandt myndighederne i flere stater og byer modstand mod at lade et sådant spørgsmål indgå, fordi man forventede, at det det kunne få nogle immigranter til at modsætte sig registrering (selv om deltagelse i folketællingen er lovpligtig), af frygt for, at oplysningerne kunne blive brugt til at så tvivl deres ret til at opholde sig i USA. Det ville betyde en undervurdering af immigrantbefolkningen, og også her var antagelsen, at det ville styrke republikanerne på demokraternes bekostning. Lovligheden af spørgsmålet blev anfægtet, og Højesteret besluttede at blokere for spørgsmålet, fordi den ikke fandt, at der var overbevisende argumenter for spørgsmålets nytte og nødvendighed. Myndighederne havde andre statistiske kilder til belysning af statsborgerskab. Trump reagerede ved at udstede en bekendtgørlse, der pålagde føderale myndigheder at levere data om statsborgerskab til folketællingsbureauet, der så kunne samkøre oplysningerne med de øvrige indsamlede data. Det er denne bekendtgørelse, der nu er omgjort, således at spørgsmålet om statsborgerskab ikke kommer til at indgå i folketællingsopgørelserne.

    Referencer:
    US Census Bureau: “Census Bureau Update on 2020 Census”, Press Release 21/1 2021 (link)
    The White House: Ensuring a Lawful and Accurate Enumeration and Apportionment Pursuant to the
    Decennial Census”, Executive Order of the President, 20/1-2021 (link)

  • Danmarks Statistiks arbejdsplan for 2021

    For Danmarks Statistik har to begivenheder gjort 2020 til et særligt år. Den ene, covid19-krisen, har været en fælles erfaring for stort set alle — institutioner såvel som personer. Den anden, udnævnelsen af en ny rigsstatistiker (se tidl. indlæg), er institutions-specifik. Begge begivenheder vil få betydning for institutionens fremtidige virke, og det kan allerede spores i den netop udsendte arbejdsplan for 2021. Arbejdsplanen skal jo afspejle den mere langsigtede strategi, som er beskrevet i institutionens strategiplan, men som Bestyrelsen påpeger i sin kommentar til arbejdsplanen, så er der jo ingen grund til ikke at foregribe en fremtidig strategiplan, i det omfang ændringer i strategien allerede er forudset. Det gælder måske særligt denne arbejdsplan, hvor udarbejdelsen af en ny strategiplan er et af punkterne. Som Bestyrelsen også påpeger, bliver den nye strategiplan en god lejlighed for den nye rigsstatistiker til at introducere sine visioner og ambitioner.

    Foranlediget af covid19-krisen påbegyndte Danmarks Statistik i 2020, under overskriften Eksperimentel Statistik,  offentliggørelsen af en række statistikker med særlig relevans for belysning af krisen og dens virkninger (se tidl.indlæg). Betegnelsen eksperimentel dækker bl.a. over, at statistikken kan udvikles til at indgå i det almindelige statistikprogram, eller at den kan nedlægges, hvis behovet viser sig at være midlertidigt, eller at kvaliteten viser sig at være for ringe. Arbejdsplanen lægger da også op til, at den eksperimentelle statistik i sin helhed kun videreføres, så længe det er relevant, men at dele af den kan overgå til løbende drift.

    Et centralt punkt i arbejdsplanen er etableringen af en særlig enhed, der skal arbejde med forbedring af nationalregnskabet. Fokus er især på bedre overensstemmelse mellem den første og foreløbige opgørelse og den endelige version. Tanken er også at inddrage eksterne interessenter i arbejdet. Andre vigtige planer omkring nationalregnskabet er udarbejdelse af en revideret udgave af dokumentationen af offentliggørelsen af bruttonationalindkomsten (BNI), forbedret opgørelse af den sorte økonomi og videreførelse af det grønne nationalregnskab. Blandt øvrige planer kan nævnes bedre integration af udenrigshandels- og betalingsbalancestatistik, med henblik på bedre belysning af globaliseringen, indarbejdelse af nye typer af organiske data (big data) og introduktion af en mere intuitiv struktur i statistikbanken og på hjemmesiden.

    Referencer:
    Danmarks Statistik: “Arbejdsplan 2021”, januar 2021 (link, 15/1-2021)
    Danmarks Statistik: “Statistikprogram 2021”, januar 2021 (link, 15/1-2021)
    Danmarks Statistik: “Strategi 2022 – Revideret”, december 2020 (link, 15/1-2021)
    Danmarks Statistik: “Eksperimentel statistik COVID-19”, december 2020 (link, 16/1-2021)

  • EU-statistikken efter Brexit

    Da UK forlod EU den 1. februar 2020, fik det i første omgang kun begrænsede følger for EU-statistikken, herunder EU’s statistikbank. I den overgangsaftale, der blev indgået, indgik en fortsættelse af  UK’s indberetninger af statistik til EU’s statistikenhed — Eurostat — og Eurostat fortsatte offentliggørelsen af den indberettede statistik. Men den 1. januar 2021 udløb overgangsaftalen, og UK er herefter ikke længere omfattet af EU’s statistiksamarbejde.

    Samarbejdet mellem UK og EU er nu reguleret i en handels- og samarbejdsaftale, som blev indgået den 30.december 2020. Aftalen indeholder enkelte bestemmelser om udveksling af statistik, der er nødvendig, for at aftalen kan fungere. Det gælder f.eks. bruttonationalproduktet (BNP), der indgår i beregningen af det bidrag (operational contribution), UK skal betale for fortsat at deltage i nogle få udvalgte EU-programmer. Af størst betydning set fra den officielle statistiks synsvinkel er en kort paragraf, der lægger op til en særlig statistikaftale mellem Eurostat og UK’s statistikmyndighed.

    Indtil en aftale er indgået vil Eurostat ikke opdatere data om UK, men allerede offentliggjorte data vil fortsat være tilgængelige i statistikbanken. UK er i landelisterne flyttet fra gruppen af EU-lande til gruppen af lande, der indberetter statistik til EU, uden at være medlemmer. Udover UK omfatter gruppen bl.a. Norge, Island og Schweiz. 

    Det må være i  begge parters interesse fortsat at kunne indgå i sammenlignelige statistiske opgørelser, så mon ikke der indenfor relativ kort tid vil blive indgået en aftale, der vil sikre, at en stor del af opgørelserne i EU’ statistikbank kan videreføres med data også fra UK.

    Referencer:
    Eurostat: “Dissemination of European Statistics after Brexit”,  (link, 8/1-2021)
    Council of the European Union: “Trade and Cooperation Agreement”, (link, 10/1-2021)

  • Birgitte Anker bliver den ny rigsstatistiker

    Den 1. oktober tiltræder Birgitte Anker som Danmarks nye Rigsstatistiker — den femte i rækken. Rigstatistikeren er daglig leder af Danmarks officielle statistikmyndighed — Danmarks Statistik — og er samtidig formand for Danmarks Statistiks bestyrelse, der fastlægger institutionens arbejdsprogram. Embedet blev etableret ved en lov i 1966, hvor Danmarks Statistik oprettes som afløser for det tidligere Statistisk Departement. Loven fra 1966 gav Danmarks Statistik vidtgående beføjelser til indsamling af data, både fra virksomheder og fra andre myndigheder, og tillagde rigsstatistikeren en central rolle. Embedet blev yderligere styrket ved en ny statistiklov i 2018 (tidl. indlæg), hvor navnlig Danmarks Statistiks rolle som uafhængig institution og som den overordnet ansvarlige for den officielle danske statistikproduktion udtrykkeligt fastslås. Birgitte Anker får derfor en central og inflydelsesrig position i den fremtidige udvikling af  dansk statistik.

    Loven om Danmarks Statistik fra 1966 kan ses som den danske indgang til tredie fase i det skema for den officielle statistiks udvikling som Walter J. Radermacher — en tidligere chef for Eurostat — har opstillet (se oversigten nedenfor). Tredie fase er navnlig karakteriseret ved, at computere og automatisering for alvor begynder at vinde indpas i samfundet. Det betød, at den officielle statistik måtte tilpasse sin produktion til de nye teknologier, navnlig omkring indhold og metoder i forbindelse med dataindsamlingen. I forhold til Radermachers kronologi er loven lidt forud for sin tid, men der kan heller ikke være tvivl om her var tale om en meget fremsynet lov. Bag loven stod bl.a. Viggo Kampmann og som den første rigsstatistiker udpegedes N. V. Skak-Nielsen. Både Kampmann og Skak-Nielsen havde et klart blik for, hvad de nye tekniske muligheder kunne betyde for statistikken, og de var villige til at bruge dem. Resultatet blev en lov, der bl.a. gav Danmarks Statistik ret til at anvende andre myndigheders adminstrative registre i statistikproduktionen, og en administration af loven, der i høj grad udnyttede disse muligheder.

    Oversigt: Fire faser i den officielle statistiks historiske udvikling

    Første fase 1800-1899 Den industrielle evolution
    Fremspirende nationalstater
    Etablering af nationale statistikinstitutter
    Anden fase 1900-1969 Udvikling af statistisk teori
    Udvikling af stikprøvemetoder
    Nationalregnskaber
    Tredie fase 1970-2009 Computere (mainframe)
    PC’ere
    Registerbaseret statistilk
    Udvikling af EU’s statistiske system
    Fjerde fase 2010- Organiske data (Big data)
    Globalisering
    Evidensbaseret beslutningstagning

    Kilde: Radermacher(2019) s. 2-3

    Opbygningen af de registerstatistiske systemer, der i dag er et hovedgrundlag for den danske statistik, var Skak-Nielsens vigtigste indsats. Anvendelsen af admistrative registre er et af de karakteristiske træk i fase tre og er en selvfølgelighed i fase fire,  men i 60’erne og 70’erne blev de nordiske landes bestræbelser på området betragtet med skepsis og mistro mange steder. Registeranvendelse har størst umiddelbar betydning for befolknings- og erhvervstatistikkerne, men Skak-Nielsen interesserede sig i høj grad også for de makroøkonomiske statistikker. Navnlig nationalregnskabet, der ved hans tiltræden havde været lidt forsømt, gennemgik i hans periode en omfattende modernisering og udvidelse.

    Satsningen på registerstatistikken betød bl.a. at de danske statistikker ofte var totaltællinger og ikke baseret på stikprøver, som man i højere grad betjente sig af i andre lande. Danmarks Statistik arbejdede derfor med meget store datasæt, og store mainframecomputere blev som følge deraf et centralt værktøj. Da PC’erne begyndte at vinde udbredelse andre steder, blev de i Danmarks Statistik betragtet som irrelevante og interessen for dem var i begyndelsen ret ringe. I den sidste del af sin periode iværksatte Skak-Nielsen dog nogle forsøg med anvendelse af PC’ere, men det er først under hans efterfølger, Hans Zeuten, der tiltrådte i 1988, at PC-ere for alvor blev taget i brug, dog kun som som supplement til mainframemaskinen. Først i 2003 — flere år efter Zeuthes fratræden i 1995 — var pc-teknologien blevet så udvilket, at man kunne begynde en total afvikling af mainframemaskinen, og fra 2007 foregår hele statistikproduktionen på PC-netværket.

    Den tredie rigsstatistiker — Jan Plovsing — tiltrådte i 1995. Hans periode blev præget af EU’s stigende betydning for statistikken, der bl.a. betød at størstedelen af statistikproduktionen efterhånden blev styret af forpligtende EU-regler. Rigstatistikerens og bestyrelsens direkte inflydelse på statistikproduktionen blev derfor tilsvarende beskåret. Det stigende internationale samarbejde er også en af årsagerne til at ledelses- og  sekretariatsfunktionerne i hans periode blev styrket i forhold til de traditionelt statistikfaglige funktioner.

    Jørgen Elmeskov, der tiltrådte i 2013, blev den fjerde rigsstatistiker. Han repræsenterer på den måde indledningen til fjerde fase. I hans periode har vanskelighederne ved at løse opgaverne ved anvendelse tredie fases metoder og teknologi for alvor vist sig. Det har bl.a givet sig udslag i stigende problemer med at få responenter til at deltage i stikrøveundersøgelser og i at centrale størrelser i nationalregnskabet, herunder BNP, blev vanskeligere at opgøre meningsfuldt og pålideligt. Perioden har dog også i høj grad været præget af Danmarks Statistiks aktive deltagelse i eksperimenter omkring anvendelse af nye metoder, til afhjælpning af problemerne.

    Men som det tegner sig bliver det den netop udnævnte femte rigststistiker, der for alvor skal føre Danmarks Statistik ind i fase 4. Som nævnt er stikprøveundersøgelser og traditionelle opgørelsesmetoder under pres og  de nye krav om f.eks miljøstatistik betyder mere komplekse målinger og nye former for dataindsamlig. Heldigvis er der også opstået en række nye muligheder, bl.a form af omfattende mængder af organiske data (se tidl. indlæg). Men udnyttelse af dem kræver nye metoder  og nye måder at tænke på. Set fra Danmarks Statistiks synspunkt betyder de nye datakilder også, at man mister sit naturlige monopol. Organiske data vil typisk være ejet af andre institutioner og virksomheder, og statistikmyndighederne skal finde måder at samarbejde om udnyttelsen. Alt tyder på, at Birgitte Anker kan se frem til en spændende og betydningsfuld, men også krævende, opgave.

    Referencer:
    Retsinformation : “Bekendtgørelse af lov om Danmarks Statistik”, LBK nr 610 af 30/05/2018 (link)
    Walter J. Radermacher: “Official Statistics 4.0 Facts for People in the 21. Century”, 2019 (link)

     

  • Eksperimentel statistik fra producenter af officiel statistik

    COVID-19 situationen har skabt et særligt behov for statistikker med kort produktionstid, der kan belyse centrale forhold omkring krisen, både vedrørende udbredelsen af epedemien og udviklingen i den økonomiske situation. På den baggrund har Danmarks Statistik på sit websted etableret en side,  hvor en række statistikker af denne type præsenteres. Siden har fået overskriften “Eksperimentel statistik og analyse”.

    Producenter af officiel statistik anvender begrebet eksperimentel statistik om opgørelser, der offentliggøres mens en planlagt statistik endnu er i udviklings- eller overvejelsesfasen. De offentliggjorte opgørelser lever ikke nødvendigvis fuldt ud op til de sædvanlige kvalitetskrav for officiel statistik, men kan dog være af interesse for kvalificerede brugere, der er indstillet på, at statistikken endnu ikke har fundet sin endelige form. Der kan f.eks være tale om, at den endnu ikke er fuldt dækkende for den population, den tilstræber at belyse, eller at metoderne ikke er færdigudviklede eller endelig fastlagt. For brugerne betyder det dels, at de på et tidligt tidspunkt kan anvende resultaterne, selvom det må ske med større forsigtighed end for færdige statistikker, og dels at de gennem feed-back kan bidrage til forbedring af det endelige resultat. De britiske statistikmyndigheder kar opstillet en række klare regler for, hvornår en statistik kan kaldes eksperimentel og hvornår den har nået en sådan grad af modenhed, at betegnelsen eksperimentel skal fjernes, men der eksisterer ikke en internationelt anerkendt definition på begrebet.

    En del af de opgørelser, der præsenteres på Danmarks Statistiks nye side, er gengivelser af statistik produceret af ikke-officielle prodcenter, f.eks Statens Serum Institut (indikatorer for smitetudbredelse og dødsfald), Danske Bank (forbrugsindikatorerpå grundlag af data fra MobilePay), Styrelsen for Arbejdsmarked og Rekruttering (indikatorer for arbejdsløshed mv.), Vejdirektoratet (Indeks for vejtrafik) og Storebæltsforbindelsen (personbilstrafik over Storebælt). Disse opgørelser er naturligvis meget nyttige, men de er ikke et led i en overvejet eller planlagt udvikling af den officielle statistik, og er derfor ikke eksperimentelle i den gængse betydning af ordet.

    Men den nyetablerede side indeholder også et par eksempler på egentlig eksperimentel statistik. Først og fremmest vises resultater fra Anløbsaktiviteten i danske havne , der hidtil kun har været offentliggjort i Statistikbanken. Denne statistiks grundlag er skibpositionsdata (AIS-systemet) leveret af Søfartsstyrelsen og er et eksempel på Danmarks Statistiks eksperimenter med anvendelse af big data (se tidl. indlæg). Særlig interessant er en ny statitsik, udarbejdet i samarbejde med Nationalbanken, der dagligt opgør antallet af flyafgange fra Københavns Lufthavn. Kilden er The OpenSky Network — en organisation, der indsamler omfattende data om flytrafik og stiller dem til rådighed i en åben datatbase. Det kan ses som et eksempel på Trusted smart statistics (se tidl . indlæg), hvor en offentlig statistikmyndighed — i dette tilælde Danmarks Statistik — ingen andel har i dataindsamlingen, men gennem sine metoder og redskaber skaber en pålidelig og brugbar statistik.

    Også Eurostat har offentliggjort en række statistikker, som de betegner som eksperimentelle, bl. a. en web-baseret opgørelse af populariteten af steder optaget på UNESCOs Verdensarvliste (se tidl. indlæg), en rapport om multinationale koncerner (se tidl. indlæg) og en longitudinel arbejdsmarkedsstatistik (se tidl. indlæg).

    Referencer:
    Danmarks Statistik: “Eksperimentel statistik og analyse”, (link)
    Danmarks Statistik: “Anløbsaktiviteten i danske havne (eksperimentel statistik)”, Statistikdokumentation (link)
    Eurostat: “Eksperimental statistics” (link)
    European Statistical Systen: “Experimental Statistic” (link)
    Office for Statistcs Regulation: “Experimental statistics – official statistics in development “, August 2019 (link)

  • Demokrati og ulighed – Eksempel på anvendelse af “Comparative Political Data Set”

    Den officielle statistik gør — som alt andet godt — mere nytte, jo flere, der har adgang til at benytte den.  Frit tilgængelige statistikbanker, som de der leveres af f.eks Danmarks Statistik og Eurostat bidrager derfor stærkt til at øge værdien af den officielle statistik. Samme princip gælder naturligvis for ikke-officiel statistik, og særligt værdifuldt bliver det når nogen påtager sig, at samle data fra forskellige kilder i frit tilængelige databanker. Et eksempel herpå er “Comparative Political Data Set” (CPDS), der kombinerer en række oplysninger for en gruppe af demokratiske lande, hentet fra både officiel statistik og fra andre kilder. Bag dette datasæt står en række forskere fra Universitetet i Zürich med professor Dr. Klaus Amingeon i spidsen. Datasættet indeholder dels oplysninger om valg, regeringsdannelse og politiske partier i de udvalgte lande og dels oplysninger om økonomi og befolkningsforhold. Datasættet har bla. været anvendt af to forskere fra universitetet i Aberdeen — Ioannis Theodossiou og Alexandros Zangelidis. De kombinerer data fra CPDS med data om ulighed fra OECD i et studie af sammenhængen mellem uligheden i et samfund og graden af politisk deltagelse.

    Theodossiou og Zangelidis udgangspunkt er, at uligheden i indkomst i  demokratiske land har været stigende de seneste tre årtier, samtidig med at valgdeltagelsen har været faldende, og de stiller spørgsmålet, om der er en sammenhæng mellem de to udviklinger. Mere præcist stiller de spørgsmålet om der er tale om en selvforstærkende proces, hvor stigende ulighed fører til faldende politisk interesse, med faldende valgdeltagelse som følge, samtidig med at den faldende valgdeltagelse i sig selv fører til større ulighed. Mekanismen bag en sådan selvfortærkende udvikling kan være, at de der sakker bagud i indkomstudviklingen mister troen på, at valgdeltagelse giver dem nogen indflydelse, og derfor undlader at deltage i valgene. Det resulterer i, at de velstillede opnår en større repræsentation i de besluttende organer, som de — ikke overraskende — bruger til at fremme deres egne interesser på bekostning af de mindre velstilledes.

    Anvendelse af denne type data til analyse at en to-vejs sammenhæng rejser en række praktiske og teoretiske problemer. I deres artikel redegør Theodossiou og Zangelidis for problemerne og anvender forskellige metoder for at imødegå dem. Deres samlede konklusion er, at de anvendte data støtter hypotesen om den selvforstærkende mekanisme.

    Referencer:
    Armingeon, Klaus, Virginia Wenger, Fiona Wiedemeier, Christian Isler, Laura Knöpfel, David Weisstanner and Sarah Engler: 2019. Comparative Political Data Set 1960-2017″
    Zurich: Institute of Political Science, University of Zurich.  (link)
    Ioannis Theodossiou og Alexandros Zangelidis: “Inequality and Participative Democrazy — a Self-Reinforcing Mechanism”,  Review of Income and Wealth,  Series 66, Number 1, March 20120 (link)