• Præsident Bidens første beslutninger vedrørende officiel statistik

    Blandt de mange bekendtgørelser (executive orders) som Joe Biden, USA’s nytiltrådte præsident, udstedte i de første timer efter sin edsaflæggelse, var også en vedrørende den folketælling, der blev afholdt i USA i 2020 (link). Bekendtgørelsen omgør to kontroversielle bekendtgørelser udstedt af den netop afgåede præsident, Donald Trump. Donald Trump havde, som beskrevet i flere tidligere indlæg (bl.a. 7/2-2017 og 19/9-2017), et noget anstrengt forhold til folketællingen, og til andre grene af statistikken for den sags skyld. 

    Den ene omgjorte bekendtgørelse vedrører den rolle ulovlige immigranter skal spille i forbindelse med fordelingen af pladser i de folkevalgte forsamlinger, herunder forbundsparlamentet (Repræsentanternes Hus) og  delstaternes parlamenter. Trump havde i en bekendtgørelse besluttet, at ulovlige immigranter ikke skulle indgå i disse optællinger. Da den almindelige antagelse er, at antallet af ulovlige immigranter er størst i de områder, hvor demokraterne står stærkest, betød det en styrkelse af republikanernes stilling i fordelingen. Demokraterne så Trumps bekendtgørelse som et brud på en lang tradition for fortolkningen af forfatningens regler om folketællingen, der gik ud på at alle skulle medregnes, uanset lovligheden af opholdsgrundlaget. Med præsident Bidens omgørelse er man vendt tilbage til den traditionelle tolkning.

    Den anden af de to omgjorte bekendtgørelser vedrører registrering af statsborgerskab. Trump-administrationen havde oprindeligt besluttet, at der i folketællingsskemaet skulle indgå et spørgsmål om statsborgerskab. Der var blandt myndighederne i flere stater og byer modstand mod at lade et sådant spørgsmål indgå, fordi man forventede, at det det kunne få nogle immigranter til at modsætte sig registrering (selv om deltagelse i folketællingen er lovpligtig), af frygt for, at oplysningerne kunne blive brugt til at så tvivl deres ret til at opholde sig i USA. Det ville betyde en undervurdering af immigrantbefolkningen, og også her var antagelsen, at det ville styrke republikanerne på demokraternes bekostning. Lovligheden af spørgsmålet blev anfægtet, og Højesteret besluttede at blokere for spørgsmålet, fordi den ikke fandt, at der var overbevisende argumenter for spørgsmålets nytte og nødvendighed. Myndighederne havde andre statistiske kilder til belysning af statsborgerskab. Trump reagerede ved at udstede en bekendtgørlse, der pålagde føderale myndigheder at levere data om statsborgerskab til folketællingsbureauet, der så kunne samkøre oplysningerne med de øvrige indsamlede data. Det er denne bekendtgørelse, der nu er omgjort, således at spørgsmålet om statsborgerskab ikke kommer til at indgå i folketællingsopgørelserne.

    Referencer:
    US Census Bureau: “Census Bureau Update on 2020 Census”, Press Release 21/1 2021 (link)
    The White House: Ensuring a Lawful and Accurate Enumeration and Apportionment Pursuant to the
    Decennial Census”, Executive Order of the President, 20/1-2021 (link)

  • Danmarks Statistiks arbejdsplan for 2021

    For Danmarks Statistik har to begivenheder gjort 2020 til et særligt år. Den ene, covid19-krisen, har været en fælles erfaring for stort set alle — institutioner såvel som personer. Den anden, udnævnelsen af en ny rigsstatistiker (se tidl. indlæg), er institutions-specifik. Begge begivenheder vil få betydning for institutionens fremtidige virke, og det kan allerede spores i den netop udsendte arbejdsplan for 2021. Arbejdsplanen skal jo afspejle den mere langsigtede strategi, som er beskrevet i institutionens strategiplan, men som Bestyrelsen påpeger i sin kommentar til arbejdsplanen, så er der jo ingen grund til ikke at foregribe en fremtidig strategiplan, i det omfang ændringer i strategien allerede er forudset. Det gælder måske særligt denne arbejdsplan, hvor udarbejdelsen af en ny strategiplan er et af punkterne. Som Bestyrelsen også påpeger, bliver den nye strategiplan en god lejlighed for den nye rigsstatistiker til at introducere sine visioner og ambitioner.

    Foranlediget af covid19-krisen påbegyndte Danmarks Statistik i 2020, under overskriften Eksperimentel Statistik,  offentliggørelsen af en række statistikker med særlig relevans for belysning af krisen og dens virkninger (se tidl.indlæg). Betegnelsen eksperimentel dækker bl.a. over, at statistikken kan udvikles til at indgå i det almindelige statistikprogram, eller at den kan nedlægges, hvis behovet viser sig at være midlertidigt, eller at kvaliteten viser sig at være for ringe. Arbejdsplanen lægger da også op til, at den eksperimentelle statistik i sin helhed kun videreføres, så længe det er relevant, men at dele af den kan overgå til løbende drift.

    Et centralt punkt i arbejdsplanen er etableringen af en særlig enhed, der skal arbejde med forbedring af nationalregnskabet. Fokus er især på bedre overensstemmelse mellem den første og foreløbige opgørelse og den endelige version. Tanken er også at inddrage eksterne interessenter i arbejdet. Andre vigtige planer omkring nationalregnskabet er udarbejdelse af en revideret udgave af dokumentationen af offentliggørelsen af bruttonationalindkomsten (BNI), forbedret opgørelse af den sorte økonomi og videreførelse af det grønne nationalregnskab. Blandt øvrige planer kan nævnes bedre integration af udenrigshandels- og betalingsbalancestatistik, med henblik på bedre belysning af globaliseringen, indarbejdelse af nye typer af organiske data (big data) og introduktion af en mere intuitiv struktur i statistikbanken og på hjemmesiden.

    Referencer:
    Danmarks Statistik: “Arbejdsplan 2021”, januar 2021 (link, 15/1-2021)
    Danmarks Statistik: “Statistikprogram 2021”, januar 2021 (link, 15/1-2021)
    Danmarks Statistik: “Strategi 2022 – Revideret”, december 2020 (link, 15/1-2021)
    Danmarks Statistik: “Eksperimentel statistik COVID-19”, december 2020 (link, 16/1-2021)

  • EU-statistikken efter Brexit

    Da UK forlod EU den 1. februar 2020, fik det i første omgang kun begrænsede følger for EU-statistikken, herunder EU’s statistikbank. I den overgangsaftale, der blev indgået, indgik en fortsættelse af  UK’s indberetninger af statistik til EU’s statistikenhed — Eurostat — og Eurostat fortsatte offentliggørelsen af den indberettede statistik. Men den 1. januar 2021 udløb overgangsaftalen, og UK er herefter ikke længere omfattet af EU’s statistiksamarbejde.

    Samarbejdet mellem UK og EU er nu reguleret i en handels- og samarbejdsaftale, som blev indgået den 30.december 2020. Aftalen indeholder enkelte bestemmelser om udveksling af statistik, der er nødvendig, for at aftalen kan fungere. Det gælder f.eks. bruttonationalproduktet (BNP), der indgår i beregningen af det bidrag (operational contribution), UK skal betale for fortsat at deltage i nogle få udvalgte EU-programmer. Af størst betydning set fra den officielle statistiks synsvinkel er en kort paragraf, der lægger op til en særlig statistikaftale mellem Eurostat og UK’s statistikmyndighed.

    Indtil en aftale er indgået vil Eurostat ikke opdatere data om UK, men allerede offentliggjorte data vil fortsat være tilgængelige i statistikbanken. UK er i landelisterne flyttet fra gruppen af EU-lande til gruppen af lande, der indberetter statistik til EU, uden at være medlemmer. Udover UK omfatter gruppen bl.a. Norge, Island og Schweiz. 

    Det må være i  begge parters interesse fortsat at kunne indgå i sammenlignelige statistiske opgørelser, så mon ikke der indenfor relativ kort tid vil blive indgået en aftale, der vil sikre, at en stor del af opgørelserne i EU’ statistikbank kan videreføres med data også fra UK.

    Referencer:
    Eurostat: “Dissemination of European Statistics after Brexit”,  (link, 8/1-2021)
    Council of the European Union: “Trade and Cooperation Agreement”, (link, 10/1-2021)

  • Folketællinger i EU og resten af verden

    Alverden skrives i mandtal i disse år. Det sker ikke på befaling fra Kejser Augustus, men på anbefaling af FN’s Økonomiske og Social Råd (Economic and Social Council of the United Nations, ECOSOC), og selvom en anbefaling fra ECOSOC i det 21. århundrede ikke underbygges af samme magt og autoritet som en befaling fra en romersk kejser omkring år 0, så afholdes der faktisk folketælling i næsten alle verdens lande i disse år.

    ECOSOC anbefaler at folketælling så vidt muligt afholdes i 2020 eller 2021. Kina og Indien, der er verdens suverænt folkerigeste lande, og tilsammen rummer mere end en tredjedel af den samlede verdensbefolkning på 7,8 mia., har fastlagt hhv. 2020 og 2021 som folketællingsår. I Kina er folketællingen i fuld gang, men i Indien vil Covid19-situationen sandsynligvis nødvendiggøre en udsættelse. USA’s folketælling blev gennemført i år* og 2021 bliver EU’s folketællingsår. En lille gruppe lande har afholdt deres folketællinger i perioden  2015-2019, og enkelte har planlagt at afholde dem i 2022 eller senere, men langt de fleste følger anbefalingen om 2020 eller 2021. Kun ganske få lande har hverken gennemført eller planlagt en folketælling.

    I en traditionel folketælling indsamles data ved, at der rettes henvendelse til hver enkelt husstand — personligt eller gennem postvæsenet. Det er en velprøvet metode, og i mange henseender den mest hensigtsmæssige, fordi den giver statistikproducenten fuld kontrol over hele processen. Men metoden er kostbar. En langt billigere fremgangsmåde er at basere opgørelsen på eksisterende administrative registre, f.eks. skattevæsenets og de sociale myndigheders registre, og/eller egentlige folkeregistre, som det danske CPR. Men i de fleste af verdens lande findes sådanne registre ikke, eller de er for ufuldstændige eller upålidelige til  at kunne anvendes som folketællingsgrundlag. Derfor gennemføres folketællingerne i to tredjedele af verdens lande efter den traditionelle metode (Mrkić, s. 37). I den resterende tredjedel anvendes registre enten alene eller i kombination med supplerende dataindsamling, evt i form af stikprøveundersøgelser**.

    Rammerne for EU-landenes folketællinger er fastlagt i en forordning, hvis regler ligger indenfor FN’s retningslinjer. Med hensyn til metoder giver forordningen landene meget vide rammer. Derimod opstilles der ret præcise krav til hvilke data, der skal leveres. Resultaterne fra EU-landenes folketællinger vil blive offentligt tilgængelige gennem EU’s Census Hub (se tidl indlæg), hvor resultaterne fra EU-folketællingen i 2011 allerede findes (link). Landene skal levere data til Census Hub inden 1. april 2024.

    I Danmark har der ikke været afholdt folketællinger siden 1981, og der kommer heller ingen folketælling i 2021. Som EU-medlem er Danmark naturligvis forpligtet til at levere en folketællingsopgørelse til EU, men det kan Danmarks Statistik gøre ud fra den eksisterende statistik. Den løbende registerbaserede statistik indeholder alle de data, der normalt indsamles ved en folketælling, herunder de data EU kræver indberettet, så en egentlig folketælling er overflødig.

    * Den amerikanske folketælling har tidigere være behandlet i flere indlæg i denne blog (20/10-2020, 4/2-202014/5-201912/6-201819/9-2017 og 23/5-2017)

    ** Korte beskrivelser af forskellige typer af folketællinger kan findes i et tidligere indlæg (link)

    Referencer:
    Srdjan Mrkić: The 2020 round of population and housing censuses: An overview, Statistical Journal of the IAOS, vol. 36, no. 1, pp. 35-42, 2020 (link)
    UNSD: Webside – World Population and Housing Census Programme(website), (link)
    Eurostat: “EU legislation on the 2021 population and housing censuses”, 2019 (link)
    EU: “Census Hub”,  (link)

  • Trafikkameraer som grundlag for statistik

    Covid19-krisen har rejst en efterspørgsel efter nye typer af statistik, der kan belyse krisens udvikling og effekten af de politiske tiltag, der sættes i værk for at holde den under kontrol. De nationale statistikmyndigheder — herunder Danmarks Statistik (se tidl. indlæg) — har været hurtige til at søge at imødekomme de nye behov ved at udvikle og offentliggøre nye statistikker, ofte af eksperimentel karakter. Det er navnlig statistik om udviklingen i økonomiske forhold — både nationalt og privat — og i befolkningens sundhed og adfærd, der efterspørges.      

    Et af eksperimenterne går ud på, at anvende trafikovervågningskameraer som grundlag for statistik over den trafikale aktivitet fordelt på fodgængere og forskellige køretøjstyper. Eksperimentet er iværksat af Office for National Statistics (ONS)  — UK’s officielle statistikmyndighed — og udviklingsarbejdet er udført på Data Science Campus  — en forsknings- og uddannelsesenhed under ONS (se tidl. indlæg). Projektet er næmere beskrevet i et dokumentationsnotat fra Data Science Campus

    Udgangspunktet for eksperimentet er, at der i UK findes et meget stort antal trafikovervågningskameraer i drift, som umiddelbart og uden større omkostninger, kan levere et omfattende grundmateriale i form af billeder. Grundlæggende for projektet er anvendelse af programmel, der automatisk kan identificere objekter som biler, busser, cyklister og fodgængere på de mange billeder. En væsentlig del af projektet har derfor været, at sammenligne forskellige systemer til objektidentifikation i bllleder. Valget er faldet på en arkitektur, der går under navnet Faster-RCNN. 

    Der er stor forskel på antallet af kameraer i forskellige geografiske regioner. Derfor er etablering af et system til aggregering af de regionale data til et samlet skøn for UK i første omgang ikke forsøgt, men det nævnes som et muligt fremtidigt projekt. I stedet præsenteres resultaterne for tre regioner — London, Manchester og Nordirland — hver for sig. For hver region vises dagligt antallet af biler, antallet af busser og det samlede antal af fodgængere og cyklister. Antallet af personer i biler og busser kan ikke opgøres med denne metode. Opgørelserne er tænkt som indikatorer for ændringer i aktiviteten over tid, men er ikke egnede til vurdering af det samlede trafikomfang

    Sammenlignet med andre mulige metoder til registrering af trafikstrømme, f,eks.manuel optælling af passerede køretøjer og fodgængere, har kameradata en række fordele. Først og fremmest kan de opgøres med høj frekvens, f.eks. dagligt, og de kan offentliggøres meget hurtigt efter optællingsperiodens afslutning. Dertil kommer, at metoden er billig, bl.a. fordi der er tale om genanvendelse af data indsamlet til andet formål, og at man undgår fortrolighedsproblemer, da kun objekternes type, og ikke deres identitet, registreres.

    Naturligvis er der også en række svagheder ved metoden. Bl.a. er valget af opstillingssteder for kameraerne styret af forskellige myndigheders specifikke behov for trafikdata, så de indsamlede data er ikke repræsentative for den samlede trafik. En anden svaghed er, at variationer i vejr og belysning kan påvirke billedets kvalitet, så præcisionen af optællingen kan variere under dataindsamlingen.

    Generelt er optælling af fodgængere en af de større udfordringer ved denne type opgørelser. I den forbindelse har covid19-restriktionernes afstandskrav været en hjælp, fordi den større afstand har gjort det nemmere at identificere de enkelte fodgængere. Det er derfor ikke sikkert, at metoden uden videre kan anvendes, når engang restriktionerne lettes.

    Dokumentationsnotatet har en række forslag til fremtidige forbedringer af metoden. Ønsket om en aggregeret opgørelse for hel UK er allerede nævnt. Mere generelt ønskes forbedringer af metoden, der kan gøre data mere repræsentative for den samlede trafik. 

    Referencer:
    Alistair Edwardes: “Estimating vehicle and pedestrian activity from town and city traffic cameras”, Data Science Campus (web), September 3, 2020 (link)
    Office for National Statistics: “Coronavirus and the latest indicators for the UK economy and society: 12 November”, (link)

     

  • Syntetiske data

    Originale og fabrikerede datasæt

    Når der i forbindelse med  officiel statistik tales om grunddata, tænkes der normalt på målte og registrerede værdier af en eller flere egenskaber ved et tællingsobjekt. Tællingsobjektet kan f.eks. være en person, og egenskaberne kan være køn og alder. Det er sådanne originale data, der er grundlaget for enhver pålidelig statistik. Den diamentrale modsætning til originale data er fabrikerede data, hvor man — eventuelt ved anvendelse af en tilfældighedsgenerator — danner datasæt, hvor objekterne er fiktive og de værdier der er knyttet til egenskaberne er tilfældige og på ingen måde afspejler virkeligheden. Fabrikerede data kan være nyttige under planlægningen af en statistik. De kan f.eks. gøre det muligt, i et vist omfang at teste programkoder tidligt i udviklingsprocessen, inden dataindsamlingen er sat i værk eller afsluttet.

    Syntetiske datasæt

    Et sted imellem originale og fabrikerede data finder man de syntetiske data. Her er de værdier der tillægges objekterne nok fabrikeret, men det er tilstræbt, at de fabrikerede værdier i en eller anden forstand afspejler virkeligheden. Objekterne i syntetiske data kan selv være syntetiske, men der kan også være tale om originale objekter, der blot tillægges syntetiske værdier for en eller flere egenskaber. Syntetiske data kan ligesom helt fabrikerede data være nyttige i forbindelse med aftestning af programkoder, men kan i nogle tilfælde også anvendes i forbindelse med aftestning af analyse- og målingsmetoder. Den ultimative anvendelse af syntetiske data er til forbedring  (berigelse) af et originalt datasæt.

    ONS — UK’s nationale statistikmyndighed  — har i et arbejdspapir foreslået en klassifikation af syntetiske datasæt ( se oversigten nedenfor), der rangordner dem efter analytisk værdi og risiko for fortrolighedsbrud.. De to rangordninger er identiske — jo større analytisk værdi, jo større risiko for fortrolighedsbrud.

    ONS’s rangordning af syntetiske datasæt

    Type Analytisk værdi Risiko for fortrolighedsbrud Typisk anvendelse
    Ordinære syntetiske datasæt Strukturel Ingen Ingen Grundlæggende testning af programkode
    Validt Ingen Minimal Avanceret testning af programkode
    Udvidede syntetiske datasæt Univariabelt Plausibelt Minimal Betydelig Udvidet testning af programkode
    Multivariabelt plausibelt Nogen Høj Uddannelse og eksperimentel testning af metoder
    Mutivariabelt detaljeret Nogen Meget høj
    Replikeret (beriget) Høj Ekstrem Erstatter originalt datasæt

    Kilde: Office for National Statistics: “Synthetic data pilot”

    Ordinære syntetiske datasæt

    I ordinære syntetiske datasæt er variabelnavne og variabelformater (f.eks. tekst eller heltal) identiske med det originale datasæt. I strukturelle datasæt forekommer forekommer kun værdier af variablene, der også forekommer i det originale datasæt, men uden hensyn til at kombinationen af værdier for den enkelte datapost kan være umulig eller usandsynlig — f.eks gravide mænd eller gifte personer under to år. I valide datasæt er det derimod tilstræbt, at både værdierne og kombinationerne af værdier ar plausible. Endvidere tilstræbes det i valide datasæt at inddrage manglende værdier og fejl, hvis de forekommer i det originale datasæt.Der gøres derimod intet forsøg på at få fordelingerne af de indgående variable til at ligne det originale datasæt. 

    Udvidede syntetiske datasæt

    I udvidede syntetiske datasæt går man skridtet videre, således at datasættet ikke blot i formel struktur ligner det originale datasæt, men også afspejler dele af indholdet. I univariabelt plausible datasæt tilstræber man, at de marginale fordelinger af variablene er som i de originale data. I multivariabelt plausible datasæt tilstræber man yderligere, at også multivariable fordelinger i et vist omfang afspejler det originale datasæt.

    I et replikeret (beriget) datasæt er al information i det originale datasæt bevaret, men yderligere information i form af imputerede data kan være tilføjet. Mangler f.eks. oplysning om en enkelt egenskab for et objekt i det originale datasæt, f.eks. størrelsen af indkomsten for en enkelt husholdning, kan man vælge at erstatte den manglende værdi med værdien fra en anden husholdning, der på de egenskaber, der findes oplysning om f.eks erhverv, adresse, antal børn og alder på husholdningens medlemmer ligner den ufuldstændige husholdning. Ved denne fremgangsmåde, kan syntetiske data øge værdien af det originale datasæt.

    Referencer:
    Office for National Statistics: “Synthetic data pilot”, ONS methodology working paper series number 16,  januar 2019 (link)

  • Nowcasting

    Aktualitet og pålidelighed er to af hovedkravene til den officielle statistik. Uheldigvis er de to krav konkurrerende. Pålidelig statistik tager tid at producere, så brugere af hurtig statistik må acceptere, at aktualiteten kommer på bekostning af pålideligheden. Traditionelt har statistikproducenter søgt at tilgodese begge behov ved at producere to typer statistik:  en konjunkturstatistik, der lægger hovedvægten på aktualitet, og en strukturstatistik, hvor pålidelighed vægtes højt. De to kategorier er dog normalt tæt forbundet, forstået på den måde, at en solid strukturstatistik er det vigtigste grundlag for en anvendelig konjunkturstatistik.

    Men specielt blandt beslutningstagerne i den økonomiske politik er der et stort ønske om  hurtigere data  end konjunkturstatistikken kan levere. Det har ført til bestræbelser på at kombinere konjunkturstatistikkens traditionelle metoder med redskaber, der ellers betragtes som for usikre til at kunne indgå i en statistisk opgørelse. Ofte er der tale om redskaber, der er udviklet til udarbejdelse af prognoser (forecasting). Derfor kaldes metoden for nowcasting.     

    I den økonomiske statistik er bruttonationalproduktet (BNP) den mest efterspurgte opgørelse, og det er derfor hurtige opgørelser af denne størrelse, der navnlig har være i fokus.  BNP er en del af nationalregnskabet og Danmarks Statistik leverer sin første version af det kvartalsvise nationalregnskabet 60 dage efter kvartalets udløb, men allerede efter 45 dage offentliggøres den såkaldte BNP-indikator. BNP-indikatoren er et skøn udelukkende for udviklingen i samlet BNP (og beskæftigelse), uden nationalregnskabets detaljerede opgørelser. Indikatoreren er delvis baseret på now-casting metoder.

    Covid-19 krisen har øget interessen for hurtige skøn over den økonomiske udvikling, og Nationalbanken har i den forbindelse påbegyndt offentliggørelse af løbende (ugentlige) skøn over væksten i det løbende kvartal. Uge for uge i det løbende kvartal  — og  i de første uger efter kvartalets udløb — offentliggøres et opdateret skøn for BNP-væksten. Eller rettere to skøn, for banken arbejder med to forskellige modeller. Den ene model — realtidsmodellen — der er baseret på en model fra New York Federal Reserve, benytter et omfattende datasæt til beregning af skønnet. En vigtig egenskab ved denne model er, at den leverer information om, hvor meget de enkelte kilder, f.eks. importstatistikken og ledighedsstatistiken, har bidraget til resultaterne  Den anden model — vendepunktsmodellen — er baseret på et samarbejde med Den Europæiske Centralbank, og benytter et mindre datasæt. En vigtig egenskab ved den model er, at den leverer en sandsynlighedsfordeling for de mulige vækstrater.

    Nationalbanken lægger vægt på, at modellerne er en metode til at illustrere den information om udviklingen, der kan ligge i de valgte nøgletal, men er ikke et udtryk for bankens forventninger til udviklingen. I bankens samlede skøn og vurderinger om den økonomiske udvikling indgår modellerne kun som del af et større informationsgrundlag.

    Referencer:
    Danmarks Nationalbank: “Nye værktøjer til vurdering af økonomien”, Nyt – Danmarks Nationalbank 1/6 2020, nr.6 (link)
    Danmarks Nationalbank: “Nowcastmodeller”, web-side (link)
    Danmarks Statistik: “BNP-indikator 2.kvt 2020″,Nyt fra Danmarks Statistik”, 14. august 2020 – Nr. 307 (link)
    Danmarks Statistik: “Dokumentation af BNP-indikator”, November 2016, (link)

  • USA’s højesteret standser dataindsamlingen til folketællingen

    I USA er indsamlingen af data til folketællingen for 2020 nu afsluttet. Præcis hvornår afslutningen skulle ske har været genstand for en politisk og juridisk strid, der nu er blevet afgjort af højesteret. Efter den helt oprindelige plan skulle dataindsamlingen afsluttes med udgangen af juli, men på grund af covid-19 krisen blev indsamlingsperioden først udvidet til udgangen af oktober, og senere igen afkortet til udgangen af september. Da en række eksperter udtrykte bekymring for, at afkortningen af indberetningsperioden kunne få negative følger for folketællingens kvalitet, indbragte en alliance af lokale myndigheder og borgerretsgrupper sagen for retten, med krav om at udgangen af oktober blev fastholdt som afslutningtidspunkt.

    Alliancen fik i første omgang medhold ved en distriktsdomstol, og dataindsamlingen blev fortsat ind i oktober, men den den 13. oktober besluttede højesteret, at regeringen har ret til at afslutte dataindsamlingen. I praksis betyder det, at dataindsamlingen blev afsluttet den 15. oktober. Trods nederlaget i Højesteret kan klagerne altså glæde sig over, at de gennem distriktsdomstolens kendelse opnåede 15 dages ekstra indsamlingsperiode.

    Når fastlæggelse af afslutningsdatoen for indsamlæingsperioden kunne blive et politisk stridsspørgsmål skyldes det først og fremmest, at folketællingens resultater afgør fordelingen mellem delstaterne af medlemmerne af Repræsentanternes Hus og af det valgmandskollegium, der vælger præsidenten. Der er en forventning om, at der er en overvægt af økonomisk og socialt dårligt stillede husstande blandt de senest indkomne besvarelser, og da sådanne husstande i højere grad antages at støtte Demokraterne, kan en republikansk præsident og regering alene af den grund have en interesse i så kort en indsamlingsperiode som muligt. Dertil kommer, at folketællingen også anvendes som fordelingsgrundlag for ydelser i forbundets sociale støtteprogrammer. Jo færre fattige, der optælles, jo færre midler til de fattigste områder, og tilsvarende flere til de knap så fattige.

    Der er intet usædvanligt i, at en amerikansk folketælling er genstand for voldsomme politiske og juridiske slagsmål. Forfatningen fastlægger, at tællingen skal afholdes hvert tiende år, men siger meget lidt om det konkrete indhold. Der er derfor rig anledning til politisk uenighed, og med Højesterets rolle som fortolker af forfatningen kommer kampen til at udspille sig både i Kongressen og i Højesteret. Folketællingen for 2020 er dog nok en af de mest omstridte, navnlig fordi Trump-administrationen fra starten har udvist en meget kritisk holdning til officiel statistik i almindelighed og til Folketællingen i særdeleshed (se tidl indlæg, 19/9-2017 og 7/2-1017)

    * Den amerikanske folketælling har tidigere være behandlet i flere indlæg i denne blog (4/2-2020, 14/5-201912/6-201819/9-2017 og 23/5-2017)

    Referencer:
    Mike Schneider: “Supreme Court halts census in latest twist of 2020 count”, AP News 14/10-2020 (link)

  • Generationsstatistik

    De generationer, der er vokset op med internettet — forstået som personer, der er født i 1981 eller senere — udgør fra 2019 flertallet af USA’s befolkning. Det er udgangspunktet for en analyse af den demografiske udvikling i USA, udført af  William H. Frey — seniorforsker ved Brookings Metropolitan Policy Program. Med udgangspunkt i en afgrænsning af generationer, foreslået af PEW Research Center, og data fra Folketællingsbureauet (Census Bureau), beskriver han udviklingen i befolkningens racemæssige og etniske sammensætning. De mest markante træk er, at andelen af hvide er lavere, jo yngre generationen er. Andre analyser viser, at uddannelsesniveauet er højere i de yngre generationer, og at der er betydelige holdningsforskelle mellem generationerne. Der kan derfor forventes ændringer i det politiske billede i USA, efterhånden som de yngre generationer overtager de centrale poster.

    I skemaet nedenfor er PEW’s opdeling i generationer vist. Post-Z generationen ved vi ikke så meget om endnu. Den optræder mest for fuldstændighedens skyld. På et tidspunkt vil den blive afgrænset og muligvis få et andet navn.

    PEW’s opdeling i generationer

    Generation Fødselsårgange Alder 1. januar 2020
    Præ-boomere 1945 og tidligere 74 år og ældre
    Baby-boomere 1946-1964 55-73 år
    Generation-X 1965-1980 39-54 år
    Millennium generation 1981-1996 23-38 år
    Generation-Z 1997-2012 7-22 år
    Post-Z generation 2013 og senere 6 år og yngre

    Kilde: Michael Dimock: “Defining generations: Where Millennials end and Generation Z begins”

    Der er ikke tale om  en autoriseret eller officiel kategorisering, og PEW har udviklet den specielt til brug for amerikanske forhold. Ikke desto mindre vil jeg i det følgende anvende den til en belysning af generationerne i Danmark, idet jeg antager, at de ønskelige tilpasninger er så begrænsede, at umiddelbar anvendelse på danske data giver mening.

    Millennium-generationen er den første, der er der er opvokset med internettet. Den efterfølges af generation-Z, der ikke blot er vokset op med internettet, men for hvem hele den internetbaserede teknologi er en selvfølge. Fra 2019 udgør millennium-generationen og dens efterfølgere, som tidliger nævnt, flertallet af USA’s befolkning. Det er endnu ikke tilfældet for Danmark — den danske befolkning er ældre end den amerikanske — men det vil ske i løbet af få år (se graf nedenfor)

    Andel af befolkningen i Danmark født i 1981 eller senere


    Kilde:
    Danmarks Statistikbank, www.statistikbanken.dk FOLK2

    Forskellene mellem generationernes uddannelsesmæssige status er beskrevet i tabel 1 nedenfor. Som det ses, er tendensen klart at andelen med grundskole som højeste uddannelse er faldende og andelen med lang videregående uddannelse stigende gennem generationerne. Sålænge generationerne ikke er uddøde kan uddannelsesbilledet ændre sig, men for generation-X og tidligere må ændringerne forventes at blive små. En del af millennium-generationen er derimod stadig under uddannelse, så her vil andelen med grundskole falde og andelen med lang videregående uddannelse stige i de kommende år. Det skal også bemærkes, at grundskoleuddannelse i 1972 blev forlænget fra 7 til 9 år. Det betyder, at grundskolen for generation-X og senere repræsenterer en længere uddannelse end for de foregående generationer.

    Tabel 1: Højeste fuldførte uddannelse i generationer, Danmark 2019

    Andel i pct.
    Grundskole Kort og mellemlang uddannelse Lang videregående uddannelse I alt
    Præ-boomere 30 64 6 100
    Baby-boomere 25 67 8 100
    Generation-X 17 68 14 100
    Millennium generation 18 67 16 100

    Kilde: Danmarks Statistikbank www.statistikbanken.dk/FOLK2 og HFUDD11 samt egne beregninger

    Opgørelser af  befolkningen efter etnicitet og race, som de findes i den amerikanske befolkningsstatistik,  findes ikke i den officielle danske statistik. I stedet findes opgørelser efter herkomst, hvor der skelnes mellem personer med dansk oprindelse, indvandrere og efterkommere af indvandrere. Indvandrere og efterkommere er yderligere opdelt på oprindelsesland. I tabel 2 nedenfor er generationernes sammensætning efter oprindelse vist.

    Tabel 2. Befolkningen efter oprindelse, 2020 og 2035 (prognose), Danmark

    Pct.
    Personer med dansk oprindelse
    Indvandrere og efterkommere
    I alt
    Vestlig oprindelse Ikke-vestlig oprindlse
    Befolkningsstatistik 2020
    Præ-boomere 96 3 2 100
    Baby-boomere 92 3 5 100
    Generation-X 85 5 10 100
    Millennium generation 76 10 14 100
    Generation-Z 86 3 10 100
    Prognose 2035
    Præ-boomere 95 3 2 100
    Baby-boomere 92 3 5 100
    Generation-X 86 5 9 100
    Millennium generation 77 9 14 100
    Generation-Z 76 10 14 100

    Kilde: Danmarks Statistikbank, www.statistikbanken.dk/FOLK2 og FRDK120

    Indvandreres og efterkommeres andel er, som det fremgår, størst i de yngste generationer. Der forventes også i de kommende år en betydelig indvandring, og da hovedparten af indvandrere er unge, undervurderer befolkningsstatistikken de yngste generationers fremtidige andel, Derfor er tabellen suppleret med data fra Danmarks Statistiks befolkningsprognose.

    Referencer:
    William H. Frey:  “Now more than half of Americans are millennials or younger”,  Brookings Blog Posts 30/7-2020 (link)
    Michael Dimock: “Defining generations: Where Millennials end and Generation Z begins”. Pew Research Center Facttank, 17/1-2019 (link)

  • Finansloven for 2021

    Finanslovforslaget for 2021 blev fremsat den 31, august og udgivet i statistisk bearbejdet form af Danmarks Statistik den 15. september. Den statistiske opgørelse omfatter ikke blot finansloven (der er statens budget) men også budgetterne for kommuner og regioner. Statistikken viser på flere punkter brud i forhold til den hidtidige udvikling frem mod seneste regnskabsopgørelse fra 2019. Bruddene er naturligvis forårsaget af Covid19-krisen.

    Af tabellen nedenfor fremgår det, at de samlede offentlige udgifter målt i pct. af BNP forventes at stige fra fra 46 pct. i 2019 (regnskab) til  49,1 pct. i 2021. Indtægterne forventes at bevæge sig den modsatte vej — fra 49,8 pct til 46,8 pct. På bundlinien betyder det, at det offentlige går fra et overskud på 3,8 pct. af BNP til et underskud på 2,2 pct.

    Tabel: Offentlige finanser 2018-2021

    mia. kr pct af BNP
    20181 20191 20202 20212 20181 20191 20202 20212
    Forbrug 547 557 577 591 24,3 24,1 25,9 25,1
    Overførsler 425 435 445 465 18,9 18,8 19,9 19,8
    Subsidier 38 38 40 41 1,7 1,6 1,8 1,7
    Andre udgifter 51 36 39 56 2,3 1,5 1,7 2,4
    Udgifter i alt 1061 1065 1101 1153 47,2 46,0 49,4 49,1
    Indkomskat 640 716 671 670 28,5 30,9 30,1 28,5
    Andre skatter 361 363 374 369 16,1 15,7 16,8 15,7
    Andre indtægter 71 75 61 61 3,2 3,2 2,7 2,6
    Indtægter i alt 1072 1153 1106 1100 47,7 49,8 49,6 46,8
    Overskud 11 88 5 -52 0,5 3,8 0,2 -2,2

    Kilder: Danmarks Statistikbank (www.statistikbanken.dk/OFF3, OFF26, OFF3B, OFF26B)
    Noter: 1Regnskab    2Budget

    Som det fremgår af figuren nedenfor bryder budgettet med en tendens til, at forbrug og overførsler har udgjort en faldende andel af BNP i de senste regnskabsår. Det er også udtryk for en ændret tendens, at der efter en række år med overskud nu budgetteres med et underskud. Det er dog Finansministeriets forventning, at disse afvigelser er midlertidige. Det fremgår af en rapport, ministreiet udsendte samtidig med fremsættelsen af finanslovforslaget. I 2025 forventes indtægter og udgifter igen at balancere.

    Figur: Offentlige udgifter i pct af BNP 2010-2021

    Kilder: Danmarks Statistikbank (www.statistikbanken.dk/OFF3, OFF26, OFF3B, OFF26B)

    Referencer:
    Danmarks Statistik: “Statistikbanken, OFF3, OFF26, OFF3B, OFF26B”, (link)
    Finansministeriet:
    DK2025 – en grøn, retfærdig og ansvarlig genopretning af dansk økonomi”, august 2020, (link)

Arkiv

Kategorier

År

Få en e-post , når bloggen opdateres
Tilmeldingen kan nårsomhelst tilbagekaldes