Digitale data som alternativ til spørgeskemaer: Trusted Smart Surveys

21/03/2023          Taleboble Kommentarer

Spørgeskemaer på papir som grundlag for statistiske undersøgelser er vel ikke helt forsvundet, men det typiske i dag er nok at skemaerne udfyldes på en computer eller mobiltelefon. Herfra er vejen ikke lang til at erstatte nogle af  spørgsmålene med automatiske registreringer fra mobiltelefonens indbyggede sensorer, f.eks. tidspunkt, geografisk lokation og temperatur. Undersøgelser, der anvender mobiltelefoner til at kombinere traditionelle spørgsmål med automatiske registreringer har fået betegnelsen smart surveys. De automatisk indsamlede data er eksempler på organiske data (se tidl indlæg). De officielle statistikproducenter har for længst set, at de kan spille en rolle som garanter for at undersøgelser baseret på organiske data opfylder fundamentale krav omkring kvalitet og fortrolighed (se tidl indlæg). Sådanne garanterede undersøgelser betegnes trusted smart statistics. Når disse garantier implementeres på smart surveys får  man trusted smart surveys.

Indenfor rammerne af det europæiske statistiksamarbejde har en række landes officielle statistikbureauer — Danmark er ikke iblandt dem —  etableret et projekt (ESSnet Smart Surveys Project), med det formål at etablere en fælles europæisk platform for anvendelse af trusted smart surveys. I en artikel i det tyske statistikbureaus tidsskrift — Wista — har Shari Stehrenberg og Johannes Volk givet et overblik over status for dette projekt.

Projektet er opdelt i tre parallelle såkaldte arbejdspakker (work packages):

  1. Kommunikation og koordinering
  2. Udvikling og udførelse af pilotprojekter
  3. Konceptuel ramme for platformen

Fire pilotprojekter med temaerne forbrug, tidsanvendelse, sundhed og levevilkår blev udvalgt. Alle fire projekter knyttede sig til eksisterende europæiske statistikker. Udover arbejdspakkerne blev der under projektets forløb dannet arbejdsgrupper med henblik på at sammenknytte punkterne 2 og 3. Stehrenberg og Volk fokuserer i deres artikel på arbejdsgruppen om retslige og etiske  spørgsmål. Denne arbejdsgruppe blev oprettet fordi det viste sig, at de deltagende lande dels fortolkede de gældende europæiske databestyttelsesregler forskelligt og dels havde forskellige nationale regler at forholde sig til. Projektet blev afsluttet med en workshop i maj 2022.

Smart Surveys Projektet var et første skridt på vejen til en fælleseuropæisk platform. Arbejdet fortsættes i et nyt projekt under overskriften Smart Survey Implementation. De første resultater fra dette projekt forventes i sommeren 2024.

Referencer:

Shari Stehrenberg, Johannes Volk: “Trusted Smart Surveys: Fragebogen trift Neue digitale Daten”, Wista 2023 nr 1, Statistisches Bundesamt (link 19/3-2023)
Destatis/Eurostat: “Minutes – Finale Conference Smart Surveys”, Maj 2022 (link 19/3-2023)


Opdatering af statistikkens branchegruppering

07/03/2023          Taleboble Kommentarer

Produktion af varer og tjenester er en grundlæggende økonomisk aktivitet. I den officielle statistiks optik foregår produktion på et arbejdssted, der f.eks. kan være en bankfilial, et slagteri, en restaurant eller en butik. Arbejdssteder fordeles på brancher efter arten af deres produktion, f.eks landbrug, industri eller handel. Branchefordelingen er central ikke blot i produktionsstatistik, men også i en række andre statistikområder som  f.eks beskæftigelsesstatistik, regnskabsstatistik og nationalregnskab.

Naturligvis er de overordnede regler for en så central fordeling fastlagt i internationale retningslinier. På verdensplan har FN fastlagt retningslinier, der går under betegnelsen ISIC (International Standard Industrial Classification). ISIC er en ret summarisk klassifikation, egnet til verdensomspændende internationale sammenligninger, men de enkelte lande har behov for mere detaljerede opdelinger, tilpasset deres særlige forhold. Ved at opbygge de nationale brancheklassifikationer som underopdelinger af ISIC opnår man, at både behovet for internationale sammenligninger og landenes individuelle behov kan opfyldes.

EU har etableret en fælles en underopdeling af ISIC — NACE (Nomenclature générale des Activités économiques dans les Communautés Européennes) — der skal opfylde EU-statistikkens behov. ISIC omfatter ca. 290 brancher, hvor NACE omfatter ca. 480. De enkelte medlemslande kan yderligere underopdele NACE for at opfylde nationale behov. Danmarks Statistiks underopdeling af NACE — DB07 (Dansk Branchekode 2007) — omfatter ca. 740 brancher.

I den dynamiske verden opstår hele tiden ny produkter, og gamle produkter forsvinder eller mister betydning. Derfor må brancheklassifikationer jævnligt revideres. Den aktuelle version af NACE (Revision 2) er fra 2008, men EU har besluttet, at den skal erstattes af en ny opdateret version (Revision 2.1), baseret på en ny (endnu ikke offentliggjort) version af ISIC (Revision 5). Indfasningen af den nye version af NACE i medlemslandenes indberetninger til Eurostat begynder i januar 2026. 

Danmarks Statistik er i fuld gang med forberedelserne af revisionen. En opdateret udgave af Dansk Branchekode — DB25 — vi blive sendt i høring i efteråret 2023. DB25 vil træde i kraft i 2025, således at man er klar til at indberette til Eurostat efter de nye regler fra 1. januar 2026. 

Referencer:
FN: “International Standard Industrial Classification of All Economic Activities Revision 4”, 2008” (link, 4/3-2023)
EUR-Lex: Commission Delegated Regulation (EU) 2023/137 of 10 October 2022 amending Regulation (EC) No 1893/2006 of the European Parliament and of the Council establishing the statistical classification of economic activities NACE Revision 2”, 20/1-2023 (link, 5/3-2023)
Eurostat: “NACE-background”, (link, 5/3-2023)
Eurostat: “NACE Rev. 2 – Statistical classification of economic activities”,(link, 5/3-2023
Ilaria Di Matteo & Claude Macchi: “Update of ISIC Revision and NACE revision”, Dias fra ECE Meeting of the Group of Experts on Business Registers 26 – 29 September 2022, (link, 5/3-2023)
Danmarks Statistik: “DB07 – Dansk Branchekode 2007, revideret december 2015”, (link, 5/3-2023)


Verdens sundhedsystemer er i vanskeligheder

21/02/2023          Taleboble Kommentarer

Det danske sundhedssystem er i vanskeligheder. Stigende ventetid på behandling, øget pres på akutmodtagelsen, hyppigere overskridelse af  30-dages fristen for undersøgelse og udredning af sygehushenviste patienter, og faldende produktion trods flere ansatte. Det er konklusionerne i Indenrigs- og sundhedsministeriets rapport: Eftersyn af sygehusvæsenet. Der er øjensynligt ikke tale om et specifikt dansk problem. The Economist — et britisk ugeskrift — taler ligefrem om kaos og om at sundhedssystemerne er nærmere sammenbrud end de var før covid-19 pandemiens udbrud i 1. kvartal 2020  (link). 

Datagrundlaget for Indenrigs- og sundhedsministeriets rapport er egne opgørelser på grundlag af Landspatientregistret og The Economist bygger deres artikel på data sammenstykket fra meget forskellige typer af kilder. I begge tilfælde er bidraget fra den officielle statistik meget begrænset. Der har ikke i den officielle sundhedsstatistik været tradition for hurtige og højfrekvente statistikker, således som man kender det den økonomiske konjunkturstatistik. Covid19-pandemien ændrede på det billede og Danmarks Statistik — i lighed med andre officielle statistikproducenter — etablerede højfrekvente sundhedsmæssige korttidsstatistikker på eksperimentel basis. Størst betydning for den overordnede belysning af sundhedstilstanden er opgørelserne af antal daglige og ugentlige dødsfald.

Intet tyder på, at årsagen til vanskelighederne er nedskæringer og besparelser. Indenrigs- og sundhedsministeriets rapport viser, at antallet af ansatte i det danske hospitalsvæsen er øget, og The Economist finder at i OECD-landene øges både antallet af ansatte og sundhedsudgifternes andel af BNP. Alligevel vokser køer og ventetider.

Den faktiske aktivitet — f.eks.i form af indlæggelser og behandlinger —  er faldende, dvs de ansattes produktivitet er faldende, så det kan ikke udelukkende være en stigende efterspørgsel, der er problemet. The Economist peger dog på, at et efterslæb af udsatte behandlinger i forbindelse med pandemien, formentlig betyder, at der faktisk er er en forøget efterspørgsel. Faldet i produktivitet kan måske forklares ved, at de ansatte arbejdede særligt hårdt tidligere i pandemien, og at en kombination af udbrændthed og tilbagevenden til normalt arbejdstempo nu slår igennem. Indenrigs- og sundhedsministeriets rapport nævner herudover stor udskiftning blandt sygeplejersker, flaskehalsproblemer og dårlig udnyttelse af personalets kvalifikationer — f.eks. narkosesygeplejersker, der ikke anvender deres speciale i praksis.

Når problemer er erkendt er et rimelig næste skridt at tage fat på løsninger. The Economist mener at bedre tider er på vej, bl.a fordi de negative virkninger af pandemien nu er aftagende. Men nye udfordringer er på vej, bl.a. aldrende befolkninger, så man skal ikke forvente at alt bliver lige så godt som som før pandemien.  

Referencer:
Indenrigs- og Sundhedsministeriet: “Eftersyn af sygehusvæsenet”, 12/1-2023 (link, 24/1-2023)
The Economist: “Why health-care services are in chaos everywhere”, 15/1-20123 (link 24/1-2023)
The Economist: “Excess deaths are soaring as health-care systems wobble”, 19/1-2023 (link, 24/1-2023)


Indberetningsbyrden ved spørgeskema- og interviewundersøgelser

07/02/2023          Taleboble Kommentarer

Et af principperne (nr. 9) i Eurostats adfærdskodeks for europæisk officiel statistik er, at byrden for indberettere til statistik skal begrænses mest muligt. Hensigten, der udtrykkes i adfærdskodekset, er at der skal være et rimeligt forhold mellem brugernes behov og indberetternes byrde. Statistikkernes omfang og detaljeringsgrad skal derfor begrænses til det absolut nødvendige. Princippet er nok mest møntet på dataindsamling, hvor deltagelse er tvungen, men der er god grund til også at overveje indberetningsbyrden ved undersøgelser, hvor deltagelse er frivillig. Det skyldes at størrelsen af byrden påvirker indberetternes motivation både til at deltage og til at svare fyldestgørende på de stillede spørgsmål, og dermed kvaliteten af den færdige statistik. Det er så meget desto vigtigere i lyset af tendensen til at villigheden til at deltage i spørgeskema- og interviewundersøgelser er vigende.

Man har da også i de senere år set en stigende interesse for indberetningsbyrdens betydning for statistikkernes kvalitet. Det afspejler sig i bl.a. i et voksende antal tidsskriftartikler om omfang, årsager og måling af indberetningsbyrden og om sammenhængen mellem byrdens størrelse og statistikkens kvalitet. Ting Yan — vicedirektør i forskningsinstitutionen Westat  — og Douglas Williams —  seniorforsker i US Bureau of Labor Statistics  — har i en artikel søgt at danne et overblik over den viden om området, der i øjeblikket er tilgængelig, og samtidig skabe en begrebsmæssig fælles sammenhæng til erstatning af de forskellige definitioner,  indfaldsvinkler og begrebsrammer, der har været anvendt i de mange artikler. Det er samtidig forfatternes tanke, at deres resultater skal være en hjælp til planlæggere af spørgeskema- og interviewundersøgelser i deres bestræbelser på at begrænse indberetningsbyrden.

Ved indberetningsbyrde forstår Yan og Williams de negative følelser og det besvær, der opleves af indberetterne. Indberetningsbyrden er således et subjektivt fænomen, hvis størrelse kan måles ved at spørge respondenterne om deres oplevelser. Udover denne subjektive byrde kan man tale om en objektiv byrde, der f.eks kan måles som spørgeskemaets længde, spørgsmålenes kompleksitet og den tid det vil tage at besvare spørgsmålene. I Yan og Williams optik er fokus på den subjektive byrde, men den objektive byrde kan analytisk tjene som forklarende årsag til den subjektive byrde.   

Helt grundlæggende ser Yan og Williams indberetningsbyrden som en dynamisk størrelse, der kan måles på forskellige stadier i indberetningsprocessen. Helt konkret specificerer de byrden i tre centrale tidsrum i det samlede forløb:

De tre byrder skal forstås dynamisk, dvs. at de kan ændre sig løbende under undersøgelsesforløbet, i takt med at indberetterne får ny information eller nye erfaringer. Det dynamiske perspektiv er vigtigt fordi byrdens placering i tidsforløbet både har betydning for hvilke konsekvenser der rammer kvaliteten, og hvilke forholdsregler, der kan tages for at begrænse byrden. Den initiale byrde kan føre til at respondenten afviser at deltage, og den kan muligvis afhjælpes bedre præsentation af undersøgelsen og en mere indbydende udformning af spørgeskemaet. Den kumulerede byrde kan føre til at interviewet eller besvarelsen afbrydes eller at spørgsmål springes over eller besvares ufuldstændigt. Afhjælpning kan bl.a. ske gennem bedre udformning af spørgsmålene. Den fortsatte byrde kan få respondenten til at afvise at deltage i senere runder af undersøgelsen og afhænger bl.a. af størrelsen af de to foregående byrder.

Referencer:
Eurostat: “Adfærdskodeks for Europæiske Statistikker”, 2018 (link, 9/1-2023)
Ting Yan og Douglas Williams: “Response Burden  –  Review and Conceptual Framework”, Journal of Official Statistics, Vol. 38, No. 4, 2022, pp. 939–961 (link, 9/1-2023)


Danmarks Statistiks arbejdsplan for 2023

17/01/2023          Taleboble Kommentarer

Danmarks Statistik har ambitiøse planer for udviklingen af statistikken i 2023. Det fremgår af Arbejdsplanen for 2023, der netop er udkommet. Arbejdsplanerne er en konkret udmøntning af institutionens strategi, som er beskrevet i Strategi 2025 (se tidl. indlæg). I forbindelse med arbejdsplanen udgives også statistikprogrammet, som er en kort gennemgang af alle de eksisterende statistikprodukter.

Det efter min opfattelse mest interessante punkt i arbejdsplanen har overskriften Fokus på fordelingsaspekter i Nationalregnskabet. Den overskrift dækker over opfyldelsen af en gammel statistisk drøm om at knytte det noget abstrakte nationalregnskab til de lidt mere konkrete personstatistikker — det såkaldte mikro/makro-link (se tidl. indlæg). Ideen er, at nationalregnskabets opgørelser af nationens samlede indkomst og forbrug skal fordeles ud på forskellige husholdningstyper. Det vil øge mulighederne for mere direkte at belyse hvordan forskellige husholdningstyper — f.eks pensionister, lønmodtagere selvstændige og studerende — påvirkes af den generelle økonomiske udvikling. Mulighederne for at belyse udviklingen i uligheden i indkomst og forbrug vil også blive forbedret.

Nationalregnskabet har i det hele taget en central plads i årsberetningen. Der loves forbedringer i det eksisterende regnskab i form af bedre opgørelser af aktiviteten i de største globaliserede danske virksomheder, der hidtil har voldt problemer, og en fortsat udbygning af det grønne nationalregnskab i form af de såkaldte økosystemregnskaber. På lidt længere sigt arbejdes med mulighederne for en bedre belysning af  den økonomiske aktivitet, der foregår i verdensrummet uden for jordkloden, f.eks. i form af satellitbaseret kommunikation. En plan om at undersøge mulighederne for at finde data til en bedre statistik om frivilligt arbejde og donationer til aktiviteter inden for kultur, idræt, socialt arbejde mv, vil også kunne få stor betydning for for nationalregnskabet.

Men naturligvis er det ikke kun nationalregnskabet, der er tilgodeset i arbejdsplanen. På kulturområdet tales om en udbygget statistik om kulturlivet — bl.a. en belysning af udøvende kunstneres vilkår — og en kortlægning af mediebranchen med henblik på en ny mediestatistik, Den eksisterende mediestatistik betegnes nærmest som forældet. Blandt de øvrige planlagte udvidelser og forbedringer skal her blot nævnes forbrugsundersøgelsen, og statistikken over udenrigshandel med tjenester.

Referencer
Danmarks Statistik (2023A): “Arbejdsplan 2023”, januar 2023 (link, 16/1-2023)
Danmarks Statistik (2023B): Statistikprogram 2023”, januar 2023 (link, 16/1-2023)
Danmarks Statistik (2022): “Strategi 2025”,  2022  (link, 16/1-2023)


Nyt sundhedsindeks for England

03/01/2023          Taleboble Kommentarer

I november 2022 introducerede det britiske statistikbureau — ONS — et nyt sundhedsindeks. I første omgang er kun England omfattet af indekset, men det er meningen at det senere skal udbredes til alle dele af UK. Formålet er at give et samlet overblik over nationens samlede sundhedstilstand, uden at skygge for vigtige detaljer. Detaljene tilgodeses gennem offentliggørelse af omkring 70 indikatorer for hver af 307 “kommuner” (LTLA). Hver indikator vedrører et aspekt af den samlede sundhed, f.eks.  spædbørnsdødelighed, misbrug af alkohol, overvægt eller luftforurening.

På det geografiske område tilgodeses overblikket ved at kommunnerne grupperes i 24 “amter” (UTLA), der igen grupperes i ni regioner. Indikatorerne grupperes i 14 subdomæner, f.eks. mental sundhed, adfærdsmæssige risikofaktorer og kriminalitet, der igen grupperes i tre domæner: sunde mennesker, sunde liv og sunde steder. En oversigt over domæner og subdomæner er vist nedenfor. Det helt store, men unuancerede, overblik tilgodeses ved et samlet sundhedsindeks for England som helhed.

DomæneSubdomæne
Sunde mennesker Adfærdsmæssige risikofaktorer
Børn og unge
Fysiologiske risikofaktorer
Beskyttende foranstaltninger
Sunde livVanskeligheder i dagligdagen
Mentalt helbred
Dødelighed
Personligt velbefindende
Fysiske helbredsforhold
Sunde stederAdgang til grønne områder
Adgang til tjenester
Kriminalitet
Økonomiske og arbejdsmæssige forhold
Levevilkår

Udgangspunktet for beregningen af indeksene England som helhed i 2015. Det betyder, at alle indeks for England i 2015 er 100. I tabellen nedenfor er vist resulaterne for 2020 for de ni regioner og de tre domæner

  Sunde
mennesker
Sunde
liv
Sunde
steder
Samlet
indeks
ENGLAND 95 101 103 100
North East 83 96 103 93
North West 89 96 105 96
Yorkshire and The Humber 89 98 102 96
East Midlands 94 103 107 101
West Midlands 91 95 102 96
East of England 98 106 107 104
London 108 98 92 99
South East 98 109 107 105
South West 95 109 109 105

Kilde:  Health Index scores, England

Sundhed er i overensstemmelse med Verdenssundhedsorganisation (WHO) defineret som “en tilstand af fuldstændig fysisk, mentalt og socialt velbefindende og ikke blot fravær af sygdom eller svagheder”. Ved konstruktionen af indekset er anvendt data fra allerede publicerede kilder, så ingen yderligere dataindsamling har været nødvendig. Ved udvælgelse af kilder har navnlig tre kriterier været væsentlige:

De indsamlede data gennemgår en ret omfattende proces, der bl.a omfatter imputationer, normalisering og håndtering af afvigere, før de indgår i de endelige indikatorer. På den måde sikres det, at tidsserierne er konsistente, fuldstændige og nemme at sammenligne. 

Referencer:

Office for National Statistics (ONS): “Health Index scores, England”, 9. november 2022, ONS website (link 2/1-2023)
Office for National Statistics (ONS): “Health in England: 2015 to 2020”,  9. november 2022, ONS website, statistical bulletin (link 16/12-2022)
Office for National Statistics (ONS):  “Health Index contents and definitions”, 9 november 2022, ONS website, methodology article, (link 19/12-2022)
Office for National Statistics (ONS):Health Index methods and development: 2015 to 2020”, 9 november 2022, ONS website, Methodology, (link 19/12-2022)


Klimastatistik

13/12/2022          Taleboble Kommentarer

Klimastatistik er ikke et af Danmarks Statistiks eller andre officielle statistikinstitutters kerneområder, hvis man ved klimaststistik forstår data om fænomener, der direkte beskriver klimaet. Danmarks Statistik har ganske vist på deres hjemmeside en temaside med overskriften klima, men den handler ikke direkte om klimaet, men om udledning af drivhusgasser. Disse udledninger påvirker klimaet, men er ikke klimaet. Den egentlige statistiske belysning af klimaet består i opgørelser af de såkaldte klimatiske dataelementer. Det er lidt forskelligt, hvilke elementer de forskellige producenter af klimastatistik anvender, men Danmarks Meteorologiske Institut (DMI), der står for den danske klimastatistik, leverer i deres klimarapport opgørelser omkring vind (retning og hastighed), lufttryk, lufttemperatur, luftfugtighed, nedbør, solskinstimer og sne (højde og udbredelse).

Som summarisk mål for udviklingen i klimaet anvendes sædvanligvis temperaturen nær jordoverfladen. Der findes forskellige opgørelser af denne størrelse, men navnlig følgende tre dataserier har vundet stor udbredelse:

  1. HadCRUT4 udarbejdes af UK’s meteorologiske institut — The Met Office
  2. GISTEMP udarbejdes af USA’s nationale myndighed for luftfart og rumforskning — NASA 
  3. NOAA Global Temp udarbejdes af USA’s nationale myndighed for hav- og atmosfæreforskning — NOAA

I Eurostats statistikbank findes opgørelser fra alle de tre nævnte kilder for temperaturudviklingen for Europa og for Verden. Der er ikke tale om officiel statistik, og ingen af producenterne er hjemmehørende i EU, så man kan ikke uden videre regne med, at de følger EU’s kvalitetskodeks for officiel statistik. Men af Eurostats metadada om de tre serier fremgår det, at data overvåges ved anvendelse af standardiserede metoder for at sikre kvalitet og sammenlignelighed. 

Selv om der er forskel i opgørelsesmetoderne, så viser alle tre serier i store træk samme udvikling. I figuren nedenfor har jeg valgt at anvende HadCRUT4 fordi det er den serie, der kan føres længst tilbage (til 1850).  Figuren viser stigningen (Celcius) i den gennemsnitlige overfladetemperatur (near surface temperature) i forhold til gennemsnittet for 1850-1899.    

Figur: Udvikling i overfladetemperatur 1850-2019, HadCRUT4

Kilde: Eurostats Statistikbank sdg_13_30

Referencer:
Eurostat: “Global and European Temperatures”, 22/6-2022, (link 11/12-2022)
Eurostat: “Mean near surface temperature deviation (source EEA)”, Reference Metadata (link 22/11-2022)


Værdien af husholdningernes forbrug af internettjenester

29/11/2022          Taleboble Kommentarer

Den økonomiske statistiks bedst kendte og oftest anvendte begreb — bruttonationalproduktet eller BNP — bliver mere og mere vanskeligt både at opgøre og at fortolke, jvf f.eks Bean rapporten (se tidl.indlæg). BNP er et mål for den samlede værditilvækst, der skabes i produktionen, og reglerne for hvordan denne produktion afgrænses og opgøres er fastlagt i FN’s internationale retningslinjer for nationalregnskaber — System of National Accounts eller SNA. Varer og tjenester, der sælges (og købes) eller som produceres af det offentlige og gratis eller til reduceret pris stilles til rådighed for befolkningen (f.eks politi, uddannelse og gadebelysning) udgør de centrale dele af produktionen. Lidt mere kompliceret er behandlingen af varer og tjenester, som husholdningerne fremstiller internt og selv forbruger. Her opstiller opstiller SNA en række regler for hvad der skal indgå, og hvad der ikke skal. Bl.a. udelades husholdningernes produktion af en række tjenesteydelser til eget brug, f.eks. madlavning, rengøring og børnepasning. Disse udeladelser betyder, at både husholdningernes produktion og forbrug undervurderes. 

Fremkomsten af gratis digitale tjenester som Facebook og Twitter har sat fokus på endnu en kilde til undervurdering af husholdningernes forbrug. De gratis digitale tjenesters popularitet efterlader ingen tvivl om de spiller en stor rolle for forbrugernes velfærd, men da der ikke sker en direkte betaling, sker der heller ingen registrering i nationalregnskabets opgørelse af forbruget. OECD’s chefstatistiker — Paul Schreyer — har i en artikel søgt at belyse værdien af de gratis digitale tjenester i relation til nationalregnskabet forbrugsopgørelse. Han anvender USA som reference, men hovedresultaterne er uden tvivl anvendelige for ethvert højt digitaliseret samfund.

Hvis værdien af den underholdning, de digitale tjenester giver husholdningerne, skal indgå i forbruget, sådan som det defineres i nationalregnskabet, skal værdien først indregnes i produktionen. Første spørgsmål er derfor, hvem der står for denne produktion. Schreyers bud er, at det gør husholdningerne selv. Værdiskabelsen ved produktionen (nationalproduktet) sker i nationalregnskabet ved at producenten kombinerer arbejdskraft og kapital i en produktionsproces. I dette tilfælde leveres kapitalen af de digitale tjenester og arbejdskraften af husholdningerne selv i kraft af den tid de bruger på medierne. Da en beregning af værdien af det samlede forbrug af digitale tjenester vil være ret omfattende, vælger Schreyer at koncentrere sig om en enkelt tjeneste, nemlig Facebook. Uheldigvis er stort set ingen af de data der kræves for denne beregning direkte tilgængelige, så den må i høj grad baseres på forenklinger og skøn.

Med alle forbehold når Schreyer frem til det resultat, at USA’s nationalprodukt (BNP) i perioden 2004-2017 ville være vokset mellem 0,04 og 0,2 procentpoint mere, hvis værdien af husholdningernes forbrug af Facebook-tjenester var inkluderet.. Det lyder måske ikke af meget, men dels er der tale om årlig vækst, der akkumuleres gennem tiden, og dels vedrører beregningen kun Facebook. Inddrages andre tjenester vil effekten naturligvis blive større. Schreyers vigtigste pointe er, at forbruget af digitale tjenester har en væsentlig betydning for husholdningernes velfærd, men at denne værdi ikke afspejles i det nationalregnskabsmæssigt opgjorte forbrug.

Om reglerne for beregning af nationalregnskabets produktion og forbrug skal ændres, så det kommer til at omfatte et beregnet forbrug af digitale tjenester tager Schreyer ikke direkte stilling til. Tværtimod påpeger han, at der er andre former for ikke-indregnet forbrug, f.eks. rengørings- og børnepasningstjenester, der med lige så stor ret kunne indregnes

Referencer

Paul Schreyer: “Accounting for free digital services and household production – an application to Facebook (Meta)”, Eurona juni 2022 s.7-23 (link 26/11-2022)


EU-landenes forsørgerbyrde

15/11/2022          Taleboble Kommentarer

En vigtig opgave for ethvert velfungerende samfund er at sikre forsørgelsen af de, der ikke kan forsørge sig selv. Det kaldes samfundets forsørgerbyrde. Der kan være mange grunde til, at en person ikke er i stand til or forsørge sig selv, men i den definition af forsørgerbyrde, der anvendes i den officielle statistik, forenkles begrebet til at omfatte de ældste og de yngste. Det er altså udelukkende alderen, der afgør om en person tilhører gruppen, der skal forsørges eller ej. Den befolkningsgruppe, der skal bære forsørgerbyrden — dvs. som hverken er blandt de ældste eller de yngste — betegnes den erhvervsaktive aldersgruppe. En person, der ikke kan forsørge sig selv på grund af sygdom eller arbejdsløshed, eller som forsørges af en ægtefælle indgår derfor i den erhvervsaktive aldersgruppe, hvis ikke personen tilhører den ældste eller yngste aldersgruppe.

Hvilke aldersgrænser, der skal gælde, for afgrænsningen, varierer. I det følgende er aldersgrænserne sat til 19 år og yngre for de yngste og 65 år og ældre for de ældste. De yngstes antal i forhold til den erhvervsaktive gruppe betegnes ungebyrden eller ungekvoten og den tilsvarende andel for de ældste betegnes ældrebyrden eller ældrekvoten. Forsørgerbyrden opgøres summen af ungebyrden og ældrebyrden.

I figuren nedenfor er vist udviklingen i forsørgerbyrden de seneste tyve år (2001-2021) og udviklingen i de kommende tyve år (2021-2041) ifølge EU’s befolkningsprognose for de fem, EU-lande med den højeste og den laveste forsørgerbyrde i 2021. For nogle af de ti lande er forsørgerbyrden faldet de seneste 20 år, og for andre er den steget, men for alle ti gælder, at der kan forventes en stigning — og for de fleste en betydelig stigning — de kommende tyve år.

Figur: Udvikling i forsørgerbyrde for 10 udvalgte EU-lande 2001-2041

Kilde: Eurostats statistikbank demo_pjangroup, proj_19np

Som det fremgår af tabellen nedenfor, så har alle landene — undtagen Luxembourg — oplevet en forøgelse af ældrebyrden de senest tyve år. Til gengæld har ungebyrden været faldende, og det har virket begrænsende på den samlede forsørgerbyrde. Men den lave ungebyrde afspejler jo, at der er færre, der i de kommende år vil indtræde i de erhvervsaktive aldersgrupper til erstatning for de ældre, der går fra. Resultatet er, at der kan forventes en betydelig stigning i ældrebyrden i de kommende år, og da ungebyrden for de fleste landes vedkommende næsten ikke ændres, vil det føre til en stigning i den samlede forsørgerbyrde.

Tabel Udvikling i forsørgerbyrde for 10 udvalgte EU-lande 2001-2041

 
Stigning 2001-2021 Forventet Stigning           2021-2041
I alt
Heraf
I alt
Heraf
Ældre- byrde Unge- byrde Ældre- byrde Unge- byrde
Luxembourg -7 0 -8 13 15 -2
Malta -8 10 -18 5 7 -2
Slovakiet -4 9 -13 15 16 -2
Cypern -12 7 -19 9 9 0
Østrig 0 6 -7 18 17 1
Grækenland 9 10 -1 17 20 -3
Danmark 9 11 -1 14 13 1
Sverige 5 6 -1 3 6 -3
Finland 11 15 -4 2 8 -7
Frankrig 8 10 -2 12 14 -2

Kilde: Eurostats statistikbank demo_pjangroup, proj_19np


Kvalitetsgennemgang af den danske officielle statistik

25/10/2022          Taleboble Kommentarer

Eurostat gennemfører i disse år en gennemgang af kvaliteten af den officielle statistik i EU’s og EFTA’s medlemslande, de såkaldte peer-reviews (se tidl. indlæg). Resultatet af disse peer-reviews offentliggøres i landerapporter, og rapporten for Danmark er netop udkommet. Kvalitetsgennemgangen er først og fremmest rettet mod landenes nationale statistikinstitutter, der har hovedansvaret for den officielle statistik — i Danmarks tilfælde Danmarks Statistik —  men et udvalg af andre myndigheder, der bidrager til statistikindberetningen til EU, inddrages også. I Danmark findes 15 sådanne myndigheder, men kun tre af dem er udvalgt i denne gennemgang:  Energistyrelsen, Miljøstyrelsen og Udlændingestyrelsen.

Rapporten er udarbejdet af en undersøgelsesgruppe bestående af fire eksperter. Gruppen udtrykker generel tilfredshed med kvaliteten af den danske statistikproduktion, og bemærker i den forbindelse, at der er en høj grad af tillid til Danmarks Statistik blandt brugerne af statistikken. Men naturligvis er der stadig ting, der kan gøres bedre, og i rapporten oplister gruppen 22 punkter, hvor ændringer og forbedringer er ønskelige.

Siden forrige kvalitetsgennemgang i 2015 har Danmark fået en ny statistiklov i 2018 (se tidl. indlæg) Rapporten udtrykker generel tilfredshed med den nye lov og noterer, at den imødekommer mange af forslagene fra den forrige kvalitetsgennemgang i 2015. Undersøgelsesgruppen så dog gerne, at Danmarks Statistiks hjemmel til dataindsamling blev styrket, navnlig i forhold til data ejet af private virksomheder og institutioner. Gruppen mener også, at loven lægger nogle begrænsninger på Rigsstatistikerens autoritet der, skønt de ikke er af afgørende betydning, dog ikke er i overensstemmelse med EU’s retningslinjer for statistikproduktion. Endelig finder gruppen ikke, at databeskyttelsen er tilstrækkelig, og henviser til to konkrete sager, hvor Danmarks Statistik — efter gruppens opfattelse i strid med databeskyttelsesreglerne — er blevet pålagt at levere data indsamlet til statistisk brug til andre offentlige myndigheder, der derefter anvender de leverede data til administrative formål.

Blandt rapportens øvrige forslag og ønsker kan nævnes: forbedringer i dokumentation af metoder og kvalitet, bedre kvalitetsovervågning, bedre forståelse og bedre forklaringer hvor revisioner er hyppige og forholdsvis store (nationalregnskabet), bedre håndtering af databrud og øget anvendelse af sæsonkorrektion.

En vigtig forudsætning for vedligeholdelse og navnlig udvikling og forbedring  af statistikken er, at der er tilstrækkelige ressourcer til rådighed. Gruppen frygter, at der her er et problem, navnlig set i lyset af, at statens bevillinger til Danmarks Statistik har været faldende, på trods af, at kravene til statistikproduktionen, bla. fra EU, har været stigende. Gruppen opfordrer derfor regeringen til at sikre, at der er overensstemmelse mellem de lovmæssige krav til statistikken og de ressourcer, der stilles til rådighed.

Der er indtil nu offentliggjort kvalitetsrapporter for 11 lande. Rapporterne for de resterende lande forventes offentliggjort i løbet af de kommende 14 måneder, således at alle rapporter foreligger ved udgangen af 2023.

Referencer:
Eurostat: “Peer Review Report – Demmark”. April 2022 (link 25/10-2022)


Danmarks Statistiks portræt af danske landmænd

27/09/2022          Taleboble Kommentarer

Danmarks Statistik har i en analysepublikation givet et statistisk portræt af danske landmænd i 2020. Landbrugsstatistikkens hovedkilde er den årlige landbrugs- og gartneritælling, der leverer en generel beskrivelse af landbrugets struktur med udgangspunkt i bedrifterne, dvs de enkelte gårde. Landbrugs- og gartneritællingerne fotæller meget om bedrifternes beliggenhed, størrelse og produktion, men giver ikke megen information om de personer, der er beskæftiget i bedrifterne. Den information findes til gengæld i Danmarks Statistiks personregistre, så ved at kombinere de to kilder han man kunnet etablere et personorienteret datagrundlag for en analyse af de beskæftigede i landbruget. Normalt udgøres datagrundlaget for landbrugs- og gartneritællingen af en stikprøve, men hvert  tiende år — senest i 2020 — indsamles data for alle bedrifter. Det har derfor været muligt at basere portrættet for 2020 på en totalopgørelse. I portrættet belyses både bedrifter og personer, men jeg vil i dette blogindlæg udelukkende se på persondelen.

Analysen omfatter udelukkende landmænd over 18 år, der driver landbrug for egen regning og risiko (selveje) og hvor bedriften giver beskæftigelse til mindst en person (fuldtidslandbrug). Landbrug kan også drives i selskabsform, men den type landbrug indgår ikke (landbrug drevet som interessentskaber betragtes dog som selvejede og indgår derfor). I alt var der i 2020 ca. 7.500  selvejere af fuldtidslandbrug. Ti år tidligere, i 2010, var der ca. 12.300.

Ikke mindre end 94 pct. af landmændene er mænd, men mere end 70 pct, af disse landmænd er gift, og mon ikke mange af ægtefællerne tager aktivt del i driften og også ser sig som landmænd, selvom tradition og lovgivning gør, at kun manden i statistikken registreres som sådan. Det gælder jo i hvert fald nok for en stor del af de 14 procent af landmændenes partnere, der er registreret som medarbejdende ægtefæller, men sikkert også for mange af de øvrige, der kan være registreret som lønmodtagere på familiens bedrift.

Aldersmæssigt adskiller landmændene sig fra den øvrige arbejdsstyrke ved en højere gennemsnitsalder, og gennemsnitsalderen er stigende. I 1920 var den 53,6 år mode 49,2 år i 2010. Omkring 75 pct. af landmændene har en erhvervfaglig uddannelse. For arbejdsstyrken som helhed gælder det 30 pct. En del af årsagen til den høje andel kan være, at der indtil 2010 krævedes en landbrugsuddannelse for at kunne erhverve landbrugsjord.

I analysepublikationen kan man finde mange flere detaljer i portrættet, også om andre aspekter som indkomst, pensionsforhold og landmandsbørns erhvervsvalg.

Referenser:
Danmarks Statistik: Landbrugs- og gartneritællingen”, Dokumentation (link 24/9-2922)
Henrik Bolding Pedersen, Line Merling Arendt, Charlotte Filt Slothuus og Fenja Søndergaard Møller: “Portræt af danske landmænd”, DSTAnalyse 2022:9, Danmarks Statistik 6/9-2022 (link 24/9-2022)


Fertilitet og kvinders erhvervsfrekvens

13/09/2022          Taleboble Kommentarer

Næsten alle rige lande har oplevet et fald i fertiliteten siden 1980 (med Danmark som en markant undtagelse). Ved fertilitet forstås her det antal børn, som 1000 kvinder forventes at sætte i verden gennem deres fertile periode. I samme tidsrum er erhvervsfrekvensen for kvinder (i det følgende betegnet EKV) øget for de lande, hvor den ikke allerede i 1980 lå på et højt niveau, dvs. Danmark, Sverige og Finland.  Det er naturligvis ikke særligt overraskende, at fertiliteten falder i takt en øget EKV, men fire tyske økonomer — Matthias Doepke , Anne Hannusch , Fabian Kindermann og Michele Tertilt — har i en artikel påpeget, at hvor der i 1980 ikke var nogen særlig markant sammenhæng mellem et lands fertilitet og landets EKV, så er der efter fertilitetsfaldet en tendens til at lande med høj EKV også har en relativ høj fertilitet.

Doepke m.fl. sammenligner i deres analyse tal fra OECD’s statistikbank for årene 1980 og 2000.  I figuren nedenfor er sammenhængen illustreret med anvendelse af de samme OECD-data, som Doepke m.fl. anvender i deres analyse, men udvidet med data for 1984 og 2020. Data for 1984 er medtaget fordi det gør det muligt at inddrage Danmark og UK i analysen. For disse to lande finde indeholder OECD’s statistikbank ikke data for EKV for 1980, og de indgår derfor ikke hos Doepke m.fl. De blå tendenslinier, der er indlagt i figurerne, er såkaldte median-median linier. Doepke m.fl. anvender i deres analyse tendenslinier beregnet efter mindste kvadraters metode, men det gør ikke den store forskel for resultaterne.

Figur: Fertilitet og erhvervsfrekevens for kvinder i udvalgte OECD-lande, 1980, 1884, 2000 og 2020

Kilde: OECD’s statistikbank

At der kan iagttages en positiv sammenhæng mellem EKV og fertilitet i rige OECD-lande, er ikke et udtryk, at øget EKV fører til øget fertilitet. Fertiliteten er faldet i stort set alle lande i takt med stigningen i EKV, jf. tabellen nedenfor. I tabellen er landene sorteret efter størrelsen af stigningen i EKV fra 1984 til 2020, og det fremgår, at med enkelte undtagelser (Danmark er en af dem) er faldet i fertilitet størst i de lande med størst stigning i EKV. Der er med andre ord grund til at antage, at stigende EKV fører til faldende fertilitetet, men samtidig ser det ud til, at de lande der når den højeste EKV ender med et mindre fald i fertilitet end lande der når et lavere EKV-niveau.

Tabel: Fertilitet og erhvervsfrekevens for kvinder i udvalgte OECD-lande, 1884 og 2020

  Fertilitet Erhvervsfrekvens Stigning 1984-2020
Land
1984 2020 1984 2020 Fertilitet Erhvervs-frekvens
Antal pct.
Spain 1,73 1,36 34 81 -21 137
Nederlandene 1,49 1,55 43 84 4 93
Australien 1,84 1,58 55 79 -14 43
Tyskland 1,39 1,53 58 83 10 43
Portugal 1,90 1,4 61 87 -26 42
Italien 1,48 1,24 47 66 -16 40
Japan 1,81 1,33 60 80 -27 33
Storbritannien 1,77 1,56 67 83 -12 24
Canada 1,63 1,5 67 82 -8 23
Frankrig 1,80 1,79 68 83 -1 21
Norge 1,66 1,48 74 83 -11 12
USA 1,81 1,64 68 75 -9 10
Danmark 1,40 1,67 83 83 19 0
Sverige 1,65 1,66 88 88 1 0
Finland 1,70 1,37 86 85 -19 -1

Kilde: OECD’s statistikbank

Doepke m.fl. har også gjort sig nogle overvejelser om mulige årsager til den observerede positive sammenhæng mellem EKV og fertilitet. En vigtig faktor er den familie- og arbejdsmarkedspolitik, landene fører. F.eks påviser de en positiv sammenhæng mellem et lands udgifter til småbørnspædagogik og EMK. En anden faktor er forskelle i landenes normer og praksis for fædres deltagelse i børnepasning. Også på det punkt kan de observere en positiv sammenhæng mellem mænds andel af husholdningernes samlede tidsanvendelse på husholdnings- og børnepasningaktiviteter og EKV.

Referencer:
Matthias Doepke,
Anne Hannusch, Fabian Kindermann og Michele Tertilt: “A new era in the economics of fertility”, CEPR 11 Jun 2022 (link 13/9-2022)


EU’s overvågning af statistikkvalitet, peer review af Eurostat

23/08/2022          Taleboble Kommentarer

Som det tidligere er omtalt i denne blog (8/2-22) foregår i disse år er et omfattende kvalitetscheck af statistikken i EU- og EFTA-landene i form af de såkaldte peer-reviews. Der er på nuværende tidspunkt offentliggjort peer review rapporter for ti lande, og den elvte — om Danmark — kan ventes snart. Peer reviews spiller en vigtig rolle i Eurostats overvågning af de nationale statistikinstitutters overholdelse af at kvalitetskravene, som er fastlagt i Adfærdskodeks for Europæiske Statistikker. Eurostat er også selv omfattet af dette adfærdskodeks, men da Eurostat jo ikke kan overvåge sig selv, har Europaparlamentet og Det Europæiske Råd etableret et særligt organ, European Statistical Governance Advisory Board (ESGAB), der har til opgave at overvåge Eurostats overholdelse af adfærdskodekset. Det er derfor ESGAB, der står for peer review af Eurostat. Resultaterne af ESGAB’s peer review  blev offentliggjort i januar 2022.

ESGAB lægger i rapporten vægt på, at Eurostat skal fremstå som en rollemodel for de nationale statistikinstitutter og derfor må leve fuldt op til kravene i adfærdskodekset. I den sammenhæng finder ESGAB, at der er et par punkter, hvor der bør strammes op. Et af dem vedrører orientering af visse myndigheder — f.eks. regering og nationalbank – om statistikresultater før den officielle offentliggørelse (pre-releasing). Den praksis er adfærdskodekset meget kritisk overfor, men den forekommer i en vis udtrækning i EU-systemet, og ESGAB opfordrer til at den nuværende praksis gennemgås kritisk. ESGAB mener også, at de formelle regler for afskedigelse af chefen for Eurostat og for rekruttering og afskedigelse af ansatte på højt niveau bør strammes op, selvom der ikke i praksis er konstateret problemer. I sit svar til rapporten erklærer Eurostat sig dog uenig i, at der på disse personalemæssige områder er uoverensstemmelse med afdfærdskodekset.

ESGAB har naturligvis en række forslag til yderligere forbedringer. F.eks anbefales en udbredelse af adfærdskodeksets gyldighedsområde til også at omfatte EU-statistik produceret af andre end Eurostat, en udvidelse af samarbejdet med Den Europæiske Centralbank (ECB) og udvikling af en samlet strategi for anvendelse af nye digitale data. Men generelt udtrykker ESGAB tilfredshed med Eurostats virke og påskønner navnlig indsatsen i forbindelse med Covid-19 krisen, der på mange måder satte den officielle statistik under pres (jf. indlæg fra 21/9-2021)

Referencer:
Eurostat: “Peer Reviews, Current Round 2021-2023”, (link 23/8-2022)
ESGAB: “Annual Reports”, (link 23/8-20229)


Bog af Tim Harford om at skabe mening i statistik

09/08/2022          Taleboble Kommentarer

Alle læsere af denne blog må formodes at være enige i, at statistik er nyttig og nødvendig. De fleste vil nok også være enige i, at det kan kræve en indsats, at få styr på, hvad indholdet af en statistik egentlig er. En erfaren statistikbruger — økonomen Tim Harford — har gjort den proces lidt nemmere ved at skrive en bog med vejledning i, hvordan man skaber mening i en statistisk opgørelse. Bogens titel er The Data Detective  og udkom i februar 2021.

Bogens indhold er sammenfattet i følgende 10 råd:

  1. Vær bevidst om dine følelser
  2. Overvej din personlige oplevelse
  3. Undgå for tidlig opregning
  4. Træd tilbage og nyd udsigten.
  5. Tjek baggrundshistorien
  6. Spørg hvem der mangler
  7. Kræv gennemsigtighed, når computeren siger nej.
  8. Tag ikke det statistiske fundament for givet
  9. Husk, at misinformation også kan være smuk
  10. Fasthold et åbent sind

I listen har jeg ved farvemarkering opdelt rådene i tre grupper. Råd der vedrører hvordan man mentalt forholder sig, når en statistik vurderes og analyseres, er markeret med rødt, konkrete råd vedrørende vurdering af statistikkens kvalitet er markeret med blåt, og to råd — det syvende og det ottende —  der mere principielt vedrører datagrundlaget og dets tilvejebringelse er markeret med grønt. Jeg vil i det følgende give en kort uddybning af de to sidstnævnte råd. En kort sammenfatning af alle ti råd kan findes hos  Jessica Stillman, og i  Harford’s bog har hvert af rådene sit eget kapitel, hvor det uddybes grundigt.

Det ottende råd er en opfordring til at værdsætte de muligheder, den officielle statistik tilbyder. Hvis de officielle statistikproducenter overholder de internationale retningslinjer — og det gør producenterne i næsten alle udviklede lande — får man her en statistik, der er udarbejdet efter professionelle og vederhæftige principper, og som ledsages af en dokumentation, der gør det muligt for brugeren selv at vurdere statistikkens kvalitet (råd nr. 3-6) i forhold til hans konkrete behov. Statistikkvalitet er nemlig ikke et absolut begreb. Kvaliteten af en statistik kan være tilstrækkelig til et formål, men ikke til et andet. Det er brugerens opgave at vurdere, om kvaliteten er tilstrækkelig, men det er producentens opgave at levere den dokumntation, der  gør vurderingen mulig.

En helt central forudsætning for pålidelig officiel statistik af høj kvalitet er, at de institutioner, der producerer den officielle statistik, er professionelle og uafhængige. Som nævnt er det hovedreglen i udviklede lande, men det må ikke ses en som en selvfølge, og Harford opfordrer kraftigt til at støtte de personer — som han betegner som nørder — der i det daglige står for produktionen af den officielle statistik, især ved at beskytte dem mod pression. Han giver adskillige eksempler på at pression er forekommet. Et af de værste eksempler er den græske regerings behandling af chefstatistikeren Andreas Georgiou (beskrevet i denne blog i indlæg fra 18/2-2020, 16/10-2018 og 15/08-2017)

Det syvende råd handler navnlig om statistik baseret på anvendelse af organiske data (big data, 11/8-2020 og 19/5-2020). De meget store datamængder, der ofte ligger til grund for sådanne statistikker, kan forlede brugeren til at tro, at resultaterne har en høj grad af sikkerhed. I virkeligheden er de anvendte data ofte så usikre, at de er problematiske at anvende. Hertil kommer, at konklusionerne, som ofte er frembragt af algoritmer, der kun søger mønstre i datamaterialet, men ikke inddrager overvejelser om mulige årsager og virkninger, og slet ikke overvejer i hvilket omfang resultaterne kan generaliseres. Resultatet er, at de sammenhænge algoritmerne finder, kan vise sig ikke at holde, når de forsøges anvendt i praksis. Det hele forværres af, at både data og algoritmer ofte ejes af private virksomheder, der ser deres viden kom vigtige forretningshemmeligheder, og derfor kun i begrænset omfang offentliggør detaljer om data og metoder. Harford mener bestemt ikke, at man skal afstå fra at anvende organiske data, men han opfordrer til, at man kræver indsigt i kilder og metoder, på samme måde som det sker i den officielle statistik.

Harfords bog er på mange måder et modstykke til en af mest udbredte introduktioner til statistik: Hvordan man lyver med statistik af Dariel Huff. Som det fremgår af titlen, så tager Huff udgangspunkt i en anvendelse af statistikken, der kun kan betegnes som misbrug. Og naturligvis bliver statistiske metoder misbrugt til udbredelse af falsk information, men det er dog lidt skævt og negativt, at bygge en vejledning i anvendelse af et redskab på, hvordan redskabet kan misbruges. Tim Harford er bestemt ikke blind for, at misbrug af statistik forekommer. Misbruget kan være led i en bevidst vildledning, men ofte er der nok tale om misforståelser, og rigtigt anvendt og forstået er statistik et nyttigt og helt uundværligt værktøj.

Referencer:
Tim Harford: “The Data Detective – Ten Easy Rules to Make Sense of Statistics”, Riverhead 2021
Jessica Stillman: “10 Rules to Be Smarter About Statistics”, Inc. (link 1/8-2022)


Danmarks Datavindue

21/06/2022          Taleboble Kommentarer

Kort efter sin tiltræden som rigsstatistiker i oktober 2020 præsenterede Birgitte Anker sin ide om Danmarks Datavindue — en samlet national indgang til samfundsdata, fortrinsvis rettet mod forskere og analytikere. Danmarks Statistik gik hurtigt i gang med forberedelserne, støttet af en bevilling fra Carlsbergfondet på 10 mio.kr., og i juni 2022 blev der åbnet for en begrænset brugerkreds. Efter planen skal der åbnes for alle brugere i løbet af efteråret 2022.

Der er ikke tale om en umiddelbart offentligt tilgængelig datakilde, som det kendes fra Danmarks Statistikbank. Brug af datavinduet kræver at der oprettes et projekt, som skal godkendes af Danmarks Statistik, og brugeren skal have en brugeraftale med en institution, der er autoriseret til adgang til Danmarks Statistiks mikrodata. Herudover skal brugeren certificeres, og certificering kræver dokumenteret kendskab til de gældende datasikkerhedsregler.

Kernen i Danmarks Datavindue er naturligvis de mikrodata, der i forvejen findes i Danmarks Statistik, men vil også omfatte data fra andre dataejere. Gennem datavinduet får brugerne en samlet overblik over hvilke data, der er til rådighed, og data vil være kvalitetssikrede og dokumenterede.

Datavinduet er ikke blot en samling mikrodatasæt, men også et automatiseret administrativt system til håndtering af projekterne, under hensyntagen til kravene om fortrolighed og datasikkerhed, og redskaber til behandling og analyse af data. I den forbindelse arbejdes der på, at gøre det muligt at knytte såkaldt high performance faciliteter — dvs. meget store og meget hurtige computere — til projekterne.  

Referencer:
Danmarks Statistik: “Danmarks Datavindue” (link 15/6-2022)
Danmarks Statistik: “Arbejdsplan 2022”, januar 2022 (link 15/6-2022)
Birgitte Anker:Et fælles vindue til Danmarks data vil give stor værdi for alle”, Danmarks Statistik, Rigsstatistikerens Klumme 17/6-2021 (link15/6-2022)
Carlsbgfondet: “Bevillingsoversigt: Danmarks Datavindue”, 2021 (link 16/6-2022)


Integration af makro- og mikrostatistik om husholdningenes økonomi

07/06/2022          Taleboble Kommentarer

Husholdningernes indkomst og forbrug er to centrale størrelse,når husholdningernes økonomiske velfærd skal vurderes. Begge størrelser opgøres i nationalregnskabet, der er et af den officielle statistiks flagskibe, når det gælder opgørelser af høj kvalitet, herunder en høj grad af sammenlignelighed  både mellem lande og over tid. Til gengæld opgøres kun tal for husholdningerne samlet, og intet om forskelle mellem typer af husholdninger, f,eks fordeling efter husholdningsindkomstens størrelse. Den slags opgørelser findes i andre dele af den officielle statistik, men her er kvaliteten og navnlig den internationale sammenlignelighed ringere. En fælles OECD-Eurostat ekspertgruppe har i en årrække arbejdet med en bedre integration af disse to statistikområder — gerne betegnet makro- og mikrostatistik — og de har nu udsendt en rapport om de foreløbige resultater.

Projektet har fulgt to forskellige spor. I det ene spor udarbejdede en række af de deltagende lande nationalregnskabsbaserede opgørelser med husholdningsfordelinger på grundlag af nationalt tilgængeligt materiale og efter retningslinjer fastlagt af ekspertgruppen. I det andet spor udarbejdede Eurostat tilsvarende opgørelser på grundlag af eksisterende data indberettet af medlemslandene som led i det løbende statistiksamarbejde. Bindingen til eksisterende materiale indsamlet i andre sammenhænge betyder, at Eurostat centraliserede metode har nogle begrænsninger i forhold til de nationale opgørelser, men til gengæld er en større kreds af lande omfattet.   

I tabellen nedenfor er vist nogle resultater fra den nationale danske opgørelse. Husholdningerne er i tabellen opdelt på kvintiler af ækvivaleret indkomst. Første kvintil omfatter den femtedel af husholdningerne med de laveste indkomster og femte kvintil den femtedel med de højeste indkomster. At indkomsten er ækvivaleret betyder, at der er korrigeret for forskelle i husstandsstørrelse og -sammensætning.

Tabel: Husholdningernes samlede indkomster fordelt på kvintiler af ækvivaleret disponibel indkomst. 2015

mia. kr
Kvintil  
1. 2. 3. 4. 5. Total
Løn og virksomhedsoverskud 75 90 145 254 464 1.028
Lejeværdi af ejerbolig 7 9 12 19 28 74
Formueindkomst(netto) -10 -8 -9 -11 121 83
Sociale overførsler 52 97 95 81 85 410
Andre løbende overførsler (indtægt) 1 1 2 6 32 42
Indkomst i alt 125 189 244 349 730 1.636
Skatter og socialsikkringsbidrag 60 69 95 147 268 639
Andre løbende overførsler (udgift) 38 2 2 2 2 45
Disponoibel indkomst 27 118 148 200 460 953

Kilde Eurostat Experimental Statistics

Ikke overraskende viser tabellen, at skatter og socialsikringsbidrag er stigende med stigende indkomst. Mere overraskende er det måske, at husholdningerne med de laveste indkomster har de største betalinger af andre løbende overførsler. Posten omfatter bl.a. gaver og lignende mellem husholdninger. En del af forklaringen kan være, at den laveste indkomstgruppe omfatter mange immigranter, der sender penge til familien i hjemlandet, de såkaldte personlige remitter (se tidl indlæg).

På Eurostats hjemmeside under eksperimentel statistik er resultater fra flere lande, både af de nationale og decentraliserede opgørelser, offentliggjort. Her findes også detaljerede beskrivelser af de anvendte begreber og metoder.

Referencer:
Eurostat: “ExperimentalStatistics: Income and Consumption”, (link 24/5-2022)
Alessandra Coli, Radoslav Istatkov, Hakam Jayyousi, Friderike Oehler, Orestis Tsigkas: “Distributional national account estimates for household income and consumption: methodological issues and experimental results, 2022 edition”, European Union / OECD 2022 (link 24/5-2022)


Anvendelse af kontanter i daglige betalinger

18/05/2022          Taleboble Kommentarer

Nationalbanken har analyseret borgernes betalingsvaner i 2021, med særligt henblik på at belyse betydningen af digitaliseringen. Tilsvarende analyser har været gennemført for 2017 og 2019. Et af analysernes klare resultater er, at husholdningernes anvendelse af kontanter til betalinger i fysiske butikker er faldet fra 23 pct. af samtlige betalinger i 2017 til 12 pct. i 2021. Målt på andelen af omsætningen er faldet fra 16 pct. til 9 pct. Også i forbindelse med betalinger mellem private er brugen af kontanter faldende..

Faldet i kontanters andel af betalingerne gælder for alle aldersgrupper, jf. figuren nedenfor, men er ikke så markant for den yngste aldersgruppe (15-29 år), der allerede i 2017 var langt forud for de ældre aldersgrupper i overgangen fra kontant til elektronisk betaling. Den yngste gruppe har stadig et forspring, men det er blevet væsentligt indsnævret.

Kontantandelen af husholdningernes samlede betaliger i fysiske butikker. Aldersgupper, 2027, 2017 0g 2021


Kilde: Danmarks Nastionalbank: Kontanters anvendelse i samfundet

Nationalbanken har også analyseret tilfredsheden med de digitale betalingssystemer, synet på anvendelse af kontanter og covid19-pandemiens  betydning for anvendelsen af kontanter. Alt det kan man læse mere om i Nationalbankens publikation.

Referencer:
Jakob Mølgaard Heisel: “Kontanters anvendelse i samfundet”, Danmarks Nationalbank Analyse. 3/3-2022 (link 4/5-2022)


Tre analyser om segregering fra Danmarks Statistik

03/05/2022          Taleboble Kommentarer

Tendensen til at befolkningsgrupper med fælles karakteristika bor i geografiske områder adskilt fra grupper med andre karakteristika kaldes segregering. Segregering kan  f.eks være baseret på indkomst, uddannelse eller etnicitet. Traditionelt har man belyst graden af segregering i et land ved at sammenligne befolkningssammensætningen i forskellige geografiske områder, feks. kommuner, og undersøgt om særlige grupper, f.eks. bistandsmodtagere eller højtuddannede var over- eller underrepræsenteret i visse kommuner.

En mere direkte måde er at tage udgangspunkt i hver enkelt person og beregne et personligt nabolag f.eks. defineret som den cirkel inden for hvilken 250 af personens nærmeste naboer bor. Uheldigvis er denne metode voldsomt beregningskrævende, men ved en tillempet metode, hvor det analyserede land opdeles i små kvadrater på 100 gang 100 meter, og alle personer inden for et kvadrat behandles som en enhed, kan man opnå anvendelige resultater med en overkommelig beregningsindsats. Danmark Statistik har benyttet denne fremgangsmåde i tre analyser til belysning af hhv. udviklingen i multietniske nabolag, segregering på grundlag af uddannelse og indkomst og befolkningssammensætningen i boligområder, der har været på ghettolisterne. Danmarks Statistiks beregninger er baseret på programmet EquiPop, der oprindeligt er udviklet på Uppsala Universitet af kulturgeografen John Östh.  

Analysen af multietniske nabolag belyser udviklingen fra 1990 — hvor indvandrere og efterkommere udgjorde 4 pct. af befolkningen —  til 2020, hvor andelen var steget til 11 pct. Det fører — ikke så overraskende — til en stigende udbredelse af multietniske nabolag. F.eks. faldt andelen af befolkningen, der bor i i områder, hvor alle de 50 nærmeste naboer er af dansk oprindelsede, fra 34 pct. i 1990 til 10 pct i 2020. Der er dog store regionale forskelle. I Region Hovedstaden var andelen i 2020 tæt på nul. I de øvrige regioner svingede andelen mellem 10 og 16 pct.

Analysen af uddannelse og indkomst vedrører året 2019. Konklusionen er at der er en klar tilbøjelighed til at personer med høj uddannelse og høj indkomst bor i særlige områder i de store byer — København, Århus Odense og Ålborg.

Analysen af ghettoområderne viser en stigning i andelen af indvandrere og efterkommere i områderne fra 19 pct. i 1990 til 62 pct. i 2017, dvs ca. en tredobling, hvilket svarer nogenlunde til udviklingen i Danmark som helhed (fra 4  til 13 pct). Andelen af personer med en videregående uddannelse voksede i ghettoområderme fra 8 pct. til 21 pct og i Danmark som helhed 19 pct. til 38 pct. Her er altså sket en vis indsnævring af forskellene. Mest markant er udviklingen i andelen af personer med lav indkomst. I 1990 var andelen ca 4 pct. både i ghettoområderne og i landet som helhed. I 2017 var andelen steget til 7 pct. i landet som helhed, men til hele 21 pct. i ghettoområderne. 

Referencer:
Marcin Jan Stonawski, Henning Christiansen og Sose Hakhverdyanrcin: “Udviklingen i multinationale nabolag fra 1990 til 2020”, DSTAnalyse 22/3-2022 (link 29/4-2022)
Henning Christiansen, Michael Berg Rasmussen, Emil Habes og Anne Kaag Andersen: Samler de højtlønnede og højtuddannede sig få steder i byerne?”, DstAnalyse 23/1-2020 (link 29/4-2022)
Marcin Jan Stonawski, Henning Christiansen, Sose Hakhverdyan og Anne Kaag Andersen: “Hvem bor i og omkring 53 boligområder, der har været på ghettolisterne?”, DSTAnalyse 21/6-2021 (link 29/4-2022)
John Östh: “Introducing the EquiPop software an application for the calculation of k-nearest neighbour contexts/neighbourhoods”(link 29/4-2022)


Opdatering af de internationale retningslinier for nationalregnskaber

19/04/2022          Taleboble Kommentarer

Nationalregnskabet udgør grundstammen i den økonomiske statistik. Generelt er nationalregnskabet den mest pålidelige og mest sammenlignelige af alle statistikker. Det skyldes, at det bygger på et grundlag af internationale aftaler, der både stiller krav til begreber og opgørelsesmetode, der skal bidrage til konsistens og sammenlignelighed, og til kvaliteten af opgørelserne. Principielt er kvalitetskravene de samme som stilles til al officiel statistik, men de overvåges og håndhæves i højere grad af internationale organisationer, fordi nationalregnskaberne ofte anvendes som grundlag for tildeling af lån og økonomisk støtte og for opgørelse af medlemslandenes bidrag til organisationerne. Overvågningen og håndhævelsen er klart mest udviklet i EU, men også andre, f.eks. OECD og Verdensbanken, deltager.

De nugældende retningslinier er beskrevet i publikationen System af National Accounts 2008 (SNA 2008), der af FN’s Statistiske Kommission (UNSC) er fastlagt som den internationale standard for udarbejdelse af nationalregnskaber. En række internationale arbejdsgrupper har stået for udarbejdelsen af de detaljerede retningslinjer, og en gruppe betegnet the Inter-Secretariat Working Group on National Accounts (ISWGNA) har stået for planlægning og koordinering. ISWGNA omfatter fem internationale organisationer: Eurostat, IMF, OECD, FN og Verdensbanken. SNA 2008 blev — som navnet antyder — vedtaget i i 2008 og blev implementeret i de fleste lande i de følgende år. I EU-landene blev SNA 2008 implementeret i 2014 i form af en forordning — European System of Accounts (ESA) — der er i overensstemmelse med SNA, men på nogle områder indeholder nogle præciseringer.

Nationalregnskabet må naturligvis hele tiden tilpasses udviklingen i den økonomiske virkelighed, som det skal afspejle. I et vist omfang kan justeringer ske inden for den gældende SNA, men efter en årrække er der behov for en mere grundlæggende opdatering af retningslinjerne — de såkaldte hovedrevisioner. Arbejdet med den næste hovedrevision har været igang siden implementeringen af den nugældende SNA. Opdateringen tager udgangspunkt i en liste omfattende 35 konkrete punkter, hvor der kan være behov for opdatering af den nugældende SNA. De endelige ændringer fastlægges efter omfattende konsultationer med statistikproducenter, politikere, forskere og brugere. Nogle af punkterne vil yderligere blive aftestet ved konkrete eksperimenter i udvalgte lande.


Det er planen, at den næste udgave af SNA skal vedtages endeligt af af UNSC i 2025.

Referencer:
United Nations: “System of National Accounts 2008”, New York 2009 (link 16/4-2022)
ISWGNA: Webside for Intersecretariat Working Group on National Accounts (link 16/4-2022)
ISWGNA: “Towards the 2025 SNA” (link 17/4-2022)
ISWGNA: “List of SNA research issues for the updating of the 2008 SNA” (link,17/4-2022)
Eurostat: “European System of Accounts 2010”, European Union 2013, (link 16/4-2022)


Web scraping som datakilde for officiel statistik

29/03/2022          Taleboble Kommentarer

Web scraping er en metode til indsamling af data, hvor programmer udviklet til formålet automatisk opsøger hjemmesider og uddrager information fra dem. Programmerne skal være i stand til at finde den ønskede information i den kode, der frembringer hjemmesiden (HTML-kode) og omforme den, således at den bliver brugbar for videre analyse. For officielle statistikproducenter kan der være mange fordele forbundet med at basere statistik på internettets tilgængelige data. F.eks. kan  respondentbyrden begrænses eller helt undgås og dækningen af målpopulationen forbedres, navnlig for internetbaserede aktiviteter som internethandel. Som ved andre anvendelser af organiske data (Big Data) kan dataindsamling ske med høj frekvens, f.eks. dagligt, og hvis  produktionsprocessen er automatiseret kan offentliggørelsen af resultaterne ske hurtigt efter analyseperiodens afslutning. Til gengæld kræves investering i etablering af nye produktionssystemer

Det bedst kendte eksempel på anvendelse af webscraping til statistikproduktion  er The Billion Prices Project (se tidl. indlæg), der ganske vist ikke er officiel statistik, men som af mange centralbanker anvendes som supplement til — og i nogle tilfælde erstatning for — den officielle statistik. The Billion Prices Project leverer inflationsopgørelser for en række lande langt hurtigere og med langt højere frekvens end den officielle statistik.

Anvendelse af webscaping i den officielle statistik er endnu i en pionerfase. Der er ikke mange konkrete projekter, men der er eksperimenter, overvejelser og forberedelser i gang, både omkring metoder, etik og jura. Et af de institutter, der er langt i forberedelserne er UK’s  Office of National Statistics (ONS). ONS har udgivet et notat om retningslinier for anvendelse af web-scraping, hvori det præciseres hvilke juridiske regler der gælder på området, og hvilke etiske principper, der skal gælde for anvendelsen i UK’s officielle statistik. I notatet fremhæves tre grundæggende principper: 

Minimering af byrden for websideejerne skal bl.a ske ved at begrænse antallet af søgninger på side, undgå søgninger på de tidspunkter, hvor siden er mest anvendt og kun søge på de dele af siden, der er relevante for det konkrete formål. 

Referencer:
ONS: “Web Scraping Policy”, ONS 2020 (link)
Olav ten Bosch: “Uses of web scraping for official statistics”, 2016 (link)


Danmarks Statistik: Strategi 2025 og arbejdsplan 2022

08/03/2022          Taleboble Kommentarer

Ifølge Walter Radermacher — forsker ved Sapienza Universitetet i Rom og generaldirektør for Eurostat 2008-2016 — har vilkårene for den officielle statistik siden 2010 været præget af tre centrale udviklingstræk (se indlæg fra 18/8-2020) :

  1. Globalisering
  2. Stærkt stigende udbredelse af organiske data (Big Data)
  3. Stærk fokus på evidensbaseret beslutningstagning
  4. Faldende tillid til den officielle statistik 

At man i Danmarks Statistiks er fuldt bevidst om denne udvikling fremgår tydeligt af institutionens strategi frem til 2025, som blev godkendt af bestyrelsen 6/12-2021. Her fremhæves øget relevans af statistikkerne — herunder udvikling af hurtigere indikatorer og nye formidlingskanaler — og  sikring af høj statistikkvalitet.  Der loves også en indsats for at opsøge og afteste nye muligheder for statistik. På dataområdet lægges op til at finde nye datakilder, og på personaleområdet lægges op til styrkelse af kompetenceniveauet.

Den mere konkrete implementering af strategien beskrives i de årlige arbejdsplaner, hvor planen for 2022 , som er den første under Strategi 2025, udkom  i januar 2022. Mest direkte afspejler strategien sig i forbedringer og udvidelser af de konkrete statistikprodukter. Blandt planerne kan nævnes udvidelse af ledighedsstatistikken (bl.a. med en månedlig indikator) og nye bolig- og ejendomsstatistikker (bl.a et prisindeks for andelsboliger). Lidt mere abstrakt, men mindst lige så vigtigt er den planlagte indsats for at vedligeholde og forbedre kvaliteten af statistikprodukterne. Helt central bliver gennemførelse af EU’s såkaldte peer review i marts,  der skal vurdere statistikkernes overensstemmelse med reglerne i EU’s adfærfdskodeks for officiel statistik (se indlæg fra 8/2-2022). Vigtig er også en annonceret indsats til imødegåelse af problemerne i forbindelse med de faldende svarprocenter i spørgeskemaundersøgelser.

Referencer:
Danmarks Statistik: “Strategi 2025”, januar 2022. (link 1/3-2022)
Danmarks Statistik:Arbejdsplan 2022”, januar 2022, (link 18/2-2022)


Den tyrkiske statistikchef afskediget

22/02/2022          Taleboble Kommentarer

I slutningen af januar blev chefen for den tyrkiske statistikmyndighed (TUIK) — Sait Erdal Dincer — afskediget. Afskedigelsen skal ses på baggrund af en dyb uenighed mellem den tyrkiske præsident — Tayyip Erdogan — og de fleste økonomiske eksperter om omfanget af og årsagerne til inflationen i Tyrkiet. TUIK havde netop offentliggjort en årlig inflationsrate på 36 pct. og Erdogan er tilsyneladende overbevist om, at TUIK overdriver inflationens størrelse. Fra andre sider i Tyrkiet kritiseres TUIK til gengæld for for at undervurdere den faktiske vækst i leveomkostningerne. Dincer har fastholdt, at TUIK’s inflationsopgørelser opgøres som foreskrevet i de internationale retningslinjer for officiel statistik.

Sagen skal også ses i sammenhæng med Erdogans forhold til den tyrkiske centralbank. Centralbanker har som en væsentlig opgave at kontrollere inflationen, og de reagerer oftest på høje inflationstal ved at sætte renten op. Men da Erdogan er af den opfattelse, at midlet til at begrænse inflationen er at holde renten nede, har det givet anledning til konflikter, hvilket igen har medført, at direktøren for banken har været udskiftet tre gange siden 2019.

Det er en central del af de internationalt aftalte kvalitetskrav til officiel statistik, at statistikcheferne skal udpeges på grundlag af deres professionelle og videnskabelige indsigt, og at de i deres varetagelse af statistiske opgaver skal være uafhængige af øvrige myndigheder. Da afskedigelsen af Dincer ikke er begrundet i kritik af hans professionalisme, frygter International Statistical Institute (ISI) og International Association for Official Statistics (IAOS) — begge centrale og anerkendte professionelle organisationer for statistikere —  at der ligger et ønske om politisk kontrol med opgørelser og metoder bag opsigelsen. De to organisationer har derfor udsendt en erklæring hvor de opfordrer de tyrkiske myndigheder til at sikre TUIK’s muligheder for levere pålidelig statistik og til at overholde de internationale retningslinjer vedrørende kvaliteten af statistikken.

Det er ikke første gang man ser en regering søge at påvirke de officielle statistiske opgørelser i strid med de internationale retningslinjer. I Tyrkiets naboland, Grækenland, har man ligefrem retsforfulgt en statistikchef, der fulgte retningslinjerne, på trods af regeringens ønsker om at sløre statistikkerne (se indlæg fra 18/2-2020, 16/10-2018 og 15/8-2017). 

Referencer:
Economist: “Prices in Turkey are surging. But by how much?”, 31/7-2021
International Statistical Institute: “Reaction to the dismissal of the head of the Turkish Statistical Office”, 11/1-2022 (link 16/2-2022)
Middle East Eye: “Turkey: Erdogan sacks statistics chief and replaces justice minister”, 29/1-2022 (link 16/2-2022)


Kvalitetscheck af EU-landenes officielle statistik — peer reviews

08/02/2022          Taleboble Kommentarer

For at officiel statistik skal være brugbar, må den være af høj kvalitet. Så langt er alle enige. Hvad der mere konkret skal forstås ved høj kvalitet og hvordan forskellige aspekter af kvalitet skal prioriteres og afvejes, kan der derimod være uenighed om. EU, der i sin administration fuldstændig afhængig af højkvalitetsstatistik fra medlemslandene, har i publikationen “Adfærdskodeḱs for europæiske statistikker” ret præcist beskrevet de kvalitetskrav, som landene er forpligtet til at overholde i deres produktion af officiel statistik. Overholdelsen af reglerne kontrolleres dels gennem Eurostats løbende overvågning, og dels gennem mere systematiske gennemgange af landenes statistiksystemer — de såkaldte peer-reviews. Der blev gennemført peer-reviews i 2006-2008 og 2013-2015, og en tredje runde er i gang i øjeblikket. Den blev indledt i 2021 og forventes afslutttet i 2023.

Peer-review processen består af to trin: et omfattende spørgeskema der bevares af landets statistikmyndigheder og et besøg af en international undersøgelsesgruppe. Bevarelsen af sprøgeskemaet danner grundlag for undersøgelsesgruppens arbejde. Gruppens besøg finder sted ca. en måned efter besvarelsen af spørgeskemaet og varer 4-5 dage. Under covid-19 krisen har det været nødvendigt af gennemføre besøgene virtuelt. Efter kontrolbesøget udarbejdes en rapport, der offentliggøres på Eurostats hjemmeside. Processen omfatter alle medlemmer af det Europæiske Økonomiske Samarbejdsområde, dvs både EU-landene og EFTA-landene.

Undersøgelsesgruppen består af fire personer, der er udvalgt således at en de tilsammen afspejler en passende kombination af kompetencer, viden og færdigheder. Det er klart, at den nationale statistikmyndighed er genstand for peer-review processen, men også andre officielle statsitikproducenter inddrages. Efter besøget udarbejder undersøgelsesgruppen en beretning. Beretingen vil typisk indeholde en række ønsker om forbedringer med tilhørende forslag til, hvordan disse forbedringer kan gennemføres.

I alt 25 lande indgår i denne tredje runde. Der er på nuværende tidspunkt gennemført peer-reviews i 11 lande og der er offentliggjort rapporter for to lande (Frankrig og Estland).  For Danmarks vedkommende er det planen, at kontrolbesøget skal ske i marts 2022 og at rapporten offentliggøres i juli eller august 2022.

Efter afslutningen af peer-review runden skal der ske en opfølgning af de planer, der er fastlagt i beretningerne. Landene skal fra 2024 årligt rapportere til Eurostat om de fremskridt der er gjort i forbindelse med implementeringen af de foreslåede forbedringer, og Eurostat skal udarbejde en årlig rapport om de samlede fremskridt.

Referencer:
Eurostat: “European Statistical System Peer Reviews. Third round: 2021-2023 — Overall methodology”, 2020 (link 3/2-2022)
Eurostat: “Adfærdskodeks for Europæiske Statistikker”, 2017 (link 3/1-2022)
Eurostat: “Peer-Reviews: Current Round 2021-2023”, (link 7/2-2022)
Mirko Herzner: “Der Peer Review 2021 bis 2023 im Europäischen Statistischen System”, WISTA 2021 nr 5 (link 1/2/2022)


Boligpriser før, under og efter covid-19 krisen

25/01/2022          Taleboble Kommentarer

Set på verdensplan har huspriserne været støt stigende siden 2013 (IMF Global Housing Watch) , og covid-19 krisen har ikke afbrudt denne tendens. Udviklingen afspejler sig også i EU og i Danmark, jf. figuren nedenfor.

Figur: Prisindeks for ejerboliger (inflationskorrigeret) 2014 – 2021

Kilde: Eurostats statistikbank prc_hpi_ooq og prc_hicp_midx

I perioder med prisstigninger på boliger rejser to store spørgsmål sig: hvor længe kan de fortsætte og hvad bliver følgerne når tendensen vender og prisstigningerne bliver svagere eller ligefrem vendes til prisfald. Svaret på begge spørgsmål afhænger af de bagvedliggende årsager til prisstigningerne. Hvis boligkøberne har handlet ud fra en uholdbar optimisme, f,eks, båret af midlertidig lav inflation og midtertidig lav rente, så kan vendingen bringe mange boligejere i økonomiske vanskeligheder. Ligger der derimod mere solide ændringer i de grundlæggende økonomiske vilkår bag, så er der ikke nødvendigvis grund til bekymring. The Economist (et britisk tidsskrift) har opregnet tre mulige årsager til, at de stigende boligpriser kan være økonomisk velfunderede:

  1. Boligkøberne er økonomisk velfunderede
  2. Efterspørslen efter boliger er stigende
  3. Udbuddet af boliger er faldende

I modsætning til hvad der har været tilfældet ved tidligere boligbobler,  — i hvert fald i USA, som er hovedfokus for The Economists overvejelser — så er det denne gang  i høj grad husholdninger med gode jobs og høj kreditværdighed, der dominerer som huskøbere. Noget tilsvarende kan være tilfældet i Europa, bl.a fordi fordi bankerne har skærpet vilkårene for at opnå realkreditlån. I Danmark er Nationalbanken stort set enig i, at husholdningerne som helhed er tilstrækkeligt økonomisk robuste til uden støre problemer at kunne imødegå en renteforhøjelse. Husholdninger, der har optaget store lån med variabel rente og afdragsfrihed, vil kunne komme i vanskeligheder, men udviklingen er i de senere år gået i retning af at der optages færre af den type lån. Husholdningerne har derfor øget deres modstandsdygtighed over for renteændringer.

Hypotetsen om den stigende efterspørgsel begrunder The Economist bla. med ændrede præferencer i forbindelse med Covid-19 pandemien. Det er blevet mere udbredt at arbejde hjemme en eller flere dage om ugen, og det skaber et behov for plads til hjemmekontorer. Danmarks Statistik har opgjort, at 17 pct.af de beskæftigede arbejde hjemme i 2020 — en fordobling i forhold til året før. Omfanget af hjemmearbejde vil nok falde igen, når pandemien er overstået, men der kan meget vel være skabt nye præferencer for mere hjemmearbejde, således at en del af stigningen kan være varig.

Det faldende udbud afspejler sig ifølge The Economist i at boligbyggeriet i den rige verden, korrigeret for befolkningsudviklingen, var faldende allerede før Covid-19 pandemien, og at krisen har mange steder forårsagede yderligere fald i byggeaktiviteten. Det ser dog ikke umiddelbart ud til at være gældende for Danmark, hvor boligarealet pr capita har været voksende i de senere år, jf. tabellen nedenfor

Tabel: Boligareal pr capita 2011-2020

År Folketal Boligareal
I alt pr capita
1000 mio m2 m2
2011 5.561 296 53,3
2012 5.581 298 53,4
2013 5.603 300 53,6
2014 5.627 302 53,7
2015 5.660 304 53,7
2016 5.707 306 53,6
2017 5.749 308 53,6
2018 5.781 311 53,8
2019 5.806 314 54,1
2020 5.823 318 54,6

Kilde: Danmarks Statistikbank: BEF5 og BYGB34

Referencer:
The Economist: “How long can the global housing boom last?”, 4/1-2022
International Monetary Fond: “Global Housing Watch”, (link, 18/1-2022)
Danmarks Nationalbank: “Begrænset rentefølsomhed blandt boligejerne”, Nyt nr. 3, 2/11-2021 (link, 22/1-2022)
Danmarks Statistik: “Hjemmearbejdet fordoblet i 2020”, Nyt 2021 nr 53, 16/2-2021 (link, 23/1-20)

 


Danmarks udledning af drivhusgasser til atmosfæren

11/01/2022          Taleboble Kommentarer

Den centrale præmis for for arbejdet på FN’s klimakonferencer — senest COP26 i Glasgow i november 2021— er at udledning af drivhusgasser til atmosfæren er den helt dominerende årsag til den globale opvarmning. Den heraf følgende konklusion er, at nøglen til begrænsning af opvarmningen er en betydelig nedsættelse af udledningerne. Set med statistiske øjne betyder det, at der er behov for måling af udledningernes omfang.

Uheldigvis er det ikke helt enkelt at opgøre og måle udledninger af drivhusgasser. I den officielle statistik har man valgt at gøre måleopgaven mere overskuelig, ved at tage udgangspunkt i de aktiviteter, der fører til udledning af drivhusgasser, f.eks produktion og opvarmning fremfor en direkte måling. Ud fra viden og antagelser om de processer og materialer, der indgår i aktiviteterne, beregnes skøn over udledningerne. Langt den vigtigste af drivhusgasserne er kuldioxid (CO2), så et oplagt udgangspunkt for vurdering af udledningernes omfang er at tage udgangspunkt i udledningen af CO2. Andre drivhusgasser, som f.eks. metan (CH4), lattergas (N2O)  kan inddrages i analysen ved at omregne udledningerne til CO2-ækvivalenter. I Ole Gravgård Pedersen, 2021 finder man et kort og overskueligt overblik over de mange ofte komplekse beregninger og forudsætninger, der ligger bag beregningerne. I tabel 1 nedenfor gives et overblik over udviklingen i Danmarks udledninger fra 2010 til 2020

Tabel 1: Danmarks udledning af drivhusgasser 2010-2020 (Grønt Nationalregnskab)

Mio tons CO2-ækvivalenter 2010 2020 Ændring
Husholdninger 14,2 11,2 -21,3
Landbrug, skovbrug og fiskeri 13,2 13,0 -2,2
Råstofindvinding 2,4 1,5 -35,9
Industri 6,6 6,7 1,6
Forsyningsvirksomhed 32,6 20,1 -38,5
Handel og transport mv. 43,6 43,6 -0,1
Øvrige virksomheder 3,4 3,3 -4,4
I alt 116,1 99,3 -14,5

Kilde: Danmarks Statistikbank/DRIVHUS

Opgørelserne i tabel 1 stammer fra det grønne nationalregnskab. Det grønne nationalregnskab opgøres af Danmnarks Statistik, men på basis af opgørelser fra Nationalt Center for Miljø og Energi (DCE), der står for den grundlæggende beregning af Danmarks udledning af drivhusgasser. De opgjorte udledninger vedrører den samlede danske økonomi, som den er defineret i nationalregnskabet. Denne type opgørelser, der afspejler hvor udledningen fysisk sker, er vigtige bl.a. fordi de er udgangspunkt for de internationale aftaler omkring begrænsning af udledningen. Men det er også af interesse at belyse hvor det forbrug og de investeringer, der i sidste ende er årsag til udledningerne, finder sted. De produkter, der forårsager udledninger i et land, kan være importeret fra et andet land, hvor udledningerne i så fald fysisk er sket. Omvendt kan en del af udledningerne i landet vedrøre produktion, der eksporteres til andre lande. Om opgørelser af udledningerne i forbindelse med et lands samlede forbrug og investering, uanset hvor produktionen af de forbrugte og investerede produkter har fundet sted, anvendes betegnelsen klimaaftryk. Danmarks Statistiks offentligør klimaaftrykket som en eksperimentel statistik, dvs. en statistik der er under udvikling og endnu ikke har fundet sin endelige form. Eksperimentel statistik betragtes ikke som officiel statistik, selv om udgiveren er en officiel statistikproducent. I tabel 2 nedenfor er vist en summarisk opgørelse af udviklingen i Danmarks klimaaftryk fra 2010 til 2020.

Tabel 2: Danmarks klimaaftryk 2010-2020

Mio tons CO2-ækvivalenter
2010
2020
Procentvis ændring
Udledninger i alt Udledninger i Danmark Udledninger i udlandet
Fødevarer, drikkvarer og tobak 9,3 9,9 6,5 -2,9 9,3
El, gas og andet brændsel 13,9 5,3 -62,1 -60,3 -1,8
Transport 12,5 11,2 -10,2 -11,5 1,3
Privat forbrug i øvrigt 17,7 14,3 -19,1 -11,8 -7,3
Privat forbrug i alt 53,4 40,7 -23,7 -22,8 -0,9
Offentligt forbrug 10,6 8,3 -22,0 -22,2 0,3
Bruttoinvesteringer 15,1 16,4 8,8 -3,1 11,8
Samlet klimaaftryk 79,1 65,4 -17,3 -19,0 1,6

Kilde: Danmarks Statistikbank/AFTRYK

Det fremgår af tabel 2, at der er sket et tydeligt fald i det amlede danske klimaaftryk. Det fremgår også, at faldet udelukkende kan tilskrives aktiviteter i Danmark. Udledninger i udlandet, der forårsages af dansk forbrug og investering er steget lidt. I en analyse fra Danmarks Statistik er denne udvikling mere detaljeret belyst.

Referencer:
Danmarks Statistik: “Dansk forbrug sætter i høj grad sit klimaaftryk i udlandet”, Analyse 16/16-2021 (link)
Ole Gravgård Pedersen: “Om hvordan man opgør udledninger af drivhusgasser”, Særtryk af Erhvervshåndbogen Klimaledelse kapitel 19.3, januar 2021 (link)


Er inflationen vendt tilbage?

07/12/2021          Taleboble Kommentarer

Efter en periode med ret stabile priser, er inflationen måske vendt tilbage. Priserne er i 2021 begyndt at stige i et hastigere tempo. Det er særligt tydeligt i USA, men kan også ses i EU (se grafen for samlet inflation nedenfor). Økonomer diskuterer nu, om det er et midlertidigt fænomen, forårsaget af de særlige forhold skabt af covid-19-krisen, eller om det er en varig udvikling. Et vigtigt argument fra de økonomer, der ser det som et midlertidigt fænomen, er at den registrerede inflation dækker over store prisstigninger på en lille gruppe produkter, hvorimod priserne på langt de fleste produkter er ret stabile.

Figur: Inflation i EU, Danmark og USA
Anm: Der er defitionsforskelle mellem opgørelserne for EU og USA.
Kilde: Eurostats databank prc_hicp_manr

Tidsskriftet The Economist har søgt at efterpøve hypotesen om, at den aktuelle inflation i USA er koncentreret på relativt få varegrupper, ved at sammenligne prisstigningernes spredning på varegrupper i 2021 med spredningen i tidligere inflationsperioder (The Economist 2021). En stor spredning kan være udtryk for, at prisstigningerne er koncentreret på få varegrupper. Resultatet er faktisk, at spredningen ser ud til at være større nu end gennemsnittet for tidligere inflationsperioder. Det er navnlig prisstigninger på brugte biler, hotelværelser og flyrejser, der ligger bag den aktuelle inflation i USA.

I EU, herunder Danmark, er det prisstigninger på energiprodukter — elektricitet, benzin og gas — som har været de stærkeste drivkræfter bag inflationen, men det er ikke usædvanligt, at priserne på energiprodukter varierer mere — både op og ned — end priserne på øvrige produkter. Noget tilsvarende gælder ikke-forarbejdede fødevarer. Som et redskab til at vurdere betydningen af de særlige forhold for prisudviklingen på disse to varegrupper udarbejder EU-landene en særlig inflationsopgørelse — kerneinflationen — hvor de to produktgrupper er udeladt. Som det fremgår af grafen for kerneinflation ovenfor, så er prisudviklingen i EU, og navnlig i Danmark, langt mindre dramatisk, vurderet ud fra kerneinflationen end ud fra den generelle inflation. (Kilden indeholder ikke data om kerneinflation for USA).

Prisstatistikkerne giver således et vist grundlag for hypotesen om, at den observerede stigning i inflationen har rod i særlige forhold for en begrænset gruppe af produkter, og derfor vil falde tilbage til et lavere niveau igen. Men mange forhold i forbindelse covid-19 krisen kan have påvirket økonomien, så det vil nok ikke være klogt, at drage alt for hurtige konklusioner alene på grundlag af disse simple inflationsopgørelser.

Referencer:
The Economist: “The used-car conundrum”, 6/11-2021
Danmarks Statistik:Største stigning i forbrugerpriserne i over 10 år”, Nyt fra Danmarks Statistik Nr. 398, 10/11-2021 (link)


Køn og kønsidentitet i den officielle statistik

23/11/2021          Taleboble Kommentarer

I et tidligere indlæg (5/10-2021) har jeg omtalt de problemer registreringen af køn — og i sammenhæng hermed kønsidentitet —  har skabt i for folketællingerne i UK, dvs England, Skotland, Wales og Nordirland. For langt størstedelen af befolkningen er der overensstemmelse mellem biologisk køn og kønsidentitet, men som eksemplet fra UK viser, så er der i øjeblikket stor opmærksomhed på den befolkningsgruppe, der ikke passer ind i den generelle overensstemmelse, og det er den officielle statistik så småt ved at indrette sig efter.

Gruppens begrænsede størrelse betyder, at der stilles særlige krav til de metoder, der anvendes ved indsamlingen af data. Folketællinger, som de omtalte i UK, er velegnede, men de er kostbare at gennemføre, og afholdes derfor normalt kun hvert tiende år. Hertil kommer, at flere og flere lande undgår traditionelle folketællinger og erstatter dem helt eller delvist med data fra offentlige registre (i Danmark f.eks. CPR og skatteregistrene). I praksis må informationerne derfor indsamles gennem stikprøveundersøgelser, og her betyder gruppens begrænsede størrelse, at den ofre vil være utilstrækkeligt repræsenteret i en traditionel stikpøve. 

I tabellen nedenfor er vist en skønnet fordeling af den danske befolkning efter kønsidentitet og seksuel identitet. Skønnene er baseret på resultaterne fra Projekt SEXUS, der er en omfattende undersøgelse af  seksualitet og sundhed gennemført i et samarbejde mellem Statens Serum Institut og Aalborg Universitet. Undersøgelsens grundlag er besvarelser af et web-spørgeskema, udsendt til  ca. 187.000 personer i en tilfældighedsbaseret stikprøve af 15-89 årige. Ca 64.000 personer besvarede spørgeskemaet, svarende til en svarprocent på 35,8. Gennem efterstratifikation har man søgt delvis at kompensere for det betydelige frafald

Kønsidentitet og seksuel identitet for 15-89-årige i Danmark 2017-2018 (1000 personer)

Kønsidentitet

Seksuel identitet
Hetero-
seksuel
Homo-
sekuel
Biseksuel Andre1 I alt
Mænd Cis-person 2.040 33 37 71 2.181
Transperson 1 0 0 1 2
Nonbinær 2 1 1 2 6
Mænd i alt 2.043 34 39 74 2.190
Kvinder Cis-person 2.001 13 55 141 2.210
Transperson 1 0 1 1 2
Nonbinær 6 1 2 4 13
Kvinder I alt 2.007 14 58 146 2.226
I alt 4.051 48 97 220 4.415

Note: 1Omfatter aseksuelle og personer med uafklaret seksuel identitet. Aseksuelle udgør en forsvindende andel (omkring 1/4 procent af befolkningen)
Kilde: Morten Frisch, Ellen Moseholm, Mikael Andersson, Josefine Bernhard Andresen & Christian Graugaard

Den officielle befolkningsstatistik er baseret på CPR-registret. Her er udgangspunktet køn tildelt ved fødslen (biologisk køn), men det kan være ændret ved et juridisk kønsskifte. For tabellens Cis-personer og non-binære personer vil der være overensstemmelse mellem kønsidentitet og CPR-køn, men for transpersoner vil der kun være overensstemmelse, hvis der er sket et juridisk kønsskifte. Der findes (endnu?) ikke i den danske officielle statistik rene opgørelser af hverken biologisk køn eller kønsidentitet. 

Referencer:
Morten Frisch, Ellen Moseholm, Mikael Andersson, Josefine Bernhard Andresen & Christian Graugaard: “Sex i Danmark — Nøgletal fra Projekt SEXUS 2017-2018”, Statens Serum Institut og Aalborg Universitet, 2019 (Link)
Matt Jans, Bianca D. M. Wilson, and Jody L. Herman: “Measuring Aspects of Sexuality and Gender: A Sexual Human Rights Challenge for Science and Official Statistics”, CHANCE februar 2018 (Link)


Covid-19 rammer verdens lande forskelligt

02/11/2021          Taleboble Kommentarer

I Danmark har vi tilsyneladende fået Covid-19 krisen nogenlunde under kontrol. De fleste restriktioner er afviklet, og livet er på vej tilbage til det normale, selvom tilbageslag stadig ikke kan udelukkes. Prisen i form af økonomiske omkostninger og begrænsninger i dagliglivet har været høj, men på helbredsområdet har det positive resultatet af indsatsen været overbevisende. Der vil sandsynligvis senere vise sig nogle langsigtede helbredsskadelige virkninger af bl.a begrænsningerne i sociale kontakter, men på en så central variabel som den samlede dødelighed, har virkningen været klar — under krisen har dødeligheden ikke været højere end den var før krisen. Det betyder naturligvis ikke, at covid-19 ikke har kostet dødsfald, men at kriseforanstaltningerne har resulteret i et fald i dødelighed i forbindelse med andre sygdomme — f.eks. influenza — der har opvejet covid-19’s virkninger.

Sådan er situationen i øjeblikket i Danmark og nogle få andre lande. Men pandemien er langtfra slut, og kræver i de fleste lande stadig sin pris i form af overdødelighed. Overdødelighed defineres som forskellen mellem det samlede antal døde i en periode og det antal, man ville forvente under normale forhold. Overdødeligheden under pandemien er ikke et præcist mål for dens effekt — andre faktorer kan spille ind — men det er det eneste, der kan opgøres nogenlunde sammenlignelige tal for. Mere direkte mål for antallet af døde med eller af covid-19 opgøres i mange lande, men metoder og dækningsgrad er så forskellig, at sammenligning ikke er mulig.

Selvom overdødeligheden i princippet er et anvendeligt mål ved en landesammenligning af pandemiens virkninger, så er det ikke så enkelt at skabe et samlet overblik over situationen i alle verdens lande. I mange lande, og det gælder mange meget befolkningsrige lande som Indien og Kina, råder man ikke over de data, der er nødvendige for beregningen. Tidsskriftet The Economist har søgt at trodse vanskelighederne, og estimeret overdødeligheden i næsten alle verdens lande på grundlag af tilgængelig statistik suppleret med modelberegninger.

Dette simple mål for overdødelighed har dog begrænset værdi ved landesammenligninger. Det skyldes, at covid-19 er langt mere dødelig for ældre end for yngre. En høj overdødelighed i et land kan således helt eller delvis afspejle en ældre befolkning. The Economist har derfor også beregnet et mål for overdødelighed, der søger at tage højde for disse demografiske forskelle. Der kan dog stadig være andre relevante forskelle mellem landene, som modellen ikke tager højde for.

The Economist beregner også et mål for usikkerheden på skønnene og lægger ikke skjul på, at der for mange landes vedkommende er tale om en betydelig usikkerhed. På den anden side ligger skønnene for mange lande så langt over de officielle data, at der ikke kan være tvivl om, at det officielle billede undervurderer problemerne. I figuren nedenfor vises overdødeligheden, korrigeret for demografiske forskelle, for regioner. Medianen for hver region er markeret med en rød stjerne og øvre og nedre kvartil er markeret med pile. Ved at fokusere på medianer kan man danne sig et generelt billede af forskellene mellem regionerne, hvor betydningen af usikkerheden i opgørelsen af de enkelte lande er begrænset.

 

Overdødelighed i regioner

Kilde: Economist: “The pandemic’s true death toll”

Det fremgår, at der er betydelige forskelle mellem regionerne. Oceanien, der omfatter Australien, New Zealand og en række små østater, har klaret sig bedst. Værst står det til i Afrika, og Vestlige og Sydlige Asien.

Referencer
Economist: “The pandemic’s true death toll”, (link 30/10/2021)
Economist: “Covid-19-the-economist-global-excess-deaths-model (link 1/10/2021)
Economist: “How we estimated the true death toll of the pandemic” (link 13/0-2021)


Definition af køn i den skotske folketælling

05/10/2021          Taleboble Kommentarer

Opgørelser af befolkningens fordeling på køn og alder er, og har altid været, et vigtigt planlægningsværktøj for staten, bla. i forbindelse med udskrivning af soldater, opkrævning af skatter og tilrettelæggelse af ældreforsorg og skolebyggeri. Det var derfor praktisk, at netop køn og alder kunne betragtes som befolkningsstatistikkens sikre og stabile grundlag. Fødselstidspunkt, der er grundlag for beregning af alder, og køn blev i et velfungerende samfund bestemt ved hver fødsel, og lå derefter fast gennem hele livet. Så sikker har man i Danmark været på stabiliteten af disse to variable, at man ved indførelsen af Det Centrale Personregister (CPR) i 1968 lod alder og køn indgå i personnummeret, selvom det er en datalogisk grundregel, at identifikationsnumre ikke bør indeholde information, der kan ændres.

Alder har indtil videre fastholdt sin position som en sikker og entydig variabel, men stabiliteten og entydigheden af variablen køn er i de senere år blevet blevet genstand for en voldsom diskussion. Indtil nu har diskussionen kun i begrænset omfang påvirket den officielle statistik, selvom der findes eksempler på tilpasninger af kønsdefinitionen i enkelte specielle officielle statistiske opgørelser, navnlig på sundhedsområdet. Men nu har diskussionen bredt sig til dronningen af al officiel statistik: folketællingen. Et meget markant eksempel er den kommende skotske folketælling for 2022, hvor respondenterne kan angive selvoplevet kønsidentifikation i stedet for biologisk køn.

Den skotske folketælling var oprindeligt planlagt til afholdelse i 2021 ligesom folketællingerne i  den  øvrige del af UK — England, Wales og Nordirland — men blev udsat på grund af covid19-krisen. I det øvrige UK blev tællingstidspunktet fastholdt. I den oprindelige plan var køn defineret på samme måde som i den kommende skotske tælling, men det blev ændret efter at en domstol havde fastslået, at køn skulle forstås som biologisk køn (køn registreret ved fødslen), medmindre der er sket et juridisk kønsskifte, der kræver en særlig procedure og dokumentation af kønsidentitetsforstyrelse. Sagen var rejst af kvindesagsgruppen Fair Play for Women. Dommen har kun direkte gyldighed for England og Wales, og Skotland har som nævnt fastholdt den oprindelige definition. 

Der er stadig kun to svarmuligheder på kønsspørgsmålet: mand eller kvinde, men alle fire folketællinger i UK indeholder også et spørgsmål om  kønsidentitet. Her kan angives om kønsidentitet afviger fra biologisk køn, og hvis det er tilfældet, kan kønsidentitet angives. Det er dog frivilligt at besvare kønsidentitetsspørgsmålet, hvorimod besvarelse af kønsspørgsmålet er obligatorisk. 

Referencer:

Matt Jans, Bianca D. M. Wilson, and Jody L. Herman: “Measuring Aspects of Sexuality and Gender: A Sexual Human Rights Challenge for Science and Official Statistics”, CHANCE februar 2018 (Link, 22/9-2021)
Libby Brooks: “People can self-identify as male or female in Scottish census, says guidance”,  The Guardian 31/8-2021 (Link 16/9-2021)
Alexandra Topping: “Guidance on sex question in census must be changed, high court rules”. The Guardian 9/3-2021 (Link 27/9-2021)


Covid-19 krisens udfordringer for den officielle statistik

21/09/2021          Taleboble Kommentarer

Covid-19 krisen har presset den officielle statistik fra to sider. På den ene side har der været krav om hurtig statistik til belysning af af pandemiens udbredelse og effekterne af tiltagene til at bekæmpe den, og på den anden side har krisen vanskeliggjort dataindsamlingen, og derved skabt problemer for kvaliteten af statistikken. Behovet for hurtig statistik har statistikmyndighederne søgt at imødekomme ved at offentliggøre supplementer til den traditionelle statistik, der kan leveres hurtigt, men ikke nødvendigvis opfylder de sædvanlige kvalitetskrav. Danmarks Statistik  præsenterer en række sådanne supplementer på sin hjemmeside under overskriften COVID-19 – hurtige indikatorer. Kvalitetsproblemerne har der derimod ikke på kort sigt været de store muligheder for at imødegå, på anden måde end ved at gøre brugerne opmærksomme på problemet. Verdensbanken og FN’s statistiske afdeling har søgt at danne sig et overblik over omfanget af de nationale statistikmyndigheders problemer gennem en række spørgeskemaundersøgelser. Tidsskriftet The Economist (Economist 2021) har i en artikel leveret en opsummering og vurdering af resultaterne af disse undersøgelser.

En stor del af de ansatte i alle verdens statistikmyndigheder har under krisen arbejdet hjemmefra og dataindsamling baseret på ansigt til ansigt kontakt med respondenter er stort set ophørt. I et vist omfang har besøgsinterview kunnet erstattes med telefon-, epost- eller internetbaserede interviews, og arbejde hjemmefra har kunnet understøttes af internetbaserede redskaber som videomøder. Men det kræver en veludbygget infrastruktur, som ikke findes alle steder, og navnlig ikke i fattige lande.

Særligt for folketællingerne er krisen opstået på et uheldigt tidspunkt. De fleste lande afholder folketælling hvert tiende år, og efter anbefaling fra FN har næsten alle lande valgt at afholde folketælling i 2020 eller 2021. Nogle lande har valgt at udskyde deres folketælling, og mangler derfor opdaterede data på centrale områder. Andre lande har gennemført tællingen, men har måtte opgive dele af dataindsamlingen, og står derfor med  tællingsresultater af en kvalitet, der er ringere end den sædvanlige. Folketællingerne danner på forskellig måde grundlag fra andre statistikker, så resultaterne af den forringede kvalitet vil kunne mærkes i statistikproduktionen mange år fremover.

Centrale konjunkturstatistikker har også været hårdt ramt af krisen. Det gælder f.eks. opgørelsen af inflationen. En væsentlig del af indsamlingen af prisdata er traditionelt varetaget af prisinspektører, der besøger butikker og restauranter mm, og observerer og registrerer priser på udvalgte produkter. Den metode har været vanskelig at gennemføre. En anden vigtig konjunkturstatistik — opgørelsen af arbejdsløsheden — har haft tilsvarende problemer. 

Danmarks Statistik har på flere måder været i en mere gunstig position end de fleste andre statistikmyndigheder, fordi en stor del af dataindsamlingen sker via offentlige registre, der i stort omfang har fungeret normalt eller næsten normalt under krisen. En vigtig kilde  som momsindberetningerne fra virksomhederne er dog blevet svækket af, at indberetningsfristerne for momsafregning har været udskudt, med heraf følgende problemer for bl.a nationalregnskabet. Men som Economist også påpeger, så er det danske registerbaserede statistiksystem ret unikt. Det har nogle historiske og kulturelle forudsætninger, der gør det vanskeligt for de fleste andre lande at opbygge noget tilsvarende. 

Referencer:
Danmarks Statistik: “COVID-19 – hurtige indikatorer”, (link, 18/7/2021)
Danmarks Statistik: “Nationalregnskabsberegninger set i lyset af COVID19”, 14/52020, (link, 20/7/2021)
Economist: “Covid-19 has stymied governments’ efforts to collect data”, The Economist 25/02/2021 (link,20/9-2021)
The World Bank: “Survey of National Statistical Offices (NSOs) during COVID-19”, The World Bank Brief (link)
The World Bank: “One Year Into the Pandemic : Monitoring the State of Statistical Operations Under COVID-19”, 30/7-2021 (link)
Craig Hammer m.fl.: “National statistical offices still face disruptions and challenges as they adapt to a “new normal”, The World Bank Blogs, 11/8-2021  (link)

 


Første resultater fra USAs folketælling

31/08/2021          Taleboble Kommentarer

De første resultater fra USA’s folketælling for 2020 er kommet. I USA er folketællinger et politisk stridspunkt, fordi resultaterne fra dem danner grundlag for fordeling af både medlemmer af de lovgivende forsamlinger og af forbundets økonomiske ydelser til delstaterne. Ofte inddrages domstolene i striden, og folketællingen for 2020 har ikke været nogen undtagelse i den henseende (se indlæg fra 20/10-2020). Senest er kommet et sagsanlæg fra staten Alabama dels vedrørende en udskydelse af offentliggørelsen forårsaget af Covid19-krisen, og dels vedrørende den metode til beskyttelse af den statistiske fortrolighed, som  Folketællingsbureauet (Census Bureau) har valgt at anvende. Forsinkelsen af offentliggørelsen har betydet, at Alabama ikke har kunnet overholde en tidsfrist vedrørende fastlæggelsen af valgdistrikster fastsat i statens forfatning. Omkring databeskyttelsen er problemet en frygt for at sløringen af resultaterne kan hindre en fair repræsentation af minoriteter og små geografiske områder. Begge påstande blev afvist af federal distriktsdomstol i en kendelse afsagt 30/6 2021.

Den anvendte databeskyttelsesmetode går under navnet differential privacy og har været beskrevet i to tidligere indlæg i denne blog (23/4-2019 og 14/5-2019). En konsekvens af metoden er, at der indlægges støj i resultaterne, således at de offentliggjorte tal afviger lidt fra de faktisk opgjorte. I de fleste tilfælde er afvigelserne små, navnlig set i forhold til samlede usikkerhed, der altid vil være i en folketællingsstatitsik, men i ekstreme tilfælde kan det for meget små populationer give misvisende og i nogle tilfælde meningsløse resultater.

I en erklæring til distriktsdomstolen har John M. Abowd, der er vicedirektør (associate director) for forskning og metode i Folketællingsbureauet, givet en grundig redegørelse for bureauets overvejelser omkring beslutningen om at anvende differential privacy. Fundamentalt set er der tale om en afvejning af to hensyn: respondenternes krav om  fortrolighed og databeskyttelse på den ene side og brugernes krav om detaljerede og præcise opgørelser på den anden. Valget af differential privacy er truffet ud fra en økonomisk efficiensbetragtning. Empiriske undersøgelser har vist, at man ved anvendelse af differential privacy opnår den mest efficiente afvejning mellem de to hensyn.

Hele offentliggørelsesprocessen er på grund af covid-19 krisen forsinket i forhold til de oprindelige planer, men som nævnt er de første resultater nu udkommet. De omfatter en foreløbig opgørelse til brug for fastlæggelsen af valgdistrikter. De endelige og mere detaljerede distriktsdata udkommer den 30. september. Folketællingsbureauet oplyser, at de øvrige opgørelser, herunder detaljeret befolknings- og husholdningsstatistik, følger senere, men har ikke oplyst datoer. Kun opfordret til at holde sig orienteret på deres hjemmeside

Referencer:
John M. Abowd: “Declaration of John M. Abowd” (til US District Court for the Middle District of Alabama), 13/4-2021 (link)


Alle lyver! — Internettet som sandhedsserum?

17/08/2021          Taleboble Kommentarer

Statistikproducenter og -brugere har altid vidst, at manglende ærlighed hos respondenterne omkring kontroversielle og/eller sensitive emner kan give alvorlige skævheder i den færdige statistik. F.eks. må man regne med, at forbruget af tobak, alkohol og bordelbesøg kan være undervurderet i forbrugsundersøgelser, at tid anvendt på motion og avislæsning kan være overvurderet i tidsanvendelsesstudier og at andelen af negative holdninger til minoriteter kan være undervurderet i holdningsundersøgelser. Brugere af statistikken er naturligvis opmærksomme på disse skævheder, og kan tage dem i betragtning i forbindelse med analyser, men det grundlæggende problem — at skævhederne er der, og at man ikke kender omfanget af dem — har man ingen løsning på. Men det er man måske ved at få. Det er i hvert fald den konklusion Seth Stephens-Davidowitz — forsker i dataanalyse og datajournalist ved New York Times — når frem til i en veloplagt og indholdsmættet bog: Everybody Lies, Big Data, New Data and What the Internet Can Tell Us About Who We Really Are (Stephens-Davidowitz, 2017).

Årsagen til skævhederne er, at respondenterne i de traditionelle statistiske undersøgelser kan have et ønske om at fremstå positivt med socialt anerkendte vaner og holdninger, også selv om de loves fuld annonymitet. Derimod har de kun et svagt eller intet incitament til at sige sandheden. Ved informationssøgning på internettet er det omvendt. Her kan man kun få den information man søger, ved at være ærlig i sine søgetekster. Søger man f.eks. links til racistiske vittigheder er man nødt til at afsløre det i sine søgetekster. Stephens-Davidowitz’s pointe er, at man ved at analysere søgetekster kan få et mere realistisk indblik i udbredelse af kontroversielle holdninger og adfærd end det er muligt i traditionelle undersøgelser. Internettet kan på den måde fungere som sandhedsserum.

Rollen som sandhedsserum er en vigtig side af anvendelsen af søgeord som datakilde, men metoden er også anvendelig på områder, hvor respondenterne ikke har incitamenter til at lyve. Anvendelse af metoden kræver naturligvis, at der udvikles egnede analysemetoder, men den udvikling er i fuld gang, og Stephens-Davidowitz er selv en af de store bidragsydere. Han har bl.a. brugt metoden til undersøgelser af racismes indflydelse på Barack Obamas valgresultater , udbredelsen homoseksualitet, forskelle i opdragelsen af piger og drenge og årsager til depression.

Når vi (og Stephens-Davidowitz) taler om internetsøgning er det oftest Google-søgninger der tænkes på, og det er da også Google-søgninger, der er hovedgrundlaget for Stephens-Davidowitz’s undersøgelser. Og det datagrundlag stiller Google gratis til rådighed for alle i form af Google Trends. Grundlæggende er Google Trends meget simpelt at anvende. Man indtaster et søgeemne eller en søgesætning og får som svar en graf, der viser et indeks for udviklingen i emnets eller sætningens popularitet (andelen af samtlige søgninger) over en periode. Der ligger data tilbage til 2004. Google trends giver ikke baggrundsoplysninger om hvem, der har søgt, bortset fra en geografisk opdeling. En vigtig del af Dawidovitz’s metode består i at sammenholde søgeordsdata fra et geografisk område med data fra andre kilder om samme område.

Davidowitz finder flere styrker ved internettet, som gør det specielt i forhold til mere traditionelle datakilder, men muligheden for at få pålidelige data på sensible områder er den vigtigste. Og den styrke har intet med omfanget af data at gøre, så i den sammenhæng er betegnelsen big data misvisende. I tidligere indlæg (f.eks 19/5-2020 og 11/9-2020)  har jeg anvendt den mere sigende betegnelse organiske data, som er foreslået af Robert Groves — tidligere direktør for det amerikanske folketællingsbureau.

Referencer:
Seth Stephens-Davidowitz: “Everybody Lies — Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are”, Harper Collins Publ, 2017


Præsidentvalget i USA — Hvem støttede Trump?

01/06/2021          Taleboble Kommentarer

Ved det amerikanske præsidentvalg i november 2020 og ved indsættelsen af den nye præsident i januar 2021 viste spændingerne og polariseringen i det politiske liv sig tydeligt. Nederlaget for den tidligere præsident, Donald Trump, blev uden for USA nok generelt opfattet som en lettelse, men lettelsen må være blandet med en bekymring over, at Trump stadig havde stor opbakning. Det har naturligt nok givet anledning til overvejelser om, hvem der egentlig var Trumps støtter. Et bud har været vrede og/eller skuffede gamle, hvide mænd. Catalist — et non-profit analyseinstitut med tilknytning til Demokraterne — har leveret et statistisk grundlag for en nærmere belysning af dette spørgsmål. Graden af skuffelse og vrede bliver ikke belyst af Catalist, men med hensyn til race, køn og alder støtter deres data antagelsen om gamle, hvide mænd.

Tabel 1: Trumps andel af stemmerne (pct.) ved præsidentvalget i 2020, fordelt på køn, race og uddannelse.

Mænd Kvinder
Hvide Kort uddannelse 66 58
Lang eller mellemlang uddannelse 49 41
Hvide i alt 59 52
Ikke-hvide Kort uddannelse 30 20
Lang eller mellemlang uddannelse 31 21
Ikke-hvide i alt 31 21

Kilde: Catalist detailed data (link)

Af tabel 1 fremgår det helt klart, at der blandt hvide mænd var et markant flertal for Trump. Men det fremgår også, at Trump havde flertal blandt hvide kvinder. Til gengæld stod Trump meget svagt blandt ikke-hvide, og navnlig blandt ikke-hvide kvinder. Vurderet ud fra denne tabel, er det de ikke-hvide og kvinderne, der sikrede valgsejren til Trumps modkandidat, Joe Biden.

En anden interessant observation fra tabel 1 er uddannelsesniveauets betydning for stemmeafgivelsen. Blandt de hvide er tilslutningen til Trump højest blandt de lavest uddannede, mens uddannelsesniveauet ikke gør nogen forskel hos de ikke-hvide.

I det datamateriale Catalyst har offentliggjort findes ingen opgørelse, der sammenholder alder med race eller køn, men ser man isoleret på alder, er der en klar tendens til at Trumps stemmeandel er stigende med stigende aldersgruppe (tabel 2). Mest markant ses for den del af befolkningen, der bor på landet og i forstæderne. De ses også af tabellen, at Joe Biden først og fremmest fandt sin opbakning i byerne.

Tabel 2: Trumps andel af stemmerne (pct.) ved præsidentvalget i 2020, fordelt på bymæssighed og alder.

Alder Bymæssighed
By Forstad Land i alt
18-19 22 36 56 37
30-44 23 40 63 41
45-64 31 50 70 52
65+ 31 50 66 52
I alt 27 46 66 47

Kilde: Catalist detailed data (link)

Analysen er baseret på en såkaldt “voter file”, dannet på grundlag af data fra folketælling og valglister, kombineret med forskellige supplerende kilder.  Sammenfletningen af data fra de forskellige kilder er i mange tilfælde baseret på modeller og forudsætninger, der bidrager til usikkerhed omkring resultaterne og tilskynder til forsigtig tolkning. Flere institutioner vedligeholder sådanne voter files, der bl.a. spiller en stor rolle for partiernes planlægning af valgkampe. Catalist, som står bag den her refererede analyse,  er en non-profit organisation, der støtter Demokraterne. 

Referencer:
Yair Ghitza og Jonathan Robinson: “What Happened in 2020”, Catalist (link)
Catalist: Catalists hjemmeside (link)


Livskvalitet og indkomst

18/05/2021          Taleboble Kommentarer

Højere indkomst fører til højere livskvalitet, i hvert fald når indkomsten er under et vist niveau. Så langt er der bred enighed blandt forskere af livskvalitet, somme tider også kaldet lykke. Der er også bred enighed om, at den gevinst i livskvalitet (lykke), der følger af en indkomststigning på 1000 kr. er større hvis indkomsten i forvejen er lille, end hvis indkomsten i forvejen er stor. Det er det økonomer kalder faldende grænsenytte. Uenigheden opstår, når talen er om hvor stor indkomsten skal være, før den faldende grænsenytte for alvor sætter ind.

Den mest almindelige metode til måling af livskvalitet er at stille en række forsøgspersoner et spørgsmål af typen “Alt i alt, hvor tilfreds er du med dit liv“ og derefter analysere svarene. Livskvalitet opgjort på den måde tilstræber at vise svarpersonernes velovervejede opfattelse af deres generelle livssituation og betegnes vurderet livskvalitet. Et andet aspekt af livskvaliteten, den såkaldte oplevede livskvalitet, vedrører den umiddelbare følelse af tilfredshed på et konkret tidspunkt. Det er et mere flygtigt begreb og er vanskeligere at måle bl.a fordi det er vanskeligt at få pålidelige svar, hvis ikke spørgsmålet stilles umiddelbart efter det konkrete tidspunkt.

Den hidtidige forskning giver god grund til at antage, at der er positiv sammenhæng mellem vurderet livskvalitet og indkomst. Oplevet livskvalitet er langt svagere belyst. En udbredt hypotese har været, at sammenhængen med indkomst er positiv indtil et vist niveau (omkring 75.000 $ i årsindkomst) men at indkomst herudover ikke bidrager til øget oplevet livskvalitet. Den hypotese bliver nu udfordret af Matt Killingsworth, seniorforsker ved University of Pennsylvania, i en nylig udkommet artikel.

Killingsworth anvender data indsamlet via mobiltelefoner fra ca. 33.000 erhvervsmæssigt beskæftigede personer i alderen 18-65 år og bosiddende i USA. På tilfældige tidspunkter i løbet af arbejdsdagen er de blevet ringet op, og bedt om at beskrive deres oplevede livskvalitet umiddelbart før opkaldet gennem det simple spørgsmål: “hvordan har du det lige nu”. Ved tilmeldingen til undersøgelsen er deltagerne blevet spurgt om deres samlede husstandsindkomst før skat og om deres vurderede livskvalitet. Mere en 1,7 mio svar indgår i hans undersøgelse.

Hovedresultaterne er vist i figuren nedenfor. Resultaterne viser en klar positiv sammenhæng mellem indkomst og både vurderet og oplevet livskvalitet, men sammenhængen er lidt stærkere for den vurderede livskvalitet. Antagelsen om, at indkomst over et vist niveau ikke øger livskvaliteten bliver således ikke bekræftet, men det er på den anden side også tydeligt, at den forøgelse i livskvalitet, der følger af øget indkomst, er mindre for de højeste indkomster.  

Figur: Sammenhæng mellem indkomst og livskvalitet i USA

Kilde: Killingsworth(2021), Grafik: Veusz

Analysen er baseret på personer, der på eget initiativ har tilsluttet sig projektet, så der er ingen garanti for repræsentativitet. Men Killingsworth mener på grundlag af nærmere granskning af besvarelserne — bl.a er datagrundlaget meget omfattende, og fordelingen på centrale variable afviger det ikke voldsomt fra forholdene i den samlede amerikanske befolkning — at der er grund til at antage, at resultatene lader sig generalisere.

Referencer:
Matthew A. Killingsworth: “Experienced well-being rises with income, even above $75,000 per year”, PNAS January 26, 2021 118 (4) e2016976118 (link)


Covid19-krisens spor i nationalregnskabet for 2020

04/05/2021          Taleboble Kommentarer

Samfundet har i 2020 været præget af hele eller delvise nedlukninger, med deraf følgende begrænsninger i den økonomiske aktivitet. Det har naturligvis også vist sig i den økonomiske statistiks beskrivelse af udviklingen. I tabel 1 vises udviklingen i husholdningernes og virksomhedernes indkomst og  opsparing i 2020 således som den afspejles i nationalregnskabet. 

Tabel 1: Husholdningers og virksomheders indkomst og opsparing i 2020

Mia. kr 2020 Ændring fra 2019
Hushold-ninger1 Selska-ber  I alt Hushold-ninger1 Selska-ber I alt
Virksomhedsoverskud 101 330 432 2 -8 -7
Lønindkomst 1.187 0 1.187 11 0 11
Formueindkomst(netto) 83 -16 68 -16 16 0
Sociale ydelser 459 -76 383 24 -4 21
Div.overførsler 94 51 145 0 -2 -1
Indtægter i alt 1.924 290 2.214 21 2 23
Indkomst og formueskatter 644 61 705 10 -10 0
Socialsikringsbidrag 96 -76 20 4 -4 1
Diverse overførsler 59 73 132 0 -13 -13
Udgifter i alt 800 57 857 14 -26 -12
Disponibel indkomst 1.125 232 1.357 7 28 36
Forbrug 1.059 0 1.059 -18 0 -18
Opsparing 66 232 298 25 28 53

Anm: Nettoopgørelse, dvs afskrivninger er fratrukket.
Note: 1 Omfatter også non-profit institutioner rettet mod husholdningerne
Kilde: Danmarks Statistikbank/NAS02 

Overraskende nok ser en så væsentlig post som den disponible indkomst for husholdninger og virksomheder under et  ikke ud til at være påvirket. Stigningen på 36 mia. kr. — svarende til 2,6 pct — virker ikke påfaldende sammenlignet med tidligere år.  

Ser man på husholdninger og selskaber hver for sig er udviklingen mere markant. Stigningen er koncentreret på selskaberne, hvorimod husholdningernes disponible indkomst på det nærmeste har været uændret. En væsentlig del af forklaringen er, at selskabernes betaling af udbytter i stort omfang blev suspenderet i 2020. Det afspejler sig i posten formueindkomst, hvor udbytterne er udgift for virksomhederne men indkomst for de husholdninger, der ejer aktier. Den manglende udbyttebetaling vil afspejle sig i en forøgelse af selskabernes formue, og dermed i aktiernes værdi. Hvad husholdningerne således har mistet i udbytteindtægter har de vundet tilbage i værdistigning på aktierne. Det afspejles i nationalregnskabets finansielle konti, som jeg dog ikke vil komme nærmere ind på i dette indlæg.

I tabel 2 belyses det lidt nærmere, hvordan virksomhedsoverskuddet er sammensat, og her bliver krisens virkninger tydeligere. Her fremgår det klart, at produktionen, målt ved værditilvæksten, er faldet med 33 mia. kr., svarende til 2,6 pct., og når både virksomhedsoverskud og  lønudbetalinger har kunnet opretholdes nogenlunde uændret, så skyldes det en forøgelse af produktionssubsidierne på 29 mia. kr., svarende til mere end end fordobling.

Tabel 2: Virksomhedsoverskud i 2020

mia. kr. 2020 Ændring fra 2019
Hushold-ninger1 Selska-ber I alt Hushold-ninger1 Selska-ber  I alt
1: Nettoværditilvækst 171 1.100 1.271 -5 -28 -33
2: Produktionssubsidier 14 40 54 6 23 29
3: Produktionsskatter 20 31 51 -1 -1 -2
4. Lønudgifter 64 778 842 1 -2 -1
Virksomhedsoverskud (1+2-3-4) 101 330 432 2 -8 -7

Anm: Nettoopgørelse, dvs afskrivninger er fratrukket.
Note: 1 Omfatter også non-profit institutioner rettet mod husholdningerne
Kilde: Danmarks Statistikbank/NAS01 

Det er således kun takket være en forøgelse af det offentliges udgifter til subsidier, at den private sektors virksomhedsoverskud har kunnet opretholdes. For opretholdelsen af den samlede disponible indkomst har yderligere en forøgelse af sociale ydelser fra det offentlige (jf. tabel 1) spillet en vigtig rolle. Dertil kommer, at det offentlige har haft betydelige udgifter i form af kapitaloverførsler (navnlig erstatninger til minkavlere) der ikke fremgår af nationalregnskabets opgørelse af disponibel indkomst og opsparing. Som følge heraf er den samlede offentlige saldo gået fra et overskud på 88 mia.kr. i 2019 til et underskud på 27 mia. i 2020. Det er naturligvis foregået velovervejet og netop med det formål at afbøde krisens virkninger for den private sektor. Heldigvis er de offentlige finanser efter flere år med positiv saldo i så god stand, at der ikke umiddelbart er grund til bekymring.

De viste tal for nationalregnskabet for 2020 er meget foreløbige, og navnlig i forbindelse med  de mange nye ordninger vedrørende subsidier, sociale overførsler og kapitaloverførsler, der er etableret i forbindelse med covid-19 krisen, er Danmarks Statistik stadig i gang med overvejelser om, hvordan de skal behandles i nationalregnskabet.

Referencer:
Danmarks Statistik: “Statistikbanken tabel NAS01 og NAS02” (link)
Danmarks Statistik: “Klassifikation af corona-hjælpepakker”, 11/2-2021 (link)


Globalisering og nationalregnskab

20/04/2021          Taleboble Kommentarer

Bruttonationalproduktet (BNP) er klart det bedst kendte og mest anvendte af den økonomiske statistiks begreber. Det er et udtryk for den værditilvækst, der skabes i et land gennem produktionen, og opgøres som forskellen mellem værdien af den samlede produktion af varer og tjenester (produktionsværdien) og værdien af de varer og tjenester, der anvendes i produktionen (forbrug i produktionen, eller på engelsk: input).

Da begrebet for alvor blev introduceret i den officielle statistik efter anden verdenskrig afspejlede det danske BNP næsten udelukkende økonomisk aktivitet på dansk territorium. Det har ændret sig i de senere år, hvor en stigende del af den aktivitet, der afspejles i BNP, sker på udenlandsk territorium. At en del af det danske BNP skabes i udlandet skyldes, at der i opgørelsen af BNP — og nationalregnskabet i øvrigt — ikke tages udgangspunkt i territoriet, men i ejerskabet til produkterne. F.eks. kan en dansk virksomhed købe varer i udlandet og videresælge dem i udlandet, uden at varerne på noget tidspunkt kommer til Danmark. Det kaldes i statistikken merchanting. En dansk virksomhed kan også sende varer til videreforarbejdning på en udenlandsk fabrik, hvor varerne enten leveres fra Danmark eller købes i udlandet, og derefter sælge de forarbejdede varer enten i Danmark eller udlandet. Det kaldes i statistikken processing. Værditilvæksten ved både merchanting og processing indgår i det danske nationalprodukt, selv om aktiviteterne foregår i udlandet, da de involverede varer er ejet af virksomheder med hjemsted i Danmark. 

Omfanget af merchanting og processing opgøres ikke særskilt i nationalregnskabet, men Danmarks Statistik har i en Analyse (Thomsen og Knudsen, 2021) redegjort for, hvordan de to størrelser kan belyses ved inddragelse af udenrighandels- og betalingsbalancestatistikken. Ved denne metode kan merchantings og processings bidrag til produktionsværdien opgøres, men ikke bidraget til BNP, da den andel af forbrug i produktionen, der skal henføres til merchanting og processing kun kan opgøres delvist. Thomsen og Knudsen belyser i deres analyse også dette delvise bidrag, men i dette blogindlæg vil kun produktionsværdien blive omtalt

Figur: Andelen af processing og merchanting i samlet produktionsværdi og i produktionsværdien for brancherne engroshandel og industri


Kilde: Danmarks Statistikbank/NABP10, NABP69, NAHL2 og BBUHV, Grafik: Veusz

Som det fremgår af figuren ovenfor, er merchanting og processing i alt vokset fra at udgøre ½ pct. af den samlede produktionsværdi i 2005 til at udgøre 2,9 pct. i 2020. Det er mere end en femdobling af andelen, selv om der er tale om beskedne andele, når man betragter den samlede økonomi. Fokuserer man på de hovedbrancher, aktiviteterne henføres til — industri for processings vedkommende og engroshandel for merchantings vedkommende — bliver det tydeligere, hvor markant udviklingen har været, jf. figuren. For industriens vedkommende er andelen tidoblet. For engroshandelen er andelen er “kun” tredoblet men udgør nu 18 pct. For engroshandelen har andelen vist en jævnt stigende udvikling siden 2004, men for industrien steg andelen kun frem til 2016, hvor andelen var 9,3 pct. Fra 2017 har andelen ligget stabilt på lidt under 8 pct.

Referencer:
Annette Thomsen og Dan Knudsen:
“Hvordan indgår dansk produktion af varer i udlandet i nationalregnskabet?”, Danmarks Statistik Analyse 2021:05, 25. marts 2021 (link)


Dødelighed blandt Europas unge

06/04/2021          Taleboble Kommentarer

Den 30. marts kunne Danmarks Radio bringe den triste nyhed, at antallet af selvmord blandt unge kvinder (20-24 år) var steget fra 5 i 2019 til 17 i 2020, svarende til mere end en tredobling. Kilden er en foreløbig opgørelse fra Dødsårsagsregistret, som DR Nyheder har rekvireret hos Sundhedsdatastyrelsen. Danmarks Statistik forventer først at offentliggøre den endelige opgørelse af dødsårsager for 2020 i begyndelsen af 2022, men det samlede antal dødsfald i 2020 er offentliggjort, jf. tabellen nedenfor. Som det fremgår er det samlede antal dødsfald blandt 20-24 årige kvinder steget med 8 fra 2019 til 2020.  Ifølge den foreløbige opgørelse skulle antallet af selvmord være steget med 12, dvs. at antallet af dødsfald af andre årsager skal være faldet. Det er jo ikke umuligt, men dog udtryk for en temmelig drastisk ændring af det hidtil kendte mønster.

Tabel: Dødsfald blandt 20-24 årige, Danmark 2019  og 2020

2019 2020
Kvinder Dødsfald 31 39
Heraf selvmord 5 ?
Mænd Dødsfald 80 82
Heraf selvmord 23 ?

Kilde: Danmarks Statistikbank/DOD og DOD1

En nærmere afklaring af, om der virkelig er sket så drastiske ændringer må afvente mere detaljerede data. Det er ikke sædvanligt, at der sker så drastiske ændringer i fordelingen på dødsårsager, men naturligvis kan covid-19 have gjort 2021 til en undtagelse. I det følgende vil jeg sammenligne dødeligheden blandt unge i europæiske lande på grundlag af data fra EU’s statistikbank, hvor 2018 er det seneste år, for hvilket der findes oplysninger for en større gruppe lande. Unge omfatter her 15-29 årige, altså en bredere gruppe end de 20-24 årige. Det er naturligvis de officielt registrerede opgørelser, der sammenlignes. Kulturelle forskelle mellem landene kan  have betydning for fastlæggelsen af dødsårsagen. Det kan navnlig tænke at have betydning for, hvornår et dødsfald registreres som selvmord.

Heldigvis er dødsfald blandt unge mennesker (15-29 år) ret sjældne. Som det fremgår af figur 1, så er dødeligheden, opgjort som antal dødsfald pr. 1000 personer, for mændenes vedkommende langt under 1 i de fleste lande. For kvindernes vedkommende er dødeligheden i alle lande under 0,4. Danmarks placering er angivet ved en rød pil.

Figur 1: Dødelighed blandt 15-29 årige i europæiske lande, 2018

Kilde:  EU’sStatistikbank/hlth_cd_aro og demo_pjangroup

I figur 2 (Kvinder)  og figur 3 (Mænd) er dødsårsagerne belyst nærmere i trekantgrafer (om læsning af trekantgrafer se tidligere indlæg). Den procentvise fordeling på de tre årsager: sygdom, selvmord og ulykker og andet, aflæses på de tre skalaer, og den samlede dødelighed er angivet med samme farvekode som er anvendt i figur 1. 

Figur 2: Dødsårsager blandt 15-29 årige kvinder i europæiske lande, 2018


Kilde: EU’s Statistikbank, hlth_cd_aro og demo_pjangroup

Som det fremgår af figur 2, så er sygdom den hyppigste og ulykker den næsthyppigste dødsårsag for unge kvinder i de fleste af landene. Norge, Sverige og Finland udgør markant undtagelse fra normalbilledet, med relativt store andele for både selvmord og ulykker. 

Figur 3: Dødsårsager blandt 15-29 årige mænd i europæiske lande, 2018

Kilde: EU’s Statistikbank, hlth_cd_aro og demo_pjangroup

For de unge mænds vedkommende (figur 3) er den samlede dødelighed, som allerede påpeget, væsentligt højere, og fordelingen på årsager markant anderledes. Sygdom er ikke nær så dominerende som dødsårsag, men navnlig ulykker, og her er især tale om trafikulykker, spiller en langt større rolle.

Som påpeget i begyndelsen af indlægget, så kan covid-19 krisen tænkes at have ændret disse mønstre. Men der er vel i så fald også grund til at antage, at der vil ske en tilbagevenden i retning  af 2018-mønstret, når krisen er overstået.

Referencer:
Danmarks Radio: “Selvmord blandt unge kvinder er det højeste i 20 år”, DR’s hjemmeside (link,1/4-2021)


Remitter — pengeoverførsler til husholdninger fra udlandet

02/03/2021          Taleboble Kommentarer

Udgangspunktet for al indkomst er den værdi, den samlede produktion af varer og tjenester skaber. For stort set alle lande findes en opgørelse af denne værdiskabelse, selv om kvaliteten kan være varierende. Den opgjorte størrelse betegnes nationalproduktet (BNP). Men selvom BNP er udgangspunktet for indkomsten, så fortæller internationale sammenligninger af BNP langt fra hele historien om fordelingen af indkomst mellem verdens lande. Det skyldes, at det ikke er hele et lands BNP, der tilfalder dets egne borgere. En del overføres til andre lande f.eks. i form af løn til ansatte med bopæl i udlandet og renter og udbytter til udlændinge, der ejer aktier i eller har ydet lån til landets virksomheder. Omvendt kan landet naturligvis også ad disse veje få andel i andre landes produktionsværdi. Korrigerer man BNP for disse strømme, når man frem til nationalindkomsten (BNI). Hertil kommer overførsler, der ikke er betaling for bidrag til produktionen, f.eks. gaver o.lign. Korrigeres yderligere for den type overførsler når man frem til den disponible indkomst. Det er den disponible indkomst, der er til rådighed for forbrug og opsparing, og derfor ud fra et velfærdssynspunkt det centrale indkomstbegreb. 

Navnlig for lavindkomstlande kan en særlig type betalinger, der går under betegnelsen personlige remitter (engelsk remittances), have stor betydning som overførsel af en del af produktionsresultatat fra rigere lande. Personlige remitter omfatter dels løn optjent i udlandet af et husstandsmedlem, der jævnligt krydser en landegrænse for at arbejde i udlandet, og dels overførsler fra udenlandske residenter, typisk familiemedlemmer, der permanent eller for en længere periode opholder sig i et andet land. De samlede remitter omfatter, udover de personlige remitter, også sociale ydelser betalt af offentlige eller andre institutioner i et land til husholdninger i et andet.

Selvom begrebet remitter er ret klart defineret i de internationale retningslinjer for statistik (BPM6, Appendix 5), og en opgørelse af dem indgår i FN’s verdensmål (indikator 17.3.2), volder opgørelsen af dem i praksis store problemer for de officielle statistikproducenter, bla. fordi betalingerne ofte sker gennem uformelle og dårligt belyste kanaler. Som kompensation for de mangelfulde officielle opgørelser producerer Verdensbanken en beregning, hvori der indgår modelberegninger, baseret på antallet af immigranter i de forskellige lande, kombineret med nogle forudsætninger om hvor store beløb hver immigrant i gennemsnit sender til personer i sit oprindelsesland. Beregningen omfatter udelukkende de personlige remitter. Jeg har ikke kendskab til opgørelser af de samlede remitter. Nogle hovedtal fra Verdensbankens beregning er vist i tabellen nedenfor.

Tabel: Personlige remitter i pct af BNI, 2019 (Verdensbankens skøn)

Personlig remitter Ulandshjælp Direkte udenlandske investeringer
procent af nationalindkomst (BNI)
Lavindkomstlande 4,83 9,36 2,92
Mellemindkomstlande 1,56 0,20 1,72
Højindkomstlande 0,28 0,00 1,80
Verden 0,76 0,19 1,78

Kilde: Verdensbanken (link)

I tabellen er de personlige remitter sammenholdt med ulandshjælp og direkte udenlandske investeringer —  to andre strømme, der har stor betydning for lavindkomstlandes økonomi.

I forbindelse med covid19 pandemien er der kommet øget fokus på betydningen af remitter. Migranter er særligt udsatte for at blive ramt af pandemiens økonomiske følger,  bla. fordi de ofte har usikre jobs i de hårdest ramte erhverv. Det har givet anledning til frygt for, at omfanget af remitter vil falde hvilket kan få alvorlige følger nogle af modtagerlandene,  hvoraf mange i forvejen er hårdt ramt af krisen

Referencer:
IMF:Balance of Payments and International Investment Position Manual (BPM6)”, November 2013 (link, 23/1-2021)
World Bank: “Phase II: COVID-19 Crisis through a Migration Lens” ,Migration and Development Brief 33, October 2020 (link)
World Bank: “World Development Indicators”, (link, 24/2-1021)


Datarevolution og paradigmeskift — Nye tider for den officielle statistik?

16/02/2021          Taleboble Kommentarer

Ingen tvivl om at alle, der beskæftiger sig med officiel statistik, fornemmer at der i disse år foregår en udvikling, der fuldstændigt kan ændre vilkårene for den officielle statistikproduktion. Store ændringer er allerede sket, og flere er i vente. Nogle af ændringerne har været beskrevet i mange indlæg i denne blog, f.eks. 1/12-2020, 17/11-2020 og 17/9-2019. Stærke ord som datarevolution og paradigmeskift har været anvendt i beskrivelsen af udviklingen. 

Naturligvis er denne fornemmelse af en verden i hastig forandring ikke speciel for den officielle statistiks interessenter, Det er nok en udbredt fornemmelse for interessenter i alle, eller næsten alle, fag. Det er muligvis også en fornemmelse man har haft på andre tidspunkter i historien, uden af eftertiden har set det på samme måde. Måske er fornemmelsen af at stå midt i noget stort blot en form for manglende historisk overblik, hvor man uden at der egentlig er grund til det, ser sin egen tid, som historisk enestående. Men er der, når det kommer til stykket, dækning for at anvende stærke begreber som datarevolution og paradigmeskift? Det spørgsmål har Steve MacFeely — chefstatistiker hos UNCTAD —  underkastet en nærmere og grundigere belysning (MacFeely 2020).

MacFeely går meget grundigt til værks. Han indleder med at definere definere begrebet paradigmeskift ud fra  Thomas Kuhn’s bog “The Structure of Scientific Revolutions”, og begrebet datarevolution ud fra en rapport, A World that Counts, udarbejdet i 2014 af en FN-ekspertgruppe. På det grundlag  identificerer han fire udviklinger, som han ser som kandidater til betegnelsen datarevolution:

1. Definitionen af data udvides til at omfatte flere fænomener
Ordet data betyder det givne, og blev oprindeligt anvendt som betegnelse for den information, det er til rådighed i forbindelse med løsningen af en opgave. For en statistikproducent var data den information, der var indsamlet i form af spørgeskemaer o.lign. til brug for fremstillingen af et statistikprodukt. De teknikker, der var til rådighed, krævede at data var velstrukturerede og umiddelbart egnede som grundlag for optællinger. Objekter, der ikke opfyldte disse krav, f.eks billeder, breve, rapporter og bøger, blev ikke opfattet som mulige data for statistikproduktion.

Det har informationsteknologien ændret på. Billeder og alle skrevne dokumenter kan digitaliseres og derved gøres til genstand for computerbehandling, og både maskinel og det tilhørende programmel er blevet så effektivt, at udledning af struktur i komplekse objekter er blevet mulig. Det har ført til, at billeder og skrevne dokumenter nu er omfattet af statistikbureauernes databegreb.

En anden udvidelse af databegrebet er sket sket  ved at teknologien har medført, at mange aktiviteter nu sætter digitale spor i form af organiske data (eller Big Data). Det gælder f.eks. kredit- og dankorttransaktioner, hvert enkelt varekøb i supermarkedet, browsersøgning og aktivitet på sociale medier. Disse digitale spor kan direkte gøres til genstand for behandling af kraftige computere, og bliver således også omfattet af de nye udvidede databegreb.

2. Øget anvendelse af sekundære fremfor primære data.
Til brug for produktionen af officiel statistik har statistikbureauerne altid indsamlet primære data, dvs data der var tilpasset statistisk brug. Det kunne f.eks. være udfyldte folketællingsskemaer eller prisoplysninger fra butikker. Tidligt i udviklingen af den officielle statistik begyndte statistikbureauerne også at anvende sekundære data, dvs. data, der var indsamlet af andre myndigheder, og som ikke var tilpasset statistisk anvendelse. I de nordiske lande tog den udvikling for alvor fart i løbet af 1960’erne, hvor skattevæsenets og andre myndigheders registre blev gjort til sekundære data for den officielle statistikproduktion. I begyndelsen blev der uden for Norden set med skepsis på denne udvikling, men denne skepsis er for længst forsvundet. I dag betragtes anvendelse af sekundære data for helt nødvendigt, for at officielle statistikproducenter kan løse deres opgave.

3. Opfattelse af data og statistik som offentlige goder
Den officielle statistikproduktion har bevæget sig fra næsten udelukkende at have til til formål at understøtte regeringerne i deres administration, til at spille en vigtig rolle som leverandør af viden om samfundet for alle borgere, virksomheder og institutioner. Det giver sig bl.a. udtryk i, at internationale retningslinjer om officiel statistik lægger vægt på, at officiel statistik skal være pålidelig og stilles til rådighed for alle på lige vilkår.

Denne udvikling er dog kun entydig, for producenter af officiel statistik, men ikke for de private aktører, der ofte er ejere af de nye datatyper, der blev omtalt i forbindelse med udvidelsen af databegrebet, specielt de organiske data. Her er spørgsmålet om offentlighedens adgang mere kompliceret, bl.a fordi disse data betragtes som et økonomisk aktiv, samtidig med at det er under diskussion, hvem der ejer eller hvem der bør eje dem, og dermed have retten til at anvende dem kommercielt.

4. Data og statistik som grundlag for informeret beslutningstagning
Bevidstheden om og kravet til at statistiske data skal indgå som en central del af grundlaget for politiske beslutninger har vundet frem. Udviklingen har været tydelig efter anden verdenskrig, men er accelereret omkring årtusindskiftet, hvor begreber som datadrevet beslutningstagning og new public management kom på mode.

Efter en grundig gennemgang af hver af de fire udviklinger konkluderer MacFeely, at de alle opfylder kriterierne for at kunne betegnes som både datarevolutioner og paradigmeskift. Vi har med andre ord grund til at antage, at fornemmelsen af at stå midt i en betydningsfuld omvæltning ikke blot er udtryk for en forblændelse af vores egen tid, men faktisk er en afspejling af virkeligheden.

Referencer:
Steve MacFeely: “ In search of the data revolution: Has the official statistics paradigm shifted?”, Statistical Journal of the IAOS, December 2020 (link, 12/1-2021)
UN : “A World that counts”, November 2014 (link)


Præsident Bidens første beslutninger vedrørende officiel statistik

02/02/2021          Taleboble Kommentarer

Blandt de mange bekendtgørelser (executive orders) som Joe Biden, USA’s nytiltrådte præsident, udstedte i de første timer efter sin edsaflæggelse, var også en vedrørende den folketælling, der blev afholdt i USA i 2020 (link). Bekendtgørelsen omgør to kontroversielle bekendtgørelser udstedt af den netop afgåede præsident, Donald Trump. Donald Trump havde, som beskrevet i flere tidligere indlæg (bl.a. 7/2-2017 og 19/9-2017), et noget anstrengt forhold til folketællingen, og til andre grene af statistikken for den sags skyld. 

Den ene omgjorte bekendtgørelse vedrører den rolle ulovlige immigranter skal spille i forbindelse med fordelingen af pladser i de folkevalgte forsamlinger, herunder forbundsparlamentet (Repræsentanternes Hus) og  delstaternes parlamenter. Trump havde i en bekendtgørelse besluttet, at ulovlige immigranter ikke skulle indgå i disse optællinger. Da den almindelige antagelse er, at antallet af ulovlige immigranter er størst i de områder, hvor demokraterne står stærkest, betød det en styrkelse af republikanernes stilling i fordelingen. Demokraterne så Trumps bekendtgørelse som et brud på en lang tradition for fortolkningen af forfatningens regler om folketællingen, der gik ud på at alle skulle medregnes, uanset lovligheden af opholdsgrundlaget. Med præsident Bidens omgørelse er man vendt tilbage til den traditionelle tolkning.

Den anden af de to omgjorte bekendtgørelser vedrører registrering af statsborgerskab. Trump-administrationen havde oprindeligt besluttet, at der i folketællingsskemaet skulle indgå et spørgsmål om statsborgerskab. Der var blandt myndighederne i flere stater og byer modstand mod at lade et sådant spørgsmål indgå, fordi man forventede, at det det kunne få nogle immigranter til at modsætte sig registrering (selv om deltagelse i folketællingen er lovpligtig), af frygt for, at oplysningerne kunne blive brugt til at så tvivl deres ret til at opholde sig i USA. Det ville betyde en undervurdering af immigrantbefolkningen, og også her var antagelsen, at det ville styrke republikanerne på demokraternes bekostning. Lovligheden af spørgsmålet blev anfægtet, og Højesteret besluttede at blokere for spørgsmålet, fordi den ikke fandt, at der var overbevisende argumenter for spørgsmålets nytte og nødvendighed. Myndighederne havde andre statistiske kilder til belysning af statsborgerskab. Trump reagerede ved at udstede en bekendtgørlse, der pålagde føderale myndigheder at levere data om statsborgerskab til folketællingsbureauet, der så kunne samkøre oplysningerne med de øvrige indsamlede data. Det er denne bekendtgørelse, der nu er omgjort, således at spørgsmålet om statsborgerskab ikke kommer til at indgå i folketællingsopgørelserne.

Referencer:
US Census Bureau: “Census Bureau Update on 2020 Census”, Press Release 21/1 2021 (link)
The White House: Ensuring a Lawful and Accurate Enumeration and Apportionment Pursuant to the
Decennial Census”, Executive Order of the President, 20/1-2021 (link)


Danmarks Statistiks arbejdsplan for 2021

19/01/2021          Taleboble Kommentarer

For Danmarks Statistik har to begivenheder gjort 2020 til et særligt år. Den ene, covid19-krisen, har været en fælles erfaring for stort set alle — institutioner såvel som personer. Den anden, udnævnelsen af en ny rigsstatistiker (se tidl. indlæg), er institutions-specifik. Begge begivenheder vil få betydning for institutionens fremtidige virke, og det kan allerede spores i den netop udsendte arbejdsplan for 2021. Arbejdsplanen skal jo afspejle den mere langsigtede strategi, som er beskrevet i institutionens strategiplan, men som Bestyrelsen påpeger i sin kommentar til arbejdsplanen, så er der jo ingen grund til ikke at foregribe en fremtidig strategiplan, i det omfang ændringer i strategien allerede er forudset. Det gælder måske særligt denne arbejdsplan, hvor udarbejdelsen af en ny strategiplan er et af punkterne. Som Bestyrelsen også påpeger, bliver den nye strategiplan en god lejlighed for den nye rigsstatistiker til at introducere sine visioner og ambitioner.

Foranlediget af covid19-krisen påbegyndte Danmarks Statistik i 2020, under overskriften Eksperimentel Statistik,  offentliggørelsen af en række statistikker med særlig relevans for belysning af krisen og dens virkninger (se tidl.indlæg). Betegnelsen eksperimentel dækker bl.a. over, at statistikken kan udvikles til at indgå i det almindelige statistikprogram, eller at den kan nedlægges, hvis behovet viser sig at være midlertidigt, eller at kvaliteten viser sig at være for ringe. Arbejdsplanen lægger da også op til, at den eksperimentelle statistik i sin helhed kun videreføres, så længe det er relevant, men at dele af den kan overgå til løbende drift.

Et centralt punkt i arbejdsplanen er etableringen af en særlig enhed, der skal arbejde med forbedring af nationalregnskabet. Fokus er især på bedre overensstemmelse mellem den første og foreløbige opgørelse og den endelige version. Tanken er også at inddrage eksterne interessenter i arbejdet. Andre vigtige planer omkring nationalregnskabet er udarbejdelse af en revideret udgave af dokumentationen af offentliggørelsen af bruttonationalindkomsten (BNI), forbedret opgørelse af den sorte økonomi og videreførelse af det grønne nationalregnskab. Blandt øvrige planer kan nævnes bedre integration af udenrigshandels- og betalingsbalancestatistik, med henblik på bedre belysning af globaliseringen, indarbejdelse af nye typer af organiske data (big data) og introduktion af en mere intuitiv struktur i statistikbanken og på hjemmesiden.

Referencer:
Danmarks Statistik: “Arbejdsplan 2021”, januar 2021 (link, 15/1-2021)
Danmarks Statistik: “Statistikprogram 2021”, januar 2021 (link, 15/1-2021)
Danmarks Statistik: “Strategi 2022 – Revideret”, december 2020 (link, 15/1-2021)
Danmarks Statistik: “Eksperimentel statistik COVID-19”, december 2020 (link, 16/1-2021)


EU-statistikken efter Brexit

12/01/2021          Taleboble Kommentarer

Da UK forlod EU den 1. februar 2020, fik det i første omgang kun begrænsede følger for EU-statistikken, herunder EU’s statistikbank. I den overgangsaftale, der blev indgået, indgik en fortsættelse af  UK’s indberetninger af statistik til EU’s statistikenhed — Eurostat — og Eurostat fortsatte offentliggørelsen af den indberettede statistik. Men den 1. januar 2021 udløb overgangsaftalen, og UK er herefter ikke længere omfattet af EU’s statistiksamarbejde.

Samarbejdet mellem UK og EU er nu reguleret i en handels- og samarbejdsaftale, som blev indgået den 30.december 2020. Aftalen indeholder enkelte bestemmelser om udveksling af statistik, der er nødvendig, for at aftalen kan fungere. Det gælder f.eks. bruttonationalproduktet (BNP), der indgår i beregningen af det bidrag (operational contribution), UK skal betale for fortsat at deltage i nogle få udvalgte EU-programmer. Af størst betydning set fra den officielle statistiks synsvinkel er en kort paragraf, der lægger op til en særlig statistikaftale mellem Eurostat og UK’s statistikmyndighed.

Indtil en aftale er indgået vil Eurostat ikke opdatere data om UK, men allerede offentliggjorte data vil fortsat være tilgængelige i statistikbanken. UK er i landelisterne flyttet fra gruppen af EU-lande til gruppen af lande, der indberetter statistik til EU, uden at være medlemmer. Udover UK omfatter gruppen bl.a. Norge, Island og Schweiz. 

Det må være i  begge parters interesse fortsat at kunne indgå i sammenlignelige statistiske opgørelser, så mon ikke der indenfor relativ kort tid vil blive indgået en aftale, der vil sikre, at en stor del af opgørelserne i EU’ statistikbank kan videreføres med data også fra UK.

Referencer:
Eurostat: “Dissemination of European Statistics after Brexit”,  (link, 8/1-2021)
Council of the European Union: “Trade and Cooperation Agreement”, (link, 10/1-2021)


Folketællinger i EU og resten af verden

15/12/2020          Taleboble Kommentarer

Alverden skrives i mandtal i disse år. Det sker ikke på befaling fra Kejser Augustus, men på anbefaling af FN’s Økonomiske og Social Råd (Economic and Social Council of the United Nations, ECOSOC), og selvom en anbefaling fra ECOSOC i det 21. århundrede ikke underbygges af samme magt og autoritet som en befaling fra en romersk kejser omkring år 0, så afholdes der faktisk folketælling i næsten alle verdens lande i disse år.

ECOSOC anbefaler at folketælling så vidt muligt afholdes i 2020 eller 2021. Kina og Indien, der er verdens suverænt folkerigeste lande, og tilsammen rummer mere end en tredjedel af den samlede verdensbefolkning på 7,8 mia., har fastlagt hhv. 2020 og 2021 som folketællingsår. I Kina er folketællingen i fuld gang, men i Indien vil Covid19-situationen sandsynligvis nødvendiggøre en udsættelse. USA’s folketælling blev gennemført i år* og 2021 bliver EU’s folketællingsår. En lille gruppe lande har afholdt deres folketællinger i perioden  2015-2019, og enkelte har planlagt at afholde dem i 2022 eller senere, men langt de fleste følger anbefalingen om 2020 eller 2021. Kun ganske få lande har hverken gennemført eller planlagt en folketælling.

I en traditionel folketælling indsamles data ved, at der rettes henvendelse til hver enkelt husstand — personligt eller gennem postvæsenet. Det er en velprøvet metode, og i mange henseender den mest hensigtsmæssige, fordi den giver statistikproducenten fuld kontrol over hele processen. Men metoden er kostbar. En langt billigere fremgangsmåde er at basere opgørelsen på eksisterende administrative registre, f.eks. skattevæsenets og de sociale myndigheders registre, og/eller egentlige folkeregistre, som det danske CPR. Men i de fleste af verdens lande findes sådanne registre ikke, eller de er for ufuldstændige eller upålidelige til  at kunne anvendes som folketællingsgrundlag. Derfor gennemføres folketællingerne i to tredjedele af verdens lande efter den traditionelle metode (Mrkić, s. 37). I den resterende tredjedel anvendes registre enten alene eller i kombination med supplerende dataindsamling, evt i form af stikprøveundersøgelser**.

Rammerne for EU-landenes folketællinger er fastlagt i en forordning, hvis regler ligger indenfor FN’s retningslinjer. Med hensyn til metoder giver forordningen landene meget vide rammer. Derimod opstilles der ret præcise krav til hvilke data, der skal leveres. Resultaterne fra EU-landenes folketællinger vil blive offentligt tilgængelige gennem EU’s Census Hub (se tidl indlæg), hvor resultaterne fra EU-folketællingen i 2011 allerede findes (link). Landene skal levere data til Census Hub inden 1. april 2024.

I Danmark har der ikke været afholdt folketællinger siden 1981, og der kommer heller ingen folketælling i 2021. Som EU-medlem er Danmark naturligvis forpligtet til at levere en folketællingsopgørelse til EU, men det kan Danmarks Statistik gøre ud fra den eksisterende statistik. Den løbende registerbaserede statistik indeholder alle de data, der normalt indsamles ved en folketælling, herunder de data EU kræver indberettet, så en egentlig folketælling er overflødig.

* Den amerikanske folketælling har tidigere være behandlet i flere indlæg i denne blog (20/10-2020, 4/2-202014/5-201912/6-201819/9-2017 og 23/5-2017)

** Korte beskrivelser af forskellige typer af folketællinger kan findes i et tidligere indlæg (link)

Referencer:
Srdjan Mrkić: The 2020 round of population and housing censuses: An overview, Statistical Journal of the IAOS, vol. 36, no. 1, pp. 35-42, 2020 (link)
UNSD: Webside – World Population and Housing Census Programme(website), (link)
Eurostat: “EU legislation on the 2021 population and housing censuses”, 2019 (link)
EU: “Census Hub”,  (link)


Trafikkameraer som grundlag for statistik

01/12/2020          Taleboble Kommentarer

Covid19-krisen har rejst en efterspørgsel efter nye typer af statistik, der kan belyse krisens udvikling og effekten af de politiske tiltag, der sættes i værk for at holde den under kontrol. De nationale statistikmyndigheder — herunder Danmarks Statistik (se tidl. indlæg) — har været hurtige til at søge at imødekomme de nye behov ved at udvikle og offentliggøre nye statistikker, ofte af eksperimentel karakter. Det er navnlig statistik om udviklingen i økonomiske forhold — både nationalt og privat — og i befolkningens sundhed og adfærd, der efterspørges.      

Et af eksperimenterne går ud på, at anvende trafikovervågningskameraer som grundlag for statistik over den trafikale aktivitet fordelt på fodgængere og forskellige køretøjstyper. Eksperimentet er iværksat af Office for National Statistics (ONS)  — UK’s officielle statistikmyndighed — og udviklingsarbejdet er udført på Data Science Campus  — en forsknings- og uddannelsesenhed under ONS (se tidl. indlæg). Projektet er næmere beskrevet i et dokumentationsnotat fra Data Science Campus

Udgangspunktet for eksperimentet er, at der i UK findes et meget stort antal trafikovervågningskameraer i drift, som umiddelbart og uden større omkostninger, kan levere et omfattende grundmateriale i form af billeder. Grundlæggende for projektet er anvendelse af programmel, der automatisk kan identificere objekter som biler, busser, cyklister og fodgængere på de mange billeder. En væsentlig del af projektet har derfor været, at sammenligne forskellige systemer til objektidentifikation i bllleder. Valget er faldet på en arkitektur, der går under navnet Faster-RCNN. 

Der er stor forskel på antallet af kameraer i forskellige geografiske regioner. Derfor er etablering af et system til aggregering af de regionale data til et samlet skøn for UK i første omgang ikke forsøgt, men det nævnes som et muligt fremtidigt projekt. I stedet præsenteres resultaterne for tre regioner — London, Manchester og Nordirland — hver for sig. For hver region vises dagligt antallet af biler, antallet af busser og det samlede antal af fodgængere og cyklister. Antallet af personer i biler og busser kan ikke opgøres med denne metode. Opgørelserne er tænkt som indikatorer for ændringer i aktiviteten over tid, men er ikke egnede til vurdering af det samlede trafikomfang

Sammenlignet med andre mulige metoder til registrering af trafikstrømme, f,eks.manuel optælling af passerede køretøjer og fodgængere, har kameradata en række fordele. Først og fremmest kan de opgøres med høj frekvens, f.eks. dagligt, og de kan offentliggøres meget hurtigt efter optællingsperiodens afslutning. Dertil kommer, at metoden er billig, bl.a. fordi der er tale om genanvendelse af data indsamlet til andet formål, og at man undgår fortrolighedsproblemer, da kun objekternes type, og ikke deres identitet, registreres.

Naturligvis er der også en række svagheder ved metoden. Bl.a. er valget af opstillingssteder for kameraerne styret af forskellige myndigheders specifikke behov for trafikdata, så de indsamlede data er ikke repræsentative for den samlede trafik. En anden svaghed er, at variationer i vejr og belysning kan påvirke billedets kvalitet, så præcisionen af optællingen kan variere under dataindsamlingen.

Generelt er optælling af fodgængere en af de større udfordringer ved denne type opgørelser. I den forbindelse har covid19-restriktionernes afstandskrav været en hjælp, fordi den større afstand har gjort det nemmere at identificere de enkelte fodgængere. Det er derfor ikke sikkert, at metoden uden videre kan anvendes, når engang restriktionerne lettes.

Dokumentationsnotatet har en række forslag til fremtidige forbedringer af metoden. Ønsket om en aggregeret opgørelse for hel UK er allerede nævnt. Mere generelt ønskes forbedringer af metoden, der kan gøre data mere repræsentative for den samlede trafik. 

Referencer:
Alistair Edwardes: “Estimating vehicle and pedestrian activity from town and city traffic cameras”, Data Science Campus (web), September 3, 2020 (link)
Office for National Statistics: “Coronavirus and the latest indicators for the UK economy and society: 12 November”, (link)

 


Syntetiske data

17/11/2020          Taleboble Kommentarer

Originale og fabrikerede datasæt

Når der i forbindelse med  officiel statistik tales om grunddata, tænkes der normalt på målte og registrerede værdier af en eller flere egenskaber ved et tællingsobjekt. Tællingsobjektet kan f.eks. være en person, og egenskaberne kan være køn og alder. Det er sådanne originale data, der er grundlaget for enhver pålidelig statistik. Den diamentrale modsætning til originale data er fabrikerede data, hvor man — eventuelt ved anvendelse af en tilfældighedsgenerator — danner datasæt, hvor objekterne er fiktive og de værdier der er knyttet til egenskaberne er tilfældige og på ingen måde afspejler virkeligheden. Fabrikerede data kan være nyttige under planlægningen af en statistik. De kan f.eks. gøre det muligt, i et vist omfang at teste programkoder tidligt i udviklingsprocessen, inden dataindsamlingen er sat i værk eller afsluttet.

Syntetiske datasæt

Et sted imellem originale og fabrikerede data finder man de syntetiske data. Her er de værdier der tillægges objekterne nok fabrikeret, men det er tilstræbt, at de fabrikerede værdier i en eller anden forstand afspejler virkeligheden. Objekterne i syntetiske data kan selv være syntetiske, men der kan også være tale om originale objekter, der blot tillægges syntetiske værdier for en eller flere egenskaber. Syntetiske data kan ligesom helt fabrikerede data være nyttige i forbindelse med aftestning af programkoder, men kan i nogle tilfælde også anvendes i forbindelse med aftestning af analyse- og målingsmetoder. Den ultimative anvendelse af syntetiske data er til forbedring  (berigelse) af et originalt datasæt.

ONS — UK’s nationale statistikmyndighed  — har i et arbejdspapir foreslået en klassifikation af syntetiske datasæt ( se oversigten nedenfor), der rangordner dem efter analytisk værdi og risiko for fortrolighedsbrud.. De to rangordninger er identiske — jo større analytisk værdi, jo større risiko for fortrolighedsbrud.

ONS’s rangordning af syntetiske datasæt

Type Analytisk værdi Risiko for fortrolighedsbrud Typisk anvendelse
Ordinære syntetiske datasæt Strukturel Ingen Ingen Grundlæggende testning af programkode
Validt Ingen Minimal Avanceret testning af programkode
Udvidede syntetiske datasæt Univariabelt Plausibelt Minimal Betydelig Udvidet testning af programkode
Multivariabelt plausibelt Nogen Høj Uddannelse og eksperimentel testning af metoder
Mutivariabelt detaljeret Nogen Meget høj
Replikeret (beriget) Høj Ekstrem Erstatter originalt datasæt

Kilde: Office for National Statistics: “Synthetic data pilot”

Ordinære syntetiske datasæt

I ordinære syntetiske datasæt er variabelnavne og variabelformater (f.eks. tekst eller heltal) identiske med det originale datasæt. I strukturelle datasæt forekommer forekommer kun værdier af variablene, der også forekommer i det originale datasæt, men uden hensyn til at kombinationen af værdier for den enkelte datapost kan være umulig eller usandsynlig — f.eks gravide mænd eller gifte personer under to år. I valide datasæt er det derimod tilstræbt, at både værdierne og kombinationerne af værdier ar plausible. Endvidere tilstræbes det i valide datasæt at inddrage manglende værdier og fejl, hvis de forekommer i det originale datasæt.Der gøres derimod intet forsøg på at få fordelingerne af de indgående variable til at ligne det originale datasæt. 

Udvidede syntetiske datasæt

I udvidede syntetiske datasæt går man skridtet videre, således at datasættet ikke blot i formel struktur ligner det originale datasæt, men også afspejler dele af indholdet. I univariabelt plausible datasæt tilstræber man, at de marginale fordelinger af variablene er som i de originale data. I multivariabelt plausible datasæt tilstræber man yderligere, at også multivariable fordelinger i et vist omfang afspejler det originale datasæt.

I et replikeret (beriget) datasæt er al information i det originale datasæt bevaret, men yderligere information i form af imputerede data kan være tilføjet. Mangler f.eks. oplysning om en enkelt egenskab for et objekt i det originale datasæt, f.eks. størrelsen af indkomsten for en enkelt husholdning, kan man vælge at erstatte den manglende værdi med værdien fra en anden husholdning, der på de egenskaber, der findes oplysning om f.eks erhverv, adresse, antal børn og alder på husholdningens medlemmer ligner den ufuldstændige husholdning. Ved denne fremgangsmåde, kan syntetiske data øge værdien af det originale datasæt.

Referencer:
Office for National Statistics: “Synthetic data pilot”, ONS methodology working paper series number 16,  januar 2019 (link)


Nowcasting

03/11/2020          Taleboble Kommentarer

Aktualitet og pålidelighed er to af hovedkravene til den officielle statistik. Uheldigvis er de to krav konkurrerende. Pålidelig statistik tager tid at producere, så brugere af hurtig statistik må acceptere, at aktualiteten kommer på bekostning af pålideligheden. Traditionelt har statistikproducenter søgt at tilgodese begge behov ved at producere to typer statistik:  en konjunkturstatistik, der lægger hovedvægten på aktualitet, og en strukturstatistik, hvor pålidelighed vægtes højt. De to kategorier er dog normalt tæt forbundet, forstået på den måde, at en solid strukturstatistik er det vigtigste grundlag for en anvendelig konjunkturstatistik.

Men specielt blandt beslutningstagerne i den økonomiske politik er der et stort ønske om  hurtigere data  end konjunkturstatistikken kan levere. Det har ført til bestræbelser på at kombinere konjunkturstatistikkens traditionelle metoder med redskaber, der ellers betragtes som for usikre til at kunne indgå i en statistisk opgørelse. Ofte er der tale om redskaber, der er udviklet til udarbejdelse af prognoser (forecasting). Derfor kaldes metoden for nowcasting.     

I den økonomiske statistik er bruttonationalproduktet (BNP) den mest efterspurgte opgørelse, og det er derfor hurtige opgørelser af denne størrelse, der navnlig har være i fokus.  BNP er en del af nationalregnskabet og Danmarks Statistik leverer sin første version af det kvartalsvise nationalregnskabet 60 dage efter kvartalets udløb, men allerede efter 45 dage offentliggøres den såkaldte BNP-indikator. BNP-indikatoren er et skøn udelukkende for udviklingen i samlet BNP (og beskæftigelse), uden nationalregnskabets detaljerede opgørelser. Indikatoreren er delvis baseret på now-casting metoder.

Covid-19 krisen har øget interessen for hurtige skøn over den økonomiske udvikling, og Nationalbanken har i den forbindelse påbegyndt offentliggørelse af løbende (ugentlige) skøn over væksten i det løbende kvartal. Uge for uge i det løbende kvartal  — og  i de første uger efter kvartalets udløb — offentliggøres et opdateret skøn for BNP-væksten. Eller rettere to skøn, for banken arbejder med to forskellige modeller. Den ene model — realtidsmodellen — der er baseret på en model fra New York Federal Reserve, benytter et omfattende datasæt til beregning af skønnet. En vigtig egenskab ved denne model er, at den leverer information om, hvor meget de enkelte kilder, f.eks. importstatistikken og ledighedsstatistiken, har bidraget til resultaterne  Den anden model — vendepunktsmodellen — er baseret på et samarbejde med Den Europæiske Centralbank, og benytter et mindre datasæt. En vigtig egenskab ved den model er, at den leverer en sandsynlighedsfordeling for de mulige vækstrater.

Nationalbanken lægger vægt på, at modellerne er en metode til at illustrere den information om udviklingen, der kan ligge i de valgte nøgletal, men er ikke et udtryk for bankens forventninger til udviklingen. I bankens samlede skøn og vurderinger om den økonomiske udvikling indgår modellerne kun som del af et større informationsgrundlag.

Referencer:
Danmarks Nationalbank: “Nye værktøjer til vurdering af økonomien”, Nyt – Danmarks Nationalbank 1/6 2020, nr.6 (link)
Danmarks Nationalbank: “Nowcastmodeller”, web-side (link)
Danmarks Statistik: “BNP-indikator 2.kvt 2020″,Nyt fra Danmarks Statistik”, 14. august 2020 – Nr. 307 (link)
Danmarks Statistik: “Dokumentation af BNP-indikator”, November 2016, (link)


USA’s højesteret standser dataindsamlingen til folketællingen

20/10/2020          Taleboble Kommentarer

I USA er indsamlingen af data til folketællingen for 2020 nu afsluttet. Præcis hvornår afslutningen skulle ske har været genstand for en politisk og juridisk strid, der nu er blevet afgjort af højesteret. Efter den helt oprindelige plan skulle dataindsamlingen afsluttes med udgangen af juli, men på grund af covid-19 krisen blev indsamlingsperioden først udvidet til udgangen af oktober, og senere igen afkortet til udgangen af september. Da en række eksperter udtrykte bekymring for, at afkortningen af indberetningsperioden kunne få negative følger for folketællingens kvalitet, indbragte en alliance af lokale myndigheder og borgerretsgrupper sagen for retten, med krav om at udgangen af oktober blev fastholdt som afslutningtidspunkt.

Alliancen fik i første omgang medhold ved en distriktsdomstol, og dataindsamlingen blev fortsat ind i oktober, men den den 13. oktober besluttede højesteret, at regeringen har ret til at afslutte dataindsamlingen. I praksis betyder det, at dataindsamlingen blev afsluttet den 15. oktober. Trods nederlaget i Højesteret kan klagerne altså glæde sig over, at de gennem distriktsdomstolens kendelse opnåede 15 dages ekstra indsamlingsperiode.

Når fastlæggelse af afslutningsdatoen for indsamlæingsperioden kunne blive et politisk stridsspørgsmål skyldes det først og fremmest, at folketællingens resultater afgør fordelingen mellem delstaterne af medlemmerne af Repræsentanternes Hus og af det valgmandskollegium, der vælger præsidenten. Der er en forventning om, at der er en overvægt af økonomisk og socialt dårligt stillede husstande blandt de senest indkomne besvarelser, og da sådanne husstande i højere grad antages at støtte Demokraterne, kan en republikansk præsident og regering alene af den grund have en interesse i så kort en indsamlingsperiode som muligt. Dertil kommer, at folketællingen også anvendes som fordelingsgrundlag for ydelser i forbundets sociale støtteprogrammer. Jo færre fattige, der optælles, jo færre midler til de fattigste områder, og tilsvarende flere til de knap så fattige.

Der er intet usædvanligt i, at en amerikansk folketælling er genstand for voldsomme politiske og juridiske slagsmål. Forfatningen fastlægger, at tællingen skal afholdes hvert tiende år, men siger meget lidt om det konkrete indhold. Der er derfor rig anledning til politisk uenighed, og med Højesterets rolle som fortolker af forfatningen kommer kampen til at udspille sig både i Kongressen og i Højesteret. Folketællingen for 2020 er dog nok en af de mest omstridte, navnlig fordi Trump-administrationen fra starten har udvist en meget kritisk holdning til officiel statistik i almindelighed og til Folketællingen i særdeleshed (se tidl indlæg, 19/9-2017 og 7/2-1017)

* Den amerikanske folketælling har tidigere være behandlet i flere indlæg i denne blog (4/2-2020, 14/5-201912/6-201819/9-2017 og 23/5-2017)

Referencer:
Mike Schneider: “Supreme Court halts census in latest twist of 2020 count”, AP News 14/10-2020 (link)


Generationsstatistik

29/09/2020          Taleboble Kommentarer

De generationer, der er vokset op med internettet — forstået som personer, der er født i 1981 eller senere — udgør fra 2019 flertallet af USA’s befolkning. Det er udgangspunktet for en analyse af den demografiske udvikling i USA, udført af  William H. Frey — seniorforsker ved Brookings Metropolitan Policy Program. Med udgangspunkt i en afgrænsning af generationer, foreslået af PEW Research Center, og data fra Folketællingsbureauet (Census Bureau), beskriver han udviklingen i befolkningens racemæssige og etniske sammensætning. De mest markante træk er, at andelen af hvide er lavere, jo yngre generationen er. Andre analyser viser, at uddannelsesniveauet er højere i de yngre generationer, og at der er betydelige holdningsforskelle mellem generationerne. Der kan derfor forventes ændringer i det politiske billede i USA, efterhånden som de yngre generationer overtager de centrale poster.

I skemaet nedenfor er PEW’s opdeling i generationer vist. Post-Z generationen ved vi ikke så meget om endnu. Den optræder mest for fuldstændighedens skyld. På et tidspunkt vil den blive afgrænset og muligvis få et andet navn.

PEW’s opdeling i generationer

Generation Fødselsårgange Alder 1. januar 2020
Præ-boomere 1945 og tidligere 74 år og ældre
Baby-boomere 1946-1964 55-73 år
Generation-X 1965-1980 39-54 år
Millennium generation 1981-1996 23-38 år
Generation-Z 1997-2012 7-22 år
Post-Z generation 2013 og senere 6 år og yngre

Kilde: Michael Dimock: “Defining generations: Where Millennials end and Generation Z begins”

Der er ikke tale om  en autoriseret eller officiel kategorisering, og PEW har udviklet den specielt til brug for amerikanske forhold. Ikke desto mindre vil jeg i det følgende anvende den til en belysning af generationerne i Danmark, idet jeg antager, at de ønskelige tilpasninger er så begrænsede, at umiddelbar anvendelse på danske data giver mening.

Millennium-generationen er den første, der er der er opvokset med internettet. Den efterfølges af generation-Z, der ikke blot er vokset op med internettet, men for hvem hele den internetbaserede teknologi er en selvfølge. Fra 2019 udgør millennium-generationen og dens efterfølgere, som tidliger nævnt, flertallet af USA’s befolkning. Det er endnu ikke tilfældet for Danmark — den danske befolkning er ældre end den amerikanske — men det vil ske i løbet af få år (se graf nedenfor)

Andel af befolkningen i Danmark født i 1981 eller senere


Kilde:
Danmarks Statistikbank, www.statistikbanken.dk FOLK2

Forskellene mellem generationernes uddannelsesmæssige status er beskrevet i tabel 1 nedenfor. Som det ses, er tendensen klart at andelen med grundskole som højeste uddannelse er faldende og andelen med lang videregående uddannelse stigende gennem generationerne. Sålænge generationerne ikke er uddøde kan uddannelsesbilledet ændre sig, men for generation-X og tidligere må ændringerne forventes at blive små. En del af millennium-generationen er derimod stadig under uddannelse, så her vil andelen med grundskole falde og andelen med lang videregående uddannelse stige i de kommende år. Det skal også bemærkes, at grundskoleuddannelse i 1972 blev forlænget fra 7 til 9 år. Det betyder, at grundskolen for generation-X og senere repræsenterer en længere uddannelse end for de foregående generationer.

Tabel 1: Højeste fuldførte uddannelse i generationer, Danmark 2019

Andel i pct.
Grundskole Kort og mellemlang uddannelse Lang videregående uddannelse I alt
Præ-boomere 30 64 6 100
Baby-boomere 25 67 8 100
Generation-X 17 68 14 100
Millennium generation 18 67 16 100

Kilde: Danmarks Statistikbank www.statistikbanken.dk/FOLK2 og HFUDD11 samt egne beregninger

Opgørelser af  befolkningen efter etnicitet og race, som de findes i den amerikanske befolkningsstatistik,  findes ikke i den officielle danske statistik. I stedet findes opgørelser efter herkomst, hvor der skelnes mellem personer med dansk oprindelse, indvandrere og efterkommere af indvandrere. Indvandrere og efterkommere er yderligere opdelt på oprindelsesland. I tabel 2 nedenfor er generationernes sammensætning efter oprindelse vist.

Tabel 2. Befolkningen efter oprindelse, 2020 og 2035 (prognose), Danmark

Pct.
Personer med dansk oprindelse
Indvandrere og efterkommere
I alt
Vestlig oprindelse Ikke-vestlig oprindlse
Befolkningsstatistik 2020
Præ-boomere 96 3 2 100
Baby-boomere 92 3 5 100
Generation-X 85 5 10 100
Millennium generation 76 10 14 100
Generation-Z 86 3 10 100
Prognose 2035
Præ-boomere 95 3 2 100
Baby-boomere 92 3 5 100
Generation-X 86 5 9 100
Millennium generation 77 9 14 100
Generation-Z 76 10 14 100

Kilde: Danmarks Statistikbank, www.statistikbanken.dk/FOLK2 og FRDK120

Indvandreres og efterkommeres andel er, som det fremgår, størst i de yngste generationer. Der forventes også i de kommende år en betydelig indvandring, og da hovedparten af indvandrere er unge, undervurderer befolkningsstatistikken de yngste generationers fremtidige andel, Derfor er tabellen suppleret med data fra Danmarks Statistiks befolkningsprognose.

Referencer:
William H. Frey:  “Now more than half of Americans are millennials or younger”,  Brookings Blog Posts 30/7-2020 (link)
Michael Dimock: “Defining generations: Where Millennials end and Generation Z begins”. Pew Research Center Facttank, 17/1-2019 (link)


Finansloven for 2021

16/09/2020          Taleboble Kommentarer

Finanslovforslaget for 2021 blev fremsat den 31, august og udgivet i statistisk bearbejdet form af Danmarks Statistik den 15. september. Den statistiske opgørelse omfatter ikke blot finansloven (der er statens budget) men også budgetterne for kommuner og regioner. Statistikken viser på flere punkter brud i forhold til den hidtidige udvikling frem mod seneste regnskabsopgørelse fra 2019. Bruddene er naturligvis forårsaget af Covid19-krisen.

Af tabellen nedenfor fremgår det, at de samlede offentlige udgifter målt i pct. af BNP forventes at stige fra fra 46 pct. i 2019 (regnskab) til  49,1 pct. i 2021. Indtægterne forventes at bevæge sig den modsatte vej — fra 49,8 pct til 46,8 pct. På bundlinien betyder det, at det offentlige går fra et overskud på 3,8 pct. af BNP til et underskud på 2,2 pct.

Tabel: Offentlige finanser 2018-2021

mia. kr pct af BNP
20181 20191 20202 20212 20181 20191 20202 20212
Forbrug 547 557 577 591 24,3 24,1 25,9 25,1
Overførsler 425 435 445 465 18,9 18,8 19,9 19,8
Subsidier 38 38 40 41 1,7 1,6 1,8 1,7
Andre udgifter 51 36 39 56 2,3 1,5 1,7 2,4
Udgifter i alt 1061 1065 1101 1153 47,2 46,0 49,4 49,1
Indkomskat 640 716 671 670 28,5 30,9 30,1 28,5
Andre skatter 361 363 374 369 16,1 15,7 16,8 15,7
Andre indtægter 71 75 61 61 3,2 3,2 2,7 2,6
Indtægter i alt 1072 1153 1106 1100 47,7 49,8 49,6 46,8
Overskud 11 88 5 -52 0,5 3,8 0,2 -2,2

Kilder: Danmarks Statistikbank (www.statistikbanken.dk/OFF3, OFF26, OFF3B, OFF26B)
Noter: 1Regnskab    2Budget

Som det fremgår af figuren nedenfor bryder budgettet med en tendens til, at forbrug og overførsler har udgjort en faldende andel af BNP i de senste regnskabsår. Det er også udtryk for en ændret tendens, at der efter en række år med overskud nu budgetteres med et underskud. Det er dog Finansministeriets forventning, at disse afvigelser er midlertidige. Det fremgår af en rapport, ministreiet udsendte samtidig med fremsættelsen af finanslovforslaget. I 2025 forventes indtægter og udgifter igen at balancere.

Figur: Offentlige udgifter i pct af BNP 2010-2021

Kilder: Danmarks Statistikbank (www.statistikbanken.dk/OFF3, OFF26, OFF3B, OFF26B)

Referencer:
Danmarks Statistik: “Statistikbanken, OFF3, OFF26, OFF3B, OFF26B”, (link)
Finansministeriet:
DK2025 – en grøn, retfærdig og ansvarlig genopretning af dansk økonomi”, august 2020, (link)


Uddannelse og indkomst

01/09/2020          Taleboble Kommentarer

I en artikel i Nyt fra Danmarks Statistik (17/7-2020) er valgt den lidt usædvanlige overskrift og indfaldsvinkel til en belysning af indkomstens afhængighed af uddannelse, at elever, der afslutter folkeskolens 9. klasse med lave karakterer, får et økonomisk forspring i forhold til elever med højere karakterer. Det økonomiske forspring består i, at eleverne med de lavere karakterer i de første år efter afslutningen af 9. klasse har højere indkomster end eleverne med højere karakterer. Det skyldes naturligvis, at eleverne med de lavere karakterer oftere går direke fra folkeskolen til erhvervsmæssig beskæftigelse — og dermed opnår en almindelig erhvervsindkomst — hvor eleverne med de højere karakterer oftere påbegynder en form for videreuddannelse, hvor indkomsten, der typisk vil komme fra uddannelsestøtte og deltidsbeskæftigelse, er lavere.

Den lavere indkomst for de, der påbegynder yderligere uddannelse, gælder kun så længe uddannelsen varer. Efter endt uddannelse har de uddannede en højre indkomst, men de har naturligvis ved starten af erhvervskarrieren et efterslæb i samlet livsindkomst i forhold til de jævnaldrene, der har været i erhverv.  Men den forskel indhentes igen, og samlet er der en klar positiv sammenhæng mellem livsindkomst og uddannelseslængde. Det belyses i en anden opgørelse fra Danmarks Statitik, baseret på Registret for Akkumulerede Indkomster. I tabellen nedenfor er vist den samlede (akkumulerede) disponible indkomst for perioden 1980-2017 for personer, der har været fuldt skattepligtige i Danmark i alle periodens 38 år.

Tabel: Akkumuleret disponibel indkomst 2017 efter højeste fuldførte indkomst

mio. kr. Mænd Kvinder
Grundskole og gymnasium 7,4 5,6
Erhvervsfaglig 8,1 6,6
Kort videregående 9,2 7,6
Mellemlang videregående 10,2 7,9
Lang videregående 12,7 10,2

Kilde: Bo Møller (2019) Figur 2
Anm. Beløbene er aflæst fra figuren.

Indkomsterne er før akkumuleringen omregnet til prisniveauet i 2017, men der er ikke indregnet en kompensation for den udskydelse af indkomst, som uddannelse medfører. I nogle opgørelser af livsindkomst vælger man at lade udskudt indkomst indgå med lavere vægt (diskontering). En sådan fremgangsmåde vil betyde, at forskellene mellem de akkumulerede indkomster for de forskellige uddannelsesgrupper bliver mindre. Omvendt kan der argumenteres for, at der er en gevinst ved at udskyde indkomsten, hvis reallønnen er stigende over tid. Danmarks Statistiks metode afspejler implicit en forudsætning om, at de to modsatrettede effekter opvejer hinanden.

Referencer:
Danmarks Statistik: “Elever med lave karakterer får økonomisk forspring”, Nyt fra Danmaks Statistik, 17. juli 2020, nr. 280 (link)
Bo Møller: “Hvor meget tjener man i løbet af livet?”, DST Analyse 2019:20, 20/11-2019 (link


Birgitte Anker bliver den ny rigsstatistiker

18/08/2020          Taleboble Kommentarer

Den 1. oktober tiltræder Birgitte Anker som Danmarks nye Rigsstatistiker — den femte i rækken. Rigstatistikeren er daglig leder af Danmarks officielle statistikmyndighed — Danmarks Statistik — og er samtidig formand for Danmarks Statistiks bestyrelse, der fastlægger institutionens arbejdsprogram. Embedet blev etableret ved en lov i 1966, hvor Danmarks Statistik oprettes som afløser for det tidligere Statistisk Departement. Loven fra 1966 gav Danmarks Statistik vidtgående beføjelser til indsamling af data, både fra virksomheder og fra andre myndigheder, og tillagde rigsstatistikeren en central rolle. Embedet blev yderligere styrket ved en ny statistiklov i 2018 (tidl. indlæg), hvor navnlig Danmarks Statistiks rolle som uafhængig institution og som den overordnet ansvarlige for den officielle danske statistikproduktion udtrykkeligt fastslås. Birgitte Anker får derfor en central og inflydelsesrig position i den fremtidige udvikling af  dansk statistik.

Loven om Danmarks Statistik fra 1966 kan ses som den danske indgang til tredie fase i det skema for den officielle statistiks udvikling som Walter J. Radermacher — en tidligere chef for Eurostat — har opstillet (se oversigten nedenfor). Tredie fase er navnlig karakteriseret ved, at computere og automatisering for alvor begynder at vinde indpas i samfundet. Det betød, at den officielle statistik måtte tilpasse sin produktion til de nye teknologier, navnlig omkring indhold og metoder i forbindelse med dataindsamlingen. I forhold til Radermachers kronologi er loven lidt forud for sin tid, men der kan heller ikke være tvivl om her var tale om en meget fremsynet lov. Bag loven stod bl.a. Viggo Kampmann og som den første rigsstatistiker udpegedes N. V. Skak-Nielsen. Både Kampmann og Skak-Nielsen havde et klart blik for, hvad de nye tekniske muligheder kunne betyde for statistikken, og de var villige til at bruge dem. Resultatet blev en lov, der bl.a. gav Danmarks Statistik ret til at anvende andre myndigheders adminstrative registre i statistikproduktionen, og en administration af loven, der i høj grad udnyttede disse muligheder.

Oversigt: Fire faser i den officielle statistiks historiske udvikling

Første fase 1800-1899 Den industrielle evolution
Fremspirende nationalstater
Etablering af nationale statistikinstitutter
Anden fase 1900-1969 Udvikling af statistisk teori
Udvikling af stikprøvemetoder
Nationalregnskaber
Tredie fase 1970-2009 Computere (mainframe)
PC’ere
Registerbaseret statistilk
Udvikling af EU’s statistiske system
Fjerde fase 2010- Organiske data (Big data)
Globalisering
Evidensbaseret beslutningstagning

Kilde: Radermacher(2019) s. 2-3

Opbygningen af de registerstatistiske systemer, der i dag er et hovedgrundlag for den danske statistik, var Skak-Nielsens vigtigste indsats. Anvendelsen af admistrative registre er et af de karakteristiske træk i fase tre og er en selvfølgelighed i fase fire,  men i 60’erne og 70’erne blev de nordiske landes bestræbelser på området betragtet med skepsis og mistro mange steder. Registeranvendelse har størst umiddelbar betydning for befolknings- og erhvervstatistikkerne, men Skak-Nielsen interesserede sig i høj grad også for de makroøkonomiske statistikker. Navnlig nationalregnskabet, der ved hans tiltræden havde været lidt forsømt, gennemgik i hans periode en omfattende modernisering og udvidelse.

Satsningen på registerstatistikken betød bl.a. at de danske statistikker ofte var totaltællinger og ikke baseret på stikprøver, som man i højere grad betjente sig af i andre lande. Danmarks Statistik arbejdede derfor med meget store datasæt, og store mainframecomputere blev som følge deraf et centralt værktøj. Da PC’erne begyndte at vinde udbredelse andre steder, blev de i Danmarks Statistik betragtet som irrelevante og interessen for dem var i begyndelsen ret ringe. I den sidste del af sin periode iværksatte Skak-Nielsen dog nogle forsøg med anvendelse af PC’ere, men det er først under hans efterfølger, Hans Zeuten, der tiltrådte i 1988, at PC-ere for alvor blev taget i brug, dog kun som som supplement til mainframemaskinen. Først i 2003 — flere år efter Zeuthes fratræden i 1995 — var pc-teknologien blevet så udvilket, at man kunne begynde en total afvikling af mainframemaskinen, og fra 2007 foregår hele statistikproduktionen på PC-netværket.

Den tredie rigsstatistiker — Jan Plovsing — tiltrådte i 1995. Hans periode blev præget af EU’s stigende betydning for statistikken, der bl.a. betød at størstedelen af statistikproduktionen efterhånden blev styret af forpligtende EU-regler. Rigstatistikerens og bestyrelsens direkte inflydelse på statistikproduktionen blev derfor tilsvarende beskåret. Det stigende internationale samarbejde er også en af årsagerne til at ledelses- og  sekretariatsfunktionerne i hans periode blev styrket i forhold til de traditionelt statistikfaglige funktioner.

Jørgen Elmeskov, der tiltrådte i 2013, blev den fjerde rigsstatistiker. Han repræsenterer på den måde indledningen til fjerde fase. I hans periode har vanskelighederne ved at løse opgaverne ved anvendelse tredie fases metoder og teknologi for alvor vist sig. Det har bl.a givet sig udslag i stigende problemer med at få responenter til at deltage i stikrøveundersøgelser og i at centrale størrelser i nationalregnskabet, herunder BNP, blev vanskeligere at opgøre meningsfuldt og pålideligt. Perioden har dog også i høj grad været præget af Danmarks Statistiks aktive deltagelse i eksperimenter omkring anvendelse af nye metoder, til afhjælpning af problemerne.

Men som det tegner sig bliver det den netop udnævnte femte rigststistiker, der for alvor skal føre Danmarks Statistik ind i fase 4. Som nævnt er stikprøveundersøgelser og traditionelle opgørelsesmetoder under pres og  de nye krav om f.eks miljøstatistik betyder mere komplekse målinger og nye former for dataindsamlig. Heldigvis er der også opstået en række nye muligheder, bl.a form af omfattende mængder af organiske data (se tidl. indlæg). Men udnyttelse af dem kræver nye metoder  og nye måder at tænke på. Set fra Danmarks Statistiks synspunkt betyder de nye datakilder også, at man mister sit naturlige monopol. Organiske data vil typisk være ejet af andre institutioner og virksomheder, og statistikmyndighederne skal finde måder at samarbejde om udnyttelsen. Alt tyder på, at Birgitte Anker kan se frem til en spændende og betydningsfuld, men også krævende, opgave.

Referencer:
Retsinformation : “Bekendtgørelse af lov om Danmarks Statistik”, LBK nr 610 af 30/05/2018 (link)
Walter J. Radermacher: “Official Statistics 4.0 Facts for People in the 21. Century”, 2019 (link)

 


Organiske data (big data) skal anvendes med omtanke

11/08/2020          Taleboble Kommentarer

Som det er fremhævet i adskillige indlæg i denne blog (f.eks. 19/5-2020, 17/9-2019 og 26/4-2016 ) ligger der store muligheder i den officielle statistiks anvendelse af organiske data — ofte omtalt som big data. Covid-19 krisen har øget interessen for organiske data navnlig i forbindelse med sundhedsstatistikken og den økonomiske statistik. Danmarks Statistik har for at imødekomme behovene bl.a.  oprettet en særlig hjemmeside under overskriften Eksperimentel statistik (se indlæg fra 21/4-2020) med en række links til statistikker baseret på organiske data. Tidsskriftet The Economist har på baggrund af denne stigende interesse fundet anledning til at opfordre til forsigtighed og nærmere overvejelser, før man går alt for langt i retning af at lade de organiske data fortrænge de traditionelle i den økonomiske statistik.

Artiklen i The Economist skelner melem to hovekategorier af de organiske data, der har været i fokus: data der formodes at afspejle økonomien generelt og data, der belyser specifikke områder f.eks. restaurationsbesøg eller antallet af ledige jobs. De generelle data omfatter dels de såkaldte mobilitetsdata fra Google og Apple, og dels data for kreditkorttransaktioner. Mobilitetsdata er baseret på registreringer i forbindelse med brug af mobiltelefoner. Apple baserer sin opgørelse på antallet af anmodninger om vejvisning i Apple Kort, og  Google baserer sin på registrerede besøg i f.eks butikker og parker.

Den store fordel ved de organiske data er deres aktualitet. Både Apple og Google offentliggør deres mobilitetsdata dagen efter aktiviteten har fundet sted. Så hurtigt kan traditionel statistik slet ikke produceres. Til gengæld har den traditionelle statistik haft ry for at være mere pålidelig, men her spiller det ind, at Covid19-krisen har haft negativ indflydelse på kvaliteten, bl.a. fordi myndighederne midlertidigt har lempet indberetningskravede til virksomhederne.

Men der er også store kvalitetsproblemer i de organiske data. Mobilitetsdata bruger januar måned som sammenligningsgrundlag, og sammenblander dermed sæsonmønstre i udviklingen med virkningen af Covd19. The Economist påpeger også at mobiliteten, som den måles af Apple og Google, ikke nødvendigvis afspejler økonomisk aktivitet. For kreditkorttransaktionerne sløres billedet af, at frygten for smittespredning kan have påvirket valget mellem kontant- og kortbetaling. Data for specifikke områder vedrører oftest privatforbruget, der ganske vist udgør en meget stor del af den samlede økonomiske aktivitet, men uden data for investeringsaktiviteten, der er langt mere volatil end privatforbruget, bliver billedet af den samlede konjunkturudvikling upålideligt.

The Economist’s konklusion er, at organiske data har været et nyttigt supplement til den traditionnelle økonomiske statistik under covid19-krisen, og også fremover kan bidrage til forbedring af de ektisterende opgørelser. Men de gode gamle metoder, der i en lang periode har vist deres værdi, står ikke foreløbig overfor total udskiftnking.

Referencer:
Economist: “Why real-time economic data need to be treated with caution”, Economist 23/7-2020
Apple: “Mobilitetstendenser”, (link)
Google: “Rapporter om lokale bevægelsesmønstre“, (link)


Danmarks Statistiks portal for officiel statistik

16/06/2020          Taleboble Kommentarer

Fra Danmarks Statistiks portal for officiel statistik får man et samlet overblik over statistik produceret af offentlige myndigheder. Portalen er en udmøntning af § 4 i den lov om Danmarks Statistik, der trådte i kraft i 2018. Loven pålægger Danmarks Statistik dels at offentliggøre en liste over offenligt produceret samfundsbelysende statistik, og dels at vedligeholde en portal, der giver adgang til al officiel offentligt produceret statistik — i det følgende blot betegnet officiel statistik. Officiel statistik er statistik, som er produceret af en offentlig myndighed og som opfylder de kvalitetskrav, som er fastlagt i EU’s statistiklov og kvalitetskodeks. For at en officiel statistik kan optages i portalen kræves det dog også, at den producerende myndighed tilmelder sig  Ordningen for Officiel Statistik, der bl.a betyder, at Danmarks Statistik overvåger overholdelsen af retningslinierne. Retningslinlierne er beskrevet i et særligt dokument, udarbejdet af Danmarks Statistik.

Som udgangspunkt er det således frivilligt for en offentlig statistikproducent at tilmelde sig ordningen og dermed underkaste sig vilkårene. Denne frivillighed gælder dog ikke statistik, der indsamles til EU’s statistiske program. Myndigheder der inberetter til EU’s statistikprogram er forpligtet til at være tilmeldt ordningen. I forbindelse med indberetningen skelner EU mellem det nationale statistiske institut, som har det overordnede ansvar for statistikindberetningerne, og andre nationale statistiske myndigheder, som indberetter til systemet. Danmarks Statistik er det danske nationale statistikinstitut, men på EU’s liste over indberettere står herudover 14 danske myndigheder.

Portalen opdeler den officielle statistik i samme tolv emner, som Danmarks Statistik anvender ved præsentation af sin egen statistik. Man søger i emner og underemner på præcis samme måde som i Statistikbanken. Et underemne indeholder enten en liste over nye underemner, som man må vælge iblandt, eller et eller flere link til sider med officiel statistik. Ved hvert link er angivet navnet på den institution, der er ansvarlig for den statistik, der linkes til. Oftest vil den ansvarlige institution være Danmarks Statistik, og linket vil da normalt være til Statistikbanken. Hvor andre institutioner er ansvarlige vil linket føre til en side, hvor statistikken offentliggøres. Det kan være en side, der vedligeholdes af den ansvarlige institution selv, men kan også være til en side, der vedligeholdes af en anden institution, der står for offentliggørelsen af statistikken, f.eks Eurostat.  Er man vant til at bruge Statistikbanken vil man føle sig helt hjemme i portalen. Faktisk er det nærmest fuldstændigt som at søge i Statistikbanken, blot med adgang til flere tabeller.

Den del af den offentlige statistik, der ikke tilhører kategorien officiel statistik, enten fordi den ikke opfylder kvalitetskravene, eller fordi producenten har valgt ikke at tilmelde den ordningen, er listet på portalens hjemmeside under overskriften Anden offentligt produceret statistik“.  Også denne liste er opdelt efter samme emner som Danmarks Statistik i øvrigt anvender, men uden opdeling på underemner. I stedet er under hver emne angivet navnene på de institutioner, der producerer offentlig statistik vedrørende emnet, og under hver institution en liste med et eller flere link(s) til de statistikker, institutionen stiller til rådighed.

Referencer:
Danmarks Statistik: “Portal for Officiel Statistik“, (link)
Danmarks Statistik: “Retningslinjer for officiel statistik”, august 2019 (link)
Eurostat: “List of National Statistical Institutes and aother national authorities” (link)
Retsinformation: “Bekendtgørelse af lov om Danmarks Statistik”, LBK nr 610 af 30/05/2018 (link)


Befolkningsprognoser

02/06/2020          Taleboble Kommentarer

En befolkningsprognose er en fremskrivning af befolkningens størrelse og sammensætning på kategorier, f.eks. køn og alder, baseret dels på statistiske opgørelser frem til udgangssituationen (baseline) og dels på en række forudsætninger om fremtidig fødselshyppighed, dødelighed og migration. I tabellen nedenfor er nogle hovedtræk fra Danmarks Statistiks seneste prognose, der udkom 27/5 2020, sammenholdt med Eurostats prognose. Resultaterne fra de to prognoser er meget forskellige. Danmarks Statistik viser en forøgelse af befolkningen frem til 2060 på  ca. 9 pct. — fra 5,8 mio til 6,3 mio. Eurostat forudser en noget mindre stigning på ca. 5 pct. til 6,1 mio. Begge prognoser har stort set samme udgangspunkt, så forskellene i udviklingen må ligge i forskelle i forudsætningerne.

Tabel 1: Sammneligning af Eurostats og Danmark Statistiks Befolkningsfremskrivning for Danmark frem til 2060 (udvalgte år)

År Eurostat Danmarks Statistik
Primo-befolkning Fødsels-overskud Nettoind-vandring Tilvækst Primo-befolkning Fødsels-overskud Nettoind-vandring Tilvækst
1000 personer
2020 5.822,8 6,8 4,4 11,2 5.822,8 7,0 15,1 22,2
2025 5.895,5 5,3 12,3 17,6 5.930,2 10,5 11,9 22,4
2030 5.975,0 0,5 12,4 12,9 6.043,3 10,3 10,5 20,8
2035 6.030,3 -4,1 12,7 8,6 6.137,0 6,0 9,8 15,8
2040 6.067,1 -6,8 12,5 5,7 6.206,8 2,1 9,2 11,3
2045 6.091,7 -7,8 11,8 4,0 6.256,7 -0,4 9,0 8,6
2050 6.109,8 -8,2 11,3 3,1 6.298,2 -0,5 9,0 8,4
2055 6.123,5 -8,8 11,1 2,3 6.343,8 1,7 8,9 10,6
2060 6.134,3 -8,9 11,1 2,2 6.403,6 5,1 9,0 14,1

Anm: Tallene for Eurostet er skaleret, således at folketallet i 2020 er identisk i de to opgørelser.
Kilder: Eurostats  Statistikbank proj_19ndbi og Danmarks Statistikbank FRDK220

Som det fremgår af tabellen, forudsætter Eurostat et noget mindre fødselsoverskud end Danmarks Statistik. Fra 2035 viser Eurostats tal et mærkbart fødselsunderskud. Til gengæld ser Eurostat en større nettoindvandring, men samlet set altså en langsommere befolkningsudvikling.

Nettooindvandringen er den mest usikre del af prognoserne, især fordi den afhænger af en række uforudsigelige forhold omkring den politiske og økonomiske udvikling i resten af verden og fremtidige politiske beslutninger i Danmark og EU. Fødselsoverskuddet er i højere grad knyttet til størrelser, der udvikler sig mere stabilt som antal fødsler pr. kvinde i den fødedygtige alder og dødeligheden for forskellige aldersgrupper.

Tabel 2: Opgørelsen af fødselsoverskuddet i tabel 1

År
Eurostat Danmarks Statistik
Kvinder 15-49 år Ferti-litet1 Føds-ler Døds-fald Fødsels-over-skud Kvinder 15-49 år Ferti-litet1 Føds-ler Døds-fald Fødsels-over-skud
2020 1262,6 49,4 62,4 55,6 6,8 1266,4 48,4 61,3 54,3 7,0
2025 1237,4 51,7 64,0 58,7 5,3 1262,1 53,7 67,7 57,2 10,5
2030 1225,5 51,6 63,3 62,7 0,5 1254,8 57,0 71,5 61,2 10,3
2035 1234,9 50,3 62,1 66,2 -4,1 1269,1 55,5 70,5 64,5 6,0
2040 1237,2 49,4 61,2 67,9 -6,8 1278,1 53,4 68,2 66,1 2,1
2045 1224,4 49,6 60,7 68,5 -7,8 1281,7 51,7 66,3 66,7 -0,4
2050 1214,6 50,3 61,1 69,3 -8,2 1288,3 52,0 67,0 67,6 -0,5
2055 1209,7 50,9 61,5 70,3 -8,8 1297,2 54,2 70,3 68,6 1,7
2060 1200,7 51,2 61,5 70,3 -8,9 1300,9 56,4 73,3 68,2 5,1

Anm: Se tabel 1
Note: Antal fødsler pr 1000 kvinder i aldesgruppen 15-49 år
Kilder: Eurostats  statistikbank proj_19np, proj_19ndbi og Danmarks Statistikbank FRDK120, FRDK220

Som det fremgår af tabel 2, er der ikke de store forskelle på den samlede dødelighed i de to prognoser. Det er forskellen i fødselstallet, der er årsag til, at Eurostat når frem til et fald i fødselsoverskuddet, og her er årsagen igen at Eurostat forudser en lavere fertilitet.

Fertiliteten er her opgjort som antal fødsler pr. 1000 kvinder i den fødedygtige alder (15-49 år). Det er et simpelt, men ikke særligt præcist mål, fordi det kun ser på det samlede antal kvinder i aldersgruppen 15-49 år, og ikke tager hensyn til at fertiliteten er meget forskellig i de forskellige aldersgrupper. Et bedre mål ville være den samlede fertilitetskvotient, der tager højde for aldersfordelingen, men de offentliggjorte data for de to prognoser gør ikke en umiddelbar sammenligning af samlet fertilitetskvotient mulig. 

Referencer:
Danmarks Statistik: “Befolkningsfremskrivninger 2020-2060”, Nyt fra Danmarks Statistik, 2020 nr 1999 (link)


Designede contra organiske data

19/05/2020          Taleboble Kommentarer

Det er oplagt, at en producent af officiel statistik foretrækker at have fuld kontrol over planlægningen, etableringen og gennemførelsen af en statistik. Hvis producenten kan fastlægge definitionen af begreberne, definere populationen, beslutte  udvælgelses- og dataindsamlingsmetode,  og vælge metoder og procedurer for efterbehandlingen af de indsamlede data, har man alle forudsætninger for at opbygge en statistik af høj kvalitet. Data indsamlet og bearbejdet under dataindsamlerens fulde kontrol kaldes designede data.

De officielle statistikproducenters muligheder for basere en statistik på egne designede data begrænses dels af de ressourcer, der er til rådighed, og dels af respondenternes villighed til at  medvirke. På begge områder er den officielle statistikproduktion undet pres. Anvendelse af  administrative data som grundlag for statistik er en vej ud af disse begrænsninger. Administrative data er indsamlet af en offentlige myndighed, f.eks. skattevæsenet, til brug for egne ikke-statistiske formål, men de kan ofte bearbejdes til statistisk brug. Udgifterne til dataindsamlingen er allerede afholdt, og problemerne med respondenterne eventuelle modvilje er allerede håndteret, så statistikmyndigheden kan koncentrere sig om efterbehandlingen. Bearbejningen af administrative data til statistiske formål er ikke en triviel opgave, men dog væsentlig mindre ressourcekrævende end etableringen af en egentlig statistisk dataindsamling. Der er stadig tale om designede data, men de er designet til et andet formål end statistik, og statistikmyndigheden har ikke kontrol over defintioner og populationsafgrænsning. I praksis har det dog vist sig at fordelene ved administrative data ofte opvejer ulemperne og at det er muligt at anvende dem som grundlag for fremstilling af statistik af høj kvalitet.

Designede data udgør den absolut dominerende del af den officielle statistiks grundlag, og vil forstsat gøre det, i hvert fald indenfor en overskuelig fremtid. Men en anden type data — organiske data — der ikke er dannet som led i en planlagt og systematisk dataindsamling, er begyndt at dukke op som supplerende kilde. Det vil typisk være data, der opstår i forbindelse med anvendelse af  informationsteknologi, f.eks ved transaktioner, der involverer stregkoder eller ved anvendelse af mobiltelefoner. Disse data er tæt knyttet til de aktiviteter, der frembringer dem, og  populationsafgrænsningen er sjældent i overesstemmelse med statistikkens krav. Til gengæld kan de være fuldstændigt dækkende og meget pålidelige for det (begrænsende) område de omfatter, de kan være meget omfattende og de er af natur i digital form og således umiddelbart tilgængelige for automatisk behandling.

Betegnelserne designede data  og organiske data er foreslået af Robert Groves — en tidligere direktør for det amerikanske folketællingsbureau — i et blog-indlæg i 2011. Hans udgangspunkt var, at organiske data udgør en stor og hastigt voksende del af verdens samlede datamængde, og at de er forholdsvis let tilgængelige. Det gør det oplagt for folketællingsbureaet og andre officielle statistikproducenter at inddrage dem som kilder. Groves forestillede sig ikke, at organiske data ville fortrænge deignede data som kilde, men han så en kombination af designede og organiske data som fremtidens kilde for officiel statistik. Og foreløbigt tyder meget på, at det er den vej, det går. De officielle statistikproducenter er meget opmærksomme på mulighederne for at anvende organiske data i statistikproduktionen, ofte under overskriften Big Data. Danmarks statistik anvender f.eks. stregkodedata fra detailhandelen som en supplerende kilde ved opgørelsen af forbrugerprisindekset, og har iværksat et eksperiment, hvor positionsdata for skibe anvendes som grundlag for en statistik om aktivitet i havnene. Mulighederne er  store, men der er også behov for at indvinde mere viden og erfaring, før organiske data for alvor kan komme til deres ret som en betydningsfuld del af grundlaget for officiel statistik.

Referencer:
Robert Groves:
“Designed Data and Organic Data”, United States Census Bureu  31/5-2011 (link)
Ronberto Ribigon: “Big Data and Measurement: From Inflation to Discrimination”, RBI Bulletin, Reserve Bank of India, 11. sept. 2018 (link)


Sundhedsstatistik under COVID-19 epidemien

05/05/2020          Taleboble Kommentarer

Som omtalt i det forige indlæg har Danmarks Statistik i forbindelse med COVID-19 krisen etableret en særlig hjemmeside med statistik om udviklingen i både den sundhedsmæssige og den økonomiske situation. Her er tale om statistikker, der hurtigt kan belyse udviklingen — såkaldt konjunkturstatistik. Konjunkturstatistik står i modsætning til strukturstatistik, der lægger mere vægt på grundighed og detaljer, og som det tager længere tid at producere. Når det gælder de økonomiske indikatorer, er der en lang tradition for konjunkturstatistik i den officielle statistik, og der er derfor opbygget en omfattende viden omkring produktionen og tolkningen af den. Anderledes forholder det sig med sundhedsstatistikken, der traditionelt har været set som en strukturstatistik. Kortsigtsindikatorer ligger ikke lige for hånden, så de officielle statistikmyndigheder har måttet være kreative.

En ideel epidemistatistik skulle dagligt opgøre bl.a. det samlede antal smittede, antallet af nye smittede, antallet af smittede med alvorlige symptomer og antallet af dødsfald forårsaget af epidemien. Sådanne opgørelser optræder da også på Danmarks Statistiks COVID19-hjemmeside, men de har nogle kvalitetsbrist. Antallet af smittede kan kun skaffes gennem målinger og man har kun testet personer, der opfyldte særlige kriterier, f,eks. viste alvolige symptomer på COVID-19. Opgørelserne er således ikke repræsentative for hele befolkningen. Da kriterierne ikke har ligget fast, giver tallene heller ikke et pålideligt billede af udviklingen. Omfanget af alvorlige tilfælde belyses ved antallet of hospitalsindlagte, specielt indlagte på intensivafdelinger og i repirator. Sålænge kriterierne for indlæggelse er uændrede, er det en udmærket indikator. Hvad dødsfald angår er problemet, at de hurtige opgørelser kun registrerer om afdøde var inficeret, men ikke om COVID-19 var dødsårsagen. Den egentlige statistik over dødsårsager er lidt længere undervejs.

Ved internationale sammenligninger er problemerne endnu større, først og fremmest fordi  opgørelsesmetoderne i landene kan være meget forskellige. Det er tænkeligt, at man på sundhedsområdet kan etablere kortsigtsstatistikker (konjunkturstatistik) af den type, der er nævnt i foregående afsnit, som opfylder de sædvanlige kvalitetskrav for officiel statistik, men det vil tage noget tid, og de vil næppe kunne nå at blive operationelle i forbindelse med den nuværende epidemi. Den gode umiddelbare løsning er at tilpasse offentliggørelsen af  de eksisterende sundhedsstatistikker til de nye behov. Den simpleste og mest oplagte metode er at sammenligne det samlede antal af ugentlige (eller daglige) dødsfald med gennemsnittet for tilsvarende uger/dage i tidligere år. En sådan statistik er ved at komme i gang i mange lande herunder også Danmark, hvor den kan findes på Dannarks Statistiks COVID-19 side og i Statistikbanken

I figuren nedenfor er vist udviklingen i det samlede antal døde pr uge i pct. af en beregnet normaldødelighed. Normaldødeligheden er beregnet som medianen for døde i pct. af den samlede befolkning (ved begyndelsen af kvartalet) i den tilsvarende uge i årene 2017-2019.

Ugentlig overdødelighed 2018 uge 1 – 2020 uge 17

Kilde: Danmarks Statistík, www.statistikbanken.dk/DODC2

Som det fremgår af figuren er det tydeligt, at der sker en stigning i overdødeligheden omkring uge 11, hvor epidemien ifølge WHO brød ud.


Eksperimentel statistik fra producenter af officiel statistik

21/04/2020          Taleboble Kommentarer

COVID-19 situationen har skabt et særligt behov for statistikker med kort produktionstid, der kan belyse centrale forhold omkring krisen, både vedrørende udbredelsen af epedemien og udviklingen i den økonomiske situation. På den baggrund har Danmarks Statistik på sit websted etableret en side,  hvor en række statistikker af denne type præsenteres. Siden har fået overskriften “Eksperimentel statistik og analyse”.

Producenter af officiel statistik anvender begrebet eksperimentel statistik om opgørelser, der offentliggøres mens en planlagt statistik endnu er i udviklings- eller overvejelsesfasen. De offentliggjorte opgørelser lever ikke nødvendigvis fuldt ud op til de sædvanlige kvalitetskrav for officiel statistik, men kan dog være af interesse for kvalificerede brugere, der er indstillet på, at statistikken endnu ikke har fundet sin endelige form. Der kan f.eks være tale om, at den endnu ikke er fuldt dækkende for den population, den tilstræber at belyse, eller at metoderne ikke er færdigudviklede eller endelig fastlagt. For brugerne betyder det dels, at de på et tidligt tidspunkt kan anvende resultaterne, selvom det må ske med større forsigtighed end for færdige statistikker, og dels at de gennem feed-back kan bidrage til forbedring af det endelige resultat. De britiske statistikmyndigheder kar opstillet en række klare regler for, hvornår en statistik kan kaldes eksperimentel og hvornår den har nået en sådan grad af modenhed, at betegnelsen eksperimentel skal fjernes, men der eksisterer ikke en internationelt anerkendt definition på begrebet.

En del af de opgørelser, der præsenteres på Danmarks Statistiks nye side, er gengivelser af statistik produceret af ikke-officielle prodcenter, f.eks Statens Serum Institut (indikatorer for smitetudbredelse og dødsfald), Danske Bank (forbrugsindikatorerpå grundlag af data fra MobilePay), Styrelsen for Arbejdsmarked og Rekruttering (indikatorer for arbejdsløshed mv.), Vejdirektoratet (Indeks for vejtrafik) og Storebæltsforbindelsen (personbilstrafik over Storebælt). Disse opgørelser er naturligvis meget nyttige, men de er ikke et led i en overvejet eller planlagt udvikling af den officielle statistik, og er derfor ikke eksperimentelle i den gængse betydning af ordet.

Men den nyetablerede side indeholder også et par eksempler på egentlig eksperimentel statistik. Først og fremmest vises resultater fra Anløbsaktiviteten i danske havne , der hidtil kun har været offentliggjort i Statistikbanken. Denne statistiks grundlag er skibpositionsdata (AIS-systemet) leveret af Søfartsstyrelsen og er et eksempel på Danmarks Statistiks eksperimenter med anvendelse af big data (se tidl. indlæg). Særlig interessant er en ny statitsik, udarbejdet i samarbejde med Nationalbanken, der dagligt opgør antallet af flyafgange fra Københavns Lufthavn. Kilden er The OpenSky Network — en organisation, der indsamler omfattende data om flytrafik og stiller dem til rådighed i en åben datatbase. Det kan ses som et eksempel på Trusted smart statistics (se tidl . indlæg), hvor en offentlig statistikmyndighed — i dette tilælde Danmarks Statistik — ingen andel har i dataindsamlingen, men gennem sine metoder og redskaber skaber en pålidelig og brugbar statistik.

Også Eurostat har offentliggjort en række statistikker, som de betegner som eksperimentelle, bl. a. en web-baseret opgørelse af populariteten af steder optaget på UNESCOs Verdensarvliste (se tidl. indlæg), en rapport om multinationale koncerner (se tidl. indlæg) og en longitudinel arbejdsmarkedsstatistik (se tidl. indlæg).

Referencer:
Danmarks Statistik: “Eksperimentel statistik og analyse”, (link)
Danmarks Statistik: “Anløbsaktiviteten i danske havne (eksperimentel statistik)”, Statistikdokumentation (link)
Eurostat: “Eksperimental statistics” (link)
European Statistical Systen: “Experimental Statistic” (link)
Office for Statistcs Regulation: “Experimental statistics – official statistics in development “, August 2019 (link)


Demokrati og ulighed – Eksempel på anvendelse af “Comparative Political Data Set”

07/04/2020          Taleboble Kommentarer

Den officielle statistik gør — som alt andet godt — mere nytte, jo flere, der har adgang til at benytte den.  Frit tilgængelige statistikbanker, som de der leveres af f.eks Danmarks Statistik og Eurostat bidrager derfor stærkt til at øge værdien af den officielle statistik. Samme princip gælder naturligvis for ikke-officiel statistik, og særligt værdifuldt bliver det når nogen påtager sig, at samle data fra forskellige kilder i frit tilængelige databanker. Et eksempel herpå er “Comparative Political Data Set” (CPDS), der kombinerer en række oplysninger for en gruppe af demokratiske lande, hentet fra både officiel statistik og fra andre kilder. Bag dette datasæt står en række forskere fra Universitetet i Zürich med professor Dr. Klaus Amingeon i spidsen. Datasættet indeholder dels oplysninger om valg, regeringsdannelse og politiske partier i de udvalgte lande og dels oplysninger om økonomi og befolkningsforhold. Datasættet har bla. været anvendt af to forskere fra universitetet i Aberdeen — Ioannis Theodossiou og Alexandros Zangelidis. De kombinerer data fra CPDS med data om ulighed fra OECD i et studie af sammenhængen mellem uligheden i et samfund og graden af politisk deltagelse.

Theodossiou og Zangelidis udgangspunkt er, at uligheden i indkomst i  demokratiske land har været stigende de seneste tre årtier, samtidig med at valgdeltagelsen har været faldende, og de stiller spørgsmålet, om der er en sammenhæng mellem de to udviklinger. Mere præcist stiller de spørgsmålet om der er tale om en selvforstærkende proces, hvor stigende ulighed fører til faldende politisk interesse, med faldende valgdeltagelse som følge, samtidig med at den faldende valgdeltagelse i sig selv fører til større ulighed. Mekanismen bag en sådan selvfortærkende udvikling kan være, at de der sakker bagud i indkomstudviklingen mister troen på, at valgdeltagelse giver dem nogen indflydelse, og derfor undlader at deltage i valgene. Det resulterer i, at de velstillede opnår en større repræsentation i de besluttende organer, som de — ikke overraskende — bruger til at fremme deres egne interesser på bekostning af de mindre velstilledes.

Anvendelse af denne type data til analyse at en to-vejs sammenhæng rejser en række praktiske og teoretiske problemer. I deres artikel redegør Theodossiou og Zangelidis for problemerne og anvender forskellige metoder for at imødegå dem. Deres samlede konklusion er, at de anvendte data støtter hypotesen om den selvforstærkende mekanisme.

Referencer:
Armingeon, Klaus, Virginia Wenger, Fiona Wiedemeier, Christian Isler, Laura Knöpfel, David Weisstanner and Sarah Engler: 2019. Comparative Political Data Set 1960-2017″
Zurich: Institute of Political Science, University of Zurich.  (link)
Ioannis Theodossiou og Alexandros Zangelidis: “Inequality and Participative Democrazy — a Self-Reinforcing Mechanism”,  Review of Income and Wealth,  Series 66, Number 1, March 20120 (link)


Ulighed i testresultater i grundskolen — Forskelle mellem USA og Danmark

24/03/2020          Taleboble Kommentarer

Der er store forskelle mellem statistiksystemerne i USA og Danmark. De omfattende registerbaserede systemer, der er grundstammen i den officielle danske statistik findes ikke i USA. I stedet har man i USA opbygget en række stikprøvebaserede statsitiksystemer, specialiseret til belysning af forskellige områder, f.eks, indkomst eller uddannelse. De to systemer har hver deres fordele og ulemper. Det amerikanske system gør det muligt at tilpasse dataindsamlingen til statistikkens formål, hvor det danske system er afhængigt af data indsamlet til andre formål, f,eks skattevæsenets data. Til gengæld giver det danske system mulighed for at samkøre de forskellige systemer via cpr-numrene, hvor samkøring af forskellige statistiksystemer i USA er kompliceret og oftest umuligt. Det er også en vigtig forskel, at det danske system er langt det billigste i drift.

Det er altid forbundet med særlige vanskeligheder at sammenligne statistiske opgørelser fra forskellige lande, selv når landenes statstiksystemer ligner hinanden, men vanskelighederne bliver naturligvis større, når afvigelserne mellem systemerne er så store, som der her er tale om. Men ønsker man at foretage internationale sammenligninger må man forsøge at overvinde vanskelighederne. Det forsøg har to forskere Christopher Jamil de Montgomery fra Københavns Universitet og Hans Henrik Sievertsen fra  VIVE — gjort i forbindelse med en belysning af sammenhængen mellem forældres indkomst og socioøkonomiske baggrund på den ene side og deres børns præstationer i gundskolen på den anden.

For USA er anvendt et longitudienelt datasæt fra U.S. National Center for Education Statistics (NCES).Early Childhood Longitudinal Study, Kindergarten Class of 1998-99 (ECLS-K) — der følger den årgang, der startede i børnehaveklasse i 1998/99. Datasættet indeholder bl.a testreultater for prøver i matematik og læsning på o. (børnehaveklasse) 1., 3., 5. og 8. klassetrin og oplysninger om husstandsindkomst og forældrenes uddannelsesmæssige baggrund. For Danmark er der taget udgangspunkt i resultaterne fra de nationale tests. For læsning findes testresultater for 2., 4., 6. og 8. klassetrin og for matematik for 3. og 6. klassetrin. Dette datasæt er så udvidet med oplysninger om forældres indkomst og uddannelsemæssige baggrund ved samkøring med Danmarks Statistiks Registre.  

Der er som det fremgår tale om to ret forskellige datasæt, selvom de belyser de samme fænomener. Blandt de forskelle, som de to forskere må forholde sig til er:

  1. Det amerikanske datasæt er en stikprøve, omend en stor stikprøve, det danske er en totaltælling
  2. Det amerikanske datasæt omfatter alle skoler, både offentlige og private. det danske omfatter kun offentlige skoler
  3. Første måling er ikke sket på de samme klassetrin i de to datatsæt. (trin 0 i USA, trin 2 i Danmark)
  4. Det amerikanske data omfatter personer født omkring 1993. De danske data omfatter peroner født omkring 2000.
  5. De tests, der er er anvendt i de to datasæt, er forskellige

I artiklen redegøres for betydningen af disse forskelle, og der anvendes metoder, der søger at kompensere for forskellene. Det er klart, at denne fremgangsmåde stiller krav til omhu og forsigtighed ved tolkningen af resultaterne, men trods vanskelighederne mener forfatterne, at de kan påvise klare forskelle mellem USA og Danmark i grundskolesystemets betydning for uligheden. Nogle hovedresultater er vist i tabellen nedenfor.

Gennemsnitlige testresultater ved prøver i grundskolen, klassetrin 0/2 og klassetrin 8 (percentil score) 

Forældres indkomst Klassetrin USA Danmark
Lav indkomst Trin 0/2 43 43
Trin 8 40 41
Høj indkomst Trin 0/2 60 57
Trin 8 62 56
Forskel Trin 0/2 17 14
Trin 8 22 15

Den nederste del af tabellen (blå skrift) viser forskellen i gennemsnitligt testreusltat for børn af forældre med hhv. lav og høj indkomst. I både USA og Dannark klarer børn af velhavende forældre sig bedst, både ved testene på det lave og det høje klassetrin. Forskellene er dog noget mindre i Danmark end i USA. Mest markant er det, at i Danmark er forskellen næsten den samme på de to klassetin, hvor forskellen i USA er markant større på det høje klassetrin. Det amerikanske grundskolesystem ser altså ud til at øge uligheden, hvor det danske er nogenlunde neutralt.

Referencer
Christopher Jamil de Montgomery1 og Hans Henrik Sievertsen:
“The Socio-Economic Gradient in Children’s Test-Scores – A Comparison Between the U.S. and Denmark”, Nationaløkonomisk Tidsskrift 2019:1 (link)


Den officielle statistiks rolle i et digitaliseret og globaliseret samfund

03/03/2020          Taleboble Kommentarer

Vilkårene for de officielle statistikmyndigheders arbejde er i hastig forandring, især drevet af digitataliseringen og globaliseringen. Digitaliseringen giver nye muligheder, men rejser også store forventninger hos brugerne, og globaliseringen påvirker både det forventede/krævede indhold af statistikken og sætter nye rammer for produktionen. En tidligere generaldirektør for Eurostat — EU’s statistiske kontor — Walter J. Radermacher har i en interessant artikel gjort sig nogle overvejelser over både karakteren af udfordringerne og de mulige måder at håndtere dem på.

Forståeligt nok ønsker politikere og andre beslutningstagere at udnytte de store mængder information, der — bl.a. som følge af digitaliseringen  — er til rådighed. Forskellige betegnelser, f.eks, “evidensbaseret beslutningstagning”, “data for politics” og  “governing by the number” har været anvendt om den type bestræbelser. Emnet er meget omfattende og berører mange former for informationssøgning og -behandling. Den officielle statistik er blot et af elementerne, men dog et af de væsentlige.

Et af de markante træk i udviklingen i offentlig administration i de senere år  har været en privatisering af funktioner, der traditionelt har været anset for en del af det offentlige system. Postvæsen jernbaner og radio og TV er eksempler. Men det er også markant, at privatisering af den officielle statistik ikke har været forsøgt, og der er heller ikke er udsigt til, at det vil ske. Der ser ud til at være en generel erkendelse af, at den traditionelle officielle statistik er en vigtig del af et moderne samfunds infrastruktur. Eller sagt på en anden måde: der er forventninger til at den officielle statistik kan yde et vigtigt bidrag til til den information, beslutningstagerne har brug for. Det centrale spørgsmål er så, hvori forventningerne mere præcist består, og hvordan statistikmyndighederne kan leve op til disse forventninger. Radermacher søger at finde svaret ved at analysere den officielle statistiks fumktion og vilkår, både i et historisk og et nutidigt perspektiv og i lyset af nogle forventninger omkring den fremtidige udvikling.

En af de vigtigste opgaver statistikmyndighederne skal løse er at sikre opretholdelse (eller måske i nogle tilfælde genoprettelse) af tilliden til den officielle statistik i en tid, hvor tilliden til autoriteter er faldende. En offentlig statistikmyndighed skal levere fakta, og det er i den forbindelse efter Radermachers opfattelse vigtigt at gøre sig klart, at fakta er et resulatat af en proces, dvs. at fakta er noget, der produceres. Råvaren for faktaproduktionen er data. Data kan f.eks. bestå i digitale registreringer, der kan være meget omfattende, men som ikke er direkte anvendelige som grundlag for beslutninger. De skal først omformes til fakta gennem en proces, der kan være både meget ressourcekrævende, herunder meget vidensintensiv. Men det er fakta — ikke data — der efterspørges af beslutningstagerne.

En konsekvens af at fakta er produceret er at de som alle andre produkter kan være af forskellig kvalitet og normalt ikke kan være fuldkomne. Fakta er med andre ord ikke lig med sandheden. I det hele taget er sandhed ikke efter Radermachers opfattelse et hensigtmæssigt begreb i denne sammenhæng. Det hensigtsmæssige begreb er kvalitet. Fakta af høj kvalitet er ønskelige, og de fremkommer gennem en produktionsproces, der opfylder en række kvalitetskrav. Men de er aldrig perfekte, og det er heller ikke tilstræbt at gøre dem perfekte. Kvaliteten er et resultat af de ressourcer, der er anvendt på at producere dem, og indsatsen af ressurcer sker efter en afvejning af ønsket om høj kvalitet og begrænsning af produktionsomkostningerne. I sidste ende er denne afvejning en politisk beslutning. En af Radermachers bekymringer er, at der opbygges store forventninger til omfanget af de fakta, der kan leveres på grundlag af de enorme datatmængder den digitale udvikling skaber, men at forståelsen af kvalitetskravene og de omkostninger der er forbundet med høj kvalitet, ikke helt kan følge med. At der altså kan opstå forventninger om en både omfattende og billig statistik, som statistikmyndighederne ikke samtidig kan leve op til. Et dilemma, der helt sikkert  kan genkendes af mange andre institutioner.

Et gennemgående træk i Radermachers overvejelser er en konstatering af at faktaproduktion er en omfattende proces der involverer mange typer af ressourcer og mange fag- og brugergrupper. Det bliver derfor vigtigt på produktionssiden både at forbedre eksisterende modeller for samarbejde mellem faggrupper og at udvikle nye. Men også i beslutningsprocessen er det nødvendigt med øget inddragelse af brugerne for at sikre, at forventningerne både til omfang og kvalitet er realistiske, og at de i videst muligt omfang opfyldes.

Radermacher har øje for, at statistikmyndighederne er helt bevidste om både de mange krav og de mange muligheder, og også har iværksat initiativer der udnytter og udforsker mulighederne. Men en stor indsats er også nødvendig. Mister brugerne tilliden til kvaliteten af den officielle statistik bliver den irrelevant og vil ikke kunne overleve, samtidig med at de problemer, som den skulle  bidrage til at løse ikke bliver mindre. Samfundet får svært ved at undvære den officielle statistik, så det er et stort ansvar, der hviler på statistikmyndighederne.

Referencer:
Walter J. Radermacher : “Governing-by-the-numbers/Statistical governance: Reflections on the future of official statistics in a digital and globalised society”, Statistical Journal of the IAOS 35 , 2019 (link)


Retssagerne mod Andreas Georgiou — tidligere græsk statistikschef

18/02/2020          Taleboble Kommentarer

Græsk statistik har ikke noget godt ry. Tilbage i 2010 leverede EU-kommisionen en sønderlemmende kritik af den officielle græske statistik, og krævede en revision af både metoder og organisation. Den græske regering udpegede Andreas Georgiou — en velrennomeret økonom, der på det tidspunkt arbejdede for IMF — til at stå for genopretningen. Den gennemførte han med stor succes, og på forholdsvis kort tid fik han genskabt den internationale tillid til den officielle græske statistik. Det var af stor betydning, da de græske statsfinanser på det tidpunkt var i en kritisk forfatning og landet lå i vanskelige forhandlinger med sine debitorer. Debitorerne krævede etablering af en pålidelig statistik som en af betingelserne for at yde hjælp.

Men hvor George Georgiou høstede megen international anerkendelse for sin indsats, så var den gæske reaktion noget anderledes. En del af prisen for den ganskabte tillid til statistikken var, at den skulle være pålidelig, og at det ikke måtte være muligt for regeringen at  manipulere den. Det er et grundlæggende krav i både EU’s lovgivning og i FN’s retningslinier omkring officiel statsitik, men grækerne så det som en indskrænkning af de redskaber, de havde til rådighed i internationale forhandlinger. De mente, at de kunne have opnået bedre hjælpeaftaler hvis man — i strid med EU-reglerne — havde pyntet lidt på de officielle statistikker. Georgiou blev derfor opfattet som en forræder, der havde skadet Grækenlands nationale interesser.

Det førte til, at der blev rejst en række retsager  mod ham. Sagerne har tidligere været behandlet i denne blog (16/10-2018 og 15/8-2017). En række statistiske institutioner har udtrykt støtte til Gerogiou, og i november 2019 har American Statistical Association (ASA) udsendt en ny støtteerklæring, der opfordrer den nye gæske regering til at råde bod på den uretfærdige behandling, Georgiou har været udsat for . Det er dog ikke sandsynligt, at det vil ske. Medlemmer af premierminister Mitsotakis’ parti, Nyt Demokrati, som har en stor del af ansvaret for landets finansielle sammenbrud og manipulationen med statistikken, har været ivrige fortalere for retsforfølgelsen af Georgiou.

I en af sagene er han idømt to års betinget fængsel for pligtforsømmelse. Forseelsen bestod i, at han havde indberettet data til EU, uden først at have forelagt dem til godkendelse i statistikbureauets ledelse. Gorgious fremgangsmåde var i fuld  overensstemmelse med EU’s regler om chefstatistikerens rolle i forbindelse med sikringen af den officielle statistiks uafhængighed, som også Grækenland er forpligtet til at overholde. I en anden sag, et privat søgsmål om æreskrænkelse, er han dømt til at betale erstatning og at offentliggøre en undskyldning. Sagen er  rejst af Georgious forgænger som statistikchef, der føler sig krænket over Georgious udtalelser om den tidligere statistiske praksis. Sandheden i Geogious udtalelser er ikke anfægtet, men  græsk lov gør det muligt at sagsøge for æreskrænkelse, selvom de krænkende ytringer er i overensstemmelse med sandheden. Denne sag er appeleret og er for tiden under behandling af en appeldomstol. Herudover verserer yderligere to kriminalsager i systemet.

Referencer:
American Statisticel Association: “ASA Issues New Statement of Support for Greek Statistician Andreas Georgiou”, (link)
American Statisticel Association: “
Eight Years of Government Persecution of Greek Statistician” (link)
Miranda Xafa: “A Statistician’s Ordeal – The Case of Andreas Georgiou“, World Economics vol 20 No  3 July-Sept  2019 (link)
Miranda Xafa: A Statistician’s Prosecution For Slander”, World Economics 16 Januar 2020 (link)
European Commision: “Report on Greek Government Deficit and Debt Statistics”, Brussels 8/1-2010 (link)


USA’s folketælling 2020

04/02/2020          Taleboble Kommentarer

En af dette års helt store begivenheder i statistikverdenen er folketællingen i USA. Mange andre lande afholder folketælling i 2020 — og EU-landene holder folketællinger i 2021 — men den amerikanske tælling er noget helt særligt i kraft af sit omfang, sin historie, sin rolle i det politiske spil og den tekniske og statistikfaglige indsats, der ligger bag. Forberedelserne til den amerikanske folketælling har tidigere være behandlet i flere indlæg i denne blog (14/5-2019, 12/6-2018, 19/9-2017 og 23/5-2017)

Grundlæggende foregår folketællingen på helt traditionel vis, ved at hvert husstandsoverhoved besvarer et spørgeskema om husstandens beboere. Moderne teknologi anvendes naturligvis, hvor det er muligt, men fundamentet er data indsamlet direkte hos borgerne. Det er en meget kostbar dataindsamlingsmetode, som i andre lande er søgt erstattet eller suppleret med anvendelse af data fra allerede eksisterende registre. Ugemagasinet The Economist påpeger da også, at metoden kan forekomme ret utidsvarende, men problemet er, at USA ikke råder over den administrative infrastuktur i form af omfattende administrative registre, der er forudsætningen for alternative og langt billigere metoder.

Dataindsamlingen er så småt begyndt i afsides liggende områder i Alaska og vil fortsætte sommeren over. Det officielle starttidspunkt var 21. januar. Men den store indsamlingsmåned bliver april. Folketællingsdagen — den 1. april 2020 — vil blive markeret som en mærkedag over hele USA. Det er forholdene på denne dato tællingen tilstræber at beskrive. Alle husholdninger vil på denne dag modtage en opfordring til at deltage. Besvarelsen kan foregå telefonisk, online på internettet eller med gammeldags post. En husholdning forstås i denne sammenhæng som en lille gruppe personer, der deler bolig. Beboere i fælleshusholdninger som fængsler, kollegier og plejehjem kan ikke optælles på denne måde. De vil i stedet blive besøgt af folketællere, der vil indsamle de krævede oplysninger om beboerne. Det samme gælder de almindelige husholdninger, der ikke efterkommer opfordringen til levere data telefonisk, online eller med post. Hjemløse udgør et helt specielt problem, men også de vil blive søgt optalt i dagene omkring 1. april.

De første resultatater fra folketællingen bliver de opgørelser forfatningen kræver til fordeling af pladserne i kongressen og i det valgmandskollegium, der vælger præsidenten. De vil blive leveret i december 2020. Den 31, marts 2021 vil delstaterne modtage data, der skal danne grundlag for afgrænsningen af valgkredsene. Den egentlige offentliggørelse påbegyndes i maj 2021 og forventes afsluttet i april 2023.

Referencer:
Economist: “Out for the Count — Americas census looks out of date in the age of big data”, Economist 20/1-2020 (link)
United States Census Bureau: Hjemmeside (link)


Danmarks Statistiks planer for 2020

21/01/2020          Taleboble Kommentarer

Danmarks Statistik præsenterede i begyndelsen af januar sine planer for det kommende år. Planerne skal realiseres inden for en økonomisk ramme, der dels består af en finanslovsbevilling (60 pct.) og dels af egne indtægter i form af projektilskud og salgsindtægter (40 pct.). De samlede indtægter i faste priser for 2020 forventes at ligge ca. 3 pct højere end i 2019, men hele stigningen kan tiskrives en forventning om en forøgelse af egne indtægter. Finanslovsbevillingen er derimod faldende. Bestyrelsen udtrykker i sine bemærkninger til arbejdsplanen bekymring over at bevillingen har været beskåret gennem en årrække, samtidig med at mulighederne for at skære i aktiviteterne begrænses af, at langt størstedelen af opgaverne bestemmes af EU-lovgivningen. Den frygter, at kvalitetssikringen og vedligeholdelsen af it-systemerne kan komme i fare.

Kvalitetsproblemerne antydes i arbejsplanen i forbindelse med en planlagt fremrykning af offentliggørelsestidspunktet for nationalregnskabet. Fremrykningen er bl.a. muliggjort gennem tilsvarende fremrykninger af kildestatistikkerne til nationalregnskabet, men prisen bliver alligevel, at kvaliteten kun er omtrent den samme som hidtil.

Med faldende finanslovsbevillinger kommer de projekter, der helt eller delvist finansieres — og besluttes — udefra , til at veje tungere. Flere af de nye initativer i arbejdsplanen tihører da også denne kategori. Det gælder f.eks en videreførsel af det grønne nationalregnskab, der finansieres af en særlig finanslovsbevilling,  og et projekt omkring FN’s verdensmål, der er resultatet af en aftale med Folketingets “2030-netværk”.

Set i et fremtidsperspektiv er Danmarks Statistiks projekter omkring nye datakilder de mest interessante. Mere komplekse systemer for handel og finansiering skaber vanskeligheder for de traditionelle økonomske statistikker, og stigende fokus på byrden ved at deltage i statistiske undersøgelser truer kvaliteten bla. i skikkelse af faldende besvarelsesprocenter og krav om lettelse i respondentbyrden. Her virker en mere intensiv udnyttelse af de data, der skabes gennem elektronisk kommunikation, som en oplagt mulighed for at aflaste eller helt erstatte de traditionelle kilder. Et eksempel fra arbejdsplanen er en statistik om skibstrafik, baseret på de data fragtskibe udsender om deres position (AIS-data). Men der er meget, der skal afklares, før mulighederne for alvor kan udnyttes. Som et led i afklaringen af mulighederne afholder Danmarks Statistik den 23 januar en konference om emnet med titlen “Nye Datakilder – Muligheder og Udfordringer”.

Referencer:
Danmarks Statistik: “Arbejdsplan 2020”, januar 2020 (link)


Makro – en ny økonomisk prognosemodel

07/01/2020          Taleboble Kommentarer

En vigtig rolle for officiel økonomisk statistik er som inddata for de modeller, Finansministeriet og andre anvender til at vurdere behovet for ændringer i den økonomiske politik og til beregning af konsekvenser af nye lovinitiativer. Hidtil har ministeriet som udgangspunkt anvendt modellen ADAM, der udvikles og vedligeholdes af modelgruppen i Danmarks Statistik (tidl indlæg 13/6-2017), men siden foråret 2017 har en arbejdsgruppe, været igang med udviklingen af en erstatning for ADAM. Den nye model har fået navnet MAKRO. Projektet skulle efter planen være afsluttet i april 2020, men er blevet forlænget med et år, såldes at afslutningstidpunktet nu er april 2021. Den grundlæggende modelramme forventes stadig at ligge klar til april 2020, så det ekstra år skal anvendes på at implementere modellen i Finansministeriets daglige arbejde. Status for arbejdet er i november 2019 blevet opsummeret i et notat af Peter Stephensen, MAKROs forskningschef.

MAKRO  vil i vidt omfang bygge på den eksisterende ADAM-model, som den skal erstatte, men også erfaringerne fra andre modeller, navnlig DREAM, der administreres af  en uafhængig institution, har været inddraget i udviklingsarbejdet. Det understreges i statusnotatet, at overgangen fra ADAM til MAKRO skal ses som et led i en løbende metodeudvikling, og ikke som en grundlæggnde omvæltning. Der lægges også vægt på, at den nye model skal have et velunderbygget empirisk fundament, der ovenikøbet skal være bredere end i ADAM. Den officielle statistik skal således stadig spille en central rolle som datagrundlag for modellen.

Referencer:
Peter Stephensen: “Status for MAKRO-modellen”, (link)
MAKRO: “MAKROs hjemmeside”, (link)


Ressourcefodaftrykket

17/12/2019          Taleboble Kommentarer

Krav om bæredygtig produktion sætter grænser for, hvor meget der kan trækkes på naturressourcer som biomasse, mineraler og fossil energi. Der er derfor behov for pålidelige og helst også overskuelige opgørelser både over trækket på og mængden af tilgængelige ressourcer. De grundlæggende data indgår i de enkelte landes materialestrømsopgørelser, der er satellitsystemer til nationalregnskabet. Disse opgørelser viser landets umiddelbare anvendelse af naturressourcer, opgjort som den samlede udvinding plus import minus eksport. Men en sådan opgørelse viser ikke landets træk på verdens samlede naturressourcer. Det skyldes, at opgjort på denne måde, vil der i et lands træk på egne naturressoucer indgå ressourcer anvendt til produktion af færdigvarer, der eksporteres. Den andel af ressourcerne skal i stedet indgå i det importerende lands ressourcetræk. Omvendt vil der til  produktionen af landets import af af færdigvarer være trukket på ressourcer, der efter den umiddelbare opgørelse indgår i andre landes ressourcetræk. En opgørelse, der er korrigeret for denne indirekte import og eksport, kaldes et ressourcefodaftryk.

Ressourcefodaftrykket opgøres med udgangspunkt i vægten af de faktisk indvundne, importerede og eksporterede mængder af naturressourcer med et beregnet tillæg for den indirekte import og et beregnet fradrag for den indirekte eksport.  Eurostat offentliggør beregninger af ressourcefodaftryk  for EU som helhed og for enkelte af medlemslandene. Danmark er ikke blandt landene i EU-opgørelsen, men i en ny publikation fra Danmarks Statistik, er det danske ressourcefodaftryk for første gang opgjort officielt. En oversigt over resultater — både fra EU’s opgørelse og fra Danmarks Statistik — er vist i tabellen nedenfor.

Tons pr capita År Indenlandsk ressource-indvinding
(1)
Direkte og indirekte ressorce-import
(2)
Direkte og indirekte ressouce-eksport
(3)
Ressource-fodaftryk
(1) + (2) – (3)
EU (28 lande) 2016 11,1 7,5 4,9 13,7
Tyskland 2014 13,6 19,0 16,5 16,1
Frankrig 2016 8,7 12,2 8,2 12,7
Litauen 2016 15,4 17,1 14,7 17,8
Malta 2016 4,0 20,1 13,8 10,3
Nederlandene 2016 6,8 31,4 28,6 9,6
Østrig 2014 15,4 29,3 20,2 24,5
Portugal 2016 12,8 10,9 8,4 15,4
Danmark 2016 19,6 26,9 24,6 21,8

Kilder: Eurostats Statistikbank env_ac_rme og Iliev(2019)

Desværre er disse beregninger ikke så enkle at gennemføre, og må baseres på en række skøn og forudsætninger. Det betyder, at der er en stor usikkerhed i resultaterne. Som det udtrykkes i EU’s dokumentation, så er yderligere harmonisering nødvendig, for at nå frem til god sammenlignelighed af estimaterne på tværs af landene. Det afspejler sig i tabellen i overraskende store forskelle mellem EU-landenes fodaftryk, men indtil opgørelsene er blevet bedre harmoniseret må vi nok antage, at forskellene mere hænger sammen med forskelle i metoder end med forskelle i faktisk ressourcebelastning.

Referencer
Bogomil Emilov Iliev: “Hvordan påvirker vores forbrug verdens naturressourcer?”, Danmarks Statistik Analyse, Nr. 2019:21, 21/11-2019 (link)
Danmarks Statistik: “Statistikdokumentation for
Materialestrømsregnskab 2017″ (link)
Eurostat: “Material flow accounts in raw material equivalents – modelling estimates (env_ac_rme)”, Reference Metadata (link)
Eurostat: “Material flow accounts (env_ac_mfa)“, Reference Metadata (link)


Sundhedsomkostninger i statistikken — Behov for bedre opgørelser?

03/12/2019          Taleboble Kommentarer

Professor i sundhedsøkonomi og -politik, Kjeld Møller Pedersen, har i en kronik i Altinget efterspurgt en ny og mere gennemskuelig statistik om de offentlige sundhedsudgifter. Kritikken er især rettet mod opgørelsen af sundhedsudgifterne i to af Danmarks Statistiks produkter: Regnskaber for regioner og kommuner og Offentlig Forvaltnings Udgifter og Indtægter. Kritikken kan opsumeres i følgende punkter:

  1. Offentlig Forvaltnings Udgifter og Indtægter følger internationale retningslinier, der nok  gør opgørelsen af sundhedudgifterne internationalt sammenlignelig, men til gengæld nationalt uforståelig
  2. Der savnes en opdeling på regioner, kommuner og stat i Offentlig Forvaltnings Udgifter og Indtægter.
  3. Nogle af de betegnelser, som Danmarks Statistik anvender i Offentlig Forvaltnings Udgifter og Indtægter, er misvisende
  4. Der savnes inflationskorrigerede serier i Regnskaber for regioner og kommuner

Vedr. punkt 1 går indvendingen dels på, at sammenhængen mellem det offentliges regnskaber og de internationalt sammenlignelige statistikker er uigennemskuelig, og dels at den internationalt sammenlignelige opgørelse ikke afspejler danske nationale behov. Men regnskaber har generelt et andet og bredere formål end en specifik statistik for offentlige udgifter. Bl.a. er regnskaberne grundlag for kontrol af overholdelse af bevillingsregler. Man kan derfor ikke forvente, at regnskaber umiddelbart kan opfylde statistikbrugernes behov. Omkodning og bearbejdning er nødvendig. Samtidig er det naturligvis et krav, at sammenhængen mellem statistikkens resultater og dens kilder er gennemskuelig. Set på den baggrund går kritikken på mangler i statistikkens dokumentation.

International sammenlignelighed har høj prioritet i den officielle statistik, efter min opfattelse med rette, men naturligvis bør der suppleres med nationale opgørelser, hvor der er behov for det. De internationale retningslinier er fasttlagt i den såkaldte Cofog-manual.  Møller Pedersens kritik går især på, at Cofog-kategorien Sundhedsvæsen omfatter udgifter til plejehjem, der efter hans opfattelse ikke er en sundhedsudgift, men snarere hører hjemme under Cofog-kategorien Social beskyttelse. I den mest detaljerede Cofog-opdeling er Pleje- og rekonvalcenthjem skilt ud som en særlig kategori, men denne underopdeling offentliggøres ikke i Danmarks Statistiks opgørelser.

Referencer
Kjeld Møller Pedersen: “Dumt spørgsmål, men hvad koster sundhedsvæsenet?”, Altinget 23/11-2019 (link)
Danmarks Statistik: “Klassifikation af det offentliges udgifter efter formål (COFOG)”, v1:1999″ (link)


Alternativ inflationsmåling – Web scraping og The Billion Prices Project

19/11/2019          Taleboble Kommentarer

Det traditionelle datagrundlag for måling af inflation er indsamlede prisoplysninger for et udvalg af produkter i udvalgte butikker. En kort beskrivelse af metoden findes i et tidligere indlæg. En alternativ metode, hvor priserne indsamles fra forhandlernes hjemmesider er under udvikling. Projektet er døbt The Billion Prices Project (BPP), og er bl.a.  beskrevet i en artikel af de to forskere, der tår bag projektet, Alberto Cavallo and Roberto Rigobon. Starten på projektet var et forsøg på at skabe et alternativt inflationsmål for Argentina, hvor regeringen i perioden 2007-2016 manipulerede inflationsopgørelsen med henblik på et skjule inflationens sande størrelse. Senere blev forsøget udvidet til at omfatte flere lande, bl.a. Australien, Brasilien, Canada, Japan, Kina, Tyskland, Sydafrika, UK og USA.

Adgang til data skal købes. Et kommercielt foretagende — PriceStats — står for beregningerne, og data sælges gennem et finansielt rådgivningsfirma — State Street.  PriceStat producerer daglige inflationstal for mere end tyve lande. BPP opfylder ikke kriterierne for officiel statistik, men de metoder, der anvendes i projektet, er interessante, og kan naturligvis også være en inspirationskilde for den officielle statistik.

Det tilstræbes i BPP,  at de indsamlede priser er repræsentative for hele detailhandelen, og derfor udvælges kun forhandlere, der både er aktive på nettet og i fysiske butikker. Et fortagende som Amazon, der ikke har fysiske butikker, indgår derfor ikke. Indsamlingen sker ved anvendelse af såkaldte scraping værktøjer, der automatisk opsøger hjemmesiderne for de valgte leverandører og finder de ønskede prisoplysninger (web-scraping).

BPP-metoden har en række fordele, som gør den interessant også for officielle statistikinstitutter og deres brugere. Først og fremmest er metoden billig, fordi den ikke kræver manuel dataindsamling. Desuden kan den uden større ekstraomkostninger levere data med høj frekvens, f.eks dagligt, hvor traditionelle prisdata normalt offentliggøres månedligt. Endelig kan resultaterne leveres med meget kort forsinkelse i forhold til traditionelle prisstatistikker. Bedre muligheder for kvalitetskorrektion og for internationale sammenligninger indgår også blandt fordelene.

Men naturligvis har metoden også ulemper. En af dem er, at ikke alle produkter sælges i net-butikker, hvilket kan give problemer med repræsentativiteten. Specielt tjenesteydelser vil være stærkt underrepræsenterede ved BPP-metoden.

Albert Cavello har for en række lande sammenlignet inflationsopgørelser baseret på BPP-metoden med traditionelle inflationsopgørelser (link). Han konkluderer, at der er god overensstemmelse, navnlig for de økonomisk mest udviklede lande. Der kan derfor være gevinster at hente for de officielle statistikinstitutioner, både på omkostninger og kvalitet, ved anvendelse af BBP-metoden, i hvert fald som supplement til de traditionelle metoder.

Referencer:
Alberto Cavallo and Roberto Rigobon: “The Billion Prices Project: Using Online Prices for Measurement and Research”, Journal of Economic Perspective 2016 vol 30 no 2 (link)
Alberto Cavallo: “Are Online and Offline Prices Similar? Evidence from Large Multi-Channel Retailers”, American Economic Review 2017, 107(1): 283–303 
(link)
The Billion Proces Project: Hjemmeside, (link)

PriceStats: Hjemmeside (link)


Statistisk måling af CO2-udledninger

29/10/2019          Taleboble Kommentarer

Den globale opvarmning, og navnlig spørgsmålet om hvad vi kan og skal gøre for at begrænse den, er blevet et central emne i den offentlige debat, i hvert fald i de rige vestlige lande. Den dominerende holdning blandt forskere, vælgere og politikere er, at der bør gøres et forsøg på at begrænse opvarmningen, og at det først og fremmest skal ske ved at nedbringe den udledning af CO2, der er resultat af menneskelig virksomhed. På klimakonferencer indgår lande og byer aftaler om, hvor meget og hvor hurtigt udledningen skal nedbringes.

Alle disse aftaler og mål vedrører de direkte udledninger fra fabrikker, boliger og husdyr mm. på landets eller byens område. Dvs CO2-udledningen vedrører den produktion, der foregår i byen eller landet. Men nogle af de produkter der forbruges i byen eller landet kan være fremstillet andre steder, dvs. importeret, så den udledning, forbruget forårsager, er større end den der måles ud fra produktionen. I modsat retning trækker det af en del af produktionen eksporteres og indgår i forbruget andre steder. 

Produkion af tjenesteydelser giver ikke anledning til så megen CO2-udledning som produktion af industriprodukter.  Da rige lande typisk har stor produktion af tjenesteydelser og importerer industrivarer fra fattigere lande, undervurderer den produktionsbaserede opgørelse den virkelige — dvs. den forbrugsbaserede — belastning fra de rige lande. Det har bl.a fået den meget unge klimaaktivist  — Greta Thunberg — til at anklage de rige lande for kreativ bogføring af CO2-udledningen (Economist 2019).

Set fra statistikproducenternes synspunkt er problemet, at det er meget vanskeligere at opgøre den forbrugsbaserede udledning end den produktionsbaserede. Begge opgørelser er baseret på en række forudsætninger og modeller, der gør resultaterne usikre, men problemerne er størst for den forbrugsbaserede opgørelse. Det ændrer dog ikke på, at Grete Thunberg har ret i, at det i  denne sammenhæng giver bedre mening, at vurdere et lands eller en bys klimabelastning ud fra den forbrugsbaserede udledning.   

Referencer
Hannah Ritchie og Max Roser: “CO₂ and Greenhouse Gas Emissions”, Our World in Data 4/12-2018 (link)
Hanna Ritchie: “Who emits more than their share of CO₂ emissions?”, Our World in Data 4/12-2018 maj 2017, opdateret oktober 2018 (link)
Economist: “Greta Thunberg accuses rich countries of creative carbon accounting”, 17/10-2019  (link)

 


Kan øget anvendelse af elektroniske betalinger begrænse skatteunddragelse?

22/10/2019          Taleboble Kommentarer

 

Tidsskriftet The Economist har i et indlæg på sin hjemmeside peget på øget anvendelse af elektronske betalinger som et middel til at begrænse skatteuddragelse. De finder støtte for antagelsen i et diagram, hvor den uformelle (grå eller sorte) økonomis andel af BNP i EU-landene er plottet mod omfanget af kortbetalinger. Data for omfanget af kortbetalinger er hentet i ECB’s statistikbank og data for den uformelle økonomi er hentet fra et arbejdspapir fra IMF (Medina og Schneider). Da den uformelle økonomi netop er karakteriseret ved, at den ikke — eller kun i meget begrænset omfang — registreres i de systemer, den normalt udgør kilderne til statistikkens måling af den økonomiske aktivitet, er der stor usikkerhed forbundet med denne opgørelse. Et diagram svarende til The Economists’s er vist i figur 1 (se note).

 Figur 1

Kilde: ECB Statistical Data Warehouse“Transactions per type of payment service” og Leandro Medina and Friedrich Schneider(2018) Grafik: Veusz

Diagrammet indikerer, at i lande med at højt omfang af kortbetalinger spiller den uformelle økonomi en mindre rolle end i lande med et lavt omfang af kortbetalinger. Da uformelle økonomiske transaktioner ofte er forbundet med skatteunddragelse, kan øget udbredelse af elektroniske betalinger ses som et middel til at øge skatteindtægterne.

Sammenhængen lyder meget sandsynlig, og den indtegnede tendenslinie i figur 1 indikerer da også en tydelig sammenhæng. Men der kan også tænkes andre årsager til mindre udbredelse af uformel økonomi end omfanget af kortbetalinger. F.eks. er det i figuren tydeligt, at nordiske og vesteuropæiske lande (markeret med blå cirkler) alle har en forholdsvis lille uformel økonomi, men er vidt forskellige, når det gælder antallet af kortbetalinger. Det kan støtte en hypotese om, at forskelle i skyggeøkonomiens størrelse snarere han henføres til kulturelle forskelle.

Adskiller man analysen af de nordiske og vesteuropæiske lande fra analysen af de øvrige EU-lande, som det er gjort i figur 2, er sammenhængen mellem kortbetalinger og uformel økonomi ikke så markant. Tendenslinien for Norden og Vesteuropa (blå) er nærmest vandret, og tyder således ikke på nogen sammenhæng overhovedet, og for de øvrige EU-lande er hældningen på tendenslinien (rød) noget mindre end hældningen i figur 1. 

Figur 2

Kilde: ECB Statistical Data Warehouse“Transactions per type of payment service” og Leandro Medina and Friedrich Schneider(2018) Grafik: Veusz

Naturligvis gør anvendelse af kortbetaling det vanskeligere at skjule en transaktion, og det er derfor oplagt, at øget anvendelse af kortbetalinger må have en begrænsende virkning på den uformelle økonomi. Så langt er konklusionen i The Economist korrekt. Men en nøjere analyse af den figur, der anvendes som støtte for konklusionen, antyder at kulturelle og institutionelle forhold kan være af større betydning.

Note:
Tendenslinierne i de to figurer i dette indlæg er såkaldte median-median linier. Tendenslinien i The Economist’s plot er en regressionslinie beregnet efter mindste kvadraters metode.

Referencer:
The Economist:
“Informal payments cost governments hundreds of billions in revenue each year”, Daily Chart 30/9-2019 (link)
ECB Statistical Data Warehouse: “Transactions per type of payment service” (link)
Leandro Medina and Friedrich Schneider: “Shadow Economies Around the World: What Did We Learn Over the Last 20 Years?”,  IMF Working Paper No. 18/17,  24/1 2018 (link)


Datakundskab (data literacy) — en nøglekompetence i det 21. århundrede

15/10/2019          Taleboble Kommentarer

En følge af digitaliseringen er, at der løbende produceres enorme mængder af data. Det har været udgangspunktet for flere indlæg i denne blog, hvor fokus har været på de muligheder og problemer, udviklingen medfører for den officielle statistik. Men naturligvis er der andre end de officielle statistikbureauer, der har øje for de de store datamængder, og som er indstillet på at  udnytte dem. Før der træffes beslutninger af bare lidt mere end rutinemæssig karakter, vil beslutningstagerne i stigende grad spørge om der findes data, der kan belyse problemet, før en beslutning træffes. Da det vil gælde alle områder og niveauer i samfundet, bliver kendskab til data — hvordan de skabes, hvordan de bearbejdes og hvordan de anvendes — en vigtig kompetence for stort set alle. Det betyder naturligvis ikke, at alle skal være eksperter på området, men en grundlæggende viden vil være nødvendig i stort set alle professioner. Og der bliver naturligvis også behov for eksperter.

I praksis betyder det, at datakundskab (data literacy) må forventes af blive et vigtigt fag både i grundskolerne og på de sekundære og videregående uddannelser. Det giver igen anledning til at overveje, hvad faget datakundskab skal indeholde. Til støtte for udviklingen af kurser i datakundkab har Hochschulforum Digitalisierung — en tænketank oprettet af Stifterverband für die Deutsche Wissenschaft  — udgivet et arbejdspapir, der opstiller en såkaldt kompetenceramme for faget datakundkab. En kompetenceramme defineres i papiret som en model til beskrivelse af effektiv adfærd i en given opgavesammenhæng.  Rammen definerer 21 kompetencer fordelt på seks kompetencefelter. En oversigt er vist herunder.

Kompetencefelt Kompetence
Fastlægge problemet Identificere dataanvendelse
Specificere dataanvendelse
Koordinere dataanvendelse
Klargøre data Modellere  dataanvendelse
Overholde databeskyttelse og -sikkerhed
Identificere datakilder
Integrere data
Verificere data
Dataproces
Evaluere data Analysere data
Visualisere data
Verbalisere data
Fortolke dataprodukter Fortolke dataanalyser
Fortolke datavisualiseringer
Fortolke dataverbaliseringer
Fortolke data Dekryptere standardisering
Spore dataindsamling
Rekonstruere datakoncepter
Udlede handling Identificere handlingsmuligheder
Datastyret handling
Vurdere virkning

For hver af de 21 kompetencer giver kompetencerammen en nærmere beskrivelse af kompetencen og opstiller en række mere konkrete eksempler på krav til hhv. viden, færdigheder og holdninger — de tre kompetencedimensioner. Nedenfor er som eksempel vist rammens indhold for kompetencen Fortolke dataverbaliseringer under kompetencefeltet  Fortolke dataprodukter.

Kompetencefelt Fortolke dataprodukter
Kompetence   Fortolke dataverbaliseringer
Beskrivelse Fortolke statistiske egenskaber og modeller  således at konklusioner kan drages eller prognoser opstilles på grundlag af de bagvedliggende data og sammenhænge.
Kompetence-dimension Viden Kendskab til grundlæggende statistiske metoder 
Færdigheder Forstå en beskrevet analyseproces og kritisk granske den

Læse og forstå en statistisk tekst

Holdninger Forholde sig kritisk til beskrivelser og konklusioner

Søge implicit information i teksten

Forholde sig kritisk men være åben over for nye konklusioner og ny indsigter, også hvis de modsiger den nuværende situation

Rammen skelner for hver kompetence mellem tre kompetenceniveauer, og giver eksempler på kravene på de forskellige niveauer. For kompetencen Fortolke dataverbaliseringer er eksemplerne:

Laveste niveau Kan forstå enkle forklaringer af statistiske metoder
Mellemste niveau Kan forstå mundtlige og skriftlige forklaringer af mere komplekse analyseprocesser
Højeste niveau Kan forstå og granske mundtlige og skriftlige forklaringer af mere komplekse analyseprocesser

Rammen kan således anvendes for alle uddannelsesniveauer.

Referencer:
Katharina Schüller, Paulina Busch & Carina Hindinger: “Future Skills: Ein Framework für Data Literacy Kompetenzrahmen und Forschungsbericht”,  Hochschulforum Digitalisierung Nr 47/august 2019 (link)


Trusted Smart Statistics

17/09/2019          Taleboble Kommentarer

Et nationalt statistikinstitut, som f.eks. Danmarks Statistik, indsamler og bearbejder data, og offentliggør de bearbejdede data i form af statistik. Kontrollen med både indsamlingen og bearbejdningen er en hjørnesten i institutternes bestræbelser på at opbygge tillid hos brugerne. Garantien for anvendelse af anerkendte metoder og for åbenhed om både metoder og prioritering bygger bl.a. på, at institutterne har fuld kontrol over hele processen. Denne kontrol over data kan fungere så længe indsamling af data er kostbar og ofte afhængig af lovhjemmel, f.eks. i form af krav om at virksomheder skal besvare statistikinstituttes spørgeskemaer. Men den teknologiske udvikling har medført, at de traditionelt indsamlede datas rolle er blevet mindre. Til gengæld er de data, der mere eller mindre automatisk opstår i forbindelse med f.eks. nethandel, aktivitet på sociale medier og overvågning af trafiksikkerhed — de såkaldte organiske data — blevet meget omfangsrige.

I modsætning til de indsamlede data, der ofte ejes og kontrolleres af officielle statistikinstitutter, så er de organiske data ofte ejet og kontrolleret af private virksomheder som Google, Nets og teleselskaberne. De private ejere er meget bevidste om værdien af deres organiske data og udnytter dem i høj grad forretningsmæssigt. Men de organiske data rummer også megen information, der kan være af samme almene interesse som den traditionelle officielle statistik, og de giver i mange tilfælde muligheder for billigere og/eller bedre statistik, end de traditionelle metoder. Der kan også ligge store muligheder i kombination af et organisk datasæt med traditionelle datasæt eller med andre organiske datasæt. De private ejere vil sjældent have økonomisk interesse i udnyttelse af disse muligheder, og hvis de har, så vil databeskyttelseslovgivningen oftest forhindre det.

Men der er intet i vejen for, at de nationale statistikinstitutter kan udnytte disse muligheder, selv om der naturligvis er en række etiske spørgsmål om omfang af og grænser for anvendelsen, som skal være afklaret. Faktisk har institutterne taget hul på sådanne anvendelser. For Danmarks Statistiks vedkommende kan nævnes anvendelse af stregkodedata i forbrugerprisindekset.

I Eurostat, EU’s officielle statitstikinstitut, er man meget opmærksom på de nye muligheder og på den rolle statistikinstitutterne kan komme til at spille. Som samlet betegnelse for disse processer og deres resultater har Eurostat introduceret begrebet Trusted Smart Statistics(TSS).  

Et centralt træk i TSS er at ejerskabet til data ikke længere ligger hos statistikinstituttet, men instituttet kan gennem kontrol med og ejerskab af de redskaber i form af programmel, der anvendes ved bearbejdningen, sikre kvalitet og åbenhed. Da de organiske data kan have en langt større detaljeringsgrad end traditionelt indsamlede data, kan det være en del af datasikkerheden, at ejerskab og kontrol er fordelt på mange aktører. Det bliver så de officielle statistikintitutters opgave gennem TSS at opbygge systemer og redskaber, der gør forsvarlig og pålidelig anvendelse mulig. 

Referencer:
CROS: “Trusted Smart Statistics in a nutshell”, (link)
Fabio Ricciato & Albrecht Wirthmann: “Trusted Smart Statistics: how new data will change official statistics”, 20/5-2019 DOI:10.5281/zenodo.3066061 (link)

 


Måling af livskvalitet og bæredygtighed i den økonomiske statistik

10/09/2019          Taleboble Kommentarer

Det har, siden nationalregnskabet blev introduceret i midten af den 20. århundrede, været en kendt sag, at opgørelsen af værdien af den samlede produktion, bruttonationalproduktet (BNP), ikke er en særlig velegnet indikator for livskvalitet, og at opgørelsen ikke siger noget om produktionens bæredygtighed. Ikke desto mindre har netop BNP pr. capita ofte været tolket som et mål for livskvalitet, og den manglende hensynstagen til bæredygtighed  har ofte været ignoreret. Producenterne af den økonomiske statistik har i de senere år arbejdet med at finde egnede mål for livskvalitet og bæredygtighed, og i den forbindelse har OECD spillet en vigtig rolle. Peter van de Ven — OECD’s nationalregnskabschef  — har i en artikel i tidskriftet Eurona leveret et overblik over OECD’s hidtidige bestræbelser.

Nationalregnskabet er et omfattende statistisk system, der belyser mange sider af den økonomiske aktivitet, og BNP er blot et enkelt af de mange størrelser, der opgøres. Et naturligt første skridt er derfor at overveje, hvad der kan gøres inden for nationalregnskabets rammer. OECD har i den forbindelse bl.a. valgt at øge fokus på husholdningerne, fremfor den samlede økonomi der bl.a. også omfatter selskaber, og på den disponible indkomst, dvs. indkomst efter skat. Det foretrukne indkomstbegreb omfatter også de indkomster, husholdningerne har i form af gratis ydelser fra det offentlige, f.eks. i forbindelse med sundhed og uddannelse, og kaldes i nationalregnskabet for korrigeret disponibel indkomst. Men da langt fra alle lande kan levere de nødvendige data har OECD som udgangspunkt valgt begrebet disponibel indkomst, der ikke omfatter de de offentlige gratisydelser.

Men livskvalitet kan ikke analyseres udelukkende ud fra nationalregnskabets totalstørrelser, de såkaldte makrodata. Makrodata må suppleres med data for forskellige grupper af husholdninger og personer (f,eks fordeling efter køn, alder og erhverv), de såkaldte mikrodata. Begreberne i og teorien bag nationalregnskabet er forberedt for håndteringen af mikrodata, men i praksis er der store problemer i implementeringen. Problemet har været behandlet bl.a. i arbejdsgrupper i OECD og EU, uden at man endnu er kommet til fuld klarhed, men mange lande er begyndt at udarbejde og offentliggøre mikro-opgørelser, der er konsistente med nationalregnskabets makro-opgørelser.   

Der er dog grænser for, hvor langt man kan komme indenfor de rammer, der sættes af nationalregnskabet. Et af problemerne er den ubetalte husholdningproduktion, dvs. den produktion af f.eks. rengøring og børnepasning, der udføres direkte af en husholdnings egne medlemmer. Denne produktion indgår ikke i nationalregnskabets opgørelser. Købes sådanne ydelser på markedet, eller stilles de til rådighed af det offentlige, vil de derimod indgå. Der er derfor brug for at supplere de nationalregnskabsmæssige opgørelser med skøn over husholdningernes egen produktion. Desværre er det lettere sagt end gjort. 

Et andet problem er husholdningernes forbrug af gratis internettjenester som Google og Facebook. Leverandørerne har indtægter i form af annonceindtægter, som i en eller anden grad må afspejle sig i de priser, forbrugerne betaler for de forbrugsgoder, de køber på markedet. Men præcis hvordan og i hvilket omfang, man herved får afspejlet den værdi, forbruget af tjenesterne har for husholdningerne, er uafklaret. Endnu mere problematisk er forbruget af produkter, der udvikles og stilles til rådighed af frivillige, uden at der overhovedet er involveret betalinger. Styresystemet Linux og kontorpakken OpenOffice er eksempler på sådanne produkter. Husholdningernes forbrug af disse ydelser er slet ikke afspejlet i nationalregnskabet.

Når det drejer sig om  bæredygtighed er det begrænset, hvor meget nationalregnskabet i sin  nuværende form kan bidrage. Men der arbejdes med i tilknytning til nationalregnskabet at opbygget en række supplerende systemer, de såkaldte satellitregnskaber, der skal bidrage til at belyse de områder, de er underbelyst i det egentlige nationalregnskab (kernen). I satellitregnskaberne anvendes i videst muligt omfang de samme begreber og klassifikationer som i nationalregnskabet, således at opgørelserne kan sammenholdes. Der står dog mange problemer tilbage at løse, og endnu er satellitregnskaber kun implementeret i begrænset omfang.

Referencer
Peter van de Ven:
“Measuring economic well-being and sustainability: a practical agenda for the present and the future”, Eurona 1/2019 (link)


Er de officielle statistikbureauers monopol truet?

03/09/2019          Taleboble Kommentarer

Engang, for ikke så længe siden, havde Danmarks Radio monopol på distribution af radio og TV. Telefonvæsenet og postvæsenet er andre eksempler på offentlige monopoler, der har mistet deres monopolstatus. Fra de andre nordiske lande er monopolet på salg af alkohol et godt eksempel. I modsætning hertil er den officielle statistik et eksempel på et offentligt monopol der indtil videre har overlevet.

Men det er måske kun et spørgsmål om tid! Ulrik Rongved Amundsen — webredaktør for Norges officielle statistikbureau (SSB) — har i et et indlæg til  Nordisk Statistikermøde i Helsingfors præsenteret nogle overvejelser om statistikbureauernes fremtidige rolle i lyset af en tekniske og samfundsmæssig udvikling. Udviklingen kan på lidt længere sigt udfordre for den hidtidige monopolstatus.

Som Amundsen ser det, har statistikbureauernes rolle først og fremmest været, at tjene statens regerende elite med nødvendig information. Bureauernes funktion var (og er) at indsamle data, og ved anvendelse af statistiske teknikker at omforme de indsamlede rå data til nyttig og nødvendig indformation. Uden den statistiske information om samfundet vil det ikke være muligt at regere. Da statistikproduktion er kostbar og dataindsamling i mange tilfælde er afhængig af lovhjemmel, har statistikproduktionen været et naturligt statsmonopol. Men it-udviklingen er ved ændre vilkårene. Moderne kommunikation skaber data — oftest i form af såkaldte big data — der er kontrolleret af private virksomheder som Google og Facebook, og adgangen til teknikker til omformning af data til information, typisk i form af computerprogrammel, er blevet billigere. Statistikproduktion kræver ikke længere en solid skattefinansieret statskasse. Staten og dens eksperter ikke længere er så afhængige af statistikbureauerne og det betyder selvfølgelig en trussel mod deres eksistens.

Nu kan kan jo sige, at hvis statistikbureaerne ikke længere er nødvendige, så er de en helt natulig udvikling, at de forsvinder eller indskrænkes betydeligt. Men Amundsens ærinde er at vise, hvordan statikstikbureuerne kan overleve, ved at tilpasse sig udviklingen. Det betyder i praksis, at fokus skal flyttes fra betjening af eksperter til betjening af almindelige borgere.   

Den omstilling kan vise sig at blive vanskelig. Kulturen i statistikbureaerne er konservativ, og de ansatte er vænnet til samarbejdet med eksperterne. Amundsen frygter, at det bliver noget af en overvindelse for bureauerne at at skulle opbygge respekt og imødekommenhed overfor almindelige menneskers informationsbehov. Det er baggrunden for at artiklens titel taler om frygt og afsky (fear and loathing). Frygt for at blive overhalet af udviklingen og afsky for udsigten til at skulle flytte fokus fra eksperter til lægfolk.

Heldigvis for bureauerne er der erfaringer der viser, at en sådan omstilling er mulig. Som forbilleder ser Amundsen det norske statsfjernsyn NRK og Vinmonopolet, der begge med stort held har formået at omforme sig fra at være politikerstyrede redskaber for hhv., kultur- og alkoholpolitik til at være forbrugerorienterede leverandører af underholdning og nydelsesmidler. Statistikbureauerne må ifølge Amundsen indstille sig på en tilsvarende omstilling. Først og fremmest ser han en mulighed og en opgave i at gøre statistikken let at finde, for det kan ikke forventes at brugeren vil bruge mange kræfter på søgeprocessen og at den er let at forstå, for det kan ikke forventes at bruger har forudgående viden om statistik. Ikke nogen nem opgave!

Referencer
Ulrik Rongved Amundsen:
“Fear and loathing in official statistics(or: The death of the expert as a target audience)” , Nordic Statistical Meeting, Helsinki 26-28/8 2019 (link)


EU’s finanser, konsekvenser af Brexit

27/08/2019          Taleboble Kommentarer

Brexit nærmer sig. Næsten alle økonomer og politiske kommentatorer forudser store negative økonomiske følger for både EU og UK. En samlet økonomisk vurdering af konsekvenserne forudsætter overvejelser om mange aspekter af de økonomiske mekanismer, og i den forbindelse også stillingtagen til ukendte og uforudsigelige forhold og sammenhænge. Hertil kommer, at en samlet vurdering naturligvis  skal omfatte mere end de økonomiske konsekvenser. I dette indlæg ser jeg udelukkende på de helt umiddelbare konsekvenser for EU’s indtægter og udgifter.

Som altid er den officielle statistik et godt udgangpunkt den slags overvejelser, og når det drejer sig om økonomien er nationalregnskabet det naturlige udgangspunkt. I tabellen nedenfor er de umiddelbare konsekvenser for EU’s, UK’s og de øvrige medlemslandes finanser illustreret i en nationalregnskabsmæssig opgørelse. Tabellen viser hvordan EU’s indtægter optræder som udgifter for UK og de øvrige medlemslande, og tilsvarende hvordan EU’s udgifter viser sig som indtægter i landene. Indtægter er vis med blå skrift, udgifter med rød

EU’s indtægter og udgifter, 2018, mia. euro

Indtægt for EU
Udgift for
UK Øvrige EU-lande Resten af verdenen
Told mm 27,0 3,9 23,1 0,0
Moms 17,6 3,3 14,3 0,0
BNI-afgift (minus UK-rabat) 104,5 10,3 94,2 0,0
Øvrige løbende overførsler 15,8 0,5 13,0 2,3
I alt 164,9 18,0 144,6 2,3
Udgift for EU
Indtægt for
UK Øvrige EU-lande Resten af verdenen
Subsidier 56,5 3,8 52,7 0,0
Forbrug 25,7 1,9 22,5 1,2
Løbende internationalt samarbejde 32,8 1,3 23,7 7,8
Øvrige løbende overførsler 2,7 0,1 2,5 0,1
Investeringstilskud mv. 41,1 1,0 40,0 0,1
I alt 158,7 8,1 141,5 9,2
Overskud (Nettofordringserhvervelse) 6,2 9,9 3,2 6,9

Kilde: Eurostats databank/bop_euins6_a (link

Som det fremgår af tabellen bidrager UK med omkring 11 pct. af EU’s indtægter. Den vigtigste indtægtspost er BNI-afgiften, som landene i princippet betaler i forhold til størrelsen af deres bruttonationalindkomst (BNI). Fulgte man princippet slavisk skulle UK for 2018 betale ca. 15,2 mia euro i BNI-afgift, men gennem en særlig aftale — UK-rabatten — er dette beløb nedbragt til de 10,3 mia. euro, der er vist i tabellen. Enkelte andre lande, herunder Danmark, er omfattet af tilsvarende rabatordninger, men de er af væsentlig mindre omfang.

På EU’ udgiftside står UK som modtager af ca. 5,1 pct af subsidier mm. Opgjort på denne måde betyder Brexit således, et tab for EU på omkring 10 mia. euro. Skal status quo bevares, skal de øvrige lande øge deres samlede bidrag med op mod 7 pct. Lægges hele byrden på BNI-afgiften skal denne øges med omkring 10 pct. Nedskæringer på udgiftssiden er naturligvis også mulige. Under alle omstændigheder bliver noget at diskutere for de tilbageblivende lande!

De økonomiske fordele og ulemper ved EU-medlemskabet kan ikke belyses udelukkende ud fra EU’s regnskaber. F.eks. udgøres en del af landbrugsstøtten af kunstigt høje fødevarepriser, der betales direkte af EU’s forbrugere, men ikke indgår i EU-institutionernes regnskaber. Og de dynamiske virkninger af de åbne markeder, der er en væsentlig del af EU-samarbejdet, afspejles slet ikke i disse regnskaber.


Eurostats koncernregister

20/08/2019          Taleboble Kommentarer

Erhvervsregistre spiller en central rolle for den økonomiske statistik i alle EU-landene. Et lands erhvervsregister indeholder en række centrale oplyser som adresse, branche antal ansatte og virksomhedsform for alle virksomheder, der er registreret i landet. For statistikmyndighederne tjener erhvervsregistrene først og fremmest som lister over de virksomheder, der skal indberette til statistikkerne, enten ved totaltællinger, hvor alle virksomher skal indberette, eller ved stikprøveundersøgelser, hvor registet tjener som den ramme, hvorfra stikprøven trækkes. Det danske erhvervsregister kaldes det Centrale Virksomhedsregister (CVR) og føres af Erhvervsstyrelsen. Det anvendes af mange offentlige myndigheder, ikke mindst Danmarks Statistik, men alle har gratis adgang til registrets data.

For multinationale koncerner, vil det nationale erhvervsregister normalt kun indeholde oplysninger om kocernens aktivitet i indenlandske enheder, men ikke i filialer, datterselskaber og eventuelt hovedselskab i udlandet. Det betyder, at ingen nationale myndigheder har fuldt overblik over en multinational koncerns aktiviteter, og der er ingen garanti for konsistens i koncernens indberetninger til forskellige landes myndigheder. Det vanskeliggør opbygning af statistikker, der afspejler globaliseringen. Som svar på den udfordring har Eurostat opbygget et fælleseuropæisk koncernregister: EuroGroups Register eller ERG.

ERG omfatter multinationale koncerner, der har aktivitet i mindst et af EU’s eller EFTA’s medlemslande. Registret kan benyttes af landenes statistikmyndigheder og centralbanker, men  der er ikke offentlig adgang til registret. 

Hovedkilden til ERG er erhvervsregistrene i de deltagende lande, suppleret med data fra en kommerciel dataudbyder.  Eurostat vurderer og konsoliderer kildedata, således at resultatet bliver et konsistent register, der giver et samlet overblik over hver multinational koncerns aktivitet.

Registret er under opbygning, og kvaliteten er endnu ikke er helt tilfredsstillende. Eurostat har dog fundet det forsvarligt, at udarbejde en eksperimentel rapport om multinationale koncerner i EU. Rapporten beskriver bl.a koncernernes antal, beskæftigelse, kompleksitet (aktivitet i flere brancher) og geografiske udbredelse.    

Referencer:
Erhvervsstyrelsen: “Om CVR – det Centrale Virksomhedsregister” (link)
August Götzfried, Zsolt Völfinger & Agne Bikauskaite: “The EuroGroups Register”, Paper prepared for the 16th Conference of IAOS, 2018 (link)
Eurostat:  “
Structure of multinational enterprise groups in the EU”  (link)


Nationernes statistiske kapacitet

13/08/2019          Taleboble Kommentarer

For brugere af officiel statistik er det afgørende at kunne stole på, at statistikproducenten har viljen og evnen til at levere statistik af tilstrækkelig høj kvalitet. FN’s “Fundamentale Principper for Officiel Statistik” stiller krav om, at statistikproducenterne skal oplyse om deres kilder, metoder og procedurer, således at en bruger kan vurdere, om kvaliteten er tilstrækkelig til hans formål. For de fleste brugere vil det dog, selvom den nødvendige information er tilgængelig, være en stor og uoverskuelig opgave, selv at skulle foretage en grundig vurdering.

Heldigvis kan brugerne finde støtte i de vurderinger centrale statistikbrugere som EU og Verdensbanken stiller til rådighed. For EU-landene har EU’s statistiske kontor — Eurostat —  offentliggjort detaljerede rapporter, de såkaldte peer reviews, for alle medlemslande, og verdenbanken har beregnet og offentliggjort et kapacitetsindeks (Statistical Capacity Index, SCI) for en række lande.

Eurostats peer reviews er baseret på en grundig gennemgang af hvert lands statistiske system, hvor en lille gruppe eksperter, i samarbejde med landets statistiske myndigheder, undersøger og vurderer alle væsentlige aspekter af systemet. De resulterende rapporter er grundige, men systemet er kostbart og tidskrævene, så der går flere år mellem hver vurdering. Den seneste række af landerapporter er udarbejdet i perioden 2013-2015, og erstatter rapporter fra perioden 2006-2008.

 Verdensbankens SCI-indeks er baseret på en simplere metode, baseret på offentligt tilgængelige data. Det muliggør beregning af indeks hvert år, således at indekset kan anvendes som indikator for den løbende udbygning af et lands statistiske kapacitet, hvilket også er et af formålene. I teorien kunne indekset beregnes for alle lande, men er i praksis kun beregnet for 146  fortrinsvis lav- og mellemindkomstlande.

SCI blev udviklet i 2004. Siden da har kravene til den officielle statistikproduktion ændret sig, bl.a som følge af globalisering og fremkomsten af nye datakilder, nye beregningsmetoder og nye præsentationsformer. Det har ført til overvejelser om en revision af SCI, og i et arbejdsnotat fra Verdensbanken præsenteres et forslag til et nyt indeks, Statistical Performance Index (SPI). Det planlagte nye SPI-indeks adskiller sig fra det hidtidige SCI-indeks bl.a. ved at  inddrage flere dimensioner og omfatte flere lande, herunder også højindkomstlande.  

Referencer:
Michael M. Lokshin, Hai-Anh H. Dang, James Foster, Mustafa Dinc og Grant J. Cameron:
Measuring the Statistical Capacity of Nations”, WORLD BANK…BLOGS, 5/2-2019 (link)
Grant J. Cameron, Hai-Anh H. Dang, Mustafa Dinc, James Foster og Michael M. Lokshin: 
“Measuring the Statistical Capacity of Nations”, World Bank Group, Policy Research Working Paper 8693, januar 2019 (link)
UN Statistics Division: “Fundamental Principles of Official Statistics”, E/RES/2013/21 (link)
Eurostat: “Peer Reviews in the European Statistical System”, (link)
The World Bank: “Data on Statistical Capacity”, (link)

 


USA’s statistiske system

06/08/2019          Taleboble Kommentarer

USA’s statistiske system er stærkt decentraliseret, med en produktion af officiel statistik, der er fordelt på mere end 100 forskellige enheder. Udviklingen er tydeligvis sket ved knopskydning — når et behov er opstået, har man etableret ny enhed — uden særlig fokus på fordelene ved koordinering. Det har naturligvis skabt problemer, og kongressen har da også gennem lovgivning søgt at skabe lidt mere overblik. Den vigtigste lov omhandlende den federale statistikproduktion blev oprindeligt vedtaget i 1980, men revideret 1995. Lovens officielle navn: “Lov om Begrænsning af Papirarbejde” (Paperwork Reduction Act”) antyder, at irritation over, at skulle indberette samme oplysninger til flere myndigheder har været en drivkraft bag loven. Yderligere rammer for den officielle statistik er fastlagt i andre love som “Lov om Beskyttelse af Fortrolig Information og om Statistisk Effektivitet” (Confidential Information Protection and Statistical Efficiency Act, CIPSEA) fra 2002, og  “Lov om Evidensbaseret Politisk Beslutningstagning” (Evidence-Based Policymaking Act) fra 2018 .

Der er stor variation i størrelse og betydning af de mange officielle statistikprodu­center. En væsentlig del af den officielle statistikproduktion — 43 pct. målt ud fra de størrelsen af den finanslovbevillingen til statistikproduktion i 2016 — varetages af 13 såkaldte statistiske hovedmyndigheder (principal statistical agencies). De statistiske hovedmyndigheder er karakteriseret ved, at deres hovedformål er indsamling, behandling og analyse mm. af statistiske oplysninger. Langt den vigtigste er Folketællingebureaet (Bureau of the Census). Andre vigtige hovedmyndigheder er Det Nationale Center for Uddannelsesstatistik (National Center for Education Statistics), Det Nationale Center for Sundhedsstatistik (National Center for Heath Statistics),  Bureauet for Arbejdsmarkedsstatistik (Bureau of Labor Statistics) og Det Økonomiske Analysebureau (Bureau of Economic Analysis). De resterende 57 pct. af finanslovbevillingerne er fordelt mere end 90 institutioner, der ikke har statistikproduktion som hovedopgave, men som på finansloven modtager en bevilling øremærket til statistik. Hertil kommer produktion officielle statistikker som ikke har deres eget punkt på finansloven og statistikker produceret af enheder uden for den egentlige regering (executive branch), f.eks. Nationalbanken  (Federal Reserve).

Folketællingerne, der som fastlagt i forfatningen afholdes hvert 10 år, spiller en helt grundlæggende rolle i den amerikanske statistik, og har været behandlet i en række tidligere indlæg((14/5-2019, 12/6-2018, 19/9-2917 og 23/5-2017). Næste folketælling afholdes i 2020.

Lovgivningen etablerer tre vigtige værktøjer til koordinering og kvalitetssikring af den officielle statistik: et embede som chefstatistiker, et fællesråd for planlægningen af den officielle statistik (Interagency Council on Statistical Policy, ICSP) og en ramme for beskyttelse af den statistiske fortrolighed. Chefstatistikeren har det overordnede ansvar for og myndigheden til at koordinere og overvåge den officielle statistik. Hun (Nancy Potok) er formand for ICSP, der herudover som medlemmer har cheferne for de tretten statistiske hovedmyndigheder og  en enkelt repræsentant for de øvrige officielle statistikproducenter.

I forbindelse med Donald Trumps tiltræden som USA’s præsident blev der fra nogle statistikere og statistikbrugere udtrykt bekymring for, at den nye administration ville svække kvaliteten af den officielle statistik, og måske ligefrem søge at manipulere den (se tidl. indlæg). Den debat kører stadig. Catherine Rampell, kommentator ved The Washington Post, mener at vigtige statistikproducenter som Bureauet for Arbejdsmarkedsstatistik og Det Økonomiske Analysebureau endnu har deres uafhængighed og troværdighed i behold, men at at andre områder, f.eks. miljøstatistikken og fattigdomsstatistikken, er truet.

Referencer:
Office of Management and Budget: “Statistical Programs of the United States Government, fiscal year 2018”  (link)
National Academies of Sciences, Engineering, and Medicine: Principles and Practices for a Federal Statistical Agency” : Sixth Edition. Washington, DC: The National Academies Press. 2017 (link)
US Government: “Strengthening Federal Statistics”, Kapitel 18 i Analytical Perspectives, Budget of the US Government Fiscal Year 2020, (link)
Catherine Rampell: “The Trump Administration’s War on Statistics isn’t Slowing Down”, The Washington Post 23/5-2019 (link)


Danske husholdningers gæld

25/06/2019          Taleboble Kommentarer

I internationale opgørelser, f.eks. fra  OECD og EU, præsenteres danske husholdninger som verdens mest forgældede. Det billede er korrekt, men ufuldstændigt, fordi der udelukkende fokuseres på gælden (bruttogæld), uden hensyn til at husholdningerne også har formue. Ser men i stedet på nettogælden — dvs. forskellen mellem formueposterne og gældsposterne — ser billedet anderledes ud, fordi de husholdningerne har betydelige formuer, der modsvarer gælden. Danmarks Statistik har i en analyse søgt at give et mere nuanceret billede af husholdningernes formueforhold. I analysen anvendes familier, og ikke husholdninger, som tællingsenhed, men den forskel påvirker ikke de gundlæggende resultater.

Analysens hovedkonklusion  er, at danske familiers finansielle stilling  ganske er solid, når man ser på det samlede billede, dvs. inddrager både aktiver og passiver i analysen. Forskellen mellem værdien af aktiverne og passiverne udgør nettoformuen, og her står danske familier som helhed ganske stærkt med en gennemsnitlig nettoformue på næsten 2 mio. kr. En summarisk opgørelse af af familiernes aktiv- og gældsposter er vist nedenfor.

 Danske familiers formue og gæld, 2017 (Gennemsnitlige beløb i 1000 kr.)

Aktiver     Gæld  
Ejerboliger 1.194   Prioritetsgæld 685
Pensionsformue 903   Lån i pensinstitutter 136
Indstående i pengeinstitut 232   Anden gæld 34
Værdipapirer 211      
Andre aktiver 291      
I alt 2.831   I alt 855
Nettoformue 1.976      

Kilde: Danmarks Statistik, www.statistikbanken.dk/FORMUE1

Som det fremgår af oversigten er det prioritetsgælden — først og fremmest lån med pant i ejerboliger — der dominerer på gældsiden. Men som det også ses, så er værdien af ejerboligerne på aktivsiden langt større end prioritetsgælden. Dertil kommer en betydelig pensionsformue. Det er på den baggrund, at analysen konkluderer, at familiernes økonomiske stilling ikke er helt så dyster, som en fokusering udelukkende på bruttogælden kunne antyde.

Analysen påpeger dog også, at den store bruttogæld kan være et problem. I en krisesituation kan ejerboligerne falde i værdi og være vanskellige at sælge, men der skal stadigvæk betales renter og afdrag på gælden. Og pensionsformuen kan der ikke trækkes på i en sådan situation.

Den gennemsnitlige nettoformue op ca. 2 mio. kr dækker over betydelige forskelle familierne imellem.  Den tiendedel af familierne, der har de højeste indkomster har en gennemsnitlig nettoformue på over 7 mio. kr og tiendedelen med de laveste indkomster har en gennemsnitlig formue på 0,2 mio. For familier midt i indkomstfordelingen (medianen) ligger den gennemsnitlige nettoformue omkring 1,3 mio. kr.

Under 5 pct af alle familier har en nettogæld på 100.000 kr. eller mere, men andelen noget større blandt familierne med de laveste indkomster. Analysen omfatter en lidt dybere redegørelse for denne gruppes arbejdsmarkedstilknytning og familietype (alder og antal børn). Der leveres også nogle overvejelser om den tidsmæssige mobilitet i formue og gæld, f.eks. i hvilket omfang familierne over tiden kommer ud af gammel gæld.

Referencer:
Danmarks Statistik:  Er de danske familier dybt forgældede?”, DSTAnalyse, 11/6-2019 (link


Den globale indkomstfordeling

18/06/2019          Taleboble Kommentarer

Gini-koefficienten er det mest udbredte (men ikke det eneste) mål for ulighed i indkomstfordelinger (se tidl. indlæg). Oftest angives Gini-koefficienten i procent således at en kvotient på 0 angiver fuldstændig lighed, dvs at alle har samme indkomst, og en kvotient på 100 angiver fulstændig ulighed, dvs. at al indkomst tilfalder en indkomstmodtager. I paksis ligger værdien naturligvis et sted derimellem. I EU-landende ligger koefficienten mellem 23 og 40. Danmark ligger i den lave ende med en Gini-koefficient omkring 28.

Traditionelt opgøres og sammenlignes Gini-koefficienter for lande, som f.eks i tabel ilc_di12 i Eurostats statistikbank. EU opgør også en Gini-koefficient for EU som helhed — den er omkring 40 — og der forekommer også opgørelser af Gini-koefficienten for verden som helhed. Verdens samlede indkomstulighed kan dels tilskrives forskelle i indkomstniveau mellem rige og fattige lande og dels ulighed indenfor de enkelte lande. Der kan bo meget rige mennesker i meget fattige lande, og fattigdom forekommer også i rige lande. Økonomen Jørgen Modalsli — forskningsleder i det norske statistikbureau — har i en artikel (Modalsli 2017) søgt at opdele  Gini-koefficienten for hele verden i de komponenter, der kan tilskrives indkomstforskelle mellem lande, og de komponenter, der kan tilskrives ulighed inden for de enkelte lande. 

Modalslis beregninger vedrører året 2005, hvor han opgør Gini-koefficienten for verden som helhed til 69,7. I hans samlede beregninger indgår 188 lande. I tabellen neden for er resultatene aggregeret på syv regioner. Diagonalen i tabellen viser hvor stor en andel (i pct.) af den samlede Gini-koefficent på 69,7, der kan tiskrives indkomstforskelle mellem indkomstmodtagere indenfor hver af de syv regioner. Tallene uden for diagonalen angiver andelen, der kan tilskrives forskelle mellem regionerne indbydes. De indbyrdes forskelle afspejler både forskelle i de regionale Gini-koefficienter, dvs.  graden af ulighed i de enkelte regioner,  og forskelle i gennemsnitsindkomst mellem regionerne. 

Global Gini-koefficient dekomponeret på regioner (pct. af samlet koefficient1)

  Afrika Latin-amerika2 Nord-amerika Europa Asien, vest Asien, øst Oceanien
Afrika 0            
Latinamerika1 1 1          
Nordamerika 5 3 1        
Europa 5 3 3 2      
Asien, vest 2 3 10 11 2    
Asien, øst 5 4 10 11 10 7  
Oceanien 0 0 0 0 0 1 0

Noter: 1Tallene i tabellen summer op til 100   2Inklusiv Caribien

Som det  fremgår af tabellen, så er det forskellene mellem Nordamerika og Europa på den ene side og Asien på den anden og mellem det vestlige og østlige Asien, der bidrager mest til den samlede ulighed. Også de interne forskelle i det østlige Asien, der både omfatter et stort rigt land som Japan og et stort fattigt land som Kina, bidrager betydeligt. Selv om Afrika og Latinamerika er fattige regioner med en høj grad af ulighed i indkomstfordelingen, indgår de kun med forholdsvis beskedne andele i den samlede verdensulighed. Det skyldes, at de to regioners folketal er lavt i forhold til Asiens.

Ser man på de detaljerede landeresultater, så er det naturligt nok forskellen mellem verdens største rige økonomi, USA, og verdens største fattige økonomier, Kina og Indien, der dominerer. Ulighederne mellem Kina og USA tegner sig for for 6,0 pct af den globale ulighed, og forskellene mellem USA og Indien for 5,5 pct.  

Referencer:
Jørgen Modalsli:
“Decomposing Global Inequality”, Review of Income and Wealth Ser 3 Nr 3 september 2017


Avislæsning i Danmark

11/06/2019          Taleboble Kommentarer

Der læses markant mindre avis i Danmark i dag end for ti år siden. Værst er det gået for de landsdækkende dagblade, der i 2018 har mindre end en trediedel af det antal læsere, de havde i 2017, men som det fremgår af figuren nedenfor, så er også søndagsaviser og regionale dagblade ramt af tilbagegangen. Det relativt høje niveau for landsdækkende søndagsaviser i perioden 2011 – 2016 skyldes udelukkende, at den husstandsomdelte gratisavis — Søndagsavisen — kun i denne peride indgår i talllene. Antallet af læsere af en avis, er opgjort som antallet af personer, der har læst mindst to minutter i den pågældende avis. Læsertallene i figuren er opgjort som bruttotal, dvs. en person, der har læst i flere aviser indgår i læsertallet med det antal aviser, han har læst.

Figur 1: Læsere af dagblade og søndagsaviser 2007 – 2018

Kilde:Danmarks Statistikbank/DAGBLAD2

Læsertallene offentliggøres af Danmarks Statistik, men er baseret på data indsamlet af Index Danmark/Gallup.  Danmarks Statistik offentliggør kun aggregerede tal, men IndexDanmark/Gallup offentliggør læsertal for de enkelte aviser. 

Tilbagegangen har, som det fremgår af figur 2, ramt næsten alle aviser. De eneste, der skiller sig ud er Kristeligt Dagblad, der har haft en beskeden fremgang, og Information, der sammenlignet med de øvrige aviser kun har haft en beskeden tilbagegang.

Figur 2: Avisernes læsertal i 2007 og 2018

 Kilde: Læsertal fra Index Danmark/Gallup

Det er en nærliggende tanke, at det store fald i avislæsning hænger sammen med internettets stigende udbredelse. Af Danmarks Statistiks årlige opgørelser af IT-anvendelse i befolkningen (Statistikbanken/BBRIT07) fremgår da også, at den andel af befolkningen, der læser nyheder på nettet er steget fra 52 pct. i 2008 til 84 pct. i 2017.

Referencer
Danmarks Statistik: “Statistikdokumentation for Dagblade og tidsskrifter 2018”, (link)
Danmarks Statistik: Statistibanken/DAGBLAD2 (link)
Danmarks Statistik: Statistibanken/NEBRIT09 (link)
Indeks Danmark/Gallup: Halvårlige opgørelser af læsertal




Økonomisk vækst målt gennem lysdata fra satellitbilleder

28/05/2019          Taleboble Kommentarer

Bruttonationalproduktet (BNP) pr capita er — trods problemer med opgørelse og tolkning — standardmålet ved sammenligning af nationers velstand og økonomiske udvikling. Men opgørelsen kræver et omfattende og pålideligt statistisk system og er ofte behæftet med betydelig usikkerhed, navnlig for mellem- og lavindkomstlande, med svagt udbyggede statistiksystemer. I et arbejdspapir fra IMF har to forskere —  Yingyao Hu og Jiaxiong Yao — forsøgt at belyse usikkerheden ved at sammenligne de officielle opgørelser af BNP med den natlige oplysning, de kan måles fra satellitter. Antagelsen er at graden den natlige oplysning afspejler økonomisk aktivitet og formåen, og derfor vil variere i nogenlunde samme takt som BNP.

Hu og Yao ser ikke en opgørelse baseret på satellitdata som et alternativ til den traditionelle BNP-opgørelse. Deres ide er at skaffe viden om den generelle sammenhæng mellem BNP og lysmængde, og bruge denne viden til at konstruere et alternativt, mere præcist, BNP-mål ved at kombinere observationer af lysdata med den officielle BNP-opgørelse.

Metoden virker bedst for lav- og mellemindkomstlande. For højindkomstlande kan lysdata kun bidrage beskedent til en forbedret opgørelse, bl.a. fordi de officielle opgørelse i forvejen er af god kvalitet. Hertil kommer, at sammenhængen mellem lysemission og økonomisk aktivitet er mindre udpræget i højindkomstlande, hvor økonomisk vækst ofte har forbindelse med teknologisk innovation, der ikke genererer så meget lysemission som f.eks. opbygning af fysisk infrastuktur i form af bygninger og veje.

I forbindelse med konflikter og politisk ustabilitet kommer et lands statistiske kapacitet er under pres, fordi dataindsamlingen vanskeliggøres. En statistikproducent, der har vanskeligt ved at indsamle nye data, vil være nødt til at tage udgangspunkt i eksisterende data og søge at fremskrive dem. En sådan fremskrivning vil ofte være konservativ, og tendere mod at undervurdere et fald i BNP. Pålideligheden af satellitdata påvirkes derimod ikke af begivenheder på jorden, så det alternative mål kan i et sådanne tilfælde bidrage til et bedre billede af udviklingen.

Referencer:
Yingyao Hu og Jiaxiong Yao: “Illuminating Economic Growth”, IMF Working Paper WP/19/77, 9. april 2019 (link)


Data Science Campus

21/05/2019          Taleboble Kommentarer

I marts 2017 oprettede det britiske nationale statistikinstitut, Office for National Statistics (tidl. indlæg) en særlig enhed for forskning og uddannelse under navnet Data Science Campus (DSC). Enheden fik hjemsted i Newport i Wales, hvor Office for National Statistics har et af sine kontorer. Oprettelsen var et af resultaterne af anbefalingerne i den såkaldte Bean-rapport fra 2016 (tidl. indlæg), hvor professor Charles Bean leverede en samlet vurdering af den britiske økonomiske statistik og en række anbefalinger til forbedringer. I anledning af DSC’s toårsdag i marts 2019, blev en status for udviklingen i de første to år offentliggjort. 

På udannelsessiden tilbyder DSC et omfattende program for videreuddannelse af offentligt ansatte, rækkende fra to-timers workshops til en 2-4 årig kandidatuddannelse som datanalytiker med særlig fokus på behovene i den offentlige administration, herunder den officielle statistik. Der tilbydes også overbygningsuddannelser for kandidater (post-graduate). 

På udviklingssiden har DSC en række projekter kørende bl.a. om statistisk anvendelse af betalingsdata,  risiko for ensomhed, og bedre forståelse af hvad der kendetegner virksomheder med høj vækst. Blandt de afsluttede projekter kan nævnes dannelse af syntetiske data og forbedring af søgefunktionen på Office for National Statistics’ hjemmeside. DSC tilstræber en høj grad af åbenhed i sit arbejde og stiller det programmel, der udvikles, til rådighed for andre gennem GitHub.

Referencer:
Data Science Campus:
Hjemmeside, (link)
Data Science Campus: “Our First Two Years”, (link)
Data Science Campus: github side (link)

 


Differential privacy i den amerikanske folketælling

14/05/2019          Taleboble Kommentarer

Som omtalt i mit tidligere indlæg om differentiel privacy (link) har man i USA besluttet, at differential privacy (i det følgende kaldet DP) skal være grundlaget for fortrolighedsbeskyttelsen i den amerikanske folketælling for 2020.  Den beslutning har stillet Folketællingsbureauet (Census Bureau) over for en række udfordringer. Bureauets afdelingsdirektør for forskning og metode — John Abowd — har i et foredrag offentliggjort på YouTube leveret nogle overvejelser omkring disse udfordringer. Han har også sammen med  Simson L. Garfinkel og Sarah Powazek lidt dybere redegjort for udfordringerne i artiklen Issues Encountered Deploying Differential Privacy“.

DP er et ret nyt forskningsobjekt — de første artikler om emnet udkom i begyndelsen af dette årtusind —  så en af udfordringerne har været, at finde kvalificeret personale og egnede redskaber bl.a i form af programmel og matematiske metoder. I det omfang programmel og metoder eksisterer, har de vist sig ikke umiddelbart at kunne opfylde bureauets konkrete behov, så udviklingen af nye metoder er også en udfordring. Men den største udfordring er efter Abowds opfattelse at få brugerne til at forstå, at de nye offentliggørelsesprincipper, som bliver følgen af DP, i mange tilfælde kræver, at de de hidtil anvendte modeller, værktøjer og metoder må ændres.

Det er et centralt led i en DP-baseret fortrolighedpolitik, at den samlede information, der kan offentliggøres på grundlag af en given database, i dette tilfælde folketællingsresultaterne, må begrænses. Det kan ske ved lægge loft over omfanget af data , der offentliggøres, eller ved af mindske præcisionen i offentliggørelserne. Præcisionen mindskes ved de tal der offentliggøres afviger lidt fra de faktisk opgjorte tal. Det kaldes at indlægge støj i opgørelserne. I praksis vil en kombination af de to metoder blive anvendt

Hvor megen information, der tillades udtrukket af databasen, skal afgøres på forhånd ud fra en afvejning mellem risikoen for fortrolighedsbrud og ønsket om mest mulig information. Det er en politisk og ikke en teknisk afvejning, så den afgørelse vil blive truffet i en politisk beslutningsproces. Resultatet bliver et informationsbudget, som herefter skal fordeles mellem forskellige anvendelser. Det kan næppe undgå at give konflikter mellem forskellige brugerinteresser. Det vil nok også skabe utilfredshed hos brugerne, at deres hidtidige metoder og programmer skal tilpasses.  F.,eks. vil mikrodatasæt ikke nødvendigvis kunne leveres i den hidtidige form.

Referencer:
Simson L. Garfinkel, John M. Abowd og Sarah Powazek:  “Issues Encountered Deploying Differential Privacy”, arXiv:1809.02201v1 [cs.CR] 6 Sep 2018 (link)
 John M. Abowd: “
Stepping-up: The Census Bureau Sets an Example of How to Be a Good Data Steward in the 21st Century”, YouTube (link) 


Offentliggørelse af usikkerhed i officiel statistik — COMUNIKOS-projektet

07/05/2019          Taleboble Kommentarer

Resultatene fra en officiel statistisk opgørelse præsenteres sædvanligvis som en række observationer, f.eks antal personer og gennemsnitlig indkomst, vedrørende en række klart afgrænsede delpopulationer, f.eks. aldersgrupper. I enkelte tilfælde bliver der i forbindelse med offentliggørelsen leveret nogle oplysninger omkring usikkerheden på opgørelserne, og i dokumentationen af statistikkerne findes altid en vurdering af usikkerheden. Denne vurdering er dog oftest ret generel og holdt i vage vendinger. Der er ikke tradition for en systematisk, formaliseret og standardiseret præsentation af usikkerheden i statistiske opgørelser.

Med henblik på dels at skabe bedre overblik over eksisterende metoder og praksis for præsentation af usikkerheden i opgørelse af officiel statistik, og dels at vurdere mulighederne for forbedringer i præsentationen, er der i EU-regi blevet etableret et projekt under overskriften “Communicating Uncertainty in Key Official Statistics” — forkortet COMUNIKOS. Som pilotprojekt er valgt opgørelsen af forbrugerprisindeks på grundlag af scannerdata. Projektet forventes afsluttet i juni2020 og resultaterne vil løbende blive rapporteret.

Referencer:
EU: “Conunikos-projektets hjemmeside” (link)


Arbejdstidsregnskabet

30/04/2019          Taleboble Kommentarer

Den danske arbejdsmarkedsstatistik består dels i en række stikprøvebaserede spørgeskemaunderøgelser, dels i en række registerbaserede totaltællinger, hvor datagrundlaget er oplysninger fra administrative registre. Spørgeskemaunder­søgelserne gør det muligt at anvende de begreber, der giver den bedste mening i statistikken, typisk baseret på internationalt fastlagte definitioner. Til gengæld er pålideligheden og mulighederne for detaljerede opgørelser mindre end i registerstatistikkerne. Ulempen ved registerstatistikkerne er, at begreberne må tilpasses registrenes muligheder og derfor ikke altid er optimale set fra statistikkens synspunkt.

Med henblik på at skabe rammen om en sammenhængende og integreret arbejdsmarkedsstatistik har Danmarks Statistik etableret to grundlæggende statistiksystemer, Arbejdsmarkedsregnskabet og Arbejdstidregnskabet. Arbejdsmarkedsregnskabet har jeg beskrevet i et tidligere indlæg. Her følger en tilsvarende beskrivelse af Arbejdstidsregnskabet.

Det grundlæggende objekt (tællingsenheden) i Arbejdstidsregnskabet er jobbet. Arbejdstidsregnskabets populationen udgøres af jobs udført i dansk registrerede virksomheder, herunder skibe under dansk flag. Til et job er knyttet en person, der udfører jobbet,  og jobbet har en varighed målt i timer og en aflønning (kompensation) målt i kr. Der er altid tilknyttet én og kun én person til et job, men én person kan godt have flere jobs.

Det er opgørelsen af antallet af præsterede arbejdstimer, der er Arbejdstidsregnskabets hovedformål, men i statistikken opgøres også antallet beskæftigede personer, antallet af jobs og lønsummen. Som baggrundsvariable indgår branche, sektor (pivat/offentlig), socioøkonomisk status (lønmodtager/selvstændig) og køn.

At jobbet er det grundlæggende objekt betyder ikke, at der er etableret et register med data for hvert enkelt job. I praksis opgøres a­rbejdstidsregnskabet som en aggregeret, men detaljeret tabel, der danner grundlaget for publicering og for bidrag til andre statistikker. Den vigtigste kilde til opgørelsen er Arbejdsmarkedsregnskabet. Herudover anvendes Lønstrukturstatistikken, Indkomststatikken og Lønmodtagerbeskæftigelsen som kilder.

Der offentliggøres i statistikbanken både årlige og kvartalsvise serier for arbejdstidsregnskabet. Nedenfor er vist en summarisk opgørelse for året 2017

 2017 Enhed I alt Mænd Kvinder
Præsteret tid mio timer 3.896 2.255 1.642
Beskæftigede 1000 personer 2.878 1.543 1.335
Job tusinder 3.112 1.692 1.420
Lønsum mia. kr 1.100 648 452
Arbejdstid pr. beskæftiget timer 1.354 1.461 1.230

Kilde: Danmarks Statistikbank/ATR118

Referencer:
Danmarks Statistik: “Statistikdokumentation for Arbejdstidsregnskab 2018” (link)


Differentiel privacy som grundlag for beskyttelse af statistisk fortrolighed

23/04/2019          Taleboble Kommentarer

Det er et centralt krav til den officielle statistik at den skal levere pålidelige og detaljerede data til alle brugere. Det er også et centralt krav, at den skal sikre statistisk fortrolighed, herunder beskyttelse af dataleverandørernes identitet. Kravene fremgår bla. af EU’s Adfærdskodeks for Europæiske Statistikker. De to krav kan stride imod hinanden, så ved offentliggørelse må der foretages en afvejning af de to krav. I praksis har man hidtil løst problemet ved simple metoder, som at undlade offentliggørelse af celler i tabeller, hvis cellen kun omfatter meget få enheder, eller ved at anonymisere mikrodata, før de stilles til rådighed for forskere.

De simple metoder har været anset for tilstrækkelige, fordi det er blevet betragtet som utænkeligt, at nogen ville forsøge at udlede beskyttede data fra statistikkerene ved at kombinere forskellige opgørelser fra den samme kilde. Ikke fordi det i princippet var umuligt, men fordi det ville kræve så omfattende ressourcer, bl.a.  i form af computerkraft, at ingen ville finde det umagen værd.

Det er ikke nødvendigvis tilfældet længere. Computerkraft er blevet billigere og blandt producenter af statistik har den erkendelse bredt sig, at der nu er en seriøs risiko for alvorlige angreb på statistikkernes fortrolighedsbeskyttelse. Det har skærpet bevistheden om afvejningsproblemet, for man har også erkendt, at fuld beskyttelse af fortroligheden kan kun opnås ved helt at undlade offentliggørelse. Derfor er den  eneste praktiske mulighed, at man på forhånd gør sig overvejelser om, hvor stor en risiko for brud på fortroligheden, man vil acceptere, og efterfølgende indretter sin publiceringspolitik på det grundlag.

En metode til at beskyttelse af fortroligheden er at gå på kompromis med præcisionen i opgørelserne. I stedet for at offentliggøre det tal der faktisk fremgår af de statistiske opgørelser, så offentliggøres et lidt afvigende tal. Er det korrekte tal f.eks 1, kan man vælge at offentliggøre 0 eller 2 i stedet. Den tekniske betegnelse for fremgangsmåden er at indlægge støj i resultaterne. Brugeren vil stadig få en brugbar indikation af størrelsesordenen samtidig med, at det bliver vanskeligere at gennemføre et vellykket angreb på fortrolighedsbeskyttelsen.   

Differential privacy er en egenskab ved en matematisk teknik, der gør det muligt, at fastlægge hvor meget støj, der skal implementeres i forbindelse med offentliggørelsen, for at sikre et givet niveau af fortrolighedsbeskyttelse. Før offentliggørelsen påbegyndes fastlægges et såkaldt fortrolighedsbudget, der er et mål for, hvor meget og hvor detaljeret der kan offentliggøres. Differential privacy leverer redskaberne til at opgøre budgettet, når beskyttelsesniveauet er fastlagt. Fastlæggelsen af hvilket beskyttelsesniveau, man vil acceptere,  kan differentiel privacy-metoderne derimod ikke bidrage til. Det er og bliver et  politisk spørgsmål.   

Når fortrolighedsbudgettet er fastlagt, skal det afgøres, hvilke tabeller der skal offentliggøres. Hver tabel, der offentliggøres, trækker på budgettet, så det skal nøje overvejes, hvilke tabeller man vil vælge at offentliggøre. Enhver offentliggørelse belaster budgettet, således at der blive mindre til rådighed for andre offentliggørelser. Og budgettet lægger naturligvis en øvre grænse for, hvor meget der i alt kan offentliggøres.

USA’s folketællingsbureau har besluttet, at differentiel privacy skal være grundlaget for fortrolighedspolitikken i forbindelse med den næste folketælling der finder sted i 2020. Forberedelserne har givet anledning til en række erfaringer og overvejelser om, hvordan anvendelse af differentiel privacy i officiel statistik på en række områder vil ændre den måde hvorpå statistikken opfattes og anvendes. Disse erfaringer og overvejelser vil jeg vende tilbage til i et senere indlæg.

Referencer:
Eurostat:
“Adfærdskodeks for Europæiske Statistikker”, Eurostat 2017 (link)
Hector Page, Charlie Cabot & Kobbi Nissim,: Differential privacy: an introduction for statistical agencies,  Privatar 2018 (link)


Indvandrere og efterkommere i de nordiske lande

09/04/2019          Taleboble Kommentarer

Danmarks Statistik har for nylig (26/3) udgivet en Analyse om indvandrere og efterkommere i de nordiske lande. Statistik om indvandrere og efterkommere har været produceret af Danmarks Statistik i flere år, men da ingen andre lande hidtil har haft tilsvarende opgørelser, har internationale sammenligninger ikke været mulige. Med en række tabeller i den fællesnordiske statistikbank, Nordic Statistics Database, om indvandrere og  efterkommere, er der nu opstået en mulighed for sammenligning mellem de nordiske lande. Det er den mulighed Danmarks Statistik har udnyttet i Analysen. Tabellerne er udarbejdet i et samarbejde mellem de nordiske officielle statistikbureaer. Definitionen på indvandrere og efterkommere i den fællesnordiske statistik ligger tæt på, men er ikke helt identisk med, definitionen i den danske statistik.

Analysen fokuserer på antallet af indvandrere og efterkommere og på deres uddannelsesforhold og arbejdsmarkedstilnytning. Nogle af hovedresultaterne er i summarisk form gengivet i dette indlæg. I indlægget skelnes mellem indvandrere fra vestlige og ikke-vestlige lande, således som traditionen har været i Danmarks Statistiks opgørelser, selv om definitionerne ikke er helt identiske. I Analysen (og i den fællesnordiske statistikbank) anvendes en mere detaljeret opdeling af oprindelseslandene på regioner

Tabel 1: Indvandrere og efterkommeres befolkningsandele i nordiske lande

Samlet befolkning Indvandrere Efterkommere
Indvandre-
re og efter-kommere i alt
Vestlige lande1 Ikke-
vestlige lande
Vestlige lande1 Ikke-vestlige lande
1000 pers. pct.
Danmark 5.749 4,2 5,7 0,5 2,5 12,8
Finland 5.503 1,7 3,9 0,2 0,9 6,6
Norge 5.258 6,5 7,3 0,7 2,3 16,8
Sverige 9.995 5,8 11,1 1,7 3,7 22,2

Note: 1Omfatter regionerne Nordiske lande, EU/EØS og Nordamerika og Oceanien
Kilde: Nordic Statistics Database/CITI03

Indvandreres og efterkommeres andel af de nordiske befolkninger er vist i tabel 1. Størst andel finder man i Sverige og lavest i Finland. I alle landene kommer flertallet af indvandrere og efterkommere fra ikke-vestlige lande, men andelen er særligt høj i Sverige, hvor ikke-vestlige indvandrere mm. udgør omkring 15 pct. af befolkningen.

Tabel 2: Indvandrere og efterkommeres beskæftigelsesfrekvens i nordiske lande

Indvandrere Efterkommere
Indfødte
Vestlige lande1 Ikke-
vestlige lande
Vestlige lande1 Ikke-
vestlige lande
pct af 20-64 årige
Danmark 66,6 51,3 70,7 60,6 77,9
Finland 62,2 46,2 59,0 52,5 71,8
Norge 74,0 55,8 72,3 67,1 78,8
Sverige 67,8 56,6 79,4 70,4 84,2

Note: 1Omfatter regionerne Nordiske lande, EU/EØS og Nordamerika og Oceanien
Kilde: Egne beregninger på grundlag af tabeller i Nordic Statistics Database

I tabel 2 er vist beskæftigelsesfrekvensen for indvandrere og efterkommere sammenlignet med den indfødte befolkning. Beskæftigelsesfrekvensen er i alle landede lav for navnlig indvandrere fra ikke vestlige lande. Beskæftigelsesfrekvensen er højere for efterkommere, men dog stadig under frekvensen for den indfødte befolkning. I Analysen påpeges det, at forskellene i beskæftigelsesfrekvens delvis kan forklares af forskelle i køn, alder, uddannelse, længden af opholdet og begrundelsen for opholdstilladelsen (flygtning, familesammenføring, arbejde eller uddannelse). Alle disse forhold er belyst i tabellerne i den fællesnordiske statistikbank.

Referencer:
Nordic Statistics Database , www.nordicstatistics.org/statistics (link)
Danmarks Statistik: “Indvandrere og efterkommere i de nordiske lande”, DSTAnalyse 2018:04 26/3-2019 (link)


Kvaliteten af det kinesiske nationalregnskab

26/03/2019          Taleboble Kommentarer

Der er blandt verdens brugere af officiel statistik en kritisk holdning til kvaliteten af den officielle kinesiske statistik. Landets centrale statistikmyndighed anses generelt for kompetent, men der er naturligt nok store vanskeligheder, der skal overvindes, landets størrelse, historie og administrative system taget i betragtning. Hertil kommer, at åbenheden om problemer og metoder er begrænset. Da Kinas stigende rolle i vedensøkonomien, som den bla. viser sig i bruttonationalproduktet (BNP) og andre størrelser fra nationalregnskabet, medfører et øget behov for pålidelig statistik, har flere forskere førsøgt at vurdere størrelsen af de formodede skævheder i den kinesiske statistik, og at udarbejde alternative skøn, der søger at korrigere for disse skævheder.

Et eksempel er en gruppe forskere — en fra University of Chicago og tre fra Chinese University of Hong Kong — der for nyligt har offentliggjort en kritisk gennemgang af nogle centrale størrelser i det kinesiske nationalregnskab. De kalder ligefrem deres gennemgang for kriminalteknisk (forensic) undersøgelse. Deres fremgangsmåde er. at sammenligne de officielle nationalregnskabstal med andre målinger, som de betragter som mere pålidelige. I tabellen herunder er de officielle opgørelser af Kinas bruttonationalprodukt sammenholdt med ét af forskergruppens skøn.

Årlig vækst i Kinas bruttonationalprodukt (pct.) siden 2007

År Officielle data Moms-korrigeret
2007 23,15 23,15
2008 18.24 16,25
2009 9,25 7,92
2010 18,32 14,99
2011 18.47 15,43
2012 10,44 9,86
2013 10,16 8,77
2014 8,19 6,48
2015 7,00 6,20
2016 7,91 6,62
Gennensnit 12,00 10,28

Kilde: Wei Chen Chinese, Xilu Chen, Chang-Tai Hsieh & Zheng (Michael) Song, tabel 2

Tabellens første kolonne viser den officielle opgørelse af væksten i det kinesiske bruttonationalprodukt (BNP). Den anden viser en skønnet vækst opgjort på grundlag of udviklingen i momsprovenuet.

De officielle tal er baseret på indberetninger fra de lokale statistikmyndigheder i Kinas provinser. Det er opfattelsen hos de fire forfattere, at de centrale statistikmyndigheder gør sig store anstrengelser for at etablere pålidelige skøn, men at det samme ikke er tilfældet for de provinsernes lokale myndigheder. De er under pres fra lokale administrative myndigheder for at overvurdere væksten i indberetningerne, fordi væksten indgår som en faktor i deres aflønnings- og forfremmelsessystem. Det er de centrale myndigheder fuldt bevidste om, og søger at kompensere for det, ved at justere de indberettede tal nedad ved opgørelsen af Kinas samlede vækst.

Når det gælder indberetningen af momsprovenuet har de lokale myndigheder ingen interesse i at undervurdere indberetningerne, da de får del i indtægterne. Derfor har de fire forfattere antaget, at man kunne opnå et mere pålideligt skøn, ved at estimere væksten i BNP med udgangspunkt i væksten i momsprovenuet.

Som det fremgår af tabellen, ligger de momsbaserede skøn lavere end de officielle. Konklusionen er, at de  officielle tal overvurderer væksten i den kinesiske økonomi. Der er stadig tale om en høj vækst, men den gennemsnitlige årlige vækst er ifølge denne beregning overvurderet med 1,7 procentpoint. Set over en tiårig periode betyder det en overvurdering af det samlede BNP på omkring 14 pct.

Gruppen har også opgjort et alternativt skøn baseret på en model, hvor nationalproduktet bestemmes på grundlag af en række variable uden for nationalregnskabet. De anvendte variable er  det samlede skatteprovenu, eksport, import, forbrug af elektricitet, godstransport på jernbane, nye banklån og nattelys registeret af satellitter. Resultaterne fra de modelbaserede skøn peger i samme retning som de momsbaserede.

Referencer:
Wei Chen Chinese, Xilu Chen, Chang-Tai Hsieh & Zheng (Michael) Song: “A Forensic Examination of China’s National Accounts”, Brookings 7/3 2019 (link)
Dmitriy Plekhanov: “Quality of China’s Official Statistics: A Brief Review of Academic Perspectives”, The Copenhagen Journal of Asian Studies, Vol 35., no 1 (2017) (link)
The Economist: “China’s economy might be nearly a seventh smaller than reported”, 7/3-2019 (link)

 


Arbejdsmarkedsregnskabet

19/03/2019          Taleboble Kommentarer

Arbejdsmarkedet belyses i en række statistikker fra Danmarks Statistik, bl.a  Den Registerbaserede Arbejdsstyrkestatistik (RAS), Fraværsstatistikken, Arbejdskraftundersøgelsen og Lønstrukturstatistikken. Hver af disse statistikker tjener et formål, men da de er forskellige med hensyn til populationsafgrænsning og begrebsdefinitioner, kan det være vanskeligt at danne sig et samlet overblik. Derfor har Danmarks Statistik etableret to såkaldt integrerede arbejdsmarkedsstatistiske systemer — Arbejdsmarkedsregnskabet (AMR) og Arbejdstidsregnskabet (ATR) — der skal bidrage til et samlet overblik. AMR belyser befolkningens tilknytning til arbejdsmarkedet, og ATR belyser den samlede mængde udført arbejde, målt i timer. I dette indlæg giver jeg en kort beskrivelse af AMR. En tilsvarende beskrivelse af ATR følger senere.

En meget summarisk sammenfatning af AMR’s opgørelse af befolkningens arbejdsmarkedstilknytning er vist i tabellen nedenfor. I statistikbanken findes en betydeligt mere detaljeret opgørelse.

Befolkningens tilknytning til arbejdsmarkedet, 2016

Tilknytning til arbejdsmarkedet 1000
fuldtids-personer
I arbejdsstyrken I beskæftigelse 2.292
Arbejdsløs 106
Uden for arbejdsstyrken Midlertidigt uden for arbejdsstyrken 242
Pensionist 1.291
Under uddannelse 1.085
Barn/Ung (ikke under uddannelse) 375
Uden for arbejdsstyrke i øvr. 328
Befolkningen i alt 5.719

Kilde: Danmarks Statistik, Statistikbanken/AMR1

Tilknytningen til arbejdsmarkedet opgøres i AMR i fuldtidspersoner. Hver person forudsættes at have 37 timer pr. uge til rådighed for enten beskæftigelse eller for aktivitet uden for arbejdsstyrken. En person, der i den seneste uge har været i beskæftigelse i 37 timer eller mere indgår i kategorien I beskæftigelse som én fuldtidsperson. Har personen været beskæftiget i mindre end 37 timer indgår han med en andel, svarende til den andel beskæftigelsen udgør af du 37 timer. Den resterende andel henføres til en eller flere af de øvrige kategorier. Kun personer med mindre end 37 timers beskæftigelse indgår i de øvrige kategorier og hver person indgår samlet med én fuldtidsperson, også selv om personen har væretbeskæftiget i mere end 37 timer. Det samlede antal fuldtidpersoner er derfor identisk med det samlede folketal.

AMR er dannet ved integration og harmonisering af data fra en række af Danmarks Statistiks registre, bl.a. Erhvervsregistret, Indkomststatistikken, Befolkningsregistret og Elevregistret. Hele befolkningen indgår, og hver persons  arbejdsmarkedstilknytning kan opgøres på et vilkårligt tidspunkt. Det gør registret til et stærkt redskab til detaljerede forløbsopgørelser.

I sig selv fylder AMR ikke meget i Danmarks Statistiks løbende publicering. Blot to tabeller  i statistikbanken. Til gengæld udgør AMR grundlaget for nogle af de centrale arbejdsmarkedsstatistikker som Den Registerbaserede Arbejdsstyrkestatistik (RAS), Erhvervsbeskæftigelsen (EBS) og Arbejdstidsregnskabet (ATR). Det er dog en såkaldt ikke time-normeret version af AMR, der her anvendes. I den ikke time-normerede version begrænses en persons aktiviteter ikke til 37 ugentlige timer. AMR’s muligheder som forløbsregister udnyttes bla. i den registerbasrede opgørelse af unge der hverken er i beskæftigelse eller under uddannelse (NEET-indikatoren), se tidl. indlæg.

Begrebet fuldtidsperson er et specifikt dansk fænomen, så der er ingen muligheder for internationale sammenligninger. Heller ikke de statistikker, som anvender AMR som kilde er altid velegnede til internationale sammenligner. Generelt gælder det, at ved internationale sammenligninger af tilknytning til arbejdsmarkedet er Arbejdskraftundersøgelsen,  der er en fælles EU-undersøgelse, bedre egnet.

Reference:
Danmarks Statistik: “Statistikdokumentation for Arbejdsmarkedsregnskab 2015” (link)


Unge, der hverken er i beskæftigelse eller under uddannelse (NEET-indikatoreren)

12/03/2019          Taleboble Kommentarer

Blandt de mange aspekter i et godt ungdomsliv skal gerne indgå en forberedelse til et fremtidigt erhvervsliv. I statistikken skal det bl.a. give sig udslag i at unge mennesker enten er registreret som værende i beskæftigelse eller under uddannelse. Det er de fleste unge også, men der er en lille gruppe, som ikke er. Internationalt anvendes den engelske forkortelse NEET (Not in Employment, Education or Training) om denne gruppe. Danmarks Statistik har tilsyneladende opgivet at finde en dansk betegnelse og anvender i sine offentliggørelser også betegnelsen NEET.

EU har opgjort NEET-indikatoren siden 2006. I figuren nedenfor er vist resultaterne for 2017. NEET-gruppen er i EU-opgørelserne afgrænset til personer mellem 15 og 24 år, der i referenceugen ikke var i beskæftigelse og heller ikke i de seneste fire uger havde været i uddannelse eller træning (formel eller uformel) . 

Andel af unge (15-24 år), der hverken er i beskæftigelse eller under uddannelse i EU-landene, 2017

 Kilde: Eurostats statistikbank lfsi_neet_aGrafik: Veusz

Der er ganske store forskelle mellem EU-landene. Nederlandene ligger lavest med 4 pct. og Italien højest med 20 pct. Generelt er problemet størst i Syd- og Østeuropa 

EU-opgørelsen af NEET-indikatoren er baseret på de kvartalsvise stikprøvebaserede arbejdsstyrkeundersøgelser. Som EU-medlem deltager Danmark naturligvis i disse undersøgelser, men til nationalt brug — dvs. når international sammenlignelighed ikke er vigtig — anvendes en NEET-indikator, baseret på det registerbaserede arbejdsmarkedsregnskab (AMR), frem for arbejdsstyrkeundersøgelsens opgørelse. AMR giver langt bedre muligheder for forløbsundersøgelser og for detaljerede opdelinger af populationen end arbejdsstyrkeundersøgelsen. Til gengæld må begreberne tilpasses de begrænsninger, der kan ligge i registrene.

For den registerbaserede NEET-indikator betyder tilpasningen, at begrebet i under uddannelse defineres lidt mere snævert, idet kun formel uddannelse indgår. Registrene giver nemlig ikke mulighed for at opgøre uformel uddannelse. NEET-gruppen i AMR er således større end i arbejdsstyrkeundersøgelsen, og værdien af NEET-indikatoren derfor højere. Dertil kommer, at man i AMR afgrænser gruppen af unge til 16-24 årige og altså udelader de 15-årige. Det skyldes, at man i dansk statistik traditionelt afgrænser arbejdsstyrken til personer i aldersgruppen 16-64 år. Af hensyn til konsistensen med den øvrige arbejdsmarkedsstatistik har men derfor valgt at udelade de 15-årige fra NEET-gruppen.

De særlige muligheder for detaljeret statistik i AMR har Danmarks Statistik bl.a udnyttet til en sammenligning af NEET-indikatoren for hhv. unge af dansk oprindelse og unge efterkommere fra ikke-vestlige lande. Nogle hovedresultater er vist i tabellen nedenfor.

Registerbaseret NEET-indikator for Danmark 2017.

  Mænd Kvinder
Dansk oprindelse Efterkommer1 Dansk oprindelse Efterkommer1
16-19 år 6,1% 9,2% 5,6% 5,7%
20-24 år 12,8% 20,7% 11,6% 13,9%
16-24 år 9,9% 15,1% 9,0% 9,9%
25-29 år 13,8% 23,4% 15,8% 23,7%

Note: 1Fra ikke-vestlige lande
Kilde:
 Dannarks Statistik:  “Indvandreres og efterkommeres tilknytning til arbejdsmarkedet nov. 2017”  Excell-fil (link)

Danmarks Statistik har også benyttet registerstatistikkens muligheder til at udvide den belyste population til også at omfatte aldersgruppen 25-29 år. Som det fremgår af tabellen er forskellene mellem efterkommere og unge af dansk oprindelse større i denne aldergruppe end i den traditionelle NEET-population, navnlig for kvindernes vedkommende. Mere detaljerede resultater kan findes i en Nyt-artikel om emnet (link) og i et Excel-rgneark knyttet til Nyt-artiklen (link)

Referencer:
Danmarks Statistik: “Metodenotat — registerbaseret NEET-indikator“, 26/4-2017 (link)
Dannarks Statistik:  “Efterkommere er oftere ikke i uddannelse eller job”, Nyt 25/2-2019, nr 69 (link)
Dannarks Statistik:  Indvandreres og efterkommeres tilknytning til arbejdsmarkedet nov. 2017″  Excell-fil (link)


Ny undersøgelse af den danske befolknings kulturvaner

05/03/2019          Taleboble Kommentarer

Danmarks Statistik har påbegyndt offentliggørelsen af en ny kulturvaneunderøgelse for perioden 2018-2020. Den nye undersøgelse omfatter 8 kvartaler (3. kvartal 2018 til 2. kvartal 2020). De nu offentliggjorte resultater vedrører 3. og 4. kvartal 2018. Statistiske undersøgelser af den danske befolknings kulturvaner har været gennemført siden 1964, med med intervaller på mellem fem og tolv år, men det har været kulturministeriet, der stod for undersøgelserne. Den seneste af kulturministeriets undersøgelser er fra 2012.

Det er et meget omfattende kulturbegreb, der anvendes i undersøgelsen. Det omfatter ikke blot traditionelle kulturaktiviteter som litteraturlæsning og koncert- og teaterbesøg men også fritids- og medievaner, herunder motion og brug af digitale spil. De nu offentliggjorte resultater vedrører voksne (16 år og ældre), men undersøgelsen omfatter også børns kulturvaner. Resultater fra børneundersøgelsen vil dog tidligst blive offentliggjort i slutningen af 2019.

Andel af befolkningen, fordelt på alder, der indenfor de seneste tre måneder har deltaget i udvalgte kulturaktiviter. 4. kvartal 2018

16-24 år25-34 år35-44 år45-54 år55-64 år65-74 år75 år og deroverAlle
Opsøgt billedkunst4939353544484541
Dyrket motion9483838080898384
Læst eller lyttet til skønlitteratur6057596261696261
Brugt digitale spil8064584640392552
Været (fysisk) på biblioteket5144453936464042
Været på bibliotekets digitale tjenester3732332723281929
Læst eller lyttet til faglitteratur7161616364585062

Kilde: Danmarks Statistikbank/KVUHYP01 (link)

I tabellen ovenfor er vist nogle hovedresultater omkring kulturvaner i forskellige aldersgrupper. Den mest markante forskel mellem aldersgrupperne finder man i brugen af digitale spil, hvor de yngste helt dominerer.

Den nye kulturvaneundersøgelse afviger på flere punkter fra de tidligere, så umiddelbar sammenligning er ikke mulig. Til gengæld er begreberne i den nye undersøgelse søgt tilpasset FN’s retningslinier. Det betyder bedre international sammenlignelighed.

Referencer:

Danmarks Statistik: “Halvdelen af danskerne spiller digitale spil”, Nyt 1/3-2019 nr. 79 (linindenfor k)
Danmarks Statistik: “Statistikdokumentation for Kulturvaneundersøgelsen 2018” (link)


Registrering af illegal aktivitet i nationalproduktet

26/02/2019          Taleboble Kommentarer

I nationalregnskabets definition af værditilvæksten (nationalproduktet) har det ingen betydning, om aktiviteten bag produktionen er lovlig eller ej. Hæleri og salg af smuglergods indgår derfor principielt i produktionen på lige fod med legal handel. Det er dog et krav, at der bag aktiviteten ligger frivillige transaktioner. Slavehandel kan derfor ikke indgå i nationalproduktet.

En anden ting er, at illegale aktiviteter kan være vanskelige at belyse i statistikken, så i praksis kan man ikke regne med at aktiviteter i forbindelse med illegal produktion altid indgår. I forbindelse med den seneste revision af de internationale retningslinier for opgørelse af nationalregnskaber besluttede EU-landene dog, at tre typer af aktivitet — prostitution, narkotikahandel og smugleri — altid skal indgå , uanset om aktiviteten er lovlig eller ej. Mangler man statistik på området (og det gør man) må man basere opgørelsen på skøn.

Men prostitution, narkotikahandel og smugleri udgør kun en del af den samlede illegale aktivitet. I en artikel i Eurostats tidsskrift, Eurona (Icho Bechev, 2018) opregnes seks andre aktiviteter, der med god ret kunne inddrages, sammen med nogle overvejelser om aktiviteternes økonomisk betydning og de praktiske muligheder for at inddrage dem i statistikken. De seks punkter er:

  1. Ulovlig våbenhandel
  2. Handel med tyvekoster
  3. Smugling af migranter
  4. Forfalskning af varer og piratkopiering
  5. Bestikkelse
  6. Ulovligt spil

Tjenester i forbindelse med hvidvaskning af penge er udeladt af listen med henvisning til, at emnet er så komplekst, at det fortjener en særskilt undersøgelse.

Ikke alle seks punkter er lige betydningsfulde. Det antages i artiklen, at ulovligt spil er det økonomisk set vigtigste af punkterne.  På den anden side skønnes ulovlig våbenhandel at have en ringe udbredelse i Europa.

I dette indlæg har fokus været på værditilvæksten. Men nationalnalregnskabet omfatter mange andre poster og i Bechev’s artikel er de illegale transaktioners betydning for disse andre poster også behandlet.

Referencer:
lcho Bechev: “Expanding the coverage of illegal economic activities in national accounts”, Eurona 2/2018 (link)


Sammenligning af web-skemaer og telefoninterviews som dataindsamlingsmetode

19/02/2019          Taleboble Kommentarer

Udbredelsen af internettet gør det oplagt, at statistikproducenter må overveje at anvende web-skemaer — hvor respondenten bevarer spørgsmålene på sin computer uden medvirken af en interviewer — som alternativ til traditionelle telefoninterviews. I mange tilfælde kombinerer producenten de to metoder. Det rejser naturligt spørgsmålet om metoderne giver samme resultat.

Det gør de nok i nogle tilfælde — måske også i de fleste tilfælde — men de gør det ikke altid. Pew Research Center præsenterer i en ny YouTube-video et kort redegørelse for forskellene mellem de svar, der modtages ved anvendelse af web-skemaer og de svar, der modtages i telefoninterviews. I en rapport fra 2015, har de leveret en mere dybtgående analyse af forskellene. Rapporten er baseret på besvarelser af det samme spørgeskema fra to grupper — en der blev interviewet telefonisk, og en der besvarede et web-skema. I hver gruppe indgik ca. 1500 personer.

Hovedbudskabet er, at ved de fleste typer af spørgsmål er der kun små forskelle mellem resultaterne fra de to metoder. Men undersøgelsen viser også, at navnlig ved tre typer af spørgsmål har interviewformen afgørende betydning. Det gælder nogle, men ikke alle, spørgsmål om livskvalitet, helbred og finansielle problemer, spørgsmål om social diskrimination og spørgsmål om vurderingen af  politikere. Ved telefoninterviews var respondenterne mere  tilbøjelige til at udtrykke tilfredshed med livskvalitet, helbred og finansiel situation, mere tilbøjelige til at se diskrimination som et problem, og mere tilbøjelige til at udtrykke stærkt negative holdninger til politiske modstandere.

Karakteristisk for de spørgsmål,  hvor forskellene i svar er størst, er at der kan indgå et element af social eller politisk korrekthed i opfattelsen af svarende. Ved telefoninterviews, hvor der er direkte kontakt med intervieweren bliver svarene mere socialt og politisk korrekte, end ved web-baserede interviews, hvor den interviewede er alene. Tendens til skævhed i besvarelser i retning af det socialt accepterede eller forventede er et velkendt problem i spørgeskemabaseret statistik, og det er ikke så overrakende, at skævheden bliver større, når der er direkte kontakt til en interviewer. Men det er også et vigtigt resultat af Pew’s undersøgelse, at ikke alle typer spørgsmål er belastet af denne tendens.

Tendensen til socialt acceptable svar er den klart vigtigste kilde til forskelle i undersøgelsen, men Pew understreger, at der er andre. F,eks. er der en tendens til, at den interviewede når han præsenteres for en række svarmuligheder, vil vil vælge det sidste af de opstillede alternativer ved et telefoninterview og det første ved web-undersøgelser, hvor han sidder med spørgeskemaet foran sig. 

Pew antager, bl.a. på baggrund af andre undersøgelser, at de observerede forskelle i besvarelser ved de to metoder kan tilskrives, at der svares mere ærligt, når der ikke en interviewer indblandet. Svarene fra web-skemaerne er med andre ord af bedre kvalitet. Da metoden også er billigere at gennemføre end telefoninterviews, er der gode grund til at anvende den. Men ikke alle har adgang til internet og er villige til at besvare web-skemaer. Derimod har stort set alle adgang til telefon og villigheden til at deltage i telefoninterviews er større. Det betyder, at undersøgelser baseret på telefoninterviews er mere repræsentative end web-undersøgelser. Den mulige kvalitetsgevinst ved mere ærlige svar i web-undersøgelserne må derfor holdes op mod det mulige tab i repræsentativitet.

Referencer
Pew Research Center: 
“Phone vs. online surveys: Why do respondents’ answers sometimes differ by mode?”,  YouTube 7/2-2019 (link)
Pew Research Center: “From Telephone to the Web: The Challenge of Mode of Interview Effects in Public Opinion Polls”, 13/5-2015 (link)

 


Statistisk selvforsvar — Hvordan beskytter man sig mod vildledende statistik?

12/02/2019          Taleboble Kommentarer

Statistik er en tillidssag. Det har jeg ofte påpeget i denne blog. Det er derfor altid vigtigt at vide, hvem der har produceret en statistik, og at vurdere producentens troværdighed, før man for alvor begynder at anvende den. Men selv om en statistik er  produceret af en yderst pålidelig producent, og der ikke kan sættes en finger på dens grundlæggende kvalitet, så kan den blive præsenteret i en form, der gør den mere vildledende end informativ. Den nederlandske journalist, Sanne Blauw, giver i en YouTube video en række råd til brugere af statistik om, hvordan man kan undgå at blive ført bag lyset af en vildledende præsentation. Statistisk selvforsvar kalder hun det.

Blauw tager udgangspunkt i fem kategorier af  — bevidst eller ubevidst — statistisk vildledning, og giver eksempler på hver af dem. Om alle eksemplerne er lige velvalgte er åbent for diskussion, men det er uden betydning for relevansen af hendes advarsler. Og gennemgangen er ganske underholdende.

De fem vildledningskategorer er:

Den overbevisende graf
(The good-looking graph)
Grafer, der ved første øjekast virker overbevisende, men som ved nærmere eftersyn viser sig at være misvisende
Den misvisende måling
(The polluted poll)
Målinger baseret på små stikprøver, lav besvarelsesprocent, og komplicerede spørgsmål,  der bliver  formidlet, uden at der redegøres for de nødvendige forbehold.
Det overmodige decimalkomma
(The overconfident decimal point)
Præcisionen i statistiske opgørelse overvurderes. Det gælder specielt foreløbige opgørelser, der offentliggøres kort efter udløbet af den periode, de vedrører.
Den ikke så spektakulære statistik
(The not so spectacular statistic)
Statistiske resultater, der bringes uden at blive vurderet i en sammenhæng, kan virke mere spektakulære, end de i virkeligheden er
Den overfortolkede sammenhæng
(The cocky correlation)
En sammenhæng mellem to variable (korrelation) betyder ikke nødvendigvis en årsagssammenhæng (kausalitet)

På sin hjemmeside præsenterer Sanne Blauw sig som talkorresondent (numeracy correspondent) for den nederlandske nyhedsplatform De Correspondent. De Coorrespondent er en alternativ journalistisk platform, der i sin formidling lægger mere vægt på indhold og sammenhæng end på det seneste døgns mere eller mindre tilfældige begivenheder. De dækker klimaet, men ikke vejret, som de selv udtrykker det. Reglerne for platformens virke er fastlagt i ti principper, der udover det allerede nævnte om vægt på indhold, bl.a. omfatter annoncefrihed, fokus ikke blot på problemer, men også på løsninger, og åbenhed om kilder. Det økonomiske grundlag stammer fra netværksfinansiering (crowdfunding)  og salg af  medlemskaber (abonnementer). Artiklerne er fortrinvis på nederlandsk, men en engelsksproget udgave er under forberedelse med planlagt start i midten af 2019.

Referencer:
Sanne Blauw: “How to defend yourself against misleading statistics in the news”, YouTube (link)
Sanne Blauw: Hjemmeside (link)
De Correspondent: Hjemmeside (link)


Nederlandenes statistiske system

05/02/2019          Taleboble Kommentarer

Den nederlandske officielle statistik er organiseret i et stærkt centraliseret system, hvor statistikmyndigheden  CBS (Centraal Bureau voor de Statistiek) er ansvarlig for langt størstedelen af statistikproduktionen. Selv i de enkelte tilfælde, hvor andre institutioner er involveret i produktionen af statistikken, sker formidlingen normalt gennem CBS, og med CBS son ansvarlig myndighed.

Den officielle statistik er reguleret i en statistiklov, der ret detaljeret fastlægger opbygningen of organisationen, de forskellige statistikorganers opgaver, forholdet mellem regering og statistikmyndighed, og regler for dataindsamling og databeskyttelse. De fem centrale organer er Statistikmyndigheden (CBS),  Generaldirektøren for CBS,  Det Rådgivende Råd, Bestyrelsen og Ministeren (regeringen). Generaldirektøren udpeges af Ministeren, men det er Det Rådgivende Råd, der stiller forslag til en kandidat. Embedsperioden er højst ti år — i første omgang syv år men med mulighed for forlængelse i tre år. Generaldirektøren kan i embedsperioden kun afskediges efter samråd med Det Rådgivende Råd. Bestyrelsen fastlægger de nærmere retningslinier for Generaldirektørens virke.

Ministeren udpeger medlemmerne af Bestyrelsen og Det Rådgivende Råd og godkender det årlige arbejdsprogram. Ministeren kan dog kun i særlige tilfælde afvise at godkende programmet. Ved ændringer i regler og lovgivning om statistik skal Ministeren først konsultere Generaldirektøren.

Juridisk har CBS status om en autonom administrativ enhed (zelfstandig bestuursorgaan, ZBO). En ZBO er en institution, som er en del af den offentlige administration, men som har en udstrakt grad af selvstændig beslutningsmyndighed og et selvstændigt juridisk ansvar for sit virke. Den er er ikke hierarkisk underlagt en minister, selv om ministeren har nogle nærmere definerede beføjelser, f.eks. til at udpege ledelsen. En ZBO oprettes  ved lov og de generelle forhold omkring ZBO’er er reguleret i en særlig lov.  ZBO’er anvendes i Nederlandene i tilfælde, hvor en aktivitet forgår i offentligt regi, men hvor der ikke ønskes et direkte politisk ansvar for den løbende drift. Administration af køreprøver anvendes ofte som det typiske eksempel, men produktion af statistik er også et oplagt eksempel.

Statistikloven giver CBS en udstrakt adgang til at anvende andre myndigheders administrative registre til statistikformål. CBS har også adgang til i statistikproduktionen at at anvende burgerservicenummer (BSN) — svarende til det danske CPR-nummer — f.eks. til samkøring af registre.  Til gengæld er adgangen til at indhente data direkte fra private virksomheder udtrykkeligt  begrænset til situationer, hvor det ikke er muligt, at tilvejebringe et tilstrækkeligt datagrundlag gennem anvendelse a registrene.

CBS har et godt internationalt ry. Nederlandske statistikere er meget aktive i det internationale statistiksamarbejde og har leveret vigtige bidrag til udviklingen af den officielle statistik. I Eurostats Peer Review Report fremhæves CBS som førende i Europa og i Verden.

Referencer:
Nederlandenes statistiklov: “Statistics Netherlands act”, (link).
SCB: “Den nederlandske statistikmyndigheds hjemmeside”, (link)
SCB: “Operational Management 2016” (link)

Eurostat: “Peer Review Report – Netherlands”, 2015 (link)


Euroen fylder tyve år

29/01/2019          Taleboble Kommentarer

Den 1. januar 1999 etablerede en række EU-lande en valutaunion der betød, at de erstattede deres hidtidige nationale valutaer — D-mark, Frank, Lire osv. — med den fælles Euro. Euroen har således nu eksisteret i tyve år, og det britiske tidsskrift The Economist har i den anledning i en artikel analyseret den hidtidige udvikling og vurderet fremtidsudsigterne. Til støtte for analyse og vurdering anvender Economist tre grafer baseret på data fra Eurostat — EU’s statistiske kontor — til at belyse udviklingen i tre centrale økonomiske indikatorer i seks udvalgte Euro-lande. I dette indlæg gengiver jeg graferne fra The Economists artikel, men udvider med data for Danmark, der jo ikke er et Euro-land. Mit indlæg er koncentreret om de tre grafer og kommer kun i meget begrænset omfang ind på de mange interessante observationer og overvejelser i The Economist’s artikel.

Kilde: The Economist   Grafik: Veusz

Den første graf viser udviklingen i de samlede nettotilgodehavender overfor udlandet målt i pct. af bruttonationalproduktet (BNP). For lande med svage valutaer, hvor risikoen for devaluering var stor, betød tilslutningen til Euroen, at det blev nemmere og billigere at låne i udlandet. Landene fik så at sige del i Tysklands kreditværdighed. Som det fremgår af figuren benyttede navnlig Spanien, Portugal og Grækenland sig af de nye muligheder og øgede deres gæld til udlandet. Især Grækenland, hvis udenlandske nettogæld i 2017 udgjorde næsten 150 pct, af BNP. Tyskland har til gengæld øget sine tilgodehavender i udlandet betydeligt i perioden. Danmark har stort set fulgt den tyske udvikling.

Ser  man  specifikt på den offentlige gæld (midterste graf) viser et tilsvarende mønster sig. Den tyske gæld er nogenlunde konstant, hvorimod de sydeuropæiske Euro-medlemmer har øget gælden. Igen ligger den danske udvikling tæt på den tyske.

Den sidste graf viser udviklingen i BNP. Tyskland ligger i toppen med et BNP, der i 2017 ligger 25 pct. over niveuaet i 1999. For både Grækenland og Italien er BNP nogenlunde det samme i 1999 og 2017, men udviklingen har været meget forskellig i de to lande. Det italienske BNP har ligget ret konstant i perioden, hvorimod grækerne i begyndelsen af perioden oplevede en betydelig stigning, der imidlertid i 2017 vendte brat. De øvrige tre Euro-lande har haft en mere jævn udvikling. Det gælder også Danmark, der ikke på dette punkt har kunnet følge med Tyskland.

Referencer:
The Economist: “Incomplete union, The Euro enters its third decade in need of reform”, 5/1-2019 (link)


USA’s budgetkrise rammer også den officielle statistik

22/01/2019          Taleboble Kommentarer

I lidt over en måned har en stor del af den amerikanske forbundsadministration nu været delvist lammet på grund af budgetstriden mellem præsidenten og kongressen. Det går natuturligvis også ud over den officielle statistik, men i lidt forskellig grad for de forskellige statistikområder. Faktatanken Pew Research Center har offentliggjort en oversigt over situationen og udsigterne for de vigtigste statistikker.

Et af de helt store projekter i den amerikanske statistikverden er folketællingen, der skal afholdes i 2020. Den har i forvejen været udsat for budgetnedskæringer og andre problemer (se tidl. indlæg). I første omgang ser det dog ud til, at Folketællingskontoret (Census Bureau) kan fortsætte planlægningen i omkring halvanden måned på basis af tidligere bevilgede midler. Varer krisen længere kan planlægningen blive ramt. Folketællingekontoret producerer også andre statistikker, f.eks. om boligsalg og udenrigshandel. Disse statistikker er indstillet under budgetkrisen.

Producenten af nationalregnskabet — Bureau of Economic Analysis — er lukket ned, så en planlagt offentliggørelse den 30. januar  af de første skøn for 2018 må nok udskydes. Også en række andre statistikproducenter er lukket i forbindelse med krisen. Det går bl.a. ud over landbrugsstatitsikken og kriminalstatistikken.

Sundhedsstatistik, uddannelsesstatitik og energistatistik kan fortsætte fordi bevillingerne til producenterne var på plads inden budgetkrisens udbrud. Den del af den finansielle statistik, der leveres af Centralbanken (The Federal Reserve) kan også fortsætte, da Centralbanken ikke er afhængig af bevillinger fra kongressen.

Referencer:
Drew Desilver: “The Data Casualities of the Federal Government Shutdown”, Pew Research Center 9/1-2019 (link)


Danmarks Statistiks planer for 2019

15/01/2019          Taleboble Kommentarer

Den 1. juli 2018 trådte en ny statistiklov for Danmark i kraft (se tidl. indlæg 30/1-2018 og  26/6-2018). Implementeringen af den nye lov er naturligvis et af punkterne på Danmarks Statistiks arbejdsplan for 2019, der udkom den 7/1-2019. Loven fastlægger en præcis betydning af begrebet Officiel Statistik, som herefter omfatter statistik, der dels er produceret af offentlige myndigheder, og dels overholder en række kvalitetskrav, der bl.a er formuleret i EU’s Adfærdskodeks. Danmarks Statistik skal overvåge overholdelsen af kvalitetskravene, og etablerer i den forbindelse en samlet oversigt over den officielle statistik. Det er frivilligt for en statistikproducerende myndighed, om den vil tilmelde sine statistikker til ordningen, og derved acceptere overvågningen fra Danmarks Statistik. Men man må håbe på mange tilmeldinger, så oversigten over den officielle statistik kan blive et nyttigt redskab for statistikbrugere, der ellers kan have svært ved at vurdere kvaliteten af et statistikprodukt.

Blandt de planlagte nye statistikprodukter vil jeg fremhæve to: Livsindkomster og Kulturvaneundersøgelsen. Statistik om livsindkomster bliver baseret på et nyetableret register, der kommer til at indeholde data hentet fra eksisterende registre, for alle personer, der siden 1980 i en periode har været skattepligtige i Danmark. Registret er også tænkt som et redskab for forskere. Kulturvaneundersøgelser har været gennemført tidligere, men den seneste vedrører 2012. Den nye undersøgelse vil omhandle 2018. Undersøgelsen gennemføres i et samarbejde mellem Kulturministeriet og Danmark Statistik.

Big Data (se tidl. indlæg 26/4-2016) anvendes i stigende omfang som grundlag for officiel statistik. I opgørelsen af forbrugerprisindekset har Danmarks Statistik anvendt stregkodedata siden 2016 (se tidl. indlæg 12/2-2016), men i 2019 vil anvendelsen bliv udvidet til flere varegrupper. Anvendelsesområdet for big data forventes udvidet i 2019 med inddragelsen af to nye datakilder: el-målerdata og navigationsdata for søfarten (AIS-data). Danmarks Statistik indgår også i et forskningssamarbejde om anvendelse af Big Data i biomedicinsk forskning.

Danmarks Statistiks bestyrelse  gør i sine bemærkninger til arbejdsplanen opmærksom på to forhold, som har afgørende betydning for planens indhold. Det ene er, at langt størstedelen af statistikken er styret af EU-krav, og at omfanget af disse krav er stadigt stigende. Det andet er, at den løbende bevilling i en periode er blevet beskåret med 2  pct. årligt. Bestyrelsen udtrykker bekymring for, at det heraf følgende ressourcepres kan få en negativ virkning på statistikkens kvalitet.

Referencer:
Danmarks Statistik: “Arbejdsplan 2019”, Danmarks Statistik 2019 (link)
Eurostat: “Adfærdskodeks for Europæiske Statistikker”, Eurostat 2017 (link)


Hvordan måles nationens økonomiske og sociale tilstand?

08/01/2019          Taleboble Kommentarer

Hvad vi vælger at måle i den officielle statistik har betydning for hvilke politiske beslutninger vi træffer. Det er den centrale præmis bag en rapport udarbejdet i OECD-regi af den såkaldte Høj-Nivaeu Ekspertgruppe om Måling af  Økonomiske Resultater og Sociale Fremskridt (HLEG). Rapportens centrale konklusion er, at nationalproduktet — der stadig den centrale indikator for en nations økonomiske og sociale tilstand — er et utilstrækkeligt redskab for målingen af økonomiske resultater og sociale fremskridt. Anvendelse af nationalproduktet som succeskriterium for politiske beslutninger fører derfor til  beslutninger, der ikke nødvendigvis fremmer målet om økonomisk og social fremgang. De politiske beslutninger bør derfor træffes på grundlag af et bredere spektrum af økonomiske og sociale indikatorer.

Rapporten fremhæver finanskrisen, der begyndte i 2008, som en illustration af problemet. Fokus på nationalproduktet fik mange regeringer til af konkludere, at man allerede i 2010 igen var på det rette spor, selv om befolkningerne ikke oplevede det sådan. Mere fokus på mål, der direkte retter sig mod befolkningens opfattelse af egen situation, kunne have ført til mere hensigtsmæssige politiske tiltag.

Nationalproduktets store popularitet som generelt mål for økonomisk og social tilstand skyldes nok i høj grad bekvemmelighed. Det er bekvemt, at kunne koncentrere sig om ét mål, der opfattes som indikator for både økonomisk og generel velfærd. Men nationalproduktet er ikke udviklet, og ikke egnet, til at opfylde begge formål. Faktisk er det slet ikke muligt, at opsummere et tilstrækkeligt beslutningsgrundlag i ét enkelt mål. Der må i stedet opstilles en række mål, et såkaldt instrumentbræt (dashboard).  Udfordringen består i, at vælge et antal mål, der er tilstrækkeligt til at intet væsentlig udelades, men ikke så stort, at overblikket går tabt.

Rapportens konklusioner præsenteres i form af tolv anbefalinger. Nogle af anbefalingerne handler mest om bedre anvendelse af eksisterende information, men de fleste vedrører forbedringer og udvidelser. Der opfordres derfor også til en generel opgradering af den statistiske kapacitet i landene.

HLEG-gruppens arbejde falder i forlængelse af arbejdet i Stiglitz-Sen-Fitoussi kommisionen, der blev nedsat i 2008 af den daværende franske præsident − Sarkozy − og som afleverede sin rapport i 2009. Stiglitz-Sen-Fitoussi kommisionens rapport blev modtaget med stor interesse har siden været en helt central inspirationskilde i udviklingen af den den officielle statistik, både i de nationale statistikinstitutter — som Danmarks Statistik — og i internationale institutioner som EU og OECD.

Referencer:
Joseph E. Stiglitz, Jean-Paul Fitoussi og Martine Durand: “Beyond GDP Measuring What Counts for Economic and Social Performance”, OECD 2018 (link)
Joseph E. Stiglitz, Amartya Sen og Jean-Paul Fitoussi: “Report by the Commission on the Measurement of Economic Performance and Social Progress”, 2009 (link)


Registerbaseret forbrugsstatistik

11/12/2018          Taleboble Kommnentarer (2)

Forbrugsundersøgelsen har hidtil være kilden til detaljerede opgørelser af husholdningernes forbrug. Men forbrugsundersøgelsens opgørelse har en række svagheder — bl.a. lille stikprøvestørrelse og lav besvarelsesprocent. Den type problemer undgår man i de registerbaserede statistikker, hvor man baserer statistikken på de offentlige myndigheders registre, der dækker hele befolkningen og hvor manglende besvarelser sjældent forekommer. Indkomststatistikken, der har skattevæsenets registre blandt hovedkilderne, er et eksempel på en veludviklet registerstatistik. Det ville derfor være et stort fremskridt, hvis man kunne etablere en forbrugsopgørelse baseret på administrative registre. I et arbejdspapir præsenterer fire økonomer, to fra Nationalbanken og to fra Danmark Statistik,  resultaterne af et forsøg på at etablere en sådan registerbaseret forbrugsstatistik.

Grundlaget for forsøget er de registre, der anvendes i indkomst- og formuestatistikken. Der findes ingen direkte opgørelse af forbruget i registrene, men da forbrug kan defineres som forskellen mellem indkomst efter skat og opsparing kan forbruget opgøres indirekte, hvis man kender disse to størrelser. Indkomsten udgør ikke noget større problem — den har været opgjort og offentliggjort i mange år — så det er opgørelsen af opsparingen, der er den store udfordring.

Her tyr man igen til en indirekte beregning, nemlig forskellen mellem nettoformuen ved årets slutning og årets begyndelse, korrigeret for kapitalgevinster og kapitaltab, typisk i forbindelse med aktier. Kapitalgevinster og -tab kan i nogle år udgøre meget store beløb, og de fremgår ikke af registrene, så her må en særlig beregning til. Her ligger en af projektets store udfordringer, og en meget simpel metode er valgt. Værdien af husholdningernes beholdninger af danske aktier forudsættes simpelthen at følge udviklingen i OMXC20-indekset, der belyser kursudviklingen for de 20 mest omsatte danske aktier. Der beregnes ingen kursgevinster/-tab for obligationer og udenlandske aktier.

Forfatterne vurderer, at der er ret god overensstemmelse mellem opgørelsen af det samlede forbrug for forskellige husstandstyper i forbrugsundersøgelsen og den registerbaserede opgørelse. En af årsagerne til de forskelle der er mellem de to opgørelser kunne være usikkerheden i den registerbaserede opgørelse af kursændringer. Undersøgelsen tyder da også på, at forskellene er større for husholdninger, der ejer aktier, end for andre husholdninger. Selvom afvigelserne er små finder forfatterne det dog ønskeligt, at udvide statistikregistrene med oplysninger om kapitalgevinster/-tab fra de administrative registre, i det omfang, at det er muligt.

Styrken i den registerbaserede forbrugsopgørelse ligger i, at den er en totaltælling, og at den ikke er afhængig af indberetningsfejl fra husholdningerne. Til gengæld mangler den forbrugsundersøgelsens detaljerede opdeling af forbruget på vare- og tjenestegrupper. En registerbaseret opgørelse kan derfor ikke helt erstatte forbrugsundersøgelsen. Men det påpeges i arbejdspapiret at man kan kombinere metoderne og inddrage flere registeroplysninger i forbrugsundersøgelsen. Det sker allerede, da de fleste af forbrugsundersøgelsens indkomstoplysninger hentes fra registrene, men det vil også være muligt at indhente en række forbrugsoplysninger fra registre. Det kunne  f.eks. være forbrug af elektricitet og anskaffelse af bil. Overvejelser omkring sådanne tiltag er allerede i gang i Danmarks Statistik. På længere sigt kan der ligge stor muligheder i anvendelse af data fra transaktioner med kredit- og debetkort(dankortet).

Referencer:
Kim Abildgren,  Andreas Kuchler, America Solange Lohmann Rasmussen,  Sørensen, Henrik Sejerbo: Consistency between household-level consumption data from registers and surveys, Danmarks Nationalbank, Working Paper, 3/12-2108 – N0 131 (Link)


Fordelingen af nationalindkomsten i USA

04/12/2018          Taleboble Kommentarer

De mest præcise statistiske opgørelser af de samlede indkomster finder man i nationalregnskabet. Men nationalregnskabet belyser kun den samlede indkomst for nationen som heldhed, og siger ikke noget om hvordan indkomsten er fordelt på husstande og personer. Indkomstfordelingen belyses i andre typer af statistik, men på grund af mangler i datagrundlaget afviger indkomstbegreberne i fordelingsstatistikkerne betydeligt fra nationalregnskabets indkomstbegreb.

Denne afvigelse mellem begreberne har gjort det vanskeligt, at knytte udviklingen i nationalregnskabsstørrelser, typisk nationalproduktet og nationalindkomsten, til udviklingen i almindelige menneskers levevilkår. Der har i de senere år været stor international interesse for knytte opgørelser af indkomstfordelinger tættere til nationalregnskabet, og både i EU og OECD har der været eksperimenteret med metoder til løsning af problemet. Det måske mest ambitiøse eksperiment er et forsøg på at fordele USA’s nationalindkomst, som den er opgjort i nationalregnskabet, ud på hver enkelt borger i USA for perioden tilbage til 1913. Dette formidable eksperiment er udført af tre økonomer — Thomas Piketty, Emmanuel Saez og Gabriel Zucman.

Piketty, Saez og Zucman  har konstrueret et datamateriale for USA, der indeholder mikrodata (persondata) for nationalregnskabets makrostørrelser for perioden fra 1913 og frem.  Det kan kun lade sig gøre, hvis man accepterer udstrakt anvendelse af skøn og såkaldte syntestiske data, dvs data for en person, der er konstrueret på grundlag af viden om andre personer med samme baggrund i form af køn, alder, bopælsområde og andre kendte data. Forfatterne gør tydeligt opmærksom på, at et sådant datamateriale har væsentlige mangler med hensyn til præcision, og at der kræves meget tydelige resultater, før det er forsvarligt at drage konklusioner.

Heldigvis er resultaterne meget markante. Kort fortalt viser opgørelsen en voldsom stigning i uligheden fra 1980 til 2014. Nationalindkomsten før skat i USA steg med 60 pct.  i perioden, men hele stigningen kunne henføres til den halvdel af befolkningen med de højeste indkomster. Den gennemsnitlige indkomst for personer i den nederste halvdel af indkomstfordelingen var næsten uændret.

Tabel: Gennemsnitlig nationalindkomst efter skat, USA.

US $, 2014-priser Nederste 50 pct Øverste 10 pct Øverste
1 pct.
1980 20.610 118.903 344.324
2014 24.927 252.822 1.012.429

Kilde: Gabriel Zucman, MainData->MainFigures 

Efter skat var den gennemsnitlige indkomst for de rigeste ti pct. 10 gange større end for de nederste 50 pct i 2014 (se tabellen). I 1980 var den seks gange større. Navnlig de allerhøjeste indkomster har øget deres andel af nationalinkomsten. I 2014 var den gennemsnitlige indkomst for den ene procent med de højeste indkomter 41 gange større end gennemsnitsindkomsten for de 50 procent med de laveste indkomster. I 1980 var den “kun” 17 gange større.

Referencer:
Thomas Piketty Emmanuel Saez Gabriel Zucman: Distributional National Accounts: Methods and Estimates for the United States, The Quarterly Journal of Economics, Volume 133, Issue 2, 1 May 2018, Pages 553–609 (link)
Gabriel Zucman: Distributional National Accounts, Main Data (on-line databilag til artiklen ovenfor) (link)


Data Gaps Initiative — G-20 landenes bestræbelser for at lukke huller i statistikdækningen

27/11/2018          Taleboble Kommentarer

Den finanskrise, der tog sin begyndelse i 2007, gav anledning til mange overvejelser, også blandt statistikproducenter. Blandt de store spørgsmål var, om en grundigere granskning af de officielle statistiker på et tidligere tidspunkt kunne have afsløret, at en krise var på vej, og om der har huller i statistikdækningen, der gjorde at udviklinger, der i princippet kunne have været afsløret, forblev upåagtede. Da 19 lande og EU i 2009 dannede G20 som et forum for samarbejde og diskussion om tiltag, der kan fremme den økonomiske stabilitet, besluttede de hurtigt at iværksætte en undersøgelse af, om forbedringer i statistikken kunne være et middel i den retning. Projektet fik navnet Data Gaps Initiative (DGI) og førte til opstillingen af en række mål for udvidelser og forbedringer i den finansielle statistik.

Hvor langt er man så kommet med  implemeteringen af alle disse initiativer nu mere end ti år efter krisens begyndelse? Det spøgsmål har været emnet for en konference i Irwing Fisher Komiteen om nationalbankstatistik — Irving Fisher Committee on Central Bank Statistics (IFC). IFC er et forum for især nationalbankøkonomer, hvor statistiske emner af interesse for nationalbanker diskuteres.

Svaret på spørgsmåler er, at man er kommet langt, i hvert fald hvis man ser på indlæggende fra to af de mest centrale skikkelser i blandt nationalbankøkonomerne, Augustin Carstens og Claudia Buch. Augustin Carstens er direktør for Den Internationale Betalingsbank (Bank for International Settlements, BIS) og Claudia Buch er formand for IFC. Hun er desuden underdirektør i den tyske centralbank (Deutsche Bundesbank). Men trods fremskridtene i statistikdækningen er alle problemer naturligvis ikke løst. Både Carstens og Buch lægger vægt på, at finansverdenen er dynamisk, og at databehovene ikke ligger fast en gang for alle. Der er behov for opmærksomhed omkring opståelsen af nye behov.

Buch lægger i sit indlæg også vægt på, at selv om nye og bedre data næsten altid er nyttige, så er de ikke gratis. Nytten af nye inittiativer på området skal derfor grundigt afvejes med omkostningerne. Og Carstens henleder især opmærksomheden på, at data alene gør det ikke. Fornuftig anvendelse af data kræver viden om og indsigt i de finansielle processer hos analytikere og beslutningstagere.

Referencer:
Bank for International Settlements:  Ninth IFC Conference “Are post-crisis statistical initiatives completed?”, Basel, 30-31 August 2018 (link)
Bank for International Settlements: About the IFC (Irving Fisher Committee on Central Bank Statistics) (link)
Augustin Carstens: Are post-crisis statistical initiatives completed? Taking stock, BIS 3/9-2018 (link)
Claudia Buch :  Are post-crisis statistical initiatives completed?, BIS 31/8-2018 (link)


Frankrigs statistiske system

20/11/2018          Taleboble Kommentarer

Poduktionen af Frankrigs officielle statistik er organiseret i et funktionelt decentraliseret  system, hvor aktiviteterne er fordelt mellem ca. 16 ministerielle statistiske departementer og et nationalt statistikinstitut, Det Nationale Institiut for Statistik og Økonomiske Studier (Institut national de la statistique et des études économiques – INSEE). Hvert af de ministerielle  departementer, varetager statistikken inden for deres ministeriums fagområde. F.eks. har landbrugsministeriet et statistisk kontor, der tager sig af landbrugsstatistikken og undervisningsministeriet et kontor, der tager sig af uddannelsesstatistikken. Enkelte statistikområder, f.eks. folketællingen, varetages direkte af INSEE.  INSEE og de ministerielle statistiske departementer udgør tilsammen den Offentlige Statistiske Tjeneste — Service statistique public (SSP).

Det samlede officielle statistiske system omfatter udover SSP yderligere to institutioner: Det Nationale Råd for Statistisk Information (Conseil national de l’information statistique, CNIS) og Den Offentlige Statistikmyndighed (Autorité de la statistique publique,  ASP). CNIS er et fælles forum for brugere og producenter af officiel statistik, og ASP’s opgave er at sikre overholdelsen af lovgivning og andre regler vedr. statistikproduktion.  En summarisk oversigt over systemet er vist nedenfor.

Oversigt over Frankrigs officielle statistik

  Institution  Vigtigste opgaver
Den Offentlige Statistiske Tjeneste (SSP) INSEE
  • Koordination af arbejdet i SSP
  • Folketællingen
  • Internationalt samarbejde
Ministerielle statistiske departementer (SSM)
  • Statistikproduktion inden for ministeriets område
  • Statistisk rådgivning til ministeriet
Det Nationale Råd for Statistisk Information (CNIS) 
  • Forum for brugere og producenter af officiel statistik
  • Årlig arbejdsplan for officiel statistik
Den Offentlige Statistikmyndighed (ASP) 
  • Kontrol af overholdelse af de centrale principper for officiel statistik

Ministeriernes statistiske tjenester (Services statistiques ministeriéls, SSM) har som hovedopgave at fremstille og publicere officiel statistik indefor deres moderministeriums område og at yde statistisk bistand til ministeriets forvaltning. Oprettelse af en SSM sker ved dekret, og INSEE offentliggør en liste over dem. Der er i øjeblikket 16 SSM’er på listen.

INSEE’s vigtigste funktion er at koordinere arbejdet i SSP. Herudover varetager  INSEE som national statistikmyndighed Frankrigs internationale statistiske samarbejde, hvor samarbejdet i EU naturligvis er det dominerende element. I den forbindelse har INSEE ansvaret for overholdelsen af EU’s statistiklovgivning. INSEE har også sine egne statistikområder, som f.eks. folketællingen.

Producenter og brugere af den officielle statistik samles i Det Nationale Råd for Statistisk Information (Conseil national de l’information statistique, eller CNIS) . Rådet fungerer som forum for diskussion om udviklingen af den officielle statistik og spiller en rolle i opstillingen af de årlige arbejdsplaner.

De statistiske tjenester overvåges løbende af en særlig institution — Den Offentlige Statistikmyndighed (Autorité de la statistique publique,  ASP). ASP’s opgave er at sikre overholdelsen af de centrale principper for officiel statistik som faglig uafhængighed, metodisk stringens og respekt for etiske principper. Institutionen skal høres i forbindelse med alle lovforslag omkring officiel statistik, og den kan på eget initiativ udtale sig om alle sager inden for dens kompetenceområde. En gang årligt forestår institutionen en høring af formanden for CNIS og af generaldirektøren for INSEE.

I Eurostats Peer Review Report for Frankrig fremhæves en stærk fælles kultur blandt de ansatte i SSP. Rokeringer mellem INSEE og SSM’er forgår gnidningsløst og er en del af karrieresystemet for statistikere. Forfremmelser og rokeringer indenfor systemet koordineres af INSEE. Rapporten vurderer, at den franske officielle statistik er af høj kvalitet, og ser den fælles kultur og korpsånd som en væsentlig del af årsagen.

Referencer:
Autorité de la statistique publique: Hjemmeside (link)
Cairn: Contrepoint – L’organisation de la statistique publique en France (link)
CNIS: Hjemmeside (link)
Eurostat: Peer Review Report — France, februar 2015 (link)
Gouvernement.fr: Statistics (link)
INSEE: Hjemmeside (link)
INSEE: Liste over ministeriernes statistiske departementer, (link)


Den globale fordeling af personlig formue

06/11/2018          Taleboble Kommentarer (1)

Interessen for fordelingen af de personlige formuer har været stigende i de senere år. Det afspejler sig bl.a. i den store opmærksomhed, der har været omkring Thomas Pikettys bog: Kapitalen i det 20. århundrede. Pikkety konkluderer på grundlag af et omfattende datamateriale, at uligheden i formuefordelingen er stigende, og at det navnlig er de allerigeste, der øger deres andel af de samlede  formuer. Desværre giver den officielle statistik kun begrænsede muligheder for den slags analyser, og en væsentlig del af Pikketys indsats bestod netop i at sammenstykke et anvendeligt datamateriale på grundlag af en række kilder.

Der er dog en udvikling i gang i retning af bedre formueopgørelser i den officielle statistik. Danmarks Statistik leverer et eksempel med etableringen af en formuestatistik for husholdningerne i 2016 med data fra 2014 og frem. Men der er stadig et stykke vej til en global sammenlignelig formuestatistik, baseret på officiel statistik. (mere…)


Udfordringer til producenterne af den officielle statistik

30/10/2018          Taleboble Kommentarer

Vilkårene for indsamling, opgørelse og præsentation af officiel statistik er, som alt andet, i hastig forandring. Udviklingen har i de senere år krævet betydelige tilpasninger af de statistiske myndighededers arbejde, og flere ændringer er i vente. Peter van der Ven — OECD’s nationalregnskabschef — søger i en artikel i Journal of Official Statistiks at skabe et overblik over den hidtidige udvikling og forventningerne til den nærmeste fremtid.

Omkring indsamlingen af data ser van de Ven stigende krav om nedsat respondentbyrde som en af de største udfordringer. Et oplagt svar på den udfordring er anvendelse af administrative registre fra f.eks. skattevæsen og kommuner som grundlag for statistikken. Det har også den fordel, at data fra administrative registre ofte er mere pålidelige end data indsamlet gennem spørgeskemaer. Van de Ven har ikke meget tillid til, at respondenter bruger særlig mange ressourcer på besvarelse af spørgeskemaer fra statistiske myndigheder og  frygter at misforståelser og manglende omhu er årsag til ringe kvalitet. Ulempen ved administrative data er, at de sjældent præcist opfylder statistikkens krav med hensyn til  begrebsdefinitioner og populationsafgrænsning, og derfor kræver en omfattende efterbehandling. Heldigvis har både omfanget af administrative data og de tekniske muligheder for at udnytte dem været voksende, og den udvikling ser ud til at fortsætte.

Også Big Data tilbyder muligheder for dataindsamling uden respondentbyrde. Der sker allerede nu en vis anvendelse af Big Data i den officielle statistik, men der er er stadig en række problemer, der skal løses, før en mere omfattende og systematisk anvendelse kan komme på tale.

Som allerede nævnt er de tekniske muligheder for databearbejdning øget enormt i de seneste årtier, og den udvikling kan forventes at fortsætte. Det har givet de officielle statistikproducenter bedre muligheder, men det giver også en udfordring. Private virksomheder og andre institutioner nyder nemlig også  godt af denne udvikling og er i stigende omfang i stand til selv at producere statistik. Det kan betyde, at de officielle statistikproducenter, der har været vant til monopol, skal forberede sig på konkurrence.

Brugernes forventninger til den statistik, der produceres og offentliggøres er også i udvikling. Bl.a. går kravene i retning af mere detaljeret statistik, bedre sammenlignelighed imellem forskellige statistikker og hurtigere publicering.  Nye krav er opstået omkring nye statstikområder som globalisering og bæredygtighed og der er kommet fornyet fokus på mere traditionelle områder som levevilkår og indkomst- og formuefordeling.

Van de Ven afslutter sin artikel med at skitsere nogle tiltag, som han mener vil være nyttige eller nødvendige for at den officielle statistik skal kunne håndtere de mange udfordringer. Hans vigtigste punkt er et forslag om genovervejelse af definitionerne af de grundenheder — f.eks. firmaer, virksomheder og arbejdssteder — der anvendes i statistikken. Specielt opfordrer han til at det overvejes, om det er nødvendigt at forskellige statistikområder afgrænser enhederne forskelligt, eller om det er muligt at nå frem til fælles afgrænsninger.

Referencer:
Peter van de Ven: Economic Statistics: How to Become Lean and Mean, Journal of Official Statistics, Vol. 34, No. 2, 2018, pp. 309–321 (link)


Andreas Georgiou — tidligere græsk statistikchef — hædres for sin indsats for sikring af kvalitet og uafhængighed i den officielle statistik

16/10/2018          Taleboble Kommentarer

Den tidligere græske chefstatistiker — Andreas Georgiou — er af seks internationale statistikorganisationer (se noten) blevet tildelt en særlig hædersbevisning for sin indsats for opretholde den højeste professionelle standard i sin stræben efter integritet i statistiske systemer. Bag hæderen ligger især hans indsats for genoprettelse af tilliden til den græske økonomiske statistik. Han var chef for den nationale græske statistikmyndighed (ELSTAT) i perioden august 2010 til august 2015. Før hans tiltræden havde EU-kommisionen i en rapport fastslået, at den græske økonomiske statistik var så fejlbehæftet og upålidelig, at den var uanvendelig. Det lykkedes Georgiou i løbet af sin embedsperiode  at genskabe den internationale tillid til græsk statistik.

Uheldigvis deles den respekt, Georgiou nyder internationalt, ikke af de græske myndigheder. De ser hans insisteren på — i overensstemmelse med EU-reglerne — at levere pålidelige statistiske opgørelser som ubekvem i forbindelse med Grækenlands forhandlinger med landets kreditorer. Han og andre topchefer fra ELSTAT har været udsat for en række retsager, der for Georgieu’s vedkommende kulminerende i en dom på 2 års fængsel for pligtforsømmelse (se tidl. indlæg).

Geogiou har tidligere modtaget international støtte, bl.a. fra FENStatS, hvis medlemmer er de nationale statistiske selskaber fra 23 europæiske lande. Det danske medlem er Dansk Selskab for Teoretisk Statistik. FENStatS har i et brev til den græske regering i oktober 2017 opfordret til at standse den retslige forfølgelse af Geogieu og andre tidligere ansatte i ELSTSAT. FENStaTs påpeger også i brevet det paradoks, at man forfølger de personer, der genoprettede den græske statistik, hvorimod ingen af de ansvarlige for manipulationerne før Georgiou’s embedsperiode er blevet retsforfulgt.

Note: De seks organisationer bag hædersbevisningen er International Statistical Institute (ISI), American Statistical Association (ASA), International Association for Official Statistics (IAOS), Federation of European National Statistical Societies (FENStatS) og Société Française de Statistique (SFdS).

Referencer:
Royal Statistical Society:
Stats community honours Andreas Georgiou, Statslife 25/9-2018 (link)

Internation Statistical Institute: Commendation of Andreas Georgiou, Pressemeddelelse 18/9-2018
Internation Statistical Institute: Court proceedings against Andreas Georgiou, former President of ELSTAT (the Hellenic Statistical Authority), (link)
FENStatS: Brev til den græske regering, (link)
Bruegel: The European Union must defend Andreas Georgiou, 26/6-2018 (link)


LIBOR — en vigtig rentestatistik — skal afvikles

09/10/2018          Taleboble Kommentarer

Det er ikke altid at vigtig statistik også er officiel statistik. Et eksempel er statistikken om den rente Londons banker betaler for korte lån uden sikkerhed hos hinanden — den såkaldte interbankrente. Statistikken går under navnet LIBOR (London Interbank Offered Rate) og den bliver sommetider kaldt verdens vigtigste tal.

LIBOR’s store betydning skyldes i første omgang, at London er verdens finanscentrum, og at den rente Londons banker anvender indbyrdes derfor er vigtig for renteniveauet i hele verden. Men betydningen øges af, at den også anvendes som grundlag for fastlæggelse af renten for andre lån, f.eks. visse obligationslån med variabel rente. Den indgår også i beregningen af værdien af mange finansielle instrumenter, f.eks. derivater. LIBOR har været betragtet som den mest anerkendte indikator for for den kortfristede rente.

Men trods vigtigheden er den ikke en officiel statistik, og den er ikke underlagt de kvalitets- og kontrolregler, der gælder for officiel statistik. Den blev oprindeligt udarbejdet og offentliggjort af den britiske bankforening (British Bankers Association), men efter at det i 2012 blev afsløret, at nogle af de store banker var faldet for fristelsen til at manipulere med indberetningerne, med henblik på at øge indtjeningen, blev opgørelsen overtaget af tilsynsmyndigheden (Financial Services Agency) og senere af  ICE Benchmark Administration (IBA). IBA er et datterselskab af Euronext — et stort børsselskab, der ejer en række børser i bl.a. i Paris, Amsterdam, London og New York.

Manipulationerne var mulige fordi beregningen sker på grundlag af relativt få indberetninger, så indberetterne havde god mulighed for at påvirke opgørelsen ved at tilpasse indberetningerne til det ønskede resultat. Manipulationerne var klart ulovlige og udløste nogle store bøder til de involverede banker. Også ved en tidligere lejlighed havde opgørelsen været manipuleret, men dengang med henblik på at undgå en generel panik på markedet, og muligvis med kontrolmyndighedernes stiltiende indforståelse (Economist 29/9-2018)

De to manipulationsaffærer har svækket respekten for LIBOR. Hertil kommer, at pålideligheden af opgørelsen er blevet svækket, fordi omfanget af interbanklån er faldet, såldes at der er blevet færre transaktioner at basere statistikken på. Derfor har de britiske bankmyndigheder besluttet, at opgørelsen af LIBOR skal afvikles i 2021.

Afviklingen betyder naturligvis ikke, at de behov, som LIBOR opfylder, bare forsvinder. Der  må findes et  alternativ. Den amerikanske centralbank har i samarbejde med finansministeriet etableret et muligt  alternativ, SOFR (the Secured Overnight Financing Rate). SOFR er som statistikprodukt af højere kvalitet end LIBOR, og skulle være vanskeligere at manipulere.

Referencer:
The Economist: The end of LIBOR, The Economist 27/9-2018 (link)
The Economist: Replacing LIBOR — The Price of Everything, The Economist 29/9-2018 

ICE: ICE LIBOR (link)
Philip Stafford: Global regulators warn banks must abandon reliance on Libor, Finacial Times 12/7-2018 (link)
Why Libor Will Disappear—and What It Means for You, 30/7-2018 (link)

James McBride: Understanding the Libor Scandal, Council on Foreign Relations 12/10-2016 (link)

 


StatistikCampus — tysk internetportal om officiel statistik

02/10/2018          Taleboble Kommentarer

StatstikCampus er en internetportal om officiel tysk statistik, specielt henvendt til universitetsstuderende. Bag portalen står Tysklands officielle statistikbureau (Statistiches Bundesamt eller Destatis, se tidligere indlæg). Portalen indeholder bl. andet en generel introduktion til statistiksøgning, en række dokumenter med information om Destatis relationer til universiteterne og et E-learning kursus. Og naturligvis fortæller portalen også om ansættelses- og uddannelsesmuligheder hos Destatis.

De universitetsrelevante dokumenter præsenteres i en sektion under overskriften Statistikken møder videnskaben (Statistik trifft Wissenschaft). Studerende, der overvejer at gøre officiel statistik til tema for deres bachelor- kandidat- eller ph.d-afhandling, kan her finde en liste over relevante emner. Til hvert af de foreslåede emner er tilknyttet en kort beskrivelse — en til to sider — omkring baggrund  og eventuel eksisterende litteratur, samt henvisning til en kontaktperson i Destatis. Herudover indeholder sektionen bl.a. en beskrivelse af mulighederne for adgang til mikrodata til forskningsbrug, information om Gerhard Fürst prisen (se indlæg fra 22/11-2015), og et link til Destatis liste over konferencer og andre begivenheder vedrørende officiel statistik.

 I sektionen om statistiksøgning (Datenrecherche) er først og fremmest en kort beskrivelse af de tre vigtigske kilder til den tyske officielle statistik: Destatis hjemmesideStatistisk årbog (Statistisches Jahrbuch) og statistikbanken GENESIS-Online. Også en mere generel beskrivelse af, hvad man kan forvente at finde form af statistik, herunder statistik fra de tyske delstater (Länder) og links til hjælpemidler som bibliotek og en tysk/engelsk ordbog over statistiske fagudtryk kan findes her. Sidst men ikke mindst finder man et link til en række mikrodatasæt med anonymise­rede individdata — de såkaldte CAMPUS-files — som studerende kan få adgang til gennem en simpel procedure. Datasættene er beregnet til øvelsesbrug, og er generelt ikke egnet til egentlige analyser, men de giver de studerende en bekvem mulighed for at træne anvendelse og bearbejdning af mikrodata på realistiske materialer.

E-learning sektionen består af ni moduler til afspilning med emner som statistiske kilderdataindsamlingsmetoder og fremstilling af grafik, tabeller og kort. Længden af modulerne er mellem 20 minutter og to timer.

Referencer:
Destatis: StatistikCampus – internetportal (link)
Destatis: Hjemmeside (link)


Finanslovforslaget — uændret hovedtendens i udviklingen af de offentlige udgifter

18/09/2018          Taleboble Kommentarer

Forslaget til finanslov for 2019 blev fremsat i slutningen af august og forhandlingerne, der skal føre frem til Folketingets vedtagelse af den endelige finanslov er i fuld gang. Forhandlingerne og debatten vedører forståeligt nok ændringerne i forhold til den nærmest foregående finanslov, f.eks. fjernelse af 333 mio. kr, fra statens tilskud til byfornyelse og afsættelse af 100 mio.kr. mere til psykiatrisk behandling. Disse ændringer fra år til år er vigtige for borgernes dagligdag, så det er ikke så sært, at de følges med interesse. Men det er også interessant at følge nogle mere overordnede og langsigtede træk i udviklingen af de offentlige udgifter, og det er denne langsigtede udvikling, der er emnet for dette indlæg.

Finansloven er statens budget. For at få et samlet billede af de offentlige finanser skal kommunerne og regionernes budgetter medregnes. Kommuner og regioner tegner sig for næsten halvdelen af de samlede offentlige udgifter. I tabellen nedenfor er vist størrelsen af de samlede offentlige udgifter til forbrug, overførsler, renter og investering ifølge regnskaber for 1971 og budgetterne for 2019. Udviklingen i  hele perioden er vist i figuren.

Offentlige udgifter i 1971 og 2019

Regnskab
1971
Budget
2019
mia. kr i 2017-priser1
Forbrug 223 561
Løbende overførsler 112 435
Renter 12 21
Kapitaloverførsler 5 12
Investering 46 75
I alt 398 1.104

Note 1 Deflateret med forbrugerprisindekset
Kilder: Statistikbanken.dk/OFF3, OFF26, OFF3B, OFF26B og PRIS8

To træk kan fremhæves på grundlag af tabellen. Det ene er, at det er det offentlige forbrug og de løbende overførsler, der dominerer de offentlige udgifter, og det andet, at de løbende overførsler er vokset væsentlig stærkere end de øvrige poster.  De løbende overførsler omfatter bl.a de offentlige pensioner, arbejdsløsheds­understøttelse, bistandshjælp og uddannelsesstøtte. Det offentlige forbrug omfatter først og fremmest udgifterne til sundhed, uddannelse og pleje af ældre og syge.

Udviklingen i offentlige udgifter 1971-2019 (2017-priser)

Data til tabel og figur kommer fra Danmarks Statistiks bearbejdelser af de offentlige regnskaber og budgetter. Procedurerne omkring de offentlige regnskaber og budgetter og den tilknyttede statistik er beskrevet i et et indlæg fra 19/10-2015.

Referencer
Kasper Frandsen: Altinget guider dig gennem finanslovens velfærdsfatamorganaer, gaveregn og slagsmål, Altinget 31/9-2018 (link)
Danmarks Statistik: Statistikbanken.dk/OFF3, OFF26, OFF3B, OFF26B og PRIS8 (link)


Hundredårige er ofte født omkring Det Sydfynske Øhav.

11/09/2018          Taleboble Kommentarer

Chancen for at blive 100 år eller mere er størst, hvis man er født i et område omkring det Sydfynske Øhav. Området omfatter det vestligste Lolland, den sydligste spids af Fyn og øerne Tåsinge, Langeland og Ærø. Det er resultatet af en analyse fra Danmarks Statistik offentliggjort den 5/9-2018. Sandsynligheden for at blive 100 år eller mere er 37 pct. højere for personer født i dette område end for personer født andre steder i Danmark.

Området afviger ikke væsentligt fra det øvrige Danmarks med hensyn til de ældres fordeling på køn, socioøkonomisk gruppe og ægteskabelig status, men andelen af boligejere er noget højere. Det er tilstanden som 71-årig, der er grundlaget for denne kategorisering og ikke forholdende som 100-årig, hvor navnlig ægteskabelig status og boligforhold kan afvige meget fra forholdene, som de har været gennem det meste af livet.

Herudover går analysen ikke dybere ned i årsagerne til, at så mange født i dette område får et langt liv, men nøjes med at opregne tre kategorier af mulige forklaringer:

Geografiske: Ren luft og rent vand
Socioøkonomiske: Høj uddannelse, sund livsstil
Historiske: Færre krige og andre kriser

I hvilket omfang Det Sydfynske Øhav adskiller fra fra resten af landet på disse punkter, forholder analysen sig ikke til.

Det er ifølge analysen fødestedet, der er afgørende for sandsynligheden for at langt liv. Tilflyttere til området ser ikke ud til at have større sandsynlighed for at fylde 100 år, end andre personer født uden for området. Omvendt falder den høje sandsynlighed kun ganske lidt for de personer, der fraflytter området. Det er igen bopælen som 71-årig, der er grundlaget, således at det f.eks. ikke tæller som en fraflytning, hvis en hundredårig tilbringer sine sidste år på et plejehjem eller hos et barn uden for området.

Referencer:
Anne Vinkel Hansen, Rudi Westendorp og Laust Hvas Mortensen: Hvor bliver folk 100 år, DATAnalyse 2018:15, 5/9-1018 (link)
Anne Vinkel Hansen, Rudi Westendorp og Laust Hvas Mortensen: 
Centenarian Hotspots in Denmark, 4/8-2018, bioRxiv (link)


EU-SILC — EU-statistikken om indkomst og levevilkår mm.

04/09/2018          Taleboble Kommentarer

En væsentlig del af EU-statistikken om indkomst, social integration og levevilkår indsamles under et sæt regler og retningslinier, der går under betegnelsen EU-SILC (Statistics on Income, Social Inclusion and Living Conditions). Der er ikke tale om et enkelt klart defineret statistikprodukt, men om en liste af variable, som EU-landene har forpligtet sig til at indberette til Eurostat. Det juridiske grundlag er en forordning fra 2003, der forpligter medlemslandene til at indberette data til SILC. Forordningen fastlægger rammene for statistikkerne bl.a. i form af en liste af krævede variable og nogle enkelte præciseringer omkring population, stikprøvestørrelse og definitionener. Men i modsætning til mange andre statistikforordninger indeholder den kun få detaljerede retningslinier. Det er i stedet overladt til de enkelte lande, selv at udfylde rammerne under hensyn til lokale forhold og muligheder, og til Eurostat — i samarbejde med medlemslandene — at koordinere og sikre sammenlignelighed.

Grundstammen i SILC-systemet er en liste over primære måleområder, for hvilke der årligt skal indsamles data. De primære måleområder omfatter bl.a. indkomst, boligforhold og uddannelse. Hertil kommer en række sekundære måleområder, hvor der indsamles data hvert fjerde år eller sjældnere.

De primære variable er opdelt i otte områder. De otte områder, og eksempler på variable er vist i oversigten nedenfor.

Primære måleområder i EU-SILC

Objekt Måleområde Eksempler på variable
Husholdningsdata Basisdata Tællingsår
Husstandsidentifikation
Boligforhold Ejer/lejer
Boligstørrelse
Social udstødelse Omfang af restancer
Evne til at imødegå uforudsete udgifter
Indkomst Samlet bruttoindkomst
Samlet disponibel indkomst
Persondata Basisdata Tællingsår
Personidentifikation
Uddannelse Igangværende uddannekse
Højeste gennemførte udanelse
Sundhed Lider af kronisk sygdom
Aktivitetsbegrænsning på grund af helbedsproblemer
Beskætigelse Jobsøgende
Antal arbejdstimer foregående ug
Indkomst Lønindkomst, kontant
Frynsegoder

De sekundære data samles i årlige ad-hoc moduler. Det seneste offentliggorte ad-hoc modul vedrører befolkningens adgang til tjenester som børnepasning, uddannelse, sundhed og hjemmepleje. For de kommende år er planlagt ad-hoc moduler for sundhed, specielt børns sundhed (2017) og materielle afsavn, trivsel and boligproblemer (2018).

Statistikker baseret på EU-SILC er frit tilgængelige i Eurostats statistikbank. Til brug for videnskabelige formål kan der på særlige vilkår gives adgang til anonymiserede mikrodata fra stikprøverne.

Referencer
Eurostat: EU-SILC, Access to microdata (link)
Eurostat: Income and Living Conditions, Overview (link)
Eurostat: EU-SILC, List of variables (link)

EU: EU-forordning Nr. 1177/2003 af 16. juni 2003 om EF-statistikker over indkomstforhold og levevilkår (link)


Fabriksløs produktion — konsekvenser af globaliseret handel og produktion

28/08/2018          Taleboble Kommentarer

I nationalregnskabet og betalingsbalancen er kriteriet for, hvornår en vare importeres eller eksporteres ikke at varen krydser en landegrænse, men at ejerskabet til varen skifter mellem residenter i to forskellige lande. Det har især betydning, når en råvare transportes fra et land til et andet for at blive videreforarbejdet i det andet land. Et eksempel kan være et dansk slagterifirma, der sender slagtede grise til udskæring på et tysk slagteri for derefter at sælge det udskårne kød i USA. Da det danske slagteri stadig ejer de slagtede grise bliver der ikke tale om eksport (eller import set fra Tysklands side). Efter udskæringen er det danske slagteri stadig ejer af det udskårne kød, så salget til USA bliver registreret som eksport fra Danmark, selv om den fysiske transport af varerne sker fra Tyskland til USA.

Det tyske slagteri modtager naturligvis en betaling for sine ydelser i forbindelse med udskæringen. Denne betaling registreres som import til Danmark og eksport fra Tyskland, og vil indgå i den tyske værditilvækst (nationalprodukt). Fortjensten ved salget af grisene, dvs. salgsprisen for det udskårne kød minus omkostningerne, herunder betalingen til det tyske slagteri, vil indgå i den danske værditilvækst. Set fra dansk side sker der en produktion, uden at en dansk fabrik er involveret. Deraf udtrykket fabriksløs produktion.

Globaliseringen har medført, at transport af varer over landegrænser, uden at varerne skifter ejer, er blevet mere udbredt, og det har betydning, når de økonomiske statistikker skal fortolkes. Danmarks Statistik har i en Analyse (Knudsen 2018) beskrevet nogle af de spor, denne udvikling sætter i statistikkerne. Et hovedpunkt er, at den fabriksløse produktions andel af industriens værditilvækst er steget fra under 1 pct. i 2005 til over 15 pct. i 2017.

Selv om værditilvæksten fra den fabriksløse produktion indgår i den danske værditilvækst, så er det samme ikke tilfældet for arbejdsindsatsen og den dermed forbundne løn på den udenlandske virksomhed. Det betyder, at lønkvoten  — dvs. lønnens andel af den samlede produktion —  undervurderes, fordi den løn, der udbetales til udenlandske lønmodtagere i forbindelse med produktionen, mangler i beregningen.

Omvendt overvurderes udviklingen i arbejdsproduktiviteten — der måles som værditilvækst pr. præsteret arbejdstime — fordi den del af arbejdsindsatsen, der finder sted i udlandet, mangler i nævneren. Den offentliggjorte statistik viser er stigning i industriens arbejdsproduktivitet på næsten 50 pct. fra 2016 til 2017, men analysen viser at  stigningen er noget mindre, ca.  25 pct., hvis den fabriksløse produktion trækkes ud ud af af beregningen.

Den fabriksløse produktions virkninger på beskæftigelse og produktivitet afviger således stærkt fra den traditionelle produktions virkninger. Analysen lægger på den baggrund op til, at det overvejes om statistikkens traditionelle opdeling af produktion mv. på brancher, bør suppleres med en opdeling efter forretningsmodel, såldes at den traditionelle produktionform kan adskilles fra fra den fabriksløse produktion.

Referencer:
Dan Knudsen: Dansk BNP påvirkes af produktion i udlandet, DSTAnalyse 2018:14, 23/8-2018 (link)


International konference om forskning i indkomst og formue afholdes i København

21/08/2018          Taleboble Kommentarer

I denne uge afholder den Internationale Forening for Forskning i Indkomst og Formue (IARIW — International Association for Research in Income and Wealth) sin store såkaldte General Conference i København med Danmarks Statistik som vært. Det er en væsentligt træk ved IARIW, at foreningen samler personer med forskellige roller — forskere, statistikproducenter og statistikbrugere — til udveksling af ideer og synspunkter omkring emner som nationalregnskab, indkomst- og formuefordeling, fattigdom og økonomisk velfærd. Det er også karakteristisk for foreningen, at den både omfatter makroøkonomiske emner — der i den officielle statistik afspejles navnlig i Nationalregnskabet, men også i statististikområder som Offentlige Finanser og Finansiel statistik — og mikroøkonomiske emner — som  i den officielle satistik bla. a. omfatter Forbrugsundersøgelsen og Indkomst- og formuestatistikken.

Der er således stor spredning i interesseområderne blandt konferencens deltagere, og det slår naturligt nok igennem i konferencens program. I god overensstemmelse med IARIW’s dækning af både mikro- og makroøkonomiske aspekter er forholdet mellem mikro- oh makrodata emnet for den åbningssessionen og for den indledende hovedtale (keynote speech), som holdes af professor Torben M Andersen.

Naturligvis afspejler bredden i IARIW’s interesseområde sig også i emnerne i de skriftlige bidrag, der er indkommet til behandling på konferencen. Skal man pege på et emneområde, udover forholdet mellem mikro- og makroaspektet, som mange indlæg tager op, er det problemerne omkring måling af nogle af statistikkens centrale begreber. Målingsproblemer er i de senere år kommet i rampelyset bl.a i forbindelse med de problemer globaliseringen og udviklingen af informationsteknologien skaber for de hidtil anvendte målemetoder.

Der er til konferencen indkommet 165 skriftlige imdlæg, og næsten alle indlæggene er frit tilgængelige på IARIW’s hjemmeside.

Referencer:
IARIW: Hjemmeside (link)
IARIW: Konferenceprogram (IARIW 2018 General Conference, Programme) (link)
Danmarks Statistik: Welcome to IARIW 2018 (link)


Tysklands statistiske system

14/08/2018          Taleboble Kommentarer

Tysklands statistiske system afspejler landets politiske struktur som forbundsstat. Det afspejler også en politisk historie, der har medført en større mistillid til offentlige myndigheder, herunder offentlige statistikproducenter, end vi kender det i Danmark. Resultatet er et system karakteriseret dels ved omhyggelig lovmæssig regulering af dataindsamlingen og dels ved en forholdsvis klar og lovfæstet arbejdsdeling mellem forbundet og delstaterne.

Den lovmæssige regulering begynder med forbundsforfatningens § 73, hvor det fastslås, at forbundet har den eksklusive lovgivningskompetence vedrørende statistik fil forbundsformål. Samtidig fastlægger § 83, at det som hovedregel er delstaternes opgave at implementere forbundslovgivningen. I overensstemmelse med disse grundregler er de nærmere detaljer fastlagt i en forbundsstatistiklov, der er baseret på tre grundprincipper: princippet om lovgrundlag, princippet om faglig koncentration og princippet om regional decentralisering.

Princippet om lovgrundlag betyder først og fremmest, at hver enkelt statistikprodukt kræver sit eget retsgrundlag. Der er ikke som i den danske statistiklov en generel hjemmel til indsamling af data og udarbejdelse af statistik, og da slet ikke til anvendelse, herunder samkøring af af administrative registre. Det er med andre ord andre myndigheder — oftest fagministerier og EU — der i hvert enkelt tilfælde afgør, hvilke data der kan indsamles, hvilke personer og virksomheder, der kan rettes henvendelse til, og om deltagelse skal være tvungen eller frivillig.

Selve indsamlingen og behandlingen af data og udarbejdelsen af statistikkerne foretages dog, i overensstemmelse med EU’s regler om produktion af officiel statistik, af specialiserede institutioner, som er underlagt en forpligtelse til at overholde en række kvalitetskrav. Princippet om faglig koncentration udmønter sig i, at det som altovervejende hovedprincip forbundsstatistikkontoret og delstaternes statistikkontorer, der står for statistikproduktionen, og som har det faglige ansvar. Der findes dog afvigelser fra princippet om faglig koncentration. F.eks. har centralbanken (Bundesbank) ansvaret for en mindre del af den officielle statistik.

Princippet om regional decentralisering er en naturlig følge af forfatningens regler om magtdelingen mellem forbundet og delstaterne. Det betyder, at det i langt de fleste tilfælde er deltaternes statistiske myndigheder, ser står indsamlingen og bearbejdningen af data. Forbundsstatistikkontorets opgave er i den forbindelse at koordinere arbejdet arbejdet, og at samle og bearbejde data fra delstaterne til en samlet statistik for forbundet. Og så har forbundskontoret den helt centrale rolle i det Europæiske Statistiske System som national statistikmyndighed og er i den rolle ansvarlig over for EU, for at kravene til statistikkvalitet overholdes.

Referencer:
Bundeszentrale für politische Bildung: Statistiches Bundesamt/Statistische Landesämter (link)
European Statistical System: Partnerside om Tyskland (link)
Forbundsstatistikloven: Gesetz über die Statistik für Bundeszwecke (BStatG),  22.1.1987 (link)
Yvonne Vatter: Strategic Planning in a Decentralised Statistical System – The German Example, European Conference on Quality in Official Statistics (Q2016) Madrid, 31 May3 June 2016 (link)


Misforstået kritik af ny fattigdomsindikator fra Danmarks Statistik

07/08/2018          Taleboble Kommentarer

Den officielle statistik kom til at levere et af sommerens og agurgetidens emner, da Danmarks Statistik begyndte offentliggørelsen af en ny fattigdomsindikator. Indikatoren har fået betegnelsen relativ fattigdom og den angiver, hvor stor en andel af befolkningen, der opfylder følgende fire betinglser:

Det var ikke så meget den nye indikator i sig selv, der vakte mediernes og visse politikeres interesse. Baggrunden for interessen var snarere, at indikatoren fejlagtigt blev opfattet som en fattigdomsgrænse, der direkte kunne anvendes til at opgøre antallet af fattige. Det kontroversielle skulle ligge i, at  Danmarks Statistik  introducerede en fattigdomsgrænse  tre år efter, efter regeringen havde afskaffet den officielle fattigdomsgrænse med den udtrykkelige begrundelse, at en sådan grænse var uegnet som grundlag for politiske vurderinger omkring fattigdom. Danmarks Statistiks initiativ kom oven i købet på regeringens anmodning.

Der er nu ikke tale om nogen modsætning. Regeringen er nok fortsat af den mening, at officielle fattigdomsgrænser, der søger at opgøre antallet af fattige, ikke er særligt anvendelige som grundlag for politiske beslutninger. Det gælder især de relative mål, der fastlægger grænsen på grundlag af medianindkomsten. Et sådant mål kan mere frugtbart tolkes som et ulighedsmål, og ikke som et fattigdomsmål. Både ulighed og fattigdom er vigtige at belyse statistisk, og der kan være en ganske tæt sammenhæng mellem de to begreber. Men det gavner ikke klarheden i diskussionen at blande dem sammen.

Ikke desto minde er denne sammenblanding udbredt, desvære ikke  mindst i internationale institutioner som EU og FN. Det er da også netop Danmarks forpligtelser over for en FN-beslutning,  der har fået regeringen og Danmarks Statistik til at etablere det nye mål. Og Danmarks Statistik lægger stor vægt på, at der med den nye indikator ikke er etableret en egentlig fattigdomsgrænse, der meningsfuldt kan anvendes til at afgøre, hvem der er fattig og hvem der ikke er. Målets anvendelighed begrundes med, at ændringer over tid i den andel af befolkningen, der ligger under grænsen, kan indikere ændringer i omfanget af fattigdom, men uden at sige noget om det  absolutte antal af fattige.

Den nye indikator — Relativ fattigdom — indgår sammen med to andre indikatorer — Lav indkomst og Økonomisk sårbarhed — i Danmarks Statistiks bidrag til belysning af udviklingen i opfyldelsen af mål nr 1,  Afskaffelse af fattigdom, i FN’s meget omfattende liste af verdenmål for bæredygtig udvikling.

Referencer:
Danmarks Statistik: Fattigdomsindikatorer er ikke en ny fattigdomsgrænse, Pressemeddelelse 18/7 2018 (link)
Danmarks Statistiks hjemmeside: Verdensmål for bæredygtig udvikling (link)
Nikolaj Rytgaard: Danmark har fået en ny fattigdomsgrænse, Jyllandsposten 14/7-2018 (link)


Ny lov om Danmarks Statistik træder i kraft 1.juli

26/06/2018          Taleboble Kommentarer

En ny statistiklov for Danmark træder i kraft den 1. juli 2018. Den nye lov er først og fremmest en implementering af EU’s forordning om officiel statistik, men lejligheden benyttes også til til nogle mere nationale tiltag.  Hovedtrækkene i den nye lov er tidligere gennemgået i denne blog (link). Loven blev vedtaget  af Folketinget den 8 februar, og alle 101 tilstedeværende medlemmer stemte for. I det hele taget viser hele forløbet omkring behandlingen af loven en bred opbakning omkring principperne for produktionen af den officielle statistik. Opbakningen gælder både politikere, offentlige institutioner og involverede interesseorganistioner.

Opbakningen viste sig klart ved førstebehandlingen af loven. Alle partierne udtrykte grundlæggende tilfredshed, og kun Enhedslisten havde nogle enkelte, kritiske bemærkninger. En af dem vedrørte en ny frivillig ordning om at offentlige myndigheder, der producerer statistik, kan anvende betegnelsen offentlig officiel statistik, hvis statistikken opfylder en række kvalitetskrav. Enhedslisten ønskede, at denne ordning også kom til at omfatte privat produceret statistik, der i nogle tilfælde i praksis har samme status som officiel statistik. Desuden så de gerne, at ordningen blev obligatorisk for offentlige statistikproducenter. Til gengæld udtrykte både Konservative og Liberal Alliance tilfredshed med frivillighedsprincippet.

Også de organisationer og andre institutioner, der deltog i høringen  udtrykte overordnet tilfredshed med loven. De få uenigheder vedrørte, ligesom ved folketingsbehandlingen, den privat producerede statistik og frivillighedsprincippet.

Referencer:
Forlag til lov om ændring af Danmarks Statistik, som vedtaget (link)
Forlag til lov om ændring af Danmarks Statistik, som fremsat (link)
Referat af førstebehandlingen (link)

Høringsnotat (link)


Factfulness, bog af Hans Rosling om ubegrundet pessimisme vedrørende verdens tilstand

19/06/2018          Taleboble Kommentarer

Den svenske læge og dataanlytikker, Hans Rosling, førte indtil sin død i februar 2017 en indædt kamp mod det pessimistiske billede af verdens tilstand (børnedødelighed, fattigdom, sult mm) som medierne efter hans mening tegner. I talrige artikler, foredrag, interviews og you tube-indlæg  prøvede han med stort engagement at demonstrere, at de tilgængelige statistikker faktisk tegner at noget lysere billede. Verden og dens befolkning er gennemgående i en rimelig tilstand, og det generelle billede er en verden, der gør fremskridt. Det betyder ikke, at han var en naiv optimist. Han var i høj grad opmærksom på at der stadig er store problemer. Han så sig selv som possibilist. En possibilist definerede han som en person, der hverken håber uden årsag eller frygter uden årsag, og som konstant modstår et overdramatiseret verdensbillede.

I bogen Factfulness, som han skrev sammen med sin søn og svigerdatter, Ola Rosling og Anna Rosling Rönnlund, og som som udkom efter hans død, analyserer han, hvorfor pessimismen er så udbredt, når data faktisk giver grundlag for optimisme. Han har — typisk i forbindelse med sine forlæsninger og foredrag — bedt mange forskellige mennesker besvare en række spørgsmål om verdens tilstand. Besvarelserne har gjort det klart for ham, at pessimismen ikke skyldes simpel uvidenhed. Det er meget værre! Hvis årsagen til de forkerte svar var  simpel uvidenhed, så ville svarene nogenlunde lige ofte være rigtige og forkerte. Men svarene er systematisk forkerte. De adspurgte føler, at de har en viden, og svarer i overensstemmelse med den, men den formodede viden er i strid med kendsgerningerne.

En del af årsgen til denne misopfattelse af verden,  er at de største fremskridt er sket inden for de seneste 50 år. Før den tid var verdens tilstand faktisk ret miserabel. Pessimismen er tilsyneladende baseret på en forældet viden. Men hvorfor er den generelle viden ikke blevet opdateret? Hvorfor holder vi fast i den forældede viden?

En stor del af forklaringen ligger i vores medfødte instinkter. F. eks. vil vi instinktivt opdele verden i os og de andre, og overdrive forskellene. Det er  almindeligt at opdele verdens lande i udviklede og mindre udviklede. Det giver let en fornemmelse af, at verden består af en gruppe meget rige og udviklede lande og en gruppe meget fattige og mindre udviklede lande. I virkeligheden er der en glidende overgang fra de fattigste til de rigeste, og de fleste ligger et sted imellem de to ekstremer. Ikke voldsomt rige, men heller ikke ludfattige. Og de fleste af dem er i fremgang.

Det omtalte instinkt kan vi kalde kløftinstinktet (gap instinct hos Rosling). Eksempler på andre instinkter som Rosling behandler i sin bog, er frygtinstinktet, generaliseringsinstinktet og skæbneinstinktet. I alt gennemgår han ti instinkter, der kan forlede os til drage forkerte slutninger af statistiske oplysninger.

Generelt er instinkterne er nyttige for os, og vi kan ikke hindre, at vi ofte umiddelbart vil handle instinktivt. Men ved hjælp af fornuften kan vi etablere viden om, i hvilke situationer instinkterne kan føre os på afveje, og vi kan udvikle metoder, der kan hjælpe os til at modvirke instinktive fejlslutninger. Det er  netop, hvad Rosling gør i sin bog. Factfulness er en metode til at undgå, at vores instinkter forleder os til fejlslutninger.

Rosling har tidligere udviklet Gapminder, et program til analyse og visualisering af statistiske data (se tidligere indlæg)

Referencer:
Hans Rosling:
Factfulness, Flatiron Books 2018


Status for den kommende amerikanske folketælling i 2020

12/06/2018          Taleboble Kommentarer

Der har altid været stor politisk og juridisk bevågenhed omkring den amerikanske folketælling. Det skyldes, at folketællingen spiller en stor rolle i forbindelse med fordelingen af mandater i lovgivende forsamlinger, herunder især kongressen, og i forbindelse med fordelingen af bevillinger fra forbundsregeringen (se indlæg 19/9-2017 og 23/5-2017). I forbindelse med den kommende folketælling i 2020 har der navnlig været fokus på fire punkter (Chang, 2018):

Det centrale spørgsmål er om — eller i hvilket omfang — særlige grupper underrepræsenteres i folketællingen. Eksempler på grupper, der muligvis underrepræsenteres, er ikke-hvide, fattige og hjemløse. Der har været en formodning om, at underrepræsentationen var størst blandt Demokraternes kærnevælgere, hvilket nok er årsagen til, at Republikanerne traditionelt har været de mest kristiske overfor tiltag, der havde til formål at øge repræsentativiteten.

Omkring finansieringen er forholdene lettet lidt, efter at Folketællingen i år har fået en større bevilling end tidligere forventet. Kritikere frygter dog, at den øgede bevilling kun sikrer, at forfatningens grundlæggende krav opfyldes, men ikke er tilstrækkelig til en indsats for at forbedre repræsentativiteten.

Spørgsmålet om statsborgerskab er måske det af punkterne der har skabt mest debat. Det omstridte spørgmål vedrører kun statsborgerskabet og afslører intet om illegal indvandring. Desuden er det ikke tilladt, at anvende folketællingsdata i forbindelse med administrative afgørelser vedrørende enkeltpersoner. Alligevel frygter skeptikerne, at inddragelsen af spørgsmålet i folketællingsskemaet vil gøre det vanskeligere at opnå svar fra mange indvandrere.

Referencer:
Alvin Chang: How Republicans are Undermining the 2020 Census, Explained with a Cartoon,  Vox 8/5-2018 (link)
D’Vera Cohn: What to know about the citizenship question the Census Bureau is planning to ask in 2020, Pew Research Center  30/3-2018 (link)


Faldende villighed til at deltage i spørgeskemaundersøgelser

05/06/2018          Taleboble Kommentarer

Tidskriftet The Economist udtrykker bekymring over, at befolkningerne i de rige lande viser en faldene villighed til at deltage i spørgeskemaundersøgelser. Som eksempler nævnes den britiske arbejdskraftundersøgelse, hvor besvarelsesprocenten er faldet fra 70 pct i 2001 til 43 pct i 2017 og den amerikanske Løbende Befolkningsundersøgelse (Current Population Survey), hvor procenten i samme periode faldt fra 94 pct til 85 pct. Men tendensen er ifølge The Economist den samme i Canada og på det europæiske kontinent.

Den lave deltagelse svækker kvaliteten af disse statistikker. Navnlig øges risikoen for upræcise eller ligefrem misvisende opgørelser. Det er bekymrende, fordi den statistik, som undersøgelserne danner grundlag for, er vigtige redskaber i den politiske beslutningsproces. Den stigende uvillighed betyder også, at det kræver en større indsats at finde deltagere og at motivere dem til at deltage. Det resulterer i øgede omkostninger.

De tre årsager, nægterne  oftest giver for deres afvisning, er at de er ligeglade med statistikken, at de er bekymrede omkring privatlivets fred og at de ikke har tid. The Economist tilføjer at omfanget af spørgeskemaundersøgelser kan være blevet så stort, af befolkningen føler deltagelse som en større belastning end tidligere.Det kan også spille ind, at deltagelse i mindre grad end tidligere opfattes som en borgerpligt. Sidstnævnte årsag paralleliserer The Economist med faldende valgdeltagelse.

Kortere spørgeskemaer og tilbud om betaling for deltagelse har været forsøgt som midler til at øge deltagelsen. Det forsøges også, at kompensere for lave svarprocenter ved forskellig statistiske teknikker som vægtning og imputation. Men hverken de incitamentsfremmende eller de kompenserende metoder er uden problemer, og det er ikke givet, at de i alle tilfælde fører til mere pålidelige resultater. En bedre fremgangsmåde er at anvende alternative datakilder i form af allerede eksisterende administrative registre, f.eks. skattevæsenets registre. Problemet i den forbindelse er, at der i mange lande er store bureaukratiske og juridiske vanskeligheder, der skal overvindes, for at gøre statistisk anvendelse af administrative registre mulig. De nordiske lande, herunder Danmark, udgør dog på dette punkt en undtagelse. Her har  administrative registre allerede i mange spillet en central rolle som grundlag for den officielle statistik.

Referencer:
The Economist:   Plunging response rates to household surveys worry policymakers, 2/5-2018 (link)


Folkekirkens medlemstal og medlemsprocent

29/05/2018          Taleboble Kommentarer

Med et medlemstal på 4,4 mio. (2017) kan der vanskeligt rejses tvivl om, at Folkekirken har en solid position i danskernes bevidsthed. På den anden side står det også klart, at positionen ikke er så stærk som den har været. Medlemstallet var i 1990 4,6 mio, så medlemstallet er i de seneste 17 år faldet med 0,2 mio. I samme periode er folketallet steget med  0,7 mio. —  fra 5,1 mio. til 5,8 mio. Andelen af befolkningen, der er medlemmer, er faldet fra 89 pct. i 1990 til 75 pct i 2017. Tallene er fra Kirkeministeriets hjemmeside, men er opgjort af Danmarks Statistik på grundlag af Det Centrale Personregister (CPR).

Et fald i medlemsandel fra 89 til 75 pct er drastisk, men skal også ses på beggrund af en betydelig ændring af befolkningens etniske sammensætning. Etniske danskeres andel af befolkningen er faldet fra 96 pct til 87 pct, og kun en lille del af indvandrere og efterkommere er medlemmer af Folkekirken. Medlemsandelen blandt etniske danskere var  i 2017 86 pct. I Statistikbanken har Danmarks Statistik kun offentliggjort Folkekirkens medlemstal fordelt på etnisk baggrund tilbage til 2016, så det kan ikke umiddelbart ses, hvordan udviklingen siden 1990 har været for etniske danskere. Men der findes tal for udviklingen i den etniske sammensætning for hele befolkningen, så ved at forudsætte at indvandreres og efterkommeres medlemsandel i folkekirken i perioden 1990-2015 er den samme som i 2016, kan man få et lidt upræcist, men dog brugbart billede af, hvordan udviklingen har været for etniske danskere. Beregningen en vist i nedenstående tabel.

Beregning af etniske danskeres medlemsandel i Folkekirken

  1990 2000 2010 2015 2016 2017 2018
Medlem af Folkekirken, andel i pct. 
 (1) Vestlige indvandrere 17,9 17,9 17,9 17,9 17,9 16,9 15,9
 (2) Vestlige efterkommere 27,1 27,1 27,1 27,1 27,1 25,6 24,5
 (3) Ikke-vestlige indvandrere 3,0 3,0 3,0 3,0 3,0 2,9 3,0
 (4) Ikke-vestlige efterkommere 2,8  2,8  2,8  2,8   2,8 2,8  2,9 
 (5) Hele befolkningen 89,3 85,1 80,9 77,8 76,9 75,9 75,3
 Andel af befolkning, pct 
 (6) Vestlige indvandrere 1,8 2,1 2,9 3,7 4,0 4,1 4,3
 (7) Vestlige efterkommere 0,2 0,3 0,3 0,4 0,4 0,5 0,5
 (8) Ikke-vestlige indvandrere 1,8 3,5 4,5 5,1 5,5 5,8 5,9
 (9) Ikke-vestlige efterkommere 0,5 1,3 2,0 2,3 2,4 2,6 2,6
(10) Etniske danskere 95,8 92,9 90,2 88,4 87,7 87,1 86,7
Folkekirkemedlemmers andel af hele befolkningen, pct
(11) Indvandrere og efterkommere
(1)*(6)+(2)*(7)+(3)*(8)+(4)*(9)
0,4 0,6 0,8 1,0 1,1 1,1 1,1
12: Etniske danskere (5) – (11) 88,9 84,5 80,1 76,8 75,8 74,8 74,2
Medlem af Folkekirken, andel i pct.
Etniske danskere (12)/(10) 93 91 89 87 87 86 86

Kilder: Kirkeministeriet og Statistikbanken.dk/FOLK2, KM5 og KMSTA001

Beregnet på denne måde er medlemsandelen for etniske danskere faldet fra 93 pct i 1990 til 86 pct i 2018. Et betydeligt fald, men dog ikke så drastisk som når udviklingen for hele befolkningen betragtes.

Referencer:
Kirkeministeriet: Svar på spørgsmål fra Kirkeudvalget, 8/9-2014 (link)
Kirkeministeriet: Folkekirkens medlemstal (link)
Kristeligt Dagblad: Folkekirkens medlemstab skyldes indvandring, 3/3-2017 (link)


EU indbyder flere universiteter som partnere i EMOS-projektet

15/05/2018          Taleboble Kommentarer

Betegnelsen EMOS — European Master in Official Statistics — kan anvendes af universiteter i beskrivelser af kurser, der af EU er godkendt som EMOS-kurser, og af universitetssuddannede, som del af deres kvalifikationsbeskrivelse, hvis de som led i deres uddannelse har gennemgået et godkendt EMOS-kursus (se indlæg fra 3/11-2015). I øjeblikket udbydes EMOS på 23 universiteter i 15 forskellige lande. Ingen danske universiteter blandt de 23, men et enkelt svensk — Örebro. EU vil gerne udvide kredsen og har opfordret universiteter i EU-medlemslande, EU-kandidatlande og EFTA-lande til at søge om godkendelse. Ansøgningsfristen er 30. juni 2018, og beslutning om godkendelse af nye partnere ventes truffet i februar 2019.

Det erklærede hovedformål med EMOS-kurserne er at styrke deltagerens evne til at forstå og at analysere europæisk officiel statistik. De forventede læringsresultater er opstillet i 5 punkter

  1. Det officielle statistiksystem
  2. Produktionsmodeller og —metoder
  3. Specifikke statistikområder
  4. Statistiske metoder
  5. Formidling

EMOS-programmet inkluderer en afhandling og et praktikophold i en institution, der producerer og/eller formidler officiel statistik. Omfanget af er EMOS-kursus skal minimalt svare til en arbejdsindsats på 1½ studieår (90 ECTS).

EU arrangerer også EMOS-webinars, hvor vigtige emner i EMOS-programmet gennemgås.  En serie på 12 webinars, hver med en varighed på godt en time, er under afvikling i øjeblikket (10. januar – 6. juni 2018). Deltagelse er gratis og webinarerne optages og offentliggøres på internettet, så det er muligt efterfølgende at se og høre indlæggene.

Referencer:
EMOS: Emos hjemmeside (link)
EMOS: Emos Webinars 2018 (link)
EMOS; Learning Outcomes of the EMOS Programmes  (link)
E
MOS: 3rd EMOS Call for Applications 2018 (link)
EMOS: Guide for Applicants (link)


Forbedret museumsstatistik

08/05/2018          Taleboble Kommentarer

I et tidligere indlæg, har jeg fremhævet museumsstatistikken som en statistik af meget høj kvalitet, der kunne tjene som forbillede for andre statistikker. Uheldigvis måtte jeg kort efter modificere dette udsagn, da det viste sig at nogle museer anvendte kreative opgørelsesmetoder til at puste besøgstallet op. Men i den seneste opgørelse, der vedrører året 2017, har Danmarks Statistik præciseret reglerne for opgørelse af besøgstallet, således at museerne nu både indberetter det oppustede besøgstal (bruttotallet), der omfatter besøgende i museumscafe og —butik, og et besøgstal (nettotallet) der udelukkende omfatter besøgende i samlingerne. Den offentliggjorte statistik er baseret på nettotallet. Det gør statistikken langt mere anvendelig, at der nu er klarhed omkring definitionen af besøgstallet, men det svækker naturligvis sammenligneligheden med tidligere opgørelser.

Danmarks Statistik beretter, at musernes besøgstal er steget med 3 pct, fra 15,0 mio. i 2016 til 15,5 mio. i 2017.  Den reelle stigning er større, da tallene for 2016 er påvirket i opadgående retning, af de oppustede indberetninger fra visse museer.

 I figuren nedenunder er besøgstallene for en udvalgt gruppe af museer — de statslige og statsanerkendte kunstmuseer — illustreret. De fem største er navngivet i figuren (SMK er Statens Museum for Kunst) og udviklingen fra 2016 til 2017 er angivet med pile.

Kilde: Danmarks Statistik: Liste med besøgstal for statslige og statsanerkendte museer 2016 og 2017

Samlet set , og uden korrektion for den ændrede opgørelsesmetode, er besøgstallet for denne gruppe stort set uændret fra 2016 til 2017 (ca. 4,8 mio), men som det fremgår af figuren så er forskellen mellem museerne blevet mindre, efter at opgørelsesmetoden er blevet mere ensartet. Mest markant er, at det største af museerne — Aros — er rykket tættere på hovedfeltet. Aros er et af de museer, der tidligere indberettede oppustede besøgstal.

Referencer:
Danmarks Statistik: Museerne får stadigt flere besøgende, Nyt nr. 171 2, maj 2018 (link)
Danmarks Statistik: Liste med besøgstal for statslige og statsanerkendte museer 2016, (link)
Danmarks StatistikListe med besøgstal for statslige og statsanerkendte museer 2017, (link)


Klassifikation af husstande på grundlag af målinger af el-forbruget

01/05/2018          Taleboble Kommentarer

Brugere af officiel statistik vil gerne have mere statistik, bedre statistik, hurtigere statistik og billigere statistik. Producenterne vil på deres side gerne imødekomme kravene og arbejder derfor på at udvikle nye metoder og nye kilder, der kan forbedre, fremskynde og effektivisere produktionen. I den forbindelse stilles der store forventninger til statistik baseret på big data (se tidl. indlæg). Endnu anvendes big data kun i beskedent omfang i den officielle statistik, men der er flere eksperimenter i gang. Et af eksperimenterne er et irsk forsøg (Paula Carroll m.fl., 2018) på at anvende data om el-forbrug til klassifikation af husstande f. eks. efter antallet af børn og voksne. De første resultater er ikke særligt lovende, men derfor kan eksperimentet jo godt resultere i nyttig viden, der kan anvendes i den videre udvikling.

I Irland er statistik om sammensætningen af husholdningerne en del af folketællingen. Folketællingerne  afholdes kun hvert femte år, er kostbare at gennemføre og har en lang produktionstid. Der er derfor en stor gevinst at hente, hvis husstands­sammen­sætningen kan estimeres ud fra husholdningerns el-forbug. Den fremgangsmåde kan blive mulig, fordi man i Irland planlægger at udstyre husholdningerne med avancerede elmålere, der leverer forbrugsdata til en database. De nye målere indgår i et system, der også omfatter prisoplysninger, og formålet med systemet er dels at effektivisere el-forbrug og el-produktion med henblik på nedbringe udledningen af drivhusgasser og dels at sikre billigst mulig el til forbrugerene. Som en del af forberedelsen af dette projekt har den irske energireguleringskommission (Commision for Energy Regulation) gennemført en stikprøveundersøgelse til belysning af forbrugernes reaktion på de planlagte målere. Det er data fra denne undersøgelse, der er grundlag for husholdningsforsøget. Man forventer naturligvis, at større forbrug indikerer større antal medlemmer af husstanden, men fordelingen af forbruget over døgnet kan måske indikere noget om antallet af f.eks. børn, lønmodtagere og pensionister.

Over 5000 husstande blev udtaget til at deltaget i forsøget. De udtagne husstande fik installeret en af de avancerede el-målere (smart meter) og besvarede nogle spørgsmål før og efter målingerne blev foretaget. Ud over den lavere el-regning, som de nye målere gerne skulle medføre, så fik husholdningerne en kontant præmie på EUR 25 for at deltage. Data om el-forbruget blev indsamlet hver halve time i forsøgsperioden. Det giver en meget stor datamængde pr husholdning. Da tanken på længere sigt er, at data skal indhentes fra alle Irlands over 1,6 mio. husholdninger, bliver der virkelig tale om big data. I husholdningsforsøget indgår stikprøvens data fra perioden juli-december 2009.

Fra husholdningernes besvarelser ligger mange oplysninger om boligforhold og besiddelsen af elektriske apparater, men da disse oplysninger ikke vil vil være til rådighed hvis/når systemet implementeres i hele Irland, så er disse oplysninger ignoreret i forsøget. Kun oplysningerne om husstandenes størrelse og sammensætning er anvendt. Desværre er der kun fuldstænge oplysninger om alderen på husstandsoverhovedet. For øvrige medlemmer af husholdningerne er kun skelnet mellem under 15 år og 15 år og ældre.

Et første resultat af forsøget er — som allerede nævnt — at estimation af fordelingen af husstande på sammensætning alene på grundlag af data om el-forbrug ikke er mulig. Men man håber, at der med tiden kan inddrages flere oplysninger, f.eks. om boligen, og at det kan føre til en mere anvendelig metode.

Referencer:
Paula Carroll, Tadhg Murphy, Michael Hanley, Daniel Dempsey, and John Dunne: Household Classification Using Smart Meter Data, Journal of Official Statistics, Vol. 34, No. 1, 2018, pp. 1–25 (link)


Syv cheføkonomer rejser tvivl om BNP’s egnethed til måling af den økonomiske vækst

24/04/2018          Taleboble Kommentarer

Traditionelt har udviklingen i bruttonationalproduktet (BNP) været målestokken for vurderingen af et lands økonomiske vækst.  BNP-væksten er stadig det centrale og alment anerkendte vækstmål, men stigende problemer omkring den statistiske opgørelse af BNP (se indlæg fra 3/6-2016, 14/6-2016 og 4/4-2017) har i de senere år givet anledning til overvejelser omkring den fortsatte brugbarhed. Ikke mange kan forestille sig, at BNP helt opgives som vækstmål inden for en nær fremtid, med flere advarer om, at det må anvendes med større forsigtighed og eventuelt suppleres med andre vækstmål.

I den førløbne uge har syv danske cheføkonomer i Berlingske Tidende givet udtryk for bekymring omkring BNP-målets evne til beskrive den økonomiske vækst med tilstrækkelig præcision. Usikkerheden gør de offentliggjorte vækstrater vanskelige at fortolke. Det første skøn over BNP-væksten — BNP-indikatoren —  offentliggøres allerede 45 dage efter kvartalets udløb. Efterhånden som der bliver mere information til rådighed revideres skønnet,  første gang 60 dage efter kvartalets udløb. Men revisionerne er efterhånden blevet så store, at tilliden til pålideligheden af de første skøn er ved at gå tabt.

Kritikerne er helt på det rene med, at problemerne skyldes ændringer i den måde den nationale økonomi fungerer på, og ikke uden videre kan lægges producenten — dvs. Danmarks Statistik — til last. Nogle af dem påpeger dog, at revisionerne næsten altid er i positiv retning, hvilket tyder på en systematisk undervurdering af BNP i de første opgørelser. Der rejses også kritik af, at Danmarks Statistik ikke i tilstrækkelig grad har advaret brugerne om problemerne.

Der kan naturligvis være delte meninger om, hvornår der er advaret tilstrækkeligt, men Danmarks Statistik har faktisk peget på problemerne i en klumme (15/3-2017) fra rigsstatistikeren (se tidl. indlæg). I klummen konkluderes, at BNP-opgørelserne fremover bliver vanskeligere at fortolke, og at der må udvikles nye mål til supplering af BNP-opgørelsen.

Referencer:
Berlingske Tidende: Økonomer: Det er galt med landets store regnemaskine, 18/4-2018, 2. sektion: Business s.10
Danmarks Statistik:
Statistikdokumentation for kvartalsvist nationalregnskab (link)
Danmarks Statistik: Dokumentation af BNP-indikator (link)


Medborgerskabsundersøgelsen

17/04/2018          Taleboble Kommentarer

Medborgerskabsundersøgelsen er en statistisk opgørelse, der skal belyse status og udvikling i integrationen af efterkommere og indvandrere af ikke-vestlig herkomst. Det sker ved at sammenligne ikke-vestlige indvandreres og efterkommeres svar på en række spørgsmål om holdninger og sociale forhold med danskeres svar på de samme spørgsmål. Indvandrere er personer født i udlandet, hvis forældre hverken er danske statsborgere eller født i Danmark. Efterkommere er personer født i Danmark, men hvis forældre er indvandrere. Kun personer på 18 år og derover indgår, og indvandrere indgår kun, hvis de har opholdt sig i Danmark i mindst tre år.  Statistikken har siden 2012 årligt været opgjort af Udlændinge- og Integrationsministeriet.

En række hovedresultater fra Medborgerskabsundersøgelsen 2017 er offentliggjort i Medborgerskab 2017Underøgelsen er også kilde til nogle af indikatorerne i Det Nationale IntegrationsbarometerI tabellen nedenfor er vist nogle uddrag fra medborgerskabspublikationens tabeller i stærkt komprimeret form.

    Dan-sker Ind-van-drer  Efter-kom-mer
Tilfredshed med livet i Danmark  Tilfreds eller meget tilfreds  96  90  92
Man kan stole på de fleste mennesker 71   53  44
 Sociale relationer Ingen eller næsten ingen venner med dansk baggrund  .  21 13 
Social distance  Vil altid eller i langt de fleste tilfælde tillade børn, at omgås danske venner 90  96 
Vil altid eller i langt de fleste tilfælde tillade børn, have en dansk kæreste  .  69 65 
 Tolerance  Helt eller delvis enig i, at alle skal have samme rettigheder uanset religiøst tilhørsforhold 84   93 96
Helt eller delvis enig i, at alle skal have samme rettigheder uanset seksuel orinetering  90  87  90
Holdning til børneopdragelse Vigtigt eller meget vigtigt, at din barn opdrages til at være religiøs  14  41  51
Holdning til kærester inden ægteskab Helt eller delvis i  orden, hvis nogen i din familie har en kæreste, inden vedkommende bliver gift 97  83  82
Autoritær-libertær holdninger  Helt eller delvis enig i, at alle skal have ret til offentligt at protestere mod politikere og offentlige myndigheder  93  80   87
Helt eller delvis enig i, at ægteskab mellem to personer af samme køn er moralsk forkert 11   29  27
Oplevet diskrimination Meget ofte eller ofte følt dig diskrimineret på grund af etnisk baggrund   12   18
Holdning til kønsroller Helt eller delvis enig i, at manden er familiens naturlige overhoved 10  37   38
Social kontrol Mange eller enkelte gange oplevet, at familiemedlemmer har tjekket di mobil, mail computer eller taske for at kontrollere dig 12  16
Holdning til ytrings- og religionsfrihed Helt eller delvis enig i, alle skal have mulighed for frit at udøve deres religion og bære religiøse symboler 57   74  86
Sociale, kulturelle og/eller religiøse traditioner og normer Helt eller delvis enig i, at det er i orden ikke at melde kriminelle handlinger til politiet, men at løse dem internt 11   13  16

Datagrundlaget er en stratificeret stikprøve. Der er anvendt tre strata: indvandrere og efterkommere 18-29 år, indvandrere og efterkommere 30 år eller mere og danskere. Svarprocenten er ret lav for for indvandrere og efterkommere, 42 for gruppen under 30 år og 47  for gruppen over. Danskeres svarprocent er 60. Ved tidligere undersøgelser har svarprocenten for indvandrere og efterkommere været endnu lavere, men en række særlige tiltag har bidraget til en højere svarprocent i 2017.

Den lave svarprocent og forskellen i svarprocent mellem de grupper man ønsker at belyse, giver et problem for repræsentativiteten. En delvis kompensation herfor søger man gennem en opregning af svarene fra forskellige grupper, svarende til deres andel af den samlede population. Kriterierne for opregningen er alder, køn, uddannelse, sprog og disponibel indkomst. For danskere er kriterierne sprog og disponibel indkomst erstattet med landsdel og socioøkonomisk status.

SFI har i et notat (Gorinas og Præstgaard-Christensen)  på grundlag af medborgerundersøgelsen for 2016 undersøgt mulige konsekvenser for repræsentativiteten af den lave svarprocent for ikke-vestlige indvandrere og efterkommere. Undersøgelsen viser at de indvandrere og efterkommere, der har deltaget i undersøgelsen, på en række punkter afviger både fra den samlede population af indvandrere og efterkommere og fra den gruppe, der ikke  har deltaget. Særligt uheldigt er det, at en stor indvandrergruppe som tyrkerne er stærkt underrepræsenteret.

Referencer:
Det Nationale Integrationsbarometer: Hjemmeside (link)
Det Nationale Integrationsbarometer: Oversigt over notater om medboreskabsundersøgelsen (link)

Udlændinge- og Integrationsministeriet: Medborgerskab 2017 (notat) (link)
Cedric Gorinas og Christine Præstgaard Christensen: 
Repræsentativitet i spørgeskemaundersøgelser blandt etniske minoriteter – medborgerskabsundersøgelse, SFI 2017 (link)


Sveriges statistiske system

10/04/2018          Taleboble Kommentarer

Det svenske statistiske system er karakteriseret ved at være forholdsvis decentraliseret. Det vil sige, at ansvaret for produktionen af den officielle statistik er fordelt på en række myndigheder, i modsætning til et centraliseret system, hvor én myndighed har hoveansvaret. Sverige afviger på dette punkt fra Danmark og Norge (se tidl. indlæg), der begge har centraliserede statistiksystemer. Den svenske decentralisering er et bevidst valg. Svenskerne har ønsket at give nogle af de vigtige brugere en stærk indflydelse på statistikken ved at overlade dem ansvaret.

Der findes i Sverige 28 statistikansvarlige myndigheder, der hver har ansvaret for et eller flere statistikområder. Ansvaret for samordningen af den officielle statistik ligger hos Statistiska centralbyrån (SCB). Ud over at stå for samordningen, så er SCB også  selv en af de 28 statistikansvarlige myndigheder med ansvar for en række statistikområder,  bl.a. befolkningsstatistikken nationalregnskabet  og en række prisindeks.

Når det svenske statistiske system betegnes som decentraliseret er det med tanke på ansvaret for den løbende statistikproduktion. I fastlæggelsen af rammer og mål for den officielle statistik ligger beslutningskompetencen klart hos regeringen. Det er således regeringen, der træffer beslutning om hvilke områder, der skal produceres statistik for, og også hvilken myndigheder, der skal have ansvaret for de enkelte statistikker. Hvert år meddeler regeringen mål, hovedopgaver og økonomiske rammer for SCB i from af et bevillingsbrev (regleringsbrev). 

Reglerne for og kravene til den officielle statistik er fastlagt i  statistikloven. En vigtig del af loven er opstillingen af en række kvalitetskrav, der bl.a. sikrer, at den svenske officielle statistik lever op til EU’s krav. Loven beskytter også betegnelsen Sveriges officiella statistik (SOS) og fastlægger et særligt symbol, statistikmyndighederne kan anvende til at markere en officiel statistik. Loven siger derimod intet om, hvem der skal producere den officielle statistik. Det er fastlagt i en særlig forordning om den officielle statistik. Det er i denne forordning, at de 28 producenter opregnes sammen med en liste over, hvilke statistikområder, de er ansvarlige for.

De nærmere regler om organiseringen og koordineringen af den officielle statistik er fastlagt i en instruktion for Statistisk Centralbyrån. Her fastslås SCB’s rolle som koordinator og som nationalt statistikinstitut efter EU’s regler. SCB ledes af en generaldirektør, med støtte af et rådgivende råd — Insynsrådet — hvis medlemmer udpeges af regeringen. Til rådgivnig og støtte for SCB’s arbejde er yderligere etableret to råd: Rådet for den officielle statistik, hvor statistikproducenterne er repræsenteret, og det videnskabelige råd, der skal bistå omkring metoder og kvalitet i en videnskabelig sammenhæng.

Referencer:
SCB’s Hjemmeside (link)
Sveriges statistiklov, Lag (2001:99) om den officiella statistikken (link)
Forordning om svensk statistik, Förordning (2001:100) om den officiella statistiken (link)
Instruktion for Statistiska Centalbyrån, Förordnung (2016:822) med instruktion för Statistiska centralbyrån (link)


Forvirring omkring størrelsen af husholdningernes opsparing

27/03/2018          Taleboble Kommentarer

I Danmarks Statistiks præsentation af Forbrugsundersøgelsen for 2016 er hovedhistorien, at husholdningernes opsparing nu udgør 25 pct. af rådighedsbeløbet. Rådighedsbeløbet er det beløb husholdningernme har til rådighed til forbrug, til gaver, til  betaling af bøder og foreningskontingenter og til opsparing. Den høje opsparingsandel virker overraskende, fordi Danmarks Statistik i forbindelse med Nationalregnskabet præsenterer en helt anden og væsentlig lavere opsparingsandel for husholdningerne. Nationalregnskabet når frem til en en opspringsandel for husholdningerne på blot 4 pct (nettoopsparing) af den disponible indkomst.

Som det fremgår, så opgør forbrugsundersøgelsen opsparingskvoten ud fra rådighedsbeløbet, hvor nationalregnskabet opgør den ud fra den disponible indkomst. Hertil kommer, at nationalregnskabets definition af opsparing afviger fra forbrugsundersøgelsens. For at gøre sammenligningen lidt mere overskuelig har jeg i tabellen herunder søgt at omregne forbrugsundersøgelsens begreber til nationalregnskabets definitioner. Omregningen kan sikkert raffineres yderligere.

Sammenligning af opsparingskvote i forbrugsundersøgelse og nationalregnskab, 2016

  Forbrugs-undersøgelsen
National-regnskabet
  1000 kr./husstand
1. Rådighedsbeløb 414,3       346,2
2. Foreningskontingenter mm -9,6
3. Overført til forbrug1 -10,9
4. Kapitaloverførsler -7,0
5. Bidrag til arbejdsmarkedspensioner -52,2
6.Overført formueindkomst2 25,3
7. Disponibel indkomst, NR-definition (1 + .. + 6) 359,9
8. Forbrug 299,1  353,1
9. Forbrug, NR-definition (8 + 3) 288,3
10. Opsparing i pensionskasser 22,4 22,4
11.Opsparing, NR-definition (7 – 9 + 10) 94,0 15,5
12. Opsparingskvote (11/(7 + 10) 25 pct. 4 pct.

Noter: 1En del af renten af forbrugslån (fisim) indgår i nationalregnskabet som forbrug. Omvendt betragtes en del af forsikringspræmierne som betalt overførsel og ikke som forbrug. 2Pensionskassernes formueindkomst og investeringsforeningernes formueindkomst af husholdningsejede certifikater overføres i nationalregnskabet som indkomst for husholdningene.
Kilder: Statikstikbanken/FU6, NASD21, og NASD22 

Nationalregnskabet har en lidt tvetydig behandling af pensionsopsparingen. Ved opgørelsen af den disponible indkomst betragtes indbetalinger af bidrag til arbejdsmarkedspensioner som en slags skat, der indgår med negativt fortegn i opgørelsen.  Til gengæld betragtes de udbetalte pensioner som indkomst, der indgår med positivt fortegn. Ved opgørelsen af opsparingen betragtes bidragsindbetalingerne derimod som en opsparing og pensionsudbetalingerne tilsvarende som en nedsparing. Opsparingen kommer derfor til ikke blot at omfatte forskellen mellem den disponible indkomst og forbruget, som er den sædvanlige definition af opsparing, men også forskellen mellem de indbetalte pensionsbidrag og de udbetalte pensioner (punkt 10 i tabellen). Af hensyn til konsistensen opgøres opsparingskvoten derfor ikke som opsparingens andel af disponibel indkomst, men som opsparingens andel af disponibel indkomst plus opsparingen i pensionskasserne.

Som det fremgår af tabellen, så ændrer omformningen af forbrugsundersøgelsen til nationalregnskabets begreber ikke på den store forskel i opsparingskvote. Men det bliver tydeligt, at den vigtigste årsag til forskellen ikke ligger i opgørelsen af den disponible indkomst, men i opgørelsen af forbruget. Det opgjorte forbrug i forbrugsundersøgelsen (uden NR-korrektion) udgjorde i 2016 kun 85 pct. af nationalregnskabets forbrug. Denne andel har være faldende i de senere år. I 2007 og 2008, hvor andelen var på sit højeste, udgjorde den 96 pct. Det virker usandsynligt, at så stor en forskel, og navnlig forøgelsen af forskellen siden 2008, udelukkende skulle afspejle tilsigtede forskelle i definitioner og opgørelsesmetoder. En nøjere granskning kunne være interessant. Måske et emne for et kommende indlæg.

Referencer:
Danmarks Statistik: Vi Sparer mere op, Nyt fra Danmarks Statistik 2018:118 (Link)

 


Danmarks nationale sundhedsprofil 2017

20/03/2018          Taleboble Kommentarer

Den Nationale Sundhedsprofil er et forsøg på at give et samlet overblik over den danske befolknings sundhedstilstand. Den seneste undersøgelse vedrører året 2017, og tilsvarende undersøgelser er tidligere gennemført for årene 2010 og 2013. Bag undersøgelsen står Sundhedsstyrelsen, de fem regioner og Statens Institut for Folkesundhed. Undersøgelsen belyser både helbredstilstand, f.eks. sygelighed og livsstil, f.eks. alkoholforbrug og kostvaner. Datagrundlaget er spørgeskemaer indsamlet fra en stikprøve af landets befolkning. Undersøgelsen supplerer ved sit fokus på borgernes egne vurderinger, de informationer der er til rådighed fra registreringen af  behandlingerne i sundhedsinstitutionerne.

I alt ca. 312 tusinde personer over 16 år blevet opfordret til at at besvare spørgeskemamaet og næsten 59 procent har faktisk svaret. Der er dog stor forskel på besvarelsesprocenterne for forskellige grupper. F.eks er besvarelsesprocenten i Region Syddanmark 67 pct., men kun 53 pct, i Region Hovedstaden. Blandt etniske danskere har 62 pct. svaret, men kun 33 pct. blandt ikke-vestlige indvandrere. Forskellene i svarprocent medvirker til, at stikprøven ikke er repræsentativ for hele befolkningen. Det har man forsøgt at kompencere for, ved at opregne på grundlag af kendskab til den samlede befolknings fordeling på en række kendetegn, bl.a. køn , alder, familietype og etnisk baggrund.

Detaljerede statistiske opgørelser af det omfattende materiale er stillet til rådighed for alle gennem en internetbaseret database. For hver af 70 spørgsmål, f.eks alkolholforbrug, forekomst af slidgigt eller selvvurderet helbred, kan man i databasen finde svarene fordelt på en række baggrundsvariable, f.eks.  køn, alder og etnisk baggrund. Som et enkelt eksempel på data hentet fra statistikbanken er nedenfor vist andelen af mænd og kvinder i forskellige aldersgrupper, der efter egen vurdering har et godt helbred.

Andel med godt selvvurderet helbred1 fordelt på køn og alder, 2017

Kvinder Mænd Alle
16-24 år 89,8% 93,5% 91,7%
25-34 år 88,8% 90,7% 89,7%
35-44 år 84,0% 88,0% 86,0%
45-54 år 78,9% 83,9% 81,4%
55-64 år 76,8% 78,7% 77,7%
65-74 år 80,6% 82,6% 81,6%
75+ år 66,9% 74,0% 69,9%
 Alle 81,3% 85,3% 83,2%

1 Omfatter kategorierne fremragende, vældigt godt og godt i spørgeskemaet.
Kilde: Den Nationale Sundhedsprofil

Som man kunne forvente er andelen faldende med stigende alder. I alle aldersgrupper er andelen lidt højere for mænd end for kvinder. I  den højeste aldersgruppe er forkellen mellem kønnene tilsyneladende større end for de øvrige aldersgrupper, men det skyldes nok, at kvindernes gennemsnitsalder er højere end mændenes.

Opgørelserne findes for landet som helhed og for regioner og kommuner. Selvom statistikbankens opgørelser er detaljerede, er det dog ikke alle kombinationer af baggrundsvariablene, man kan finde data for, men forskere kan søge om adgang til mere detaljerede data.

Referencer:
Sundhedsstyrelsen: Danskernes Sundhed – Den Nationale Sundhedsprofil 2017, (link)
Statens Institut for Folkesundhed: Statistikbank (link)
Sundhedsdatastyrelsen: Hjemmeside (link)
Statens Institut for Folkesundhed: Hjemmeside (link)


Norges statistiske system

20/02/2018          Taleboble Kommentarer

På mange måder minder det norske statistiske system om det danske. F.eks. er der tale om et stærkt centraliseret system hvor et nationalt statistikinstitut, der i statistikfaglige sager arbejder uafhængigt regering og andre myndigheder, har hovedansvaret for statistikken. Også den organisatoriske opbygning minder om den danske med en statistikchef som daglig leder af statistikinstituttet og en bestyrelse, der lægger hovedlinierne for aktiviteteten.

Det nationale statistikinstitut er Statistisk sentralbyrå (SSB), — der nærmest svarer til Danmarks Statistik . Selv om Norge ikke er medlem af EU indgår landet i kraft af sit mdelemskab af EØS i det Europæiske Statistiske System (se tidl. indlæg) . Det betyder  bl.a., at data for Norge indgår i EU’ statistikbank og at Norge er forpligtet af EU’s kvalitetskrav. EU’s peer-report fra 2015 giver et meget positivt billede af kvaliteten af den officielle norske statistik.

Forholdene omkring den norske officielle statistik er reguleret i en kortfattet lov, der har det meget passende navn “Lov om officiel statistikk og Statistisk Sentralbyrå” eller bare Statistikloven. Loven fastslår, at beslutninger om udarbejdelse af statistik og den organisatoriske placering af SSB i det statslige system træffes af kongen, dvs. regeringen. Men loven slår også fast, at SSB er fagligt uafhængig.

I spidsen for SSB står en administrerende direktør og en styrelse (Styret). Styret består af en formand, en næstformand og fem ordinære medlemmer, der udpeges af regeringen. Direktøren er ikke medlem af Styret, men deltager i dets møder. Medlemmerne udpeges for en fireårig periode, men kan genudpeges. Et medlem udpeges efter indstilling fra de ansatte. Styret fastlægger arbejdsplaner (programmer) og budgetforslag efter indstilling fra den administrerende direktør og fører tilsyn med SSB’ udvikling og virksomhed. I sager, der ikke hører under Styret, træffes beslutningerne af den administrerende direktør. SSB har to afdelinger, en i Oslo og en i Kongsvinger, ca 100 km. nordøst for Oslo.

EU’s liste over producenter af officiel statistik er Norge repræsenteret med 10 institutioner (inkl SSB), men SSB tegner sig for omkring 85 pct. af produktionen. Hovedkanalen for publiceringen er bureauets hjemmeside, ssb.no, og adgangen til statistikkerne er som hovedregel gratis for brugerne. Hovedparten af  af budgettet — 70 pct. — finansieres over statsbudgettet (finansloven) og resten af indtægter fra bestillingsopgaver, f.eks. til andre statsinstitutioner og Norges Forskningsråd. I alt er ansat 900 personer, udover ca. 200 interviewere.

Statistikloven giver SSB adgang til at anvende det offentliges administrative registre og regeringen mulighed for at  pålægge borgere og virksomheder at levere oplysninger til SSB til brug for statistikken. De adminstrative registre spiller en stor rolle som kilde til statistikkerne, men ikke alt kan belyses gennem registrene, så SSB indsamler også data gennem spørgeskemaer og interviews.

Som noget ret specielt for et officielt statistikinstitut har SSB en betydelig forskningsafdeling, der beskæftiger ca. 50 forskere. Forskningsafdelingen er for tiden anledning til en konflikt omkring dens fremtidige rolle (se tidl. indlæg) . Konflikten har foreløbigt ført til at en administrerende direktør har opsagt sin stilling. Sagen behandles i øjeblikket af Stortingets kontrolkomite.

Referencer:
Statistiks sentralbyrå: SSB’s hjemmeside, (Link)
Statistiks sentralbyrå: Dette er SSB, (Link)
FinansdepatementetLov om offisiell statistikk og Statistisk Sentralbyrå (statistikkloven). (Link)

E
urostat: Peer review, Norge (Link)


Statistik om deleøkonomi

06/02/2018          Taleboble Kommentarer

Deleøkonomi, forstået som privatpersoners bytte, køb og salg af varer og tjenester direkte til hinanden, har altid eksisteret. Det har producenterne af den officielle statistik naturligvis også vidst, og har enten søgt at inddrage sådanne aktiviteter i statistikkerne, eller bevidst ignoreret dem, hvis deres omfang lå under bagatelgrænsen. Det nye er, at internettet har åbnet nye muligheder for at organisere deleøkonomien gennem  såkaldte platforme, hvor private udbydere og efterspørgere kan komme i forbindelse med hinanden. Den Blå Avis, Uber og AirBnB er kendte eksempler på sådanne platforme.

På den baggrund har både internationale institutioner som EU og OECD og nationale statistikinstitutter, herunder Danmarks Statistik, iværksat undersøgelser af behovet og mulighederne for tilpasninger af statistikken. Danmarks Statistik har samlet sine foreløbige overvejelser i en rapport, der udkom 26 januar. Der eksisterer ikke en generelt accepteret definition på deleøkonomi, så en vigtig del af rapporten består i at belyse de forskellige aspekter af begrebet for at nå frem til en statistisk afgrænsning. Der er endnu et stykke vej til en afklaring, der kan danne grundlag for mere systematiske overvejelser om deløkonomiens plads i den officielle statistik, men som et første skridt opstiller rapporten en foreløbig afgrænsning. Denne foreløbige  afgrænsning danner så udgangspunkt for en belysning af deleøkonomiens betydning for de eksisterende statistikker, og en vurdering af mulighederne for bedre belysning i fremtiden.

Kontakten mellem de privatpersoner, der indgår i bytteøkonomiske transaktioner, kan ske gennem mange kanaler, men i den foreløbige definition vælger rapporten kun at inddrage transaktioner, der sker gennem platforme, hvis formål er bytteøkonomisk formidling, og som er drevet af  virksomheder. Det kræves også, at virksomhederne modtager en betaling fra de privatpersoner, der bruger tjenesten. Sådanne platforme kan muligvis også anvendes af virksomheder, men det er kun når både modtager og leverandør er privatpersoner, at det betragtes som deleøkonomi. Endelig afgrænser den foreløbige definition området til overnatning, transport og tjenester.

Bortset fra turismestatistikken, hvor manglende dækning af deløkonomien fører til en undervurdering af antallet af overnatninger, så konkluderer rapporten, at deleøkonomien endnu kun har begrænset betydning for de eksisterende statistikker. Men da området er i udvikling, og kan blive af væsentlig betydning i fremtiden, opregner rapporten også en række muligheder, for udvikling af eksisterende statistik og etablering af ny, bl.a. gennem anvendelse af big data (se tidligere indlæg), udnyttelse af administrative data, f.eks. fra skattevæsenet, og etablering af helt nye stikprøveundersøgelser.

Referenser:
Danmarks Statistik: Deleøkonomien -hvordan kan den defineres og måles?, 2018 (link)


Ændringer i lov om Danmarks Statistik

30/01/2018          Taleboble Kommentarer

Regeringen har fremsat et forslag til ændring af lov om Danmarks Statistik. Det egentlige formål med ændringerne er, at bringe loven i overensstemmelse med EU’s forordning om statistik (se tidl. indlæg). Lovforslaget blev fremsat den 29 november 2017. Det forventes at ændringerne vedtages i Folketinget den 8. februar, og at den nye lov træder i kraft den 1. juli. Hverken udkastet til betænkning eller debatten i Folketinget under førstebehandlingen afspejler uenigheder mellem partierne om loven. Der er i Folketinget udbredt enighed om rammerne for produktionen af den officielle statistik.

EU-reglerne kræver, at hver medlemstat udpeger et organ — den nationale statistikmyndighed — der er ansvarligt for det statistiske samarbejde med Kommisionen. Danmarks Statistik har hele tiden haft den rolle, men nu bliver den udtrykkeligt  fastlagt i loven.

Et af de vigtigste krav i EU’s statistikregler er, at den nationale statistikmyndighed skal være fagligt uafhængig af  regering og andre institutioner. Sådan har det også i praksis været under den hidtidige lov, men i den nye lov bliver det gjort mere klart. Rigstatistikerens ansvar og rolle som daglig leder bliver  gjort tydeligere, og ministerens rolle bliver indskrænket. I den hidtidige lovs § 3 er opregnet en række beføjelser til ministeren, hvor  § 3 i den nye lov er ganske kort og kun fastlægger ministerens pligt til at sikre finansieringen af statistikken og at føre tilsyn med Danmarks Statistiks interne forvaltning.

Den overordnede ledelse af Danmarks Statistik ligger fortsat hos en bestyrelse — der i den hidtidige lov kaldes Styrelsen — men antallet af medlemmer udvides fra 7 til 8 medlemmer. Rigsstatistikeren er født medlem både efter den nuværende og den nye lov, og de øvrige medlemmer beskikkes af ministeren, men efter den nye lov skal beskikkelsen ske efter indstilling af rigsstatistikeren. Ved stemmelighed er rigsstatistikerens stemme afgørende. Alt i alt en styrkelse af rigsstatistikerens rolle.

Statistik produceret af Danmarks Statistik er underlagt ret detaljerede internationale regler for kvalitet. Om statistik af høj kvalitet produceret af offentlige myndigheder har man længe anvendt betegnelsen officiel statistik (denne blogs hovedfokus), men det har ikke altid været klart, hvornår statistik produceret af andre end Danmarks Statistik levede op til kravene. Den nye lov indfører begrebet officiel offentlig produceret statistik om denne type statistik, og pålægger Danmarks Statistik at offentliggøre og vedligeholde en liste over de omfattede statistikker. Det er op til de enkelte statistikproducenter om de ønsker optagelse på listen, men de skal i så fald overholde retningslinier fastlagt af Danmarks Statistik på grundlag af de internationale regler, og Danmarks Statistik skal føre tilsyn med at reglerne overholdes.

Referencer:
Forslag til ændring af lov om Danmarks Statistik, Folketingstidende A Lovforslag nr. L 110 (link)
Referat af første behandling af forslag til ændring af lov om Danmarks Statistik, Folke-tingstidende F,  7. dec. 2017 (D), s. 53-56 (link)

 


Indvandring og kriminalitet blandt unge i Tyskland

23/01/2018          Taleboble Kommentarer

I mit indlæg 5/12-2017 skrev jeg, at mange landes statistikmyndigheder ser religion som et følsomt område, som man er tilbageholdende med, at belyse statistisk. Noget tilsvarende kan siges om etnisk/national baggrund, og navnlig sammenhængen mellem etnisk/national baggrund og kriminalitet. Det gælder dog ikke alle lande. I Danmark og Norge har man i flere år opgjort en officiel statistik om indvandreres kriminalitet. I Sverige har man derimod eksplicit besluttet ikke at opgøre en sådan statistik.

Den officielle kriminalstatistik er baseret på politiets opgørelser, der ifølge sagens natur kun omfatter den kriminalitet, der kommer til politiets kendskab. Politiets materiale omfatter både anmeldte og opklarede forbrydelser, men der findes, igen ifølge dagens natur, kun oplysninger og lovovertræderens personlige data — herunder etnisk/national baggrund — i de tilfælde, hvor forbrydelsen er opklaret. Dertil kommer, at en stor andel af lovovertrædelserne slet ikke anmeldes, det såkaldte mørketal. Den officielle statistik afspejler derfor kun en del af virkeligheden.

Mørketallet kan belyses gennem spørgeskemaundersøgelser hvor man beder de adspurgte oplyse, enten om de har begået lovovertrædelser, eller om de har været ofre for en forbrydelse. På bestilling af det tyske familieministerium har  Universitetet for Anvendt Videnskab i Zürich (Zürcher Hochschule für Angewandte Wissenschaften) udarbejdet en rapport (Christian Pfeiffer, Dirk Baier og Sören Kliem), der bruger svarene på den type spørgsmål til at belyse udviklingen i voldskriminaliteten blandt unge i Tyskland. Rapportens helt overordnede konklusion er, at de unges voldskriminalitet har været faldende i Tyskland i de senere år. Faldet gælder både tyskere og indvandrere, men de unge indvandrere har stadig en højere kriminalitetsrate end de unge tyskere.

Rapporten forsøger, på grundlag af tal fra 2007/2008 for indvandrere fra Tyrkiet, det tidligere USSR og det tidligere Jugoslavien, at forklare denne forskel mellem tyskere og  indvandrere  som forårsaget dels af forskelle i socioøkonomisk status (uddannelsesniveau og arbejdsmarkedstilknytning) og dels af forskelle i kulturel orientering. Et uddrag af resultaterne er vist i nedenstående tabel.

Andel i pct., der oplyser, at de indenfor de foregående 12 måneder har udsat andre for røveri eller vold.

  Tyskland Tyrkiet Tidligere USSR Tidligere Jugoslavien
I alt  11,5  20,3  18,0  22,1
Samme socioøkonomiske status  12,0  18,9  16,3  21,4
Samme socioøk. status og kulturelle orientering 6,5   5,2  5,8  11

Kilde : Christian Pfeiffer, Dirk Baier og Sören Kliem, tabel 3, s.18

I gruppen samme socioøkonomske status er kun medtaget unge, der er under gymnasial uddannelse og hvis forældre ikke modtager bistandsydelser fra staten. Gruppen samme socioøkonomiske status og kulturelle orientering er yderligere afgrænset til kun at omfatte personer der angiver, at de ikke har oplevet alvorlig vold fra forældre gennem deres barndom og at de ikke tilslutter sig særlige normer for maskulinitet, som f.eks. at en mand, der ikke er villig til at besvare fornærmelser med vold, er en svækling.

Som det fremgår af tabellen, tyder denne undersøgelse ikke på, at uddannelse og forældres grad af selvforsørgelse i sig selv spiller den store rolle for unge indvandreres kriminalitet. Det er den kulturelle orientering, der spiller den store rolle, og den ændres tilsyneladende ikke uden videre ved ændring af socioøkonomisk status.

Referencer:
Christian Pfeiffer, Dirk Baier og Sören Kliem: Zur Entwicklung der Gewalt in Deutschland, Zürcher Hochshule für Angewandete Wissenschaften (link)


Skatter og afgifter i indeksene for forbrugerpriser

16/01/2018          Taleboble Kommentarer

Inflation måles sædvanligvis som udviklingen i forbrugerpriserne og belyses ved forskellige former for forbrugerprisindeks. Ved forbrugerpriser forstås i den sammenhæng de priser, som forbrugerne faktisk betaler, dvs. inklusiv moms og andre afgifter og eksklusiv eventuelle tilskud (subsidier). Den måde at opgøre inflation på er helt i overensstemmelse med internationale statistiske retningslinier.

Men selvfølgelig gør det en forskel, om det man betaler for varerne er en betaling til sælger og producent eller om det er en skat, som jo i princippet er en betaling til fællesskabet. Uden disse skatter på de købte produkter ville andre skatter være højere eller de offentlige ydelser lavere. Alt andet lige, skal jeg som økonom forsigtigt tilføje. For at belyse denne forskel opgør Danmarks Statistik et indeks for forbrugerpriser, der er korrigeret for afgifter og subsidier. Dette indeks betegnes nettoprisindekset.

Forbrugerprisndeks og nettoprisindeks, stigning i forhold til foregående måned, 2016-2017

Kilde: www.Statistikbanken.dk tabel PRIS111 og PRIS114

Ser man på indeksene for det samlede forbrug (den øverste af graferne ovenfor) fremgår det, at det gør en forskel om prisændringerne opgøres med eller uden afgifter, men at forskellene er ret små, så længe der kun sker afgiftsændringer for enkelte produkttyper. En ændring i en generel afgift som momsen ville vise sig tydeligere.  Mere markante forskelle ser men, hvis man sammenligener indeksene for et højtbeskattet produkt, i en periode hvor afgifterne på produktet ændres. Det er illustreret i den nederste af figurerne hvor prisudviklingen for nye biler er vist. Her ses det tydeligt, hvordan nedsættelserne af registreringsafgiften har en tydelig virkning på forbrugerprisindeksene for januar og oktober 2017, hvorimod nettoprisindeksets udsving er betydeligt mindre.

Nettoprisindekset kan ikke tolkes som et udtryk for, hvordan forbrugerpriserne ville have udviklet sig, hvis der ikke havde været afgifter på produkterne. Det skyldes, at man ikke kan regne med, at en afgiftændring slår fuldt igennem på de priser forbrugerne betaler. Økonomisk teori vil forudsige, at den prisstigning, der følger af en afgiftforhøjelse på et produkt, vil nedsætte forbrugernes efterspørgsel efter produktet. Producenterne og forhandlerne vil sandsynligvis søge at modvirke faldet i efterspørgslen ved at sætte deres avance ned, således at prisstigningen for forbrugerne bliver mindre end afgiftsforhøjelsen. I praksis betyder det, at byrden af afgiftsforhøjelsen — incidensen i økonomsprog — fordeles mellem producent/forhandler og forbruger, selv om størstedelen af byrden nok falder på forbrugeren. Ved afgiftsnedsættelser forventer den økonomske teori tilsvarende en fordeling af gevinsten.

Referencer:
Danmarks Statistik:
Dokumentation af forbrugerprisindeks (link)
Danmarks Statistik: Dokumentation af nettoprisindeks (link)


Danmarks Statistiks planer for 2018 og frem

09/01/2018          Taleboble Kommentarer

Danmarks Statistiks Styrelse fastlægger hvert år rammerne for institutionens arbejde i en arbejdsplan. Arbejdsplanen for 2018 blev offentliggjort 8/1-2018. Samtidigt med Arbejdsplanen udgives Statistikprogrammet, der er en samlet oversigt over statistikprodukterne. Arbejdsplanen er krævet i lov om Danmarks Statistik, men udover arbejdsplanen udarbejder Danmarks Statistik også en strategiplan, der rækker fem år frem, som en overordnet ramme for arbejdsplanen. Strategiplanen revideres hvert andet år, og den seneste, Strategi 2022, udkom 15. december 2017.

I både strategiplanen og abejdsplanen er målene ordnet i fem hovetemaer. I oversigten nedenfor er vist nogle af de vigtigste af målene fra de to planer for de fem temaer:

Tema Strategi Arbejdsplan
Ydelser Tilpasning til nye og ændrede behov og fuld udnyttelse af digitale muligheder i formidlingen Fremrykning af offentliggørel-sestidspunkt for nationalregn-skab, ejendomssalgsstatistik og forbrugsundersøgelse.

Nye lønindeks (jf indlæg fra 2/1-2018)

Rapport om mulighederne for statistisk belysning af deleøkononomien

Processer Bedre kvalitetsstyring, effek-tivisering af produktionen og udvikling af medarbejdernes kompetencer Samlet metadatasystem med fælles brugerflade (se tekst)
Datakilder Fortsat reduktion af indberetningsbyrden og udnyttelse af nye datakilder Udarbejdelse af handlingsplan for brugen af Big Data i statistikproduktionen
Datasikkerhed Klare regler om og skrappe krav til datasikkerheden, kombineret med effektiv overvågning Implementering af ny databeskyttelsesforordning

Iværksættelse af proces med henblik på opnåelse af ISO 27000-certificering af it-sikkerhed

Statistiksamar-
bejde
Styrkelse af samarbejde og koordinering i det danske statistiksystem og aktiv deltagelse i det internationale statistiksamarbejde Opdatering af lov om Danmarks Statistik

Etablering af godkendelsesord-ning for officiel statistik

Etablering af portal for officiel statistik

Metadata er data, der beskriver og forklarer indholdet af tabellerne, f.eks. begrebsforklaringer og klassifikationer. Det er især adgangen fra hjemmesiden til de forskellige klassifikationer — f.eks. af brancher og uddannelser — der efter planen skal gøres nemmere.

Den opdaterede lov om Danmarks Statistik, der efter planen skal træde i kraft den 1. juli, vil jeg behandle i et blogindlæg i slutningen af januar. En af nyskabelserne er, at begrebet officiel statistik, der jo er denne blogs centrale tema, bliver præciseret i loven. Statistik produceret af offentlige myndigheder vil kunne anvende betegnelsen officiel statistik, hvis de er tilmeldt en ordning, hvor opfyldelsen af kvalitetskravene overvåges. Ordningen administreres af Danmarks Statistik.

Arbejdsplanen og statistikprogrammet afspejles også i Resultatplanen for 2018, der er grundlaget for rigsstatistikerens resultatløn. Den er derfor udformet som en kontrakt underskrevet af rigsstatistikeren og departementchefen for Økonomi- og Indenrigsministeriet. Målene er her meget konkret beskrevet, så det er nemt at afgøre om de er opfyldt, og sprogbrugen kan være lidt teknisk og indforstået. Vurderingen af om målene fra Resultatplanen er opfyldt bliver præsenteret i Årsrapporten, der udkommer i marts, året efter rapporteringsåret. Årsrapporten indeholder også en række oplysninger om Danmarks Statistiks regnskab.

Referencer:
Danmarks Statistik: Strategi 2022 (link)
Danmarks Statistik: Resultatplan 2018 (link)
Danmarks Statistik: Arbejdsplan 2018 (link)


Lønindeksene fra Danmarks Statistik

02/01/2018          Taleboble Kommentarer

Lønindeksene fra Danmarks Statistik har til formål at belyse lønudviklingen fordelt på brancher og på hhv. “stat”, “regioner”, “kommuner” og “virksomheder og organisationer”. Indeksene siger intet om lønniveauet. Det belyses i andre statistikker, navnlig lønstrukturstatistikken, der til gengæld ikke er egnet til belysning af lønudvikling (se tidligere indlæg). Men brugen af lønindeksene til belysning af lønudviklingen kræver en vis omtanke for at undgå fejlfortolkninger. Det har Rigsstatistikeren — foranlediget af de kommende overenskomstforhandlinger for de offentligt ansatte — understreget i sin klumme fra 12. december.

Det væsentligste problem er, at indeksene ikke tager højde for, at de ansattes fordeling på. f.eks stillingskategori og uddannelse kan ændre sig. Øges f.eks. andelen af højtuddannede på bekostning af mellemuddannede, så vil lønindekset stige, fordi lønnen er højere for de højtuddannede. Men det afspejler ikke en lønstigning for hverken de højt-eller mellemuddannede. Kun en ændret sammensætning af arbejdsstyrken. I klummen henviser rigsstatistikeren til en analyse fra Danmarks Statistik, der faktisk viser, at det offentlige har øget andelen af højtuddannede (se tidligere indlæg). Et nyt indeks, der tager højde for sådanne ændringer i sammensætningen er under forberedelse i Danmarks Statistik, og forventes at kunne offentliggøres inden udgangen af 2018.

Ved offentliggørelsen i Nyt fra Danmarks Statistik præsenteres lønindeksene samlet, men indsamlings- og metodemæssigt er er tale om to statistikprodukter —  et for stat, kommuner og regioner (offentlig forvaltning og service) og et for virksomheder og organisationer. Indekset for offentlig forvaltning og service er basereret på en totaltælling og omfatter stort set alle ansatte indenfor området. Indekset for virksomheder og organisationer er derimod baseret på en stikprøve og omfatter kun enheder med 10 eller flere ansatte. Desuden er virksomheder indenfor landbrug og fiskeri udeladt.

I statistikbanken findes kvartalsvise opgørelser af lønindeksene tilbage til 2005 (Statistikbanken ILON12, ILON22 og ILON32). Der er dog et databrud i 2013, hvor en række offentligt ejede enheder, der i deres funktion minder om privatejede virksomheder, f.eks. DSB og kommunale forsyningsselskaber, blev flyttet fra “stat” og “kommuner” til “virksomheder og organisationer”. Danmarks Statistik mener dog ikke at dette databrud har større betydning for sammenligneligheden. I det hele taget beskriver Danmarks Statistik den generelle kvalitet af lønindeksene som værende høj.

Referencer:
Danmarks Statistik: Vær forsigtig med at bruge lønindekset til historiske sammenligninger, Rigsstatistikerens Klumme 12/12 2017 (link)
Danmarks Statistik: Dokumentation af lønindeks for offentlig forvaltning og service (link)
Danmarks Statistik: Dokumentation af lønindeks for virksomheder og organisationer (link)


Virkeligheden, som beskrevet af statistikken og som opfattet af befolkningen

19/12/2017          Taleboble Kommentarer

Ideen bag produktionen af den officielle statistik er naturligvis, at den skal bidrage til en bedre forståelse af nogle vigtige træk i samfundet, og på den måde danne grundlag for bedre beslutninger. Der er heller ingen tvivl om, at statistikken i høj grad bliver anvendt af professionelle beslutningstagere som politikere, myndigheder, virksomheder og organisationer. Men i hvilket omfang når de statistiske resultater ud til den almindelige befolkning? Et privat markedsanalysefirma — Ipsos — har offentliggjort en analyse, der forsøger at belyse dette spørgsmål. Analysen er basereret på interviews i 38 lande. Antallet af interviews i hvert land ligger mellem 500 og 1.000, afhængigt af befolkningsstørrelsen. De interviewede blev stillet en række spørgmål om hvad de troede statistikken viser, og svarene blev derefter sammenholdt med de statistikkens faktiske resultater.

Hovedkonklusionen i Ipsos analyse er, at den virkelighed, som befolkningen opfatter, er mere dyster end den virkelighed, som statistikkerne beskriver. Det giver sig bl.a. udslag i, at størrelser som antal mord pr 1000 indbygger, andel af teenagere der bliver mødre og udviklingen i antallet af terrordrab, i den almindelige opfattelse bliver overvurderet i forhold til de tal, man kan finde i statistikkerne.

Tendensen til en mere negativ opfattelse af virkeligheden, end den statistikken giver anledning til, finder man i alle landene, men graden af afvigelsen mellem opfattelse og statistik er meget forskellig landene imellem. Den mindste afvigelse finder man hos svenskerne, og efter dem følger nordmændene og danskerne. Den største afvigelse finder man hos sydafrikanerne.

Referencer:
Ipsos hjememsidePerceptions Are Not Reality: Things are NOT as Bad as they Seem (link)


Brug af mobiltelefondata i folketællinger

12/12/2017          Taleboble Kommentarer

Folketællinger er kostbare at gennemføre, især hvis der er tale om den traditionelle type, hvor hver enkelt husholdning opsøges og interviewes (blogindlæg fra 3/2-2016). I UK har man siden 1801 hvert tiende år, med undtagelse af 1941,  afholdt en traditionel folketælling, senest i 2011. Den næste folketælling er planlagt til 2021, men den vil næppe blive af den traditionelle type. Office for National Statistics (blogindlæg fra 21/11-2017) har på foranledning af regeringen, der er bekymret over omkostningerne, iværksat en undersøgelse af mulighederne for at anvende andre og billigere fremgangsmåder.

Et af de områder, som folketællingen skal dække, er pendlingen mellem hjem og arbejde. Office for National Statistics her i en rapport undersøgt, om data fra mobiltelefoner kan anvendes som kilde til belysning af dette område. Grundideen er, at hvis man kan man registrere, hvor en mobiltelefon befinder sig om natten og hvor den befinder sig indenfor normal arbejdstid, kan man under visse forudsætninger danne skøn over pendlingstrømme. Registrering af telefonens position under rejsen fra hjem til arbejde kan sige noget om anvendt transportform (vej eller jernbane).

Som et forsøg har man indhentet mobiltelefondata fra tre bydele (boroughs) i London, og søgt at beskrive pendlingmønstre ud fra disse data. En sammenligning af forsøgsresultaterne med pendlingopgørelserne fra den seneste folketælling i 2011 giver grund til en vis optimisme — især for langdistancependling — men viser også, at metoden ikke er uden problemer.

Det er ikke telefonens position, der er registreret i de anvendte data, men hvilken telemast, den er koblet til. Da hver mast dækker et areal af en vis udstrækning, er der grænser for præcisionen af positionsoplysningerne.

En vigtig forudsætning bag metoden er, at den registrerede bruger af telefonen også er den faktiske. I det omfang børn er brugere af telefoner registreret i forældrenes navn, kan børnenes bevægelse mellem hjem til skole fejlagtigt blive tolket som pendling. Sandsynligves bliver voksne studerende også i mange tilfælde fejlagtigt registreret som pendlere.

Fejlregisteringen af skoleelever og studerende er sandsynligvis en vigtig årsag til, at kortdistancependlingen i forsøget ser til ud til at blive overvurderet sammenlignet med resultaterne fra folketællingen i 2011. Til gengæld tyder resultaterne på en undervurdering af langdistancependlingen. En mulig årsag er hertil er, at metoden forudsætter et typisk pendlingmønster. Atypiske mønstre, f.eks. pendling om natten i forbindelse med skifteholdsarbejde registreres ikke.

Skal mobiltetefondata anvendes i forbindelse med folketællingen i 2021 kræves en yderligere udvikling af de metoder, der er anvendt i forsøget. Office for National Statistics ser navnlig to muligheder for forbedring af metoden. Den ene er en bedre indragelse af pendlere med atypiske mønstre, f.eks nattependlere. Den anden er at udvikle algoritmer, der gør det muligt at skelne mellem telefoner anvendt af beskæftigede på arbejdsmarkedet, og telefoner anvendt af andre, f.eks. skoleelever og studerende.

Referencer:
Office for National StatisticsResearch Outputs: Using mobile phone data to estimate commuting flow (link)


Statistik om religion

05/12/2017          Taleboble Kommentarer

Statistik om religion er ikke noget kærneområde for den officielle statistik. I de officielle statistikbanker finder man kun meget sporadiske oplysninger om området. Det skyldes næppe, at emnet anses for uvæsentligt, men snarere at det ses som et særligt følsomt område, hvor myndigheder, herunder officielle statistikinstitutter, skal træde varsomt. I Frankrig, og sikkert også i andre lande, er det ligefrem ved lov forbudt myndighederne at indsamle data om religion. Der findes dog også lande, hvor et spørgsmål om religiøst tilhørsforhold indgår i folketællingerne.

Da emnet måske nok er følsomt, men samtidigt har stor interesse, så åbner den officielle statistiks tilbageholdenhed pladsen for andre aktører. Pew Research Center, jf. indlæg fra 25/7-17, har valgt religion som et af sine fokusområder. og har udgivet en serie rapporter, der belyser emnet statistisk (se Pew’s hjemmeside under fanen RELIGION). Den seneste rapport udkom den 29. november, og handler om den voksende muslimske befolkning i Europa. Andre rapporter fra de seneste måneder har handlet om udviklingen i de ortodokse kristnes andel af verdens befolkning (8. november) og om  meningsforskellene mellem lutheranere og katolikker 500 år efter konflikten begyndte (31. august).

Analysen af muslimerne i Europa er et led i det måske mest interessante af Pews religionsprojekter, der omfatter en større analyse af de forskellige religioners udbredelse nu og fremover. I tabellen nedenfor vises analysens resultater for religionernes udbredelse i verden  i 2015 og prognosen for udbredelsen i 2060.

Verdens befolkning fordelt efter religion i 2015 og 2060

2015 2060 2015 2060
mio. personer pct.
Kristne 2.276 3.054 31,2 31,8
Muslimer 1.753 2.987 24,1 31,1
Uden religiøs tilknytning 1.165 1.202 16,0 12,5
Hinduer 1.099 1.392 15,1 14,5
Buddhister 499 462 6,9 4,8
Andre 492 517 7,7 5,4
I alt 7.285 9.616 100,0 100.0

Kilde: Pew: The Changing Global Religious Landscape

Grundmaterielet for Pew’s analyse stammer fra et meget stort antal meget forskellige kilder, herunder officiel statistik. Resultaterne afspejler, hvordan udviklingen vil blive, hvis de træk vi kender i dag omkring aldersfordeling, fødsels- og dødhyppighed og konvertering mm. for de forskellige religiøse grupper fortsætter uændret. Også migrationsmønstre er inddraget i analysens belysning af den fremtidige regionale udbredelse af de forskellige religioner. Eventuelle større ændringer i de i dag kendte mønstre er der af gode grunde ikke taget højde for. På samme måde som ved befolkningsfremskrivninger er der med andre ord ikke tale om en forudsigelse, men om en fremskrivning der belyser konsekvenserne af en fortsættelse af de kendte mønstre.

Analysens mest markante resultat er den stærke forøgelse af muslimernes andel af verdensbefolkningen. I 2060 vil islam have samme relative udbredelse som kristendommen, der i dag er  den mest udbredte religion. Samlet kommer religionerne til at stå stærkere — andelen af ateister og andre uden religiøs tilknytning er faldende.

Fremskrivningerne i den seneste rapport om Europa viser drastiske forøgelser i  muslimernes andel af befolkningen i navnlig de nord- og centraleuropæiske lande. Sverige og Tyskland er blandt de lande med udsigt til den største forøgelse. Pew opererer med tre scenarier for den fremtidige indvandring: en fortsættelse af det nuværende niveau for indvandring, en vis opbremsning og et totalt stop. For Sverige bliver den muslimske andel af befolkningen i 2050 under de tre scenarier hhv. 31 %, 21 % og 11 %, mod 8 % i 2016. For Danmark er de tilsvarende tal 16 %, 12 % og 8 %, mod 5 % i 2016. (Bemærk, at tallene for Europa vedrører 2050, hvor tallene for hele verden i tabellen vedrører 2060)

Referencer:
Pew Research Center: Hjemmeside (link)
Pew Research Center: Europe’s Growing Muslim Population (link)
Pew Research Center: 
Orthodox Christianity in the 21st Century (link)
Pew Research Center: 
After 500 Years, Reformation-Era Divisions Have Lost Much of Their Potency (link)
Pew Research Center: The Changing Global Religious Landscape (link)


Måling af ulighed i indkomst

28/11/2017          Taleboble Kommentarer

Belysning af ulighed i indkomstfordlingen har altid spillet en central rolle i den officielle statistik, og Danmarks Statistik har da også i mange år offentliggjort mål for indkomstuligheden. Den seneste opgørelse vedrører 2016, og blev offentliggjort i statistikbanken/IFOR41 den 13. november. Danmarks Statistik offentliggør fire forskellige mål for uligheden — Gini-koefficient, Maksimal udjævningsprocent, S80/20-målet og P90/10-målet — men der findes mange andre mål, der kunne være anvendt. På tabel IFOR41′ s informationsside i Statistikbanken (statistikbanken/ifor41->information->begreber) findes en kort beskrivelse af de fire mål.

Gini-koefficienten er langt det mest udbredte ulighedsmål, Den antager en værdi mellem 0 og 1 (eller 100, hvis man måler i procent), hvor 0 angiver total lighed, dvs. alle har samme indkomst, og 1 angiver maksimal ulighed, dvs. al indkomst tilfalder én person. Der argumenteres sjældent for, at netop dette mål anvendes, så måske er årsagen til udbredelsen mere tradition end konkrete overvejelser.

I konkrete overvejelser over hvilket ulighedsmål, der bør foretrækkes, indgår typisk følgende fire kriterier:

Ingen af de mål, Danmarks Statistiks offentliggør, opfylder alle kriterierne. Faktisk opfyldes alle kriterierne kun af en ganske bestemt matematisk afgrænset gruppe af mål (Cowell 2009). Blandt de mål, der opfylder kriterierne er Atkinsons indeks et af de mest populære.

Atkinsons indeks (AI) knytter sig tæt til den økonomiske velfærdsteori, hvilket nok er en væsentlig årsag til målets popularitet. Brugeren af AI tager eksplicit stilling til, hvor stor vægt der skal lægges på afvigelser fra ligheden i bunden af indkomstfordelingen i forhold til afvigelser i toppen, når uligheden måles. Større vægt på afvigelse i den lave ende ses kom et udtryk for aversion mod ulighed. I praksis sker valget af graden af ulighedsaversion ved fastlæggelsen af en aversionsparameter. Jo højere værdi af parameteren, jo mere afspejler indekset aversion mod ulighed

I tabellen nedenfor er vist uligheden i Danmark i 1987 og i 2016 som opgjort af Danmarks Statistik suppleret med egne opgørelser af Atkinsons indeks med fire forskellige værdier af aversionsparameteren. For alle målene gælder, at større værdi indikerer større ulighed. Ved beregningerne er anvendt et regneark (Inequality_Calculator.xls) som F. A. Cowel, der er en central figur indenfor måling og analyse af ulighed, har stillet til rådighed på internettet.

Indkomstulighed1 i Danmark 1987 og 2016.

1987 2016
Ændring
Gini-koefficient 0,22 0,29 31%
Maksimal udjævningsprocent 15,00 19,88 33%
S80/20(Baseret på gennemsnit i deciler) 3,24 4,48 38%
P90/10 (Baseret på decilgrænser) 2,50 3,26 30%
Atkinson, parameter = 0,5 0,06 0,09 56%
Atkinson, parameter = 1,0 0,11 0,17 44%
Atkinson, parameter = 1,5 0,22 0,28 29%
Atkinson, parameter = 2,0 0,57 0,63 12%

Anm.: Atkinson-indeksene er beregnet på grundlag af statistikbankens opgørelser på deciler. Ved beregningen er anvendt et regneark udarbejdet af F. A.Cowell
Noter: 1Ved indkomst forstås ækvivaleret disponibel indkomst
Kilder: Danmarks Statistikbank, IFOR32, IFOR41 og IFOR22

Som det fremgår af tabellen, så er uligheden større i 2016 end den var i 1987, uanset hvilket af målene der anvendes, men af AI-opgørelserne fremgår det også, at ændringen falder med stigende værdi af aversionsparameteren. Det afspejler, at den stigende ulighed især er fremkommet ved at de allerrigeste har øget deres andel af de samlede indkomster, samtidig med, at fordelingen blandt den øvrige del af befolkningen har været mere stabil.

Referencer:
Frank A. Cowell: Mesuring Inequality, 2009 (link)
Danmarks Statistik: Statistikbanken IFOR41   (link)


UK’s statistiske system

21/11/2017          Taleboble Kommentarer

Sammenlignet med det danske statistiske system afviger UK’s system mest spektakulært ved at være stærkt decentraliseret, dvs. ansvaret for og produktionen af den officielle statistik er fordelt på flere institutioner, hvor det danske system er centraliseret omkring Danmarks Statistik. Ansvaret er ikke blot fordelt på en række fælles UK-institutioner, men også de selvstyrende områder, Skotland, Wales og Nordirland, har selvstændige kompetencer på området. Fælles for det danske og det britiske system er, at statistikken produceres ud fra rent statistikfaglige hensyn, og at regeringen ikke kan påvirke de faglige beslutninger. Det træk deler  de to systemer med statistiksystemerne i alle udviklede lande.

Det juridiske grundleg for UK’s statistiske system er fastlagt i den britiske statistiklov, Statistics and Registration Service Act.  Systemet bliver af et af dets centrale organer — UK Statistics Authority —  defineret som

“alle organisationer og personer, der er ansvarlige for produktion af officiel statistik i UK”

Som definitionen antyder, så er det et meget omfattende og komplekst system. I figuren herunder har jeg forsøgt give en meget summarisk og stærkt forenklet oversigt over systemets mest centrale dele. En officiel og meget mere omfattende organisationplan kan findes her.

Centralt i systemet står UK Statistics Authority (Statistikmyndigheden), hvis bestyrelse er ansvarlig for at fremme og beskytte den officielle statistik. Institutionen arbejder uafhængigt af regeringen og refererer direkte til UK’s parlament, det skotske parlament, den wallisiske nationalforsamling og den nordirske parlamentariske forsamling. Den løbende varetagelse af Statistikmyndighedens opgaver er fordelt mellem  Office for National Statistics (ONS), som varetager den direkte statistikproduktion, og Office for Statistics Regulation, som fastlægger de faglige og etiske regler for statistikproduktionen, og overvåger overholdelsen af dem. ONS er langt den største producent af officiel statistik og har også — så længe det varer — en rolle som nationalt statistikbureau i EU’s statistiske system (se tidligere indlæg).

Government Statistical Service sorterer ikke direkte under UK Statistics Authority. Institutionen beskrives som et fællesskab af alle som arbejder med indsamling, produktion og formidling af officiel statistik for UK. Medlemmerne omfatter ansatte i ONS, de fleste regeringskontorer, og administrationerne i de hjemmestyrede områder.

Øverst i personhierarkiet står formanden for UK Statistiks Authorithy, men i det løbende arbejde spiller chefstatistikeren (the National Statistician) den mest centrale rolle. Han er medlem af Statistikmyndighedens bestyrelse og fungerer samtidig som dens administrerende direktør og som chef for ONS. Herudover er han den britiske regerings centrale statistiske rådgiver, og han er leder af Government Statistical Office, der som nævnt ikke er underlagt Statistikmyndigheden.

Referencer:
UK Statistics Authority: Hjemmeside (link)
UK Statistics Authority: UK Statistical System (link)
Office for National Statistics: Hjemmeside (link)
Office for National Statistics: Organisationsplan (link)
Government Statistical Service: Hjemmeside (link)


Journalistisk brug af statistik — BBC’s retningslinier

14/11/2017          Taleboble Kommentarer

I marts 2017 offentliggjorde BBC et sæt retningslinier for formidling af statistik, Reporting Statistics. Formålet var at vejlede BBC’s journalister i at tolke og formidle statistiske data korrekt, og baggrunden var anbefalingerne i en rapport om BBC’s upartiskhed. (tidligere behandlet i denne blog)

Allerførst i retningslinierne slås det fast, at statistik er en fremragende kilde til information og gode historier for journalister, under forudsætning af, at journalisten stiller de rigtige spørgsmål, og undgår visse faldgruber. Derefter gennemgås en række overvejelser, journalisten børe gøre, i forbindelse med anvendelse af statistik.

Først og fremmest skal statistikken naturligvis være pålidelig. Det vil i praksis sige, at producenten skal være troværdig. Den officielle statistik — der i UK overvåges af UK Statistics Authority — fremhæves som upartisk og fri for politisk indflydelse. Office for National Statistics er den vigtigste, men ikke eneste, producent af officiel statistik. Andre kilder, f.eks. universiteter og uafhængige  tænketanke kan også opfylde kravet om pålidelighed, med her kræves mere forsigtighed ved vurderingen. Et kriterium kan være om kilden tidligere har vist sig at være pålidelig. Eksplicit opfordres der til, at statistik formidlet af andre end producenten selv kun anvendes, hvis der er særlige grunde. Det gælder især hvis der er tale om kilder med særlige interesser at varetage.

Retninglinierne finder det udmærket at anvende pressemeddelelser, men opfordrer til at gå bag om overskrifterne.  Bla. opfordres til ikke udelukkende at fokusere på nationale gennemsnit, men også at vurdere opdeling på f.eks. forskellige befolkningsgrupper eller forskellige geografiske områder.

Konkret gennemgås en række statistiske begreber, bl.a. gennemsnit, ekstreme værdier, fremskrivninger, regression og procentopgørelser, og der gives anvisninger på, hvordan misfortolkninger undgås. Der advares imod at overdrive de statistiske resultater, og opfordres til at redegøre for forbehold og begrænsninger, hvor det er rimeligt. Helt specielt anbefales det at undgå overdrivelser i forbindelse med statistikker, der udtrykker en konkret risiko for befolkningen, f.eks. statistik om kriminalitet og sygdom.

BBC henviser på deres hjemmeside også til at journalister kan finde vejledning hos Royal Statistical Society. Bl.a. tilbyder Royal Statistical Society et kort kursus i statistikbrug for journalister i form af en video.

Referencer:
BBC:
Retningslinier om statistikformidling (link)
Royal Statistical Society: Statistics for Journalists (link)


Kamp om forskningen i Norges officielle statistikbureau (SSB)

07/11/2017          Taleboble Kommentarer

Norges officielle statistikbureau — Statistisk centralbyrå, SSB — er ikke blot producent af officiel statistik, men har også en forskningsafdeling, der omfatter ikke mindre end 75 personer. Eller omfattede skal men måske snart sige, for SSB har besluttet at nedskære antallet til 50. De 25, der ikke længere skal forske, overflyttes til andre afdelinger i SSB.

SSB begrunder omstruktureringen med, at der i højere grad skal skelnes mellem forskning og analyse. Forskningsafdelingen skal fortsat levere forskning på højt niveau, og de tilknyttede forskere skal publicere i anerkendte internatonale tidsskrifter. De analyseopgaver, som forskningafdelingen hidtil også har varetaget, skal derimod flyttes ud i statistikafdelingerne. SSB lægger vægt på, at der er tale om overførsel af værdifuld kompetence til statistikafdelingerne, men forskerne selv,  eller i hvert fald nogle af dem, opfatter det som en degradering, selv om de beholder både løn og titel.

I den norske politiske verden har SSB’s beslutning vakt en del røre, og politikere fra flere partier har udtrykt bekymring for, at tilliden til troværdigheden og kvaliteten af SSB’s bidrag til den politiske beslutningsproces vil blive svækket af den planlagte omlægning. Finansministeren, som er politisk chef for SSB, har også grebet ind og foranlediget, at omlægningen nu er stillet i bero, i hvert fald en uges tid.

Forskningsdirektøren i SSB — Kjetil  Telle — ser den opsigt, sagen har vakt, som en bekræftelse af at SSB er en central institution for det norske samfund, men indrømmer dog, at han gerne havde set det manifesteret på en anden måde.

Referencer:
Statistisk sentralbyrå: Endringer i Forskningsavdelingen (link)
NRK: SSB-rokeringer (link)


Lønstruktur i danske virksomheder

31/10/2017          Taleboble Kommentarer

Timeløn er ikke noget entydigt begreb. Der er forskel på lønsatsen for arbejde indenfor normal arbejdstid og lønsatsen for overarbejde, og timeløn kan være opgjort med eller uden indregning af pensionsbidrag og andre tillæg til den direkte løn. Danmark Statistiks årlige opgørelse af lønstrukturen belyser sammensætningen af timelønnen, eller timefortjenesten, som er statistikkens betegnelse, i det offentlige og i private virksomheder med mindst 10 ansatte, undtagen virksomheder indenfor landbrug og fiskeri. Opgørelsen for 2016 blev offentliggjort den 27.oktober.

Lønstrukturundersøgelsen er egnet til at sammenligne timefortjeneste og lønstruktur mellem virksomhedstyper og befolkningsgrupper. Derimod er den mindre egnet til at belyse beskæftigelse — selv om den omfatter opgørelser af antal fuldtids­be­skæf­tigede — eller lønudvikling. Til de formål er andre statistikker at foretrække, f.eks.  Lønindekset til belysning af lønudviklingen og Arbejdskraftundersøgelsen eller Den Registerbaserede Arbejdsdsstyrkestatistik til belysning af beskæftigelsen

Det mest omfattende timelønsbegreb i  Lønstrukturstatistikken betegnes fortjeneste pr. præsteret time, og lægger sig tæt op ad Nationalregnskabets lønbegreb. Nationalregnskabets løndefinition (løn hedder i nationalregnskabet aflønning af ansatte) lyder således (ENS 4.02) :

Aflønning af ansatte  omfatter de samlede ydelser i kontanter og naturalier, som arbejdsgiverne betaler de ansatte for det arbejde, de har leveret i en regnskabsperiode.

Lønnen omfatter således ikke blot den udbetalte løn, men f.eks. også indbetalinger til pensionsordninger og værdien af personalegoder. I Lønstrukturopgørelsen medtages dog kun de personalegoder, som indgår i A-indkomsten. Det gælder f.eks. fri bil og sundhedsforsikring.

Den samlede timefortjeneste opgøres ved at dividere den samlede løn, inklusive tillæg, med det præsterede antal timer, inklusiv overtid, men eksklusiv timer med fravær i forbindelse med ferie, sygdom og omsorgsdage. Den betaling der modtages i forbindelse med fraværet betragtes i statistikken som et tillæg til lønnen for de præsterede timer.

I tabellen nedenfor ar vist den samlede timefortjeneste og tillæggenes andel efter arbejdsfunktion. De uregelmæssige betalinger omfatter bl. a. bonusbetalinger.

Samlet timefortjeneste og tillæg efter arbejdsfunktion 2016

Samlet time-for-tjeneste Tillæg i pct. af samlet fortjendte
Overtid og gene Fravær Pension Personale-goder  Uregel-mæssige betalinger
kr.