Covid-19 krisens udfordringer for den officielle statistik

21. september 2021

Covid-19 krisen har presset den officielle statistik fra to sider. På den ene side har der været krav om hurtig statistik til belysning af af pandemiens udbredelse og effekterne af tiltagene til at bekæmpe den, og på den anden side har krisen vanskeliggjort dataindsamlingen, og derved skabt problemer for kvaliteten af statistikken. Behovet for hurtig statistik har statistikmyndighederne søgt at imødekomme ved at offentliggøre supplementer til den traditionelle statistik, der kan leveres hurtigt, men ikke nødvendigvis opfylder de sædvanlige kvalitetskrav. Danmarks Statistik præsenterer en række sådanne supplementer på sin hjemmeside under overskriften COVID-19 – hurtige indikatorer. Kvalitetsproblemerne har der derimod ikke på kort sigt været de store muligheder for at imødegå, på anden måde end ved at gøre brugerne opmærksomme på problemet. Verdensbanken og FN’s statistiske afdeling har søgt at danne sig et overblik over omfanget af de nationale statistikmyndigheders problemer gennem en række spørgeskemaundersøgelser. Tidsskriftet The Economist (Economist 2021) har i en artikel leveret en opsummering og vurdering af resultaterne af disse undersøgelser.

En stor del af de ansatte i alle verdens statistikmyndigheder har under krisen arbejdet hjemmefra og dataindsamling baseret på ansigt til ansigt kontakt med respondenter er stort set ophørt. I et vist omfang har besøgsinterview kunnet erstattes med telefon-, epost- eller internetbaserede interviews, og arbejde hjemmefra har kunnet understøttes af internetbaserede redskaber som videomøder. Men det kræver en veludbygget infrastruktur, som ikke findes alle steder, og navnlig ikke i fattige lande.

Særligt for folketællingerne er krisen opstået på et uheldigt tidspunkt. De fleste lande afholder folketælling hvert tiende år, og efter anbefaling fra FN har næsten alle lande valgt at afholde folketælling i 2020 eller 2021. Nogle lande har valgt at udskyde deres folketælling, og mangler derfor opdaterede data på centrale områder. Andre lande har gennemført tællingen, men har måtte opgive dele af dataindsamlingen, og står derfor med tællingsresultater af en kvalitet, der er ringere end den sædvanlige. Folketællingerne danner på forskellig måde grundlag fra andre statistikker, så resultaterne af den forringede kvalitet vil kunne mærkes i statistikproduktionen mange år fremover.

Centrale konjunkturstatistikker har også været hårdt ramt af krisen. Det gælder f.eks. opgørelsen af inflationen. En væsentlig del af indsamlingen af prisdata er traditionelt varetaget af prisinspektører, der besøger butikker og restauranter mm, og observerer og registrerer priser på udvalgte produkter. Den metode har været vanskelig at gennemføre. En anden vigtig konjunkturstatistik — opgørelsen af arbejdsløsheden — har haft tilsvarende problemer.

Danmarks Statistik har på flere måder været i en mere gunstig position end de fleste andre statistikmyndigheder, fordi en stor del af dataindsamlingen sker via offentlige registre, der i stort omfang har fungeret normalt eller næsten normalt under krisen. En vigtig kilde som momsindberetningerne fra virksomhederne er dog blevet svækket af, at indberetningsfristerne for momsafregning har været udskudt, med heraf følgende problemer for bl.a nationalregnskabet. Men som Economist også påpeger, så er det danske registerbaserede statistiksystem ret unikt. Det har nogle historiske og kulturelle forudsætninger, der gør det vanskeligt for de fleste andre lande at opbygge noget tilsvarende.

Referencer:
Danmarks Statistik: “COVID-19 – hurtige indikatorer”, (link, 18/7/2021)
Danmarks Statistik: “Nationalregnskabsberegninger set i lyset af COVID19”, 14/52020, (link, 20/7/2021)
Economist: “Covid-19 has stymied governments’ efforts to collect data”, The Economist 25/02/2021 (link,20/9-2021)
The World Bank: “Survey of National Statistical Offices (NSOs) during COVID-19”, The World Bank Brief (link)
The World Bank: “One Year Into the Pandemic : Monitoring the State of Statistical Operations Under COVID-19”, 30/7-2021 (link)
Craig Hammer m.fl.: “National statistical offices still face disruptions and challenges as they adapt to a “new normal”, The World Bank Blogs, 11/8-2021 (link)
Første resultater fra USAs folketælling

31. august 2021

De første resultater fra USA’s folketælling for 2020 er kommet. I USA er folketællinger et politisk stridspunkt, fordi resultaterne fra dem danner grundlag for fordeling af både medlemmer af de lovgivende forsamlinger og af forbundets økonomiske ydelser til delstaterne. Ofte inddrages domstolene i striden, og folketællingen for 2020 har ikke været nogen undtagelse i den henseende (se indlæg fra 20/10-2020). Senest er kommet et sagsanlæg fra staten Alabama dels vedrørende en udskydelse af offentliggørelsen forårsaget af Covid19-krisen, og dels vedrørende den metode til beskyttelse af den statistiske fortrolighed, som Folketællingsbureauet (Census Bureau) har valgt at anvende. Forsinkelsen af offentliggørelsen har betydet, at Alabama ikke har kunnet overholde en tidsfrist vedrørende fastlæggelsen af valgdistrikster fastsat i statens forfatning. Omkring databeskyttelsen er problemet en frygt for at sløringen af resultaterne kan hindre en fair repræsentation af minoriteter og små geografiske områder. Begge påstande blev afvist af federal distriktsdomstol i en kendelse afsagt 30/6 2021.

Den anvendte databeskyttelsesmetode går under navnet differential privacy og har været beskrevet i to tidligere indlæg i denne blog (23/4-2019 og 14/5-2019). En konsekvens af metoden er, at der indlægges støj i resultaterne, således at de offentliggjorte tal afviger lidt fra de faktisk opgjorte. I de fleste tilfælde er afvigelserne små, navnlig set i forhold til samlede usikkerhed, der altid vil være i en folketællingsstatitsik, men i ekstreme tilfælde kan det for meget små populationer give misvisende og i nogle tilfælde meningsløse resultater.

I en erklæring til distriktsdomstolen har John M. Abowd, der er vicedirektør (associate director) for forskning og metode i Folketællingsbureauet, givet en grundig redegørelse for bureauets overvejelser omkring beslutningen om at anvende differential privacy. Fundamentalt set er der tale om en afvejning af to hensyn: respondenternes krav om fortrolighed og databeskyttelse på den ene side og brugernes krav om detaljerede og præcise opgørelser på den anden. Valget af differential privacy er truffet ud fra en økonomisk efficiensbetragtning. Empiriske undersøgelser har vist, at man ved anvendelse af differential privacy opnår den mest efficiente afvejning mellem de to hensyn.

Hele offentliggørelsesprocessen er på grund af covid-19 krisen forsinket i forhold til de oprindelige planer, men som nævnt er de første resultater nu udkommet. De omfatter en foreløbig opgørelse til brug for fastlæggelsen af valgdistrikter. De endelige og mere detaljerede distriktsdata udkommer den 30. september. Folketællingsbureauet oplyser, at de øvrige opgørelser, herunder detaljeret befolknings- og husholdningsstatistik, følger senere, men har ikke oplyst datoer. Kun opfordret til at holde sig orienteret på deres hjemmeside.

Referencer:
John M. Abowd: “Declaration of John M. Abowd” (til US District Court for the Middle District of Alabama), 13/4-2021 (link)
Alle lyver! — Internettet som sandhedsserum?

17. august 2021

Statistikproducenter og -brugere har altid vidst, at manglende ærlighed hos respondenterne omkring kontroversielle og/eller sensitive emner kan give alvorlige skævheder i den færdige statistik. F.eks. må man regne med, at forbruget af tobak, alkohol og bordelbesøg kan være undervurderet i forbrugsundersøgelser, at tid anvendt på motion og avislæsning kan være overvurderet i tidsanvendelsesstudier og at andelen af negative holdninger til minoriteter kan være undervurderet i holdningsundersøgelser. Brugere af statistikken er naturligvis opmærksomme på disse skævheder, og kan tage dem i betragtning i forbindelse med analyser, men det grundlæggende problem — at skævhederne er der, og at man ikke kender omfanget af dem — har man ingen løsning på. Men det er man måske ved at få. Det er i hvert fald den konklusion Seth Stephens-Davidowitz — forsker i dataanalyse og datajournalist ved New York Times — når frem til i en veloplagt og indholdsmættet bog: Everybody Lies, Big Data, New Data and What the Internet Can Tell Us About Who We Really Are (Stephens-Davidowitz, 2017).

Årsagen til skævhederne er, at respondenterne i de traditionelle statistiske undersøgelser kan have et ønske om at fremstå positivt med socialt anerkendte vaner og holdninger, også selv om de loves fuld annonymitet. Derimod har de kun et svagt eller intet incitament til at sige sandheden. Ved informationssøgning på internettet er det omvendt. Her kan man kun få den information man søger, ved at være ærlig i sine søgetekster. Søger man f.eks. links til racistiske vittigheder er man nødt til at afsløre det i sine søgetekster. Stephens-Davidowitz’s pointe er, at man ved at analysere søgetekster kan få et mere realistisk indblik i udbredelse af kontroversielle holdninger og adfærd end det er muligt i traditionelle undersøgelser. Internettet kan på den måde fungere som sandhedsserum.

Rollen som sandhedsserum er en vigtig side af anvendelsen af søgeord som datakilde, men metoden er også anvendelig på områder, hvor respondenterne ikke har incitamenter til at lyve. Anvendelse af metoden kræver naturligvis, at der udvikles egnede analysemetoder, men den udvikling er i fuld gang, og Stephens-Davidowitz er selv en af de store bidragsydere. Han har bl.a. brugt metoden til undersøgelser af racismes indflydelse på Barack Obamas valgresultater , udbredelsen homoseksualitet, forskelle i opdragelsen af piger og drenge og årsager til depression.

Når vi (og Stephens-Davidowitz) taler om internetsøgning er det oftest Google-søgninger der tænkes på, og det er da også Google-søgninger, der er hovedgrundlaget for Stephens-Davidowitz’s undersøgelser. Og det datagrundlag stiller Google gratis til rådighed for alle i form af Google Trends. Grundlæggende er Google Trends meget simpelt at anvende. Man indtaster et søgeemne eller en søgesætning og får som svar en graf, der viser et indeks for udviklingen i emnets eller sætningens popularitet (andelen af samtlige søgninger) over en periode. Der ligger data tilbage til 2004. Google trends giver ikke baggrundsoplysninger om hvem, der har søgt, bortset fra en geografisk opdeling. En vigtig del af Dawidovitz’s metode består i at sammenholde søgeordsdata fra et geografisk område med data fra andre kilder om samme område.

Davidowitz finder flere styrker ved internettet, som gør det specielt i forhold til mere traditionelle datakilder, men muligheden for at få pålidelige data på sensible områder er den vigtigste. Og den styrke har intet med omfanget af data at gøre, så i den sammenhæng er betegnelsen big data misvisende. I tidligere indlæg (f.eks 19/5-2020 og 11/9-2020) har jeg anvendt den mere sigende betegnelse organiske data, som er foreslået af Robert Groves — tidligere direktør for det amerikanske folketællingsbureau.

Referencer:
Seth Stephens-Davidowitz: “Everybody Lies — Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are”, Harper Collins Publ, 2017

Præsidentvalget i USA — Hvem støttede Trump?

1. juni 2021

Ved det amerikanske præsidentvalg i november 2020 og ved indsættelsen af den nye præsident i januar 2021 viste spændingerne og polariseringen i det politiske liv sig tydeligt. Nederlaget for den tidligere præsident, Donald Trump, blev uden for USA nok generelt opfattet som en lettelse, men lettelsen må være blandet med en bekymring over, at Trump stadig havde stor opbakning. Det har naturligt nok givet anledning til overvejelser om, hvem der egentlig var Trumps støtter. Et bud har været vrede og/eller skuffede gamle, hvide mænd. Catalist — et non-profit analyseinstitut med tilknytning til Demokraterne — har leveret et statistisk grundlag for en nærmere belysning af dette spørgsmål. Graden af skuffelse og vrede bliver ikke belyst af Catalist, men med hensyn til race, køn og alder støtter deres data antagelsen om gamle, hvide mænd.

Tabel 1: Trumps andel af stemmerne (pct.) ved præsidentvalget i 2020, fordelt på køn, race og uddannelse.

		Mænd	Kvinder
Hvide	Kort uddannelse	66	58
	Lang eller mellemlang uddannelse	49	41
	Hvide i alt	59	52
Ikke-hvide	Kort uddannelse	30	20
	Lang eller mellemlang uddannelse	31	21
	Ikke-hvide i alt	31	21

Kilde: Catalist detailed data (link)

Af tabel 1 fremgår det helt klart, at der blandt hvide mænd var et markant flertal for Trump. Men det fremgår også, at Trump havde flertal blandt hvide kvinder. Til gengæld stod Trump meget svagt blandt ikke-hvide, og navnlig blandt ikke-hvide kvinder. Vurderet ud fra denne tabel, er det de ikke-hvide og kvinderne, der sikrede valgsejren til Trumps modkandidat, Joe Biden.

En anden interessant observation fra tabel 1 er uddannelsesniveauets betydning for stemmeafgivelsen. Blandt de hvide er tilslutningen til Trump højest blandt de lavest uddannede, mens uddannelsesniveauet ikke gør nogen forskel hos de ikke-hvide.

I det datamateriale Catalyst har offentliggjort findes ingen opgørelse, der sammenholder alder med race eller køn, men ser man isoleret på alder, er der en klar tendens til at Trumps stemmeandel er stigende med stigende aldersgruppe (tabel 2). Mest markant ses for den del af befolkningen, der bor på landet og i forstæderne. De ses også af tabellen, at Joe Biden først og fremmest fandt sin opbakning i byerne.

Tabel 2: Trumps andel af stemmerne (pct.) ved præsidentvalget i 2020, fordelt på bymæssighed og alder.

Alder	Bymæssighed
Alder	By	Forstad	Land	i alt
18-19	22	36	56	37
30-44	23	40	63	41
45-64	31	50	70	52
65+	31	50	66	52
I alt	27	46	66	47

Kilde: Catalist detailed data (link)

Analysen er baseret på en såkaldt “voter file”, dannet på grundlag af data fra folketælling og valglister, kombineret med forskellige supplerende kilder. Sammenfletningen af data fra de forskellige kilder er i mange tilfælde baseret på modeller og forudsætninger, der bidrager til usikkerhed omkring resultaterne og tilskynder til forsigtig tolkning. Flere institutioner vedligeholder sådanne voter files, der bl.a. spiller en stor rolle for partiernes planlægning af valgkampe. Catalist, som står bag den her refererede analyse, er en non-profit organisation, der støtter Demokraterne.

Referencer:
Yair Ghitza og Jonathan Robinson: “What Happened in 2020”, Catalist (link)
Catalist: Catalists hjemmeside (link)

Livskvalitet og indkomst

18. maj 2021

Højere indkomst fører til højere livskvalitet, i hvert fald når indkomsten er under et vist niveau. Så langt er der bred enighed blandt forskere af livskvalitet, somme tider også kaldet lykke. Der er også bred enighed om, at den gevinst i livskvalitet (lykke), der følger af en indkomststigning på 1000 kr. er større hvis indkomsten i forvejen er lille, end hvis indkomsten i forvejen er stor. Det er det økonomer kalder faldende grænsenytte. Uenigheden opstår, når talen er om hvor stor indkomsten skal være, før den faldende grænsenytte for alvor sætter ind.

Den mest almindelige metode til måling af livskvalitet er at stille en række forsøgspersoner et spørgsmål af typen “Alt i alt, hvor tilfreds er du med dit liv“ og derefter analysere svarene. Livskvalitet opgjort på den måde tilstræber at vise svarpersonernes velovervejede opfattelse af deres generelle livssituation og betegnes vurderet livskvalitet. Et andet aspekt af livskvaliteten, den såkaldte oplevede livskvalitet, vedrører den umiddelbare følelse af tilfredshed på et konkret tidspunkt. Det er et mere flygtigt begreb og er vanskeligere at måle bl.a fordi det er vanskeligt at få pålidelige svar, hvis ikke spørgsmålet stilles umiddelbart efter det konkrete tidspunkt.

Den hidtidige forskning giver god grund til at antage, at der er positiv sammenhæng mellem vurderet livskvalitet og indkomst. Oplevet livskvalitet er langt svagere belyst. En udbredt hypotese har været, at sammenhængen med indkomst er positiv indtil et vist niveau (omkring 75.000 $ i årsindkomst) men at indkomst herudover ikke bidrager til øget oplevet livskvalitet. Den hypotese bliver nu udfordret af Matt Killingsworth, seniorforsker ved University of Pennsylvania, i en nylig udkommet artikel.

Killingsworth anvender data indsamlet via mobiltelefoner fra ca. 33.000 erhvervsmæssigt beskæftigede personer i alderen 18-65 år og bosiddende i USA. På tilfældige tidspunkter i løbet af arbejdsdagen er de blevet ringet op, og bedt om at beskrive deres oplevede livskvalitet umiddelbart før opkaldet gennem det simple spørgsmål: “hvordan har du det lige nu”. Ved tilmeldingen til undersøgelsen er deltagerne blevet spurgt om deres samlede husstandsindkomst før skat og om deres vurderede livskvalitet. Mere en 1,7 mio svar indgår i hans undersøgelse.

Hovedresultaterne er vist i figuren nedenfor. Resultaterne viser en klar positiv sammenhæng mellem indkomst og både vurderet og oplevet livskvalitet, men sammenhængen er lidt stærkere for den vurderede livskvalitet. Antagelsen om, at indkomst over et vist niveau ikke øger livskvaliteten bliver således ikke bekræftet, men det er på den anden side også tydeligt, at den forøgelse i livskvalitet, der følger af øget indkomst, er mindre for de højeste indkomster.

Figur: Sammenhæng mellem indkomst og livskvalitet i USA

Kilde: Killingsworth(2021), Grafik: Veusz

Analysen er baseret på personer, der på eget initiativ har tilsluttet sig projektet, så der er ingen garanti for repræsentativitet. Men Killingsworth mener på grundlag af nærmere granskning af besvarelserne — bl.a er datagrundlaget meget omfattende, og fordelingen på centrale variable afviger det ikke voldsomt fra forholdene i den samlede amerikanske befolkning — at der er grund til at antage, at resultatene lader sig generalisere.

Referencer:
Matthew A. Killingsworth: “Experienced well-being rises with income, even above $75,000 per year”, PNAS January 26, 2021 118 (4) e2016976118 (link)

Covid19-krisens spor i nationalregnskabet for 2020

4. maj 2021

Samfundet har i 2020 været præget af hele eller delvise nedlukninger, med deraf følgende begrænsninger i den økonomiske aktivitet. Det har naturligvis også vist sig i den økonomiske statistiks beskrivelse af udviklingen. I tabel 1 vises udviklingen i husholdningernes og virksomhedernes indkomst og opsparing i 2020 således som den afspejles i nationalregnskabet.

Tabel 1: Husholdningers og virksomheders indkomst og opsparing i 2020

Mia. kr	2020			Ændring fra 2019
Mia. kr	Hushold-ninger¹	Selska-ber	I alt	Hushold-ninger¹	Selska-ber	I alt
Virksomhedsoverskud	101	330	432	2	-8	-7
Lønindkomst	1.187	0	1.187	11	0	11
Formueindkomst(netto)	83	-16	68	-16	16	0
Sociale ydelser	459	-76	383	24	-4	21
Div.overførsler	94	51	145	0	-2	-1
Indtægter i alt	1.924	290	2.214	21	2	23
Indkomst og formueskatter	644	61	705	10	-10	0
Socialsikringsbidrag	96	-76	20	4	-4	1
Diverse overførsler	59	73	132	0	-13	-13
Udgifter i alt	800	57	857	14	-26	-12
Disponibel indkomst	1.125	232	1.357	7	28	36
Forbrug	1.059	0	1.059	-18	0	-18
Opsparing	66	232	298	25	28	53

Anm: Nettoopgørelse, dvs afskrivninger er fratrukket.
Note: ¹Omfatter også non-profit institutioner rettet mod husholdningerne
Kilde: Danmarks Statistikbank/NAS02

Overraskende nok ser en så væsentlig post som den disponible indkomst for husholdninger og virksomheder under et ikke ud til at være påvirket. Stigningen på 36 mia. kr. — svarende til 2,6 pct — virker ikke påfaldende sammenlignet med tidligere år.

Ser man på husholdninger og selskaber hver for sig er udviklingen mere markant. Stigningen er koncentreret på selskaberne, hvorimod husholdningernes disponible indkomst på det nærmeste har været uændret. En væsentlig del af forklaringen er, at selskabernes betaling af udbytter i stort omfang blev suspenderet i 2020. Det afspejler sig i posten formueindkomst, hvor udbytterne er udgift for virksomhederne men indkomst for de husholdninger, der ejer aktier. Den manglende udbyttebetaling vil afspejle sig i en forøgelse af selskabernes formue, og dermed i aktiernes værdi. Hvad husholdningerne således har mistet i udbytteindtægter har de vundet tilbage i værdistigning på aktierne. Det afspejles i nationalregnskabets finansielle konti, som jeg dog ikke vil komme nærmere ind på i dette indlæg.

I tabel 2 belyses det lidt nærmere, hvordan virksomhedsoverskuddet er sammensat, og her bliver krisens virkninger tydeligere. Her fremgår det klart, at produktionen, målt ved værditilvæksten, er faldet med 33 mia. kr., svarende til 2,6 pct., og når både virksomhedsoverskud og lønudbetalinger har kunnet opretholdes nogenlunde uændret, så skyldes det en forøgelse af produktionssubsidierne på 29 mia. kr., svarende til mere end end fordobling.

Tabel 2: Virksomhedsoverskud i 2020

mia. kr.	2020			Ændring fra 2019
mia. kr.	Hushold-ninger¹	Selska-ber	I alt	Hushold-ninger¹	Selska-ber	I alt
1: Nettoværditilvækst	171	1.100	1.271	-5	-28	-33
2: Produktionssubsidier	14	40	54	6	23	29
3: Produktionsskatter	20	31	51	-1	-1	-2
4. Lønudgifter	64	778	842	1	-2	-1
Virksomhedsoverskud (1+2-3-4)	101	330	432	2	-8	-7

Anm: Nettoopgørelse, dvs afskrivninger er fratrukket.
Note: ¹Omfatter også non-profit institutioner rettet mod husholdningerne
Kilde: Danmarks Statistikbank/NAS01

Det er således kun takket være en forøgelse af det offentliges udgifter til subsidier, at den private sektors virksomhedsoverskud har kunnet opretholdes. For opretholdelsen af den samlede disponible indkomst har yderligere en forøgelse af sociale ydelser fra det offentlige (jf. tabel 1) spillet en vigtig rolle. Dertil kommer, at det offentlige har haft betydelige udgifter i form af kapitaloverførsler (navnlig erstatninger til minkavlere) der ikke fremgår af nationalregnskabets opgørelse af disponibel indkomst og opsparing. Som følge heraf er den samlede offentlige saldo gået fra et overskud på 88 mia.kr. i 2019 til et underskud på 27 mia. i 2020. Det er naturligvis foregået velovervejet og netop med det formål at afbøde krisens virkninger for den private sektor. Heldigvis er de offentlige finanser efter flere år med positiv saldo i så god stand, at der ikke umiddelbart er grund til bekymring.

De viste tal for nationalregnskabet for 2020 er meget foreløbige, og navnlig i forbindelse med de mange nye ordninger vedrørende subsidier, sociale overførsler og kapitaloverførsler, der er etableret i forbindelse med covid-19 krisen, er Danmarks Statistik stadig i gang med overvejelser om, hvordan de skal behandles i nationalregnskabet.

Referencer:
Danmarks Statistik: “Statistikbanken tabel NAS01 og NAS02” (link)
Danmarks Statistik: “Klassifikation af corona-hjælpepakker”, 11/2-2021 (link)

Globalisering og nationalregnskab

20. april 2021

Bruttonationalproduktet (BNP) er klart det bedst kendte og mest anvendte af den økonomiske statistiks begreber. Det er et udtryk for den værditilvækst, der skabes i et land gennem produktionen, og opgøres som forskellen mellem værdien af den samlede produktion af varer og tjenester (produktionsværdien) og værdien af de varer og tjenester, der anvendes i produktionen (forbrug i produktionen, eller på engelsk: input).

Da begrebet for alvor blev introduceret i den officielle statistik efter anden verdenskrig afspejlede det danske BNP næsten udelukkende økonomisk aktivitet på dansk territorium. Det har ændret sig i de senere år, hvor en stigende del af den aktivitet, der afspejles i BNP, sker på udenlandsk territorium. At en del af det danske BNP skabes i udlandet skyldes, at der i opgørelsen af BNP — og nationalregnskabet i øvrigt — ikke tages udgangspunkt i territoriet, men i ejerskabet til produkterne. F.eks. kan en dansk virksomhed købe varer i udlandet og videresælge dem i udlandet, uden at varerne på noget tidspunkt kommer til Danmark. Det kaldes i statistikken merchanting. En dansk virksomhed kan også sende varer til videreforarbejdning på en udenlandsk fabrik, hvor varerne enten leveres fra Danmark eller købes i udlandet, og derefter sælge de forarbejdede varer enten i Danmark eller udlandet. Det kaldes i statistikken processing. Værditilvæksten ved både merchanting og processing indgår i det danske nationalprodukt, selv om aktiviteterne foregår i udlandet, da de involverede varer er ejet af virksomheder med hjemsted i Danmark.

Omfanget af merchanting og processing opgøres ikke særskilt i nationalregnskabet, men Danmarks Statistik har i en Analyse (Thomsen og Knudsen, 2021) redegjort for, hvordan de to størrelser kan belyses ved inddragelse af udenrighandels- og betalingsbalancestatistikken. Ved denne metode kan merchantings og processings bidrag til produktionsværdien opgøres, men ikke bidraget til BNP, da den andel af forbrug i produktionen, der skal henføres til merchanting og processing kun kan opgøres delvist. Thomsen og Knudsen belyser i deres analyse også dette delvise bidrag, men i dette blogindlæg vil kun produktionsværdien blive omtalt

Figur: Andelen af processing og merchanting i samlet produktionsværdi og i produktionsværdien for brancherne engroshandel og industri

Kilde: Danmarks Statistikbank/NABP10, NABP69, NAHL2 og BBUHV, Grafik: Veusz

Som det fremgår af figuren ovenfor, er merchanting og processing i alt vokset fra at udgøre ½ pct. af den samlede produktionsværdi i 2005 til at udgøre 2,9 pct. i 2020. Det er mere end en femdobling af andelen, selv om der er tale om beskedne andele, når man betragter den samlede økonomi. Fokuserer man på de hovedbrancher, aktiviteterne henføres til — industri for processings vedkommende og engroshandel for merchantings vedkommende — bliver det tydeligere, hvor markant udviklingen har været, jf. figuren. For industriens vedkommende er andelen tidoblet. For engroshandelen er andelen er “kun” tredoblet men udgør nu 18 pct. For engroshandelen har andelen vist en jævnt stigende udvikling siden 2004, men for industrien steg andelen kun frem til 2016, hvor andelen var 9,3 pct. Fra 2017 har andelen ligget stabilt på lidt under 8 pct.

Referencer:
Annette Thomsen og Dan Knudsen: “Hvordan indgår dansk produktion af varer i udlandet i nationalregnskabet?”, Danmarks Statistik Analyse 2021:05, 25. marts 2021 (link)
Dødelighed blandt Europas unge

6. april 2021

Den 30. marts kunne Danmarks Radio bringe den triste nyhed, at antallet af selvmord blandt unge kvinder (20-24 år) var steget fra 5 i 2019 til 17 i 2020, svarende til mere end en tredobling. Kilden er en foreløbig opgørelse fra Dødsårsagsregistret, som DR Nyheder har rekvireret hos Sundhedsdatastyrelsen. Danmarks Statistik forventer først at offentliggøre den endelige opgørelse af dødsårsager for 2020 i begyndelsen af 2022, men det samlede antal dødsfald i 2020 er offentliggjort, jf. tabellen nedenfor. Som det fremgår er det samlede antal dødsfald blandt 20-24 årige kvinder steget med 8 fra 2019 til 2020. Ifølge den foreløbige opgørelse skulle antallet af selvmord være steget med 12, dvs. at antallet af dødsfald af andre årsager skal være faldet. Det er jo ikke umuligt, men dog udtryk for en temmelig drastisk ændring af det hidtil kendte mønster.

Tabel: Dødsfald blandt 20-24 årige, Danmark 2019 og 2020

2019 2020

Kvinder Dødsfald 31 39

Heraf selvmord 5 ?

Mænd Dødsfald 80 82

Heraf selvmord 23 ?

Kilde: Danmarks Statistikbank/DOD og DOD1

En nærmere afklaring af, om der virkelig er sket så drastiske ændringer må afvente mere detaljerede data. Det er ikke sædvanligt, at der sker så drastiske ændringer i fordelingen på dødsårsager, men naturligvis kan covid-19 have gjort 2021 til en undtagelse. I det følgende vil jeg sammenligne dødeligheden blandt unge i europæiske lande på grundlag af data fra EU’s statistikbank, hvor 2018 er det seneste år, for hvilket der findes oplysninger for en større gruppe lande. Unge omfatter her 15-29 årige, altså en bredere gruppe end de 20-24 årige. Det er naturligvis de officielt registrerede opgørelser, der sammenlignes. Kulturelle forskelle mellem landene kan have betydning for fastlæggelsen af dødsårsagen. Det kan navnlig tænke at have betydning for, hvornår et dødsfald registreres som selvmord.

Heldigvis er dødsfald blandt unge mennesker (15-29 år) ret sjældne. Som det fremgår af figur 1, så er dødeligheden, opgjort som antal dødsfald pr. 1000 personer, for mændenes vedkommende langt under 1 i de fleste lande. For kvindernes vedkommende er dødeligheden i alle lande under 0,4. Danmarks placering er angivet ved en rød pil.

Figur 1: Dødelighed blandt 15-29 årige i europæiske lande, 2018

Kilde: EU’sStatistikbank/hlth_cd_aro og demo_pjangroup

I figur 2 (Kvinder) og figur 3 (Mænd) er dødsårsagerne belyst nærmere i trekantgrafer (om læsning af trekantgrafer se tidligere indlæg). Den procentvise fordeling på de tre årsager: sygdom, selvmord og ulykker og andet, aflæses på de tre skalaer, og den samlede dødelighed er angivet med samme farvekode som er anvendt i figur 1.

Figur 2: Dødsårsager blandt 15-29 årige kvinder i europæiske lande, 2018

Kilde: EU’s Statistikbank, hlth_cd_aro og demo_pjangroup

Som det fremgår af figur 2, så er sygdom den hyppigste og ulykker den næsthyppigste dødsårsag for unge kvinder i de fleste af landene. Norge, Sverige og Finland udgør markant undtagelse fra normalbilledet, med relativt store andele for både selvmord og ulykker.

Figur 3: Dødsårsager blandt 15-29 årige mænd i europæiske lande, 2018

Kilde: EU’s Statistikbank, hlth_cd_aro og demo_pjangroup

For de unge mænds vedkommende (figur 3) er den samlede dødelighed, som allerede påpeget, væsentligt højere, og fordelingen på årsager markant anderledes. Sygdom er ikke nær så dominerende som dødsårsag, men navnlig ulykker, og her er især tale om trafikulykker, spiller en langt større rolle.

Som påpeget i begyndelsen af indlægget, så kan covid-19 krisen tænkes at have ændret disse mønstre. Men der er vel i så fald også grund til at antage, at der vil ske en tilbagevenden i retning af 2018-mønstret, når krisen er overstået.

Referencer:
Danmarks Radio: “Selvmord blandt unge kvinder er det højeste i 20 år”, DR’s hjemmeside (link,1/4-2021)

Remitter — pengeoverførsler til husholdninger fra udlandet

2. marts 2021

Udgangspunktet for al indkomst er den værdi, den samlede produktion af varer og tjenester skaber. For stort set alle lande findes en opgørelse af denne værdiskabelse, selv om kvaliteten kan være varierende. Den opgjorte størrelse betegnes nationalproduktet (BNP). Men selvom BNP er udgangspunktet for indkomsten, så fortæller internationale sammenligninger af BNP langt fra hele historien om fordelingen af indkomst mellem verdens lande. Det skyldes, at det ikke er hele et lands BNP, der tilfalder dets egne borgere. En del overføres til andre lande f.eks. i form af løn til ansatte med bopæl i udlandet og renter og udbytter til udlændinge, der ejer aktier i eller har ydet lån til landets virksomheder. Omvendt kan landet naturligvis også ad disse veje få andel i andre landes produktionsværdi. Korrigerer man BNP for disse strømme, når man frem til nationalindkomsten (BNI). Hertil kommer overførsler, der ikke er betaling for bidrag til produktionen, f.eks. gaver o.lign. Korrigeres yderligere for den type overførsler når man frem til den disponible indkomst. Det er den disponible indkomst, der er til rådighed for forbrug og opsparing, og derfor ud fra et velfærdssynspunkt det centrale indkomstbegreb.

Navnlig for lavindkomstlande kan en særlig type betalinger, der går under betegnelsen personlige remitter (engelsk remittances), have stor betydning som overførsel af en del af produktionsresultatat fra rigere lande. Personlige remitter omfatter dels løn optjent i udlandet af et husstandsmedlem, der jævnligt krydser en landegrænse for at arbejde i udlandet, og dels overførsler fra udenlandske residenter, typisk familiemedlemmer, der permanent eller for en længere periode opholder sig i et andet land. De samlede remitter omfatter, udover de personlige remitter, også sociale ydelser betalt af offentlige eller andre institutioner i et land til husholdninger i et andet.

Selvom begrebet remitter er ret klart defineret i de internationale retningslinjer for statistik (BPM6, Appendix 5), og en opgørelse af dem indgår i FN’s verdensmål (indikator 17.3.2), volder opgørelsen af dem i praksis store problemer for de officielle statistikproducenter, bla. fordi betalingerne ofte sker gennem uformelle og dårligt belyste kanaler. Som kompensation for de mangelfulde officielle opgørelser producerer Verdensbanken en beregning, hvori der indgår modelberegninger, baseret på antallet af immigranter i de forskellige lande, kombineret med nogle forudsætninger om hvor store beløb hver immigrant i gennemsnit sender til personer i sit oprindelsesland. Beregningen omfatter udelukkende de personlige remitter. Jeg har ikke kendskab til opgørelser af de samlede remitter. Nogle hovedtal fra Verdensbankens beregning er vist i tabellen nedenfor.

Tabel: Personlige remitter i pct af BNI, 2019 (Verdensbankens skøn)

	Personlig remitter	Ulandshjælp	Direkte udenlandske investeringer
	procent af nationalindkomst (BNI)
Lavindkomstlande	4,83	9,36	2,92
Mellemindkomstlande	1,56	0,20	1,72
Højindkomstlande	0,28	0,00	1,80
Verden	0,76	0,19	1,78

Kilde: Verdensbanken (link)

I tabellen er de personlige remitter sammenholdt med ulandshjælp og direkte udenlandske investeringer — to andre strømme, der har stor betydning for lavindkomstlandes økonomi.

I forbindelse med covid19 pandemien er der kommet øget fokus på betydningen af remitter. Migranter er særligt udsatte for at blive ramt af pandemiens økonomiske følger, bla. fordi de ofte har usikre jobs i de hårdest ramte erhverv. Det har givet anledning til frygt for, at omfanget af remitter vil falde hvilket kan få alvorlige følger nogle af modtagerlandene, hvoraf mange i forvejen er hårdt ramt af krisen

Referencer:
IMF: “Balance of Payments and International Investment Position Manual (BPM6)”, November 2013 (link, 23/1-2021)
World Bank: “Phase II: COVID-19 Crisis through a Migration Lens” ,Migration and Development Brief 33, October 2020 (link)
World Bank: “World Development Indicators”, (link, 24/2-1021)

Datarevolution og paradigmeskift — Nye tider for den officielle statistik?

16. februar 2021

Ingen tvivl om at alle, der beskæftiger sig med officiel statistik, fornemmer at der i disse år foregår en udvikling, der fuldstændigt kan ændre vilkårene for den officielle statistikproduktion. Store ændringer er allerede sket, og flere er i vente. Nogle af ændringerne har været beskrevet i mange indlæg i denne blog, f.eks. 1/12-2020, 17/11-2020 og 17/9-2019. Stærke ord som datarevolution og paradigmeskift har været anvendt i beskrivelsen af udviklingen.

Naturligvis er denne fornemmelse af en verden i hastig forandring ikke speciel for den officielle statistiks interessenter, Det er nok en udbredt fornemmelse for interessenter i alle, eller næsten alle, fag. Det er muligvis også en fornemmelse man har haft på andre tidspunkter i historien, uden af eftertiden har set det på samme måde. Måske er fornemmelsen af at stå midt i noget stort blot en form for manglende historisk overblik, hvor man uden at der egentlig er grund til det, ser sin egen tid, som historisk enestående. Men er der, når det kommer til stykket, dækning for at anvende stærke begreber som datarevolution og paradigmeskift? Det spørgsmål har Steve MacFeely — chefstatistiker hos UNCTAD — underkastet en nærmere og grundigere belysning (MacFeely 2020).

MacFeely går meget grundigt til værks. Han indleder med at definere definere begrebet paradigmeskift ud fra Thomas Kuhn’s bog “The Structure of Scientific Revolutions”, og begrebet datarevolution ud fra en rapport, A World that Counts, udarbejdet i 2014 af en FN-ekspertgruppe. På det grundlag identificerer han fire udviklinger, som han ser som kandidater til betegnelsen datarevolution:

1. Definitionen af data udvides til at omfatte flere fænomener
Ordet data betyder det givne, og blev oprindeligt anvendt som betegnelse for den information, det er til rådighed i forbindelse med løsningen af en opgave. For en statistikproducent var data den information, der var indsamlet i form af spørgeskemaer o.lign. til brug for fremstillingen af et statistikprodukt. De teknikker, der var til rådighed, krævede at data var velstrukturerede og umiddelbart egnede som grundlag for optællinger. Objekter, der ikke opfyldte disse krav, f.eks billeder, breve, rapporter og bøger, blev ikke opfattet som mulige data for statistikproduktion.

Det har informationsteknologien ændret på. Billeder og alle skrevne dokumenter kan digitaliseres og derved gøres til genstand for computerbehandling, og både maskinel og det tilhørende programmel er blevet så effektivt, at udledning af struktur i komplekse objekter er blevet mulig. Det har ført til, at billeder og skrevne dokumenter nu er omfattet af statistikbureauernes databegreb.

En anden udvidelse af databegrebet er sket sket ved at teknologien har medført, at mange aktiviteter nu sætter digitale spor i form af organiske data (eller Big Data). Det gælder f.eks. kredit- og dankorttransaktioner, hvert enkelt varekøb i supermarkedet, browsersøgning og aktivitet på sociale medier. Disse digitale spor kan direkte gøres til genstand for behandling af kraftige computere, og bliver således også omfattet af de nye udvidede databegreb.

2. Øget anvendelse af sekundære fremfor primære data.
Til brug for produktionen af officiel statistik har statistikbureauerne altid indsamlet primære data, dvs data der var tilpasset statistisk brug. Det kunne f.eks. være udfyldte folketællingsskemaer eller prisoplysninger fra butikker. Tidligt i udviklingen af den officielle statistik begyndte statistikbureauerne også at anvende sekundære data, dvs. data, der var indsamlet af andre myndigheder, og som ikke var tilpasset statistisk anvendelse. I de nordiske lande tog den udvikling for alvor fart i løbet af 1960’erne, hvor skattevæsenets og andre myndigheders registre blev gjort til sekundære data for den officielle statistikproduktion. I begyndelsen blev der uden for Norden set med skepsis på denne udvikling, men denne skepsis er for længst forsvundet. I dag betragtes anvendelse af sekundære data for helt nødvendigt, for at officielle statistikproducenter kan løse deres opgave.

3. Opfattelse af data og statistik som offentlige goder
Den officielle statistikproduktion har bevæget sig fra næsten udelukkende at have til til formål at understøtte regeringerne i deres administration, til at spille en vigtig rolle som leverandør af viden om samfundet for alle borgere, virksomheder og institutioner. Det giver sig bl.a. udtryk i, at internationale retningslinjer om officiel statistik lægger vægt på, at officiel statistik skal være pålidelig og stilles til rådighed for alle på lige vilkår.

Denne udvikling er dog kun entydig, for producenter af officiel statistik, men ikke for de private aktører, der ofte er ejere af de nye datatyper, der blev omtalt i forbindelse med udvidelsen af databegrebet, specielt de organiske data. Her er spørgsmålet om offentlighedens adgang mere kompliceret, bl.a fordi disse data betragtes som et økonomisk aktiv, samtidig med at det er under diskussion, hvem der ejer eller hvem der bør eje dem, og dermed have retten til at anvende dem kommercielt.

4. Data og statistik som grundlag for informeret beslutningstagning
Bevidstheden om og kravet til at statistiske data skal indgå som en central del af grundlaget for politiske beslutninger har vundet frem. Udviklingen har været tydelig efter anden verdenskrig, men er accelereret omkring årtusindskiftet, hvor begreber som datadrevet beslutningstagning og new public management kom på mode.

Efter en grundig gennemgang af hver af de fire udviklinger konkluderer MacFeely, at de alle opfylder kriterierne for at kunne betegnes som både datarevolutioner og paradigmeskift. Vi har med andre ord grund til at antage, at fornemmelsen af at stå midt i en betydningsfuld omvæltning ikke blot er udtryk for en forblændelse af vores egen tid, men faktisk er en afspejling af virkeligheden.

Referencer:
Steve MacFeely: “ In search of the data revolution: Has the official statistics paradigm shifted?”, Statistical Journal of the IAOS, December 2020 (link, 12/1-2021)
UN : “A World that counts”, November 2014 (link)

Seneste Indlæg

Tres år med Danmarks Statistik27. juni 2026
Digitale data som alternativ til spørgeskemaer: Trusted Smart Surveys21. marts 2023
Opdatering af statistikkens branchegruppering7. marts 2023
Verdens sundhedsystemer er i vanskeligheder21. februar 2023
Indberetningsbyrden ved spørgeskema- og interviewundersøgelser7. februar 2023

Covid-19 krisens udfordringer for den officielle statistik

Første resultater fra USAs folketælling

Alle lyver! — Internettet som sandhedsserum?

Præsidentvalget i USA — Hvem støttede Trump?

Livskvalitet og indkomst

Covid19-krisens spor i nationalregnskabet for 2020

Globalisering og nationalregnskab

Dødelighed blandt Europas unge

Remitter — pengeoverførsler til husholdninger fra udlandet

Datarevolution og paradigmeskift — Nye tider for den officielle statistik?

Seneste Indlæg

Arkiv

Kategorier

År

		2019	2020
Kvinder	Dødsfald	31	39
Kvinder	Heraf selvmord	5	?
Mænd	Dødsfald	80	82
Mænd	Heraf selvmord	23	?