Kategori: Specifikke statistikområder

Befolkningsprognoser

En befolkningsprognose er en fremskrivning af befolkningens størrelse og sammensætning på kategorier, f.eks. køn og alder, baseret dels på statistiske opgørelser frem til udgangssituationen (baseline) og dels på en række forudsætninger om fremtidig fødselshyppighed, dødelighed og migration. I tabellen nedenfor er nogle hovedtræk fra Danmarks Statistiks seneste prognose, der udkom 27/5 2020, sammenholdt med Eurostats prognose. Resultaterne fra de to prognoser er meget forskellige. Danmarks Statistik viser en forøgelse af befolkningen frem til 2060 på ca. 9 pct. — fra 5,8 mio til 6,3 mio. Eurostat forudser en noget mindre stigning på ca. 5 pct. til 6,1 mio. Begge prognoser har stort set samme udgangspunkt, så forskellene i udviklingen må ligge i forskelle i forudsætningerne.

Tabel 1: Sammneligning af Eurostats og Danmark Statistiks Befolkningsfremskrivning for Danmark frem til 2060 (udvalgte år)

År	Eurostat				Danmarks Statistik
	Primo-befolkning	Fødsels-overskud	Nettoind-vandring	Tilvækst	Primo-befolkning	Fødsels-overskud	Nettoind-vandring	Tilvækst
	1000 personer
2020	5.822,8	6,8	4,4	11,2	5.822,8	7,0	15,1	22,2
2025	5.895,5	5,3	12,3	17,6	5.930,2	10,5	11,9	22,4
2030	5.975,0	0,5	12,4	12,9	6.043,3	10,3	10,5	20,8
2035	6.030,3	-4,1	12,7	8,6	6.137,0	6,0	9,8	15,8
2040	6.067,1	-6,8	12,5	5,7	6.206,8	2,1	9,2	11,3
2045	6.091,7	-7,8	11,8	4,0	6.256,7	-0,4	9,0	8,6
2050	6.109,8	-8,2	11,3	3,1	6.298,2	-0,5	9,0	8,4
2055	6.123,5	-8,8	11,1	2,3	6.343,8	1,7	8,9	10,6
2060	6.134,3	-8,9	11,1	2,2	6.403,6	5,1	9,0	14,1

Anm: Tallene for Eurostet er skaleret, således at folketallet i 2020 er identisk i de to opgørelser.
Kilder: Eurostats Statistikbank proj_19ndbi og Danmarks Statistikbank FRDK220

Som det fremgår af tabellen, forudsætter Eurostat et noget mindre fødselsoverskud end Danmarks Statistik. Fra 2035 viser Eurostats tal et mærkbart fødselsunderskud. Til gengæld ser Eurostat en større nettoindvandring, men samlet set altså en langsommere befolkningsudvikling.

Nettooindvandringen er den mest usikre del af prognoserne, især fordi den afhænger af en række uforudsigelige forhold omkring den politiske og økonomiske udvikling i resten af verden og fremtidige politiske beslutninger i Danmark og EU. Fødselsoverskuddet er i højere grad knyttet til størrelser, der udvikler sig mere stabilt som antal fødsler pr. kvinde i den fødedygtige alder og dødeligheden for forskellige aldersgrupper.

Tabel 2: Opgørelsen af fødselsoverskuddet i tabel 1

År	Eurostat					Danmarks Statistik
År	Kvinder 15-49 år	Ferti-litet¹	Føds-ler	Døds-fald	Fødsels-over-skud	Kvinder 15-49 år	Ferti-litet¹	Føds-ler	Døds-fald	Fødsels-over-skud
2020	1262,6	49,4	62,4	55,6	6,8	1266,4	48,4	61,3	54,3	7,0
2025	1237,4	51,7	64,0	58,7	5,3	1262,1	53,7	67,7	57,2	10,5
2030	1225,5	51,6	63,3	62,7	0,5	1254,8	57,0	71,5	61,2	10,3
2035	1234,9	50,3	62,1	66,2	-4,1	1269,1	55,5	70,5	64,5	6,0
2040	1237,2	49,4	61,2	67,9	-6,8	1278,1	53,4	68,2	66,1	2,1
2045	1224,4	49,6	60,7	68,5	-7,8	1281,7	51,7	66,3	66,7	-0,4
2050	1214,6	50,3	61,1	69,3	-8,2	1288,3	52,0	67,0	67,6	-0,5
2055	1209,7	50,9	61,5	70,3	-8,8	1297,2	54,2	70,3	68,6	1,7
2060	1200,7	51,2	61,5	70,3	-8,9	1300,9	56,4	73,3	68,2	5,1

Anm: Se tabel 1
Note: ¹Antal fødsler pr 1000 kvinder i aldesgruppen 15-49 år
Kilder: Eurostats statistikbank proj_19np, proj_19ndbi og Danmarks Statistikbank FRDK120, FRDK220

Som det fremgår af tabel 2, er der ikke de store forskelle på den samlede dødelighed i de to prognoser. Det er forskellen i fødselstallet, der er årsag til, at Eurostat når frem til et fald i fødselsoverskuddet, og her er årsagen igen at Eurostat forudser en lavere fertilitet.

Fertiliteten er her opgjort som antal fødsler pr. 1000 kvinder i den fødedygtige alder (15-49 år). Det er et simpelt, men ikke særligt præcist mål, fordi det kun ser på det samlede antal kvinder i aldersgruppen 15-49 år, og ikke tager hensyn til at fertiliteten er meget forskellig i de forskellige aldersgrupper. Et bedre mål ville være den samlede fertilitetskvotient, der tager højde for aldersfordelingen, men de offentliggjorte data for de to prognoser gør ikke en umiddelbar sammenligning af samlet fertilitetskvotient mulig.

Referencer:
Danmarks Statistik: “Befolkningsfremskrivninger 2020-2060”, Nyt fra Danmarks Statistik, 2020 nr 1999 (link)

2. juni 2020

Sundhedsstatistik under COVID-19 epidemien

Som omtalt i det forige indlæg har Danmarks Statistik i forbindelse med COVID-19 krisen etableret en særlig hjemmeside med statistik om udviklingen i både den sundhedsmæssige og den økonomiske situation. Her er tale om statistikker, der hurtigt kan belyse udviklingen — såkaldt konjunkturstatistik. Konjunkturstatistik står i modsætning til strukturstatistik, der lægger mere vægt på grundighed og detaljer, og som det tager længere tid at producere. Når det gælder de økonomiske indikatorer, er der en lang tradition for konjunkturstatistik i den officielle statistik, og der er derfor opbygget en omfattende viden omkring produktionen og tolkningen af den. Anderledes forholder det sig med sundhedsstatistikken, der traditionelt har været set som en strukturstatistik. Kortsigtsindikatorer ligger ikke lige for hånden, så de officielle statistikmyndigheder har måttet være kreative.

En ideel epidemistatistik skulle dagligt opgøre bl.a. det samlede antal smittede, antallet af nye smittede, antallet af smittede med alvorlige symptomer og antallet af dødsfald forårsaget af epidemien. Sådanne opgørelser optræder da også på Danmarks Statistiks COVID19-hjemmeside, men de har nogle kvalitetsbrist. Antallet af smittede kan kun skaffes gennem målinger og man har kun testet personer, der opfyldte særlige kriterier, f,eks. viste alvolige symptomer på COVID-19. Opgørelserne er således ikke repræsentative for hele befolkningen. Da kriterierne ikke har ligget fast, giver tallene heller ikke et pålideligt billede af udviklingen. Omfanget af alvorlige tilfælde belyses ved antallet of hospitalsindlagte, specielt indlagte på intensivafdelinger og i repirator. Sålænge kriterierne for indlæggelse er uændrede, er det en udmærket indikator. Hvad dødsfald angår er problemet, at de hurtige opgørelser kun registrerer om afdøde var inficeret, men ikke om COVID-19 var dødsårsagen. Den egentlige statistik over dødsårsager er lidt længere undervejs.

Ved internationale sammenligninger er problemerne endnu større, først og fremmest fordi opgørelsesmetoderne i landene kan være meget forskellige. Det er tænkeligt, at man på sundhedsområdet kan etablere kortsigtsstatistikker (konjunkturstatistik) af den type, der er nævnt i foregående afsnit, som opfylder de sædvanlige kvalitetskrav for officiel statistik, men det vil tage noget tid, og de vil næppe kunne nå at blive operationelle i forbindelse med den nuværende epidemi. Den gode umiddelbare løsning er at tilpasse offentliggørelsen af de eksisterende sundhedsstatistikker til de nye behov. Den simpleste og mest oplagte metode er at sammenligne det samlede antal af ugentlige (eller daglige) dødsfald med gennemsnittet for tilsvarende uger/dage i tidligere år. En sådan statistik er ved at komme i gang i mange lande herunder også Danmark, hvor den kan findes på Dannarks Statistiks COVID-19 side og i Statistikbanken

I figuren nedenfor er vist udviklingen i det samlede antal døde pr uge i pct. af en beregnet normaldødelighed. Normaldødeligheden er beregnet som medianen for døde i pct. af den samlede befolkning (ved begyndelsen af kvartalet) i den tilsvarende uge i årene 2017-2019.

Ugentlig overdødelighed 2018 uge 1 – 2020 uge 17

Kilde: Danmarks Statistík, www.statistikbanken.dk/DODC2

Som det fremgår af figuren er det tydeligt, at der sker en stigning i overdødeligheden omkring uge 11, hvor epidemien ifølge WHO brød ud.

5. maj 2020
Ulighed i testresultater i grundskolen — Forskelle mellem USA og Danmark
Der er store forskelle mellem statistiksystemerne i USA og Danmark. De omfattende registerbaserede systemer, der er grundstammen i den officielle danske statistik findes ikke i USA. I stedet har man i USA opbygget en række stikprøvebaserede statsitiksystemer, specialiseret til belysning af forskellige områder, f.eks, indkomst eller uddannelse. De to systemer har hver deres fordele og ulemper. Det amerikanske system gør det muligt at tilpasse dataindsamlingen til statistikkens formål, hvor det danske system er afhængigt af data indsamlet til andre formål, f,eks skattevæsenets data. Til gengæld giver det danske system mulighed for at samkøre de forskellige systemer via cpr-numrene, hvor samkøring af forskellige statistiksystemer i USA er kompliceret og oftest umuligt. Det er også en vigtig forskel, at det danske system er langt det billigste i drift.

Det er altid forbundet med særlige vanskeligheder at sammenligne statistiske opgørelser fra forskellige lande, selv når landenes statstiksystemer ligner hinanden, men vanskelighederne bliver naturligvis større, når afvigelserne mellem systemerne er så store, som der her er tale om. Men ønsker man at foretage internationale sammenligninger må man forsøge at overvinde vanskelighederne. Det forsøg har to forskere — Christopher Jamil de Montgomery fra Københavns Universitet og Hans Henrik Sievertsen fra VIVE — gjort i forbindelse med en belysning af sammenhængen mellem forældres indkomst og socioøkonomiske baggrund på den ene side og deres børns præstationer i gundskolen på den anden.

For USA er anvendt et longitudienelt datasæt fra U.S. National Center for Education Statistics (NCES).— Early Childhood Longitudinal Study, Kindergarten Class of 1998-99 (ECLS-K) — der følger den årgang, der startede i børnehaveklasse i 1998/99. Datasættet indeholder bl.a testreultater for prøver i matematik og læsning på o. (børnehaveklasse) 1., 3., 5. og 8. klassetrin og oplysninger om husstandsindkomst og forældrenes uddannelsesmæssige baggrund. For Danmark er der taget udgangspunkt i resultaterne fra de nationale tests. For læsning findes testresultater for 2., 4., 6. og 8. klassetrin og for matematik for 3. og 6. klassetrin. Dette datasæt er så udvidet med oplysninger om forældres indkomst og uddannelsemæssige baggrund ved samkøring med Danmarks Statistiks Registre.

Der er som det fremgår tale om to ret forskellige datasæt, selvom de belyser de samme fænomener. Blandt de forskelle, som de to forskere må forholde sig til er:
1. Det amerikanske datasæt er en stikprøve, omend en stor stikprøve, det danske er en totaltælling
2. Det amerikanske datasæt omfatter alle skoler, både offentlige og private. det danske omfatter kun offentlige skoler
3. Første måling er ikke sket på de samme klassetrin i de to datatsæt. (trin 0 i USA, trin 2 i Danmark)
4. Det amerikanske data omfatter personer født omkring 1993. De danske data omfatter peroner født omkring 2000.
5. De tests, der er er anvendt i de to datasæt, er forskellige
I artiklen redegøres for betydningen af disse forskelle, og der anvendes metoder, der søger at kompensere for forskellene. Det er klart, at denne fremgangsmåde stiller krav til omhu og forsigtighed ved tolkningen af resultaterne, men trods vanskelighederne mener forfatterne, at de kan påvise klare forskelle mellem USA og Danmark i grundskolesystemets betydning for uligheden. Nogle hovedresultater er vist i tabellen nedenfor.

Gennemsnitlige testresultater ved prøver i grundskolen, klassetrin 0/2 og klassetrin 8 (percentil score)

Forældres indkomst Klassetrin USA Danmark

Lav indkomst Trin 0/2 43 43

Trin 8 40 41

Høj indkomst Trin 0/2 60 57

Trin 8 62 56

Forskel Trin 0/2 17 14

Trin 8 22 15

Den nederste del af tabellen (blå skrift) viser forskellen i gennemsnitligt testreusltat for børn af forældre med hhv. lav og høj indkomst. I både USA og Dannark klarer børn af velhavende forældre sig bedst, både ved testene på det lave og det høje klassetrin. Forskellene er dog noget mindre i Danmark end i USA. Mest markant er det, at i Danmark er forskellen næsten den samme på de to klassetin, hvor forskellen i USA er markant større på det høje klassetrin. Det amerikanske grundskolesystem ser altså ud til at øge uligheden, hvor det danske er nogenlunde neutralt.

Referencer
Christopher Jamil de Montgomery1 og Hans Henrik Sievertsen: “The Socio-Economic Gradient in Children’s Test-Scores – A Comparison Between the U.S. and Denmark”, Nationaløkonomisk Tidsskrift 2019:1 (link)
24. marts 2020
USA’s folketælling 2020

En af dette års helt store begivenheder i statistikverdenen er folketællingen i USA. Mange andre lande afholder folketælling i 2020 — og EU-landene holder folketællinger i 2021 — men den amerikanske tælling er noget helt særligt i kraft af sit omfang, sin historie, sin rolle i det politiske spil og den tekniske og statistikfaglige indsats, der ligger bag. Forberedelserne til den amerikanske folketælling har tidigere være behandlet i flere indlæg i denne blog (14/5-2019, 12/6-2018, 19/9-2017 og 23/5-2017)

Grundlæggende foregår folketællingen på helt traditionel vis, ved at hvert husstandsoverhoved besvarer et spørgeskema om husstandens beboere. Moderne teknologi anvendes naturligvis, hvor det er muligt, men fundamentet er data indsamlet direkte hos borgerne. Det er en meget kostbar dataindsamlingsmetode, som i andre lande er søgt erstattet eller suppleret med anvendelse af data fra allerede eksisterende registre. Ugemagasinet The Economist påpeger da også, at metoden kan forekomme ret utidsvarende, men problemet er, at USA ikke råder over den administrative infrastuktur i form af omfattende administrative registre, der er forudsætningen for alternative og langt billigere metoder.

Dataindsamlingen er så småt begyndt i afsides liggende områder i Alaska og vil fortsætte sommeren over. Det officielle starttidspunkt var 21. januar. Men den store indsamlingsmåned bliver april. Folketællingsdagen — den 1. april 2020 — vil blive markeret som en mærkedag over hele USA. Det er forholdene på denne dato tællingen tilstræber at beskrive. Alle husholdninger vil på denne dag modtage en opfordring til at deltage. Besvarelsen kan foregå telefonisk, online på internettet eller med gammeldags post. En husholdning forstås i denne sammenhæng som en lille gruppe personer, der deler bolig. Beboere i fælleshusholdninger som fængsler, kollegier og plejehjem kan ikke optælles på denne måde. De vil i stedet blive besøgt af folketællere, der vil indsamle de krævede oplysninger om beboerne. Det samme gælder de almindelige husholdninger, der ikke efterkommer opfordringen til levere data telefonisk, online eller med post. Hjemløse udgør et helt specielt problem, men også de vil blive søgt optalt i dagene omkring 1. april.

De første resultatater fra folketællingen bliver de opgørelser forfatningen kræver til fordeling af pladserne i kongressen og i det valgmandskollegium, der vælger præsidenten. De vil blive leveret i december 2020. Den 31, marts 2021 vil delstaterne modtage data, der skal danne grundlag for afgrænsningen af valgkredsene. Den egentlige offentliggørelse påbegyndes i maj 2021 og forventes afsluttet i april 2023.

Referencer:
Economist: “Out for the Count — Americas census looks out of date in the age of big data”, Economist 20/1-2020 (link)
United States Census Bureau: Hjemmeside (link)

4. februar 2020

Ressourcefodaftrykket

Krav om bæredygtig produktion sætter grænser for, hvor meget der kan trækkes på naturressourcer som biomasse, mineraler og fossil energi. Der er derfor behov for pålidelige og helst også overskuelige opgørelser både over trækket på og mængden af tilgængelige ressourcer. De grundlæggende data indgår i de enkelte landes materialestrømsopgørelser, der er satellitsystemer til nationalregnskabet. Disse opgørelser viser landets umiddelbare anvendelse af naturressourcer, opgjort som den samlede udvinding plus import minus eksport. Men en sådan opgørelse viser ikke landets træk på verdens samlede naturressourcer. Det skyldes, at opgjort på denne måde, vil der i et lands træk på egne naturressoucer indgå ressourcer anvendt til produktion af færdigvarer, der eksporteres. Den andel af ressourcerne skal i stedet indgå i det importerende lands ressourcetræk. Omvendt vil der til produktionen af landets import af af færdigvarer være trukket på ressourcer, der efter den umiddelbare opgørelse indgår i andre landes ressourcetræk. En opgørelse, der er korrigeret for denne indirekte import og eksport, kaldes et ressourcefodaftryk.

Ressourcefodaftrykket opgøres med udgangspunkt i vægten af de faktisk indvundne, importerede og eksporterede mængder af naturressourcer med et beregnet tillæg for den indirekte import og et beregnet fradrag for den indirekte eksport. Eurostat offentliggør beregninger af ressourcefodaftryk for EU som helhed og for enkelte af medlemslandene. Danmark er ikke blandt landene i EU-opgørelsen, men i en ny publikation fra Danmarks Statistik, er det danske ressourcefodaftryk for første gang opgjort officielt. En oversigt over resultater — både fra EU’s opgørelse og fra Danmarks Statistik — er vist i tabellen nedenfor.

Tons pr capita	År	Indenlandsk ressource-indvinding (1)	Direkte og indirekte ressorce-import (2)	Direkte og indirekte ressouce-eksport (3)	Ressource-fodaftryk (1) + (2) – (3)
EU (28 lande)	2016	11,1	7,5	4,9	13,7
Tyskland	2014	13,6	19,0	16,5	16,1
Frankrig	2016	8,7	12,2	8,2	12,7
Litauen	2016	15,4	17,1	14,7	17,8
Malta	2016	4,0	20,1	13,8	10,3
Nederlandene	2016	6,8	31,4	28,6	9,6
Østrig	2014	15,4	29,3	20,2	24,5
Portugal	2016	12,8	10,9	8,4	15,4
Danmark	2016	19,6	26,9	24,6	21,8

Kilder: Eurostats Statistikbank env_ac_rme og Iliev(2019)

Desværre er disse beregninger ikke så enkle at gennemføre, og må baseres på en række skøn og forudsætninger. Det betyder, at der er en stor usikkerhed i resultaterne. Som det udtrykkes i EU’s dokumentation, så er yderligere harmonisering nødvendig, for at nå frem til god sammenlignelighed af estimaterne på tværs af landene. Det afspejler sig i tabellen i overraskende store forskelle mellem EU-landenes fodaftryk, men indtil opgørelsene er blevet bedre harmoniseret må vi nok antage, at forskellene mere hænger sammen med forskelle i metoder end med forskelle i faktisk ressourcebelastning.

Referencer
Bogomil Emilov Iliev: “Hvordan påvirker vores forbrug verdens naturressourcer?”, Danmarks Statistik Analyse, Nr. 2019:21, 21/11-2019 (link)
Danmarks Statistik: “Statistikdokumentation for
Materialestrømsregnskab 2017″ (link)
Eurostat: “Material flow accounts in raw material equivalents – modelling estimates (env_ac_rme)”, Reference Metadata (link)
Eurostat: “Material flow accounts (env_ac_mfa)“, Reference Metadata (link)

17. december 2019

Sundhedsomkostninger i statistikken — Behov for bedre opgørelser?
Professor i sundhedsøkonomi og -politik, Kjeld Møller Pedersen, har i en kronik i Altinget efterspurgt en ny og mere gennemskuelig statistik om de offentlige sundhedsudgifter. Kritikken er især rettet mod opgørelsen af sundhedsudgifterne i to af Danmarks Statistiks produkter: Regnskaber for regioner og kommuner og Offentlig Forvaltnings Udgifter og Indtægter. Kritikken kan opsumeres i følgende punkter:
1. Offentlig Forvaltnings Udgifter og Indtægter følger internationale retningslinier, der nok gør opgørelsen af sundhedudgifterne internationalt sammenlignelig, men til gengæld nationalt uforståelig
2. Der savnes en opdeling på regioner, kommuner og stat i Offentlig Forvaltnings Udgifter og Indtægter.
3. Nogle af de betegnelser, som Danmarks Statistik anvender i Offentlig Forvaltnings Udgifter og Indtægter, er misvisende
4. Der savnes inflationskorrigerede serier i Regnskaber for regioner og kommuner
Vedr. punkt 1 går indvendingen dels på, at sammenhængen mellem det offentliges regnskaber og de internationalt sammenlignelige statistikker er uigennemskuelig, og dels at den internationalt sammenlignelige opgørelse ikke afspejler danske nationale behov. Men regnskaber har generelt et andet og bredere formål end en specifik statistik for offentlige udgifter. Bl.a. er regnskaberne grundlag for kontrol af overholdelse af bevillingsregler. Man kan derfor ikke forvente, at regnskaber umiddelbart kan opfylde statistikbrugernes behov. Omkodning og bearbejdning er nødvendig. Samtidig er det naturligvis et krav, at sammenhængen mellem statistikkens resultater og dens kilder er gennemskuelig. Set på den baggrund går kritikken på mangler i statistikkens dokumentation.

International sammenlignelighed har høj prioritet i den officielle statistik, efter min opfattelse med rette, men naturligvis bør der suppleres med nationale opgørelser, hvor der er behov for det. De internationale retningslinier er fasttlagt i den såkaldte Cofog-manual. Møller Pedersens kritik går især på, at Cofog-kategorien Sundhedsvæsen omfatter udgifter til plejehjem, der efter hans opfattelse ikke er en sundhedsudgift, men snarere hører hjemme under Cofog-kategorien Social beskyttelse. I den mest detaljerede Cofog-opdeling er Pleje- og rekonvalcenthjem skilt ud som en særlig kategori, men denne underopdeling offentliggøres ikke i Danmarks Statistiks opgørelser.

Referencer
Kjeld Møller Pedersen: “Dumt spørgsmål, men hvad koster sundhedsvæsenet?”, Altinget 23/11-2019 (link)
Danmarks Statistik: “Klassifikation af det offentliges udgifter efter formål (COFOG)”, v1:1999″ (link)
3. december 2019
Alternativ inflationsmåling – Web scraping og The Billion Prices Project

Det traditionelle datagrundlag for måling af inflation er indsamlede prisoplysninger for et udvalg af produkter i udvalgte butikker. En kort beskrivelse af metoden findes i et tidligere indlæg. En alternativ metode, hvor priserne indsamles fra forhandlernes hjemmesider er under udvikling. Projektet er døbt The Billion Prices Project (BPP), og er bl.a. beskrevet i en artikel af de to forskere, der tår bag projektet, Alberto Cavallo and Roberto Rigobon. Starten på projektet var et forsøg på at skabe et alternativt inflationsmål for Argentina, hvor regeringen i perioden 2007-2016 manipulerede inflationsopgørelsen med henblik på et skjule inflationens sande størrelse. Senere blev forsøget udvidet til at omfatte flere lande, bl.a. Australien, Brasilien, Canada, Japan, Kina, Tyskland, Sydafrika, UK og USA.

Adgang til data skal købes. Et kommercielt foretagende — PriceStats — står for beregningerne, og data sælges gennem et finansielt rådgivningsfirma — State Street. PriceStat producerer daglige inflationstal for mere end tyve lande. BPP opfylder ikke kriterierne for officiel statistik, men de metoder, der anvendes i projektet, er interessante, og kan naturligvis også være en inspirationskilde for den officielle statistik.

Det tilstræbes i BPP, at de indsamlede priser er repræsentative for hele detailhandelen, og derfor udvælges kun forhandlere, der både er aktive på nettet og i fysiske butikker. Et fortagende som Amazon, der ikke har fysiske butikker, indgår derfor ikke. Indsamlingen sker ved anvendelse af såkaldte scraping værktøjer, der automatisk opsøger hjemmesiderne for de valgte leverandører og finder de ønskede prisoplysninger (web-scraping).

BPP-metoden har en række fordele, som gør den interessant også for officielle statistikinstitutter og deres brugere. Først og fremmest er metoden billig, fordi den ikke kræver manuel dataindsamling. Desuden kan den uden større ekstraomkostninger levere data med høj frekvens, f.eks dagligt, hvor traditionelle prisdata normalt offentliggøres månedligt. Endelig kan resultaterne leveres med meget kort forsinkelse i forhold til traditionelle prisstatistikker. Bedre muligheder for kvalitetskorrektion og for internationale sammenligninger indgår også blandt fordelene.

Men naturligvis har metoden også ulemper. En af dem er, at ikke alle produkter sælges i net-butikker, hvilket kan give problemer med repræsentativiteten. Specielt tjenesteydelser vil være stærkt underrepræsenterede ved BPP-metoden.

Albert Cavello har for en række lande sammenlignet inflationsopgørelser baseret på BPP-metoden med traditionelle inflationsopgørelser (link). Han konkluderer, at der er god overensstemmelse, navnlig for de økonomisk mest udviklede lande. Der kan derfor være gevinster at hente for de officielle statistikinstitutioner, både på omkostninger og kvalitet, ved anvendelse af BBP-metoden, i hvert fald som supplement til de traditionelle metoder.

Referencer:
Alberto Cavallo and Roberto Rigobon: “The Billion Prices Project: Using Online Prices for Measurement and Research”, Journal of Economic Perspective 2016 vol 30 no 2 (link)
Alberto Cavallo: “Are Online and Offline Prices Similar? Evidence from Large Multi-Channel Retailers”, American Economic Review 2017, 107(1): 283–303 (link)
The Billion Proces Project: Hjemmeside, (link)
PriceStats: Hjemmeside (link)

19. november 2019
Statistisk måling af CO2-udledninger

Den globale opvarmning, og navnlig spørgsmålet om hvad vi kan og skal gøre for at begrænse den, er blevet et central emne i den offentlige debat, i hvert fald i de rige vestlige lande. Den dominerende holdning blandt forskere, vælgere og politikere er, at der bør gøres et forsøg på at begrænse opvarmningen, og at det først og fremmest skal ske ved at nedbringe den udledning af CO2, der er resultat af menneskelig virksomhed. På klimakonferencer indgår lande og byer aftaler om, hvor meget og hvor hurtigt udledningen skal nedbringes.

Alle disse aftaler og mål vedrører de direkte udledninger fra fabrikker, boliger og husdyr mm. på landets eller byens område. Dvs CO2-udledningen vedrører den produktion, der foregår i byen eller landet. Men nogle af de produkter der forbruges i byen eller landet kan være fremstillet andre steder, dvs. importeret, så den udledning, forbruget forårsager, er større end den der måles ud fra produktionen. I modsat retning trækker det af en del af produktionen eksporteres og indgår i forbruget andre steder.

Produkion af tjenesteydelser giver ikke anledning til så megen CO2-udledning som produktion af industriprodukter. Da rige lande typisk har stor produktion af tjenesteydelser og importerer industrivarer fra fattigere lande, undervurderer den produktionsbaserede opgørelse den virkelige — dvs. den forbrugsbaserede — belastning fra de rige lande. Det har bl.a fået den meget unge klimaaktivist — Greta Thunberg — til at anklage de rige lande for kreativ bogføring af CO2-udledningen (Economist 2019).

Set fra statistikproducenternes synspunkt er problemet, at det er meget vanskeligere at opgøre den forbrugsbaserede udledning end den produktionsbaserede. Begge opgørelser er baseret på en række forudsætninger og modeller, der gør resultaterne usikre, men problemerne er størst for den forbrugsbaserede opgørelse. Det ændrer dog ikke på, at Grete Thunberg har ret i, at det i denne sammenhæng giver bedre mening, at vurdere et lands eller en bys klimabelastning ud fra den forbrugsbaserede udledning.

Referencer
Hannah Ritchie og Max Roser: “CO₂ and Greenhouse Gas Emissions”, Our World in Data 4/12-2018 (link)
Hanna Ritchie: “Who emits more than their share of CO₂ emissions?”, Our World in Data 4/12-2018 maj 2017, opdateret oktober 2018 (link)
Economist: “Greta Thunberg accuses rich countries of creative carbon accounting”, 17/10-2019 (link)

29. oktober 2019
Måling af livskvalitet og bæredygtighed i den økonomiske statistik

Det har, siden nationalregnskabet blev introduceret i midten af den 20. århundrede, været en kendt sag, at opgørelsen af værdien af den samlede produktion, bruttonationalproduktet (BNP), ikke er en særlig velegnet indikator for livskvalitet, og at opgørelsen ikke siger noget om produktionens bæredygtighed. Ikke desto mindre har netop BNP pr. capita ofte været tolket som et mål for livskvalitet, og den manglende hensynstagen til bæredygtighed har ofte været ignoreret. Producenterne af den økonomiske statistik har i de senere år arbejdet med at finde egnede mål for livskvalitet og bæredygtighed, og i den forbindelse har OECD spillet en vigtig rolle. Peter van de Ven — OECD’s nationalregnskabschef — har i en artikel i tidskriftet Eurona leveret et overblik over OECD’s hidtidige bestræbelser.

Nationalregnskabet er et omfattende statistisk system, der belyser mange sider af den økonomiske aktivitet, og BNP er blot et enkelt af de mange størrelser, der opgøres. Et naturligt første skridt er derfor at overveje, hvad der kan gøres inden for nationalregnskabets rammer. OECD har i den forbindelse bl.a. valgt at øge fokus på husholdningerne, fremfor den samlede økonomi der bl.a. også omfatter selskaber, og på den disponible indkomst, dvs. indkomst efter skat. Det foretrukne indkomstbegreb omfatter også de indkomster, husholdningerne har i form af gratis ydelser fra det offentlige, f.eks. i forbindelse med sundhed og uddannelse, og kaldes i nationalregnskabet for korrigeret disponibel indkomst. Men da langt fra alle lande kan levere de nødvendige data har OECD som udgangspunkt valgt begrebet disponibel indkomst, der ikke omfatter de de offentlige gratisydelser.

Men livskvalitet kan ikke analyseres udelukkende ud fra nationalregnskabets totalstørrelser, de såkaldte makrodata. Makrodata må suppleres med data for forskellige grupper af husholdninger og personer (f,eks fordeling efter køn, alder og erhverv), de såkaldte mikrodata. Begreberne i og teorien bag nationalregnskabet er forberedt for håndteringen af mikrodata, men i praksis er der store problemer i implementeringen. Problemet har været behandlet bl.a. i arbejdsgrupper i OECD og EU, uden at man endnu er kommet til fuld klarhed, men mange lande er begyndt at udarbejde og offentliggøre mikro-opgørelser, der er konsistente med nationalregnskabets makro-opgørelser.

Der er dog grænser for, hvor langt man kan komme indenfor de rammer, der sættes af nationalregnskabet. Et af problemerne er den ubetalte husholdningproduktion, dvs. den produktion af f.eks. rengøring og børnepasning, der udføres direkte af en husholdnings egne medlemmer. Denne produktion indgår ikke i nationalregnskabets opgørelser. Købes sådanne ydelser på markedet, eller stilles de til rådighed af det offentlige, vil de derimod indgå. Der er derfor brug for at supplere de nationalregnskabsmæssige opgørelser med skøn over husholdningernes egen produktion. Desværre er det lettere sagt end gjort.

Et andet problem er husholdningernes forbrug af gratis internettjenester som Google og Facebook. Leverandørerne har indtægter i form af annonceindtægter, som i en eller anden grad må afspejle sig i de priser, forbrugerne betaler for de forbrugsgoder, de køber på markedet. Men præcis hvordan og i hvilket omfang, man herved får afspejlet den værdi, forbruget af tjenesterne har for husholdningerne, er uafklaret. Endnu mere problematisk er forbruget af produkter, der udvikles og stilles til rådighed af frivillige, uden at der overhovedet er involveret betalinger. Styresystemet Linux og kontorpakken OpenOffice er eksempler på sådanne produkter. Husholdningernes forbrug af disse ydelser er slet ikke afspejlet i nationalregnskabet.

Når det drejer sig om bæredygtighed er det begrænset, hvor meget nationalregnskabet i sin nuværende form kan bidrage. Men der arbejdes med i tilknytning til nationalregnskabet at opbygget en række supplerende systemer, de såkaldte satellitregnskaber, der skal bidrage til at belyse de områder, de er underbelyst i det egentlige nationalregnskab (kernen). I satellitregnskaberne anvendes i videst muligt omfang de samme begreber og klassifikationer som i nationalregnskabet, således at opgørelserne kan sammenholdes. Der står dog mange problemer tilbage at løse, og endnu er satellitregnskaber kun implementeret i begrænset omfang.

Referencer
Peter van de Ven: “Measuring economic well-being and sustainability: a practical agenda for the present and the future”, Eurona 1/2019 (link)

10. september 2019

Den globale indkomstfordeling

Gini-koefficienten er det mest udbredte (men ikke det eneste) mål for ulighed i indkomstfordelinger (se tidl. indlæg). Oftest angives Gini-koefficienten i procent således at en kvotient på 0 angiver fuldstændig lighed, dvs at alle har samme indkomst, og en kvotient på 100 angiver fulstændig ulighed, dvs. at al indkomst tilfalder en indkomstmodtager. I paksis ligger værdien naturligvis et sted derimellem. I EU-landende ligger koefficienten mellem 23 og 40. Danmark ligger i den lave ende med en Gini-koefficient omkring 28.

Traditionelt opgøres og sammenlignes Gini-koefficienter for lande, som f.eks i tabel ilc_di12 i Eurostats statistikbank. EU opgør også en Gini-koefficient for EU som helhed — den er omkring 40 — og der forekommer også opgørelser af Gini-koefficienten for verden som helhed. Verdens samlede indkomstulighed kan dels tilskrives forskelle i indkomstniveau mellem rige og fattige lande og dels ulighed indenfor de enkelte lande. Der kan bo meget rige mennesker i meget fattige lande, og fattigdom forekommer også i rige lande. Økonomen Jørgen Modalsli — forskningsleder i det norske statistikbureau — har i en artikel (Modalsli 2017) søgt at opdele Gini-koefficienten for hele verden i de komponenter, der kan tilskrives indkomstforskelle mellem lande, og de komponenter, der kan tilskrives ulighed inden for de enkelte lande.

Modalslis beregninger vedrører året 2005, hvor han opgør Gini-koefficienten for verden som helhed til 69,7. I hans samlede beregninger indgår 188 lande. I tabellen neden for er resultatene aggregeret på syv regioner. Diagonalen i tabellen viser hvor stor en andel (i pct.) af den samlede Gini-koefficent på 69,7, der kan tiskrives indkomstforskelle mellem indkomstmodtagere indenfor hver af de syv regioner. Tallene uden for diagonalen angiver andelen, der kan tilskrives forskelle mellem regionerne indbydes. De indbyrdes forskelle afspejler både forskelle i de regionale Gini-koefficienter, dvs. graden af ulighed i de enkelte regioner, og forskelle i gennemsnitsindkomst mellem regionerne.

Global Gini-koefficient dekomponeret på regioner (pct. af samlet koefficient¹)

	Afrika	Latin-amerika²	Nord-amerika	Europa	Asien, vest	Asien, øst	Oceanien
Afrika	0
Latinamerika¹	1	1
Nordamerika	5	3	1
Europa	5	3	3	2
Asien, vest	2	3	10	11	2
Asien, øst	5	4	10	11	10	7
Oceanien	0	0	0	0	0	1	0

Noter: ¹Tallene i tabellen summer op til 100 ²Inklusiv Caribien

Som det fremgår af tabellen, så er det forskellene mellem Nordamerika og Europa på den ene side og Asien på den anden og mellem det vestlige og østlige Asien, der bidrager mest til den samlede ulighed. Også de interne forskelle i det østlige Asien, der både omfatter et stort rigt land som Japan og et stort fattigt land som Kina, bidrager betydeligt. Selv om Afrika og Latinamerika er fattige regioner med en høj grad af ulighed i indkomstfordelingen, indgår de kun med forholdsvis beskedne andele i den samlede verdensulighed. Det skyldes, at de to regioners folketal er lavt i forhold til Asiens.

Ser man på de detaljerede landeresultater, så er det naturligt nok forskellen mellem verdens største rige økonomi, USA, og verdens største fattige økonomier, Kina og Indien, der dominerer. Ulighederne mellem Kina og USA tegner sig for for 6,0 pct af den globale ulighed, og forskellene mellem USA og Indien for 5,5 pct.

Referencer:
Jørgen Modalsli: “Decomposing Global Inequality”, Review of Income and Wealth Ser 3 Nr 3 september 2017

18. juni 2019

Forældres indkomst	Klassetrin	USA	Danmark
Lav indkomst	Trin 0/2	43	43
Lav indkomst	Trin 8	40	41
Høj indkomst	Trin 0/2	60	57
Høj indkomst	Trin 8	62	56
Forskel	Trin 0/2	17	14
Forskel	Trin 8	22	15