År: 2019

Arbejdstidsregnskabet

Den danske arbejdsmarkedsstatistik består dels i en række stikprøvebaserede spørgeskemaunderøgelser, dels i en række registerbaserede totaltællinger, hvor datagrundlaget er oplysninger fra administrative registre. Spørgeskemaundersøgelserne gør det muligt at anvende de begreber, der giver den bedste mening i statistikken, typisk baseret på internationalt fastlagte definitioner. Til gengæld er pålideligheden og mulighederne for detaljerede opgørelser mindre end i registerstatistikkerne. Ulempen ved registerstatistikkerne er, at begreberne må tilpasses registrenes muligheder og derfor ikke altid er optimale set fra statistikkens synspunkt.

Med henblik på at skabe rammen om en sammenhængende og integreret arbejdsmarkedsstatistik har Danmarks Statistik etableret to grundlæggende statistiksystemer, Arbejdsmarkedsregnskabet og Arbejdstidregnskabet. Arbejdsmarkedsregnskabet har jeg beskrevet i et tidligere indlæg. Her følger en tilsvarende beskrivelse af Arbejdstidsregnskabet.

Det grundlæggende objekt (tællingsenheden) i Arbejdstidsregnskabet er jobbet. Arbejdstidsregnskabets populationen udgøres af jobs udført i dansk registrerede virksomheder, herunder skibe under dansk flag. Til et job er knyttet en person, der udfører jobbet, og jobbet har en varighed målt i timer og en aflønning (kompensation) målt i kr. Der er altid tilknyttet én og kun én person til et job, men én person kan godt have flere jobs.

Det er opgørelsen af antallet af præsterede arbejdstimer, der er Arbejdstidsregnskabets hovedformål, men i statistikken opgøres også antallet beskæftigede personer, antallet af jobs og lønsummen. Som baggrundsvariable indgår branche, sektor (pivat/offentlig), socioøkonomisk status (lønmodtager/selvstændig) og køn.

At jobbet er det grundlæggende objekt betyder ikke, at der er etableret et register med data for hvert enkelt job. I praksis opgøres arbejdstidsregnskabet som en aggregeret, men detaljeret tabel, der danner grundlaget for publicering og for bidrag til andre statistikker. Den vigtigste kilde til opgørelsen er Arbejdsmarkedsregnskabet. Herudover anvendes Lønstrukturstatistikken, Indkomststatikken og Lønmodtagerbeskæftigelsen som kilder.

Der offentliggøres i statistikbanken både årlige og kvartalsvise serier for arbejdstidsregnskabet. Nedenfor er vist en summarisk opgørelse for året 2017

2017	Enhed	I alt	Mænd	Kvinder
Præsteret tid	mio timer	3.896	2.255	1.642
Beskæftigede	1000 personer	2.878	1.543	1.335
Job	tusinder	3.112	1.692	1.420
Lønsum	mia. kr	1.100	648	452
Arbejdstid pr. beskæftiget	timer	1.354	1.461	1.230

Kilde: Danmarks Statistikbank/ATR118

Referencer:
Danmarks Statistik: “Statistikdokumentation for Arbejdstidsregnskab 2018” (link)

30. april 2019

Differentiel privacy som grundlag for beskyttelse af statistisk fortrolighed

Det er et centralt krav til den officielle statistik at den skal levere pålidelige og detaljerede data til alle brugere. Det er også et centralt krav, at den skal sikre statistisk fortrolighed, herunder beskyttelse af dataleverandørernes identitet. Kravene fremgår bla. af EU’s Adfærdskodeks for Europæiske Statistikker. De to krav kan stride imod hinanden, så ved offentliggørelse må der foretages en afvejning af de to krav. I praksis har man hidtil løst problemet ved simple metoder, som at undlade offentliggørelse af celler i tabeller, hvis cellen kun omfatter meget få enheder, eller ved at anonymisere mikrodata, før de stilles til rådighed for forskere.

De simple metoder har været anset for tilstrækkelige, fordi det er blevet betragtet som utænkeligt, at nogen ville forsøge at udlede beskyttede data fra statistikkerene ved at kombinere forskellige opgørelser fra den samme kilde. Ikke fordi det i princippet var umuligt, men fordi det ville kræve så omfattende ressourcer, bl.a. i form af computerkraft, at ingen ville finde det umagen værd.

Det er ikke nødvendigvis tilfældet længere. Computerkraft er blevet billigere og blandt producenter af statistik har den erkendelse bredt sig, at der nu er en seriøs risiko for alvorlige angreb på statistikkernes fortrolighedsbeskyttelse. Det har skærpet bevistheden om afvejningsproblemet, for man har også erkendt, at fuld beskyttelse af fortroligheden kan kun opnås ved helt at undlade offentliggørelse. Derfor er den eneste praktiske mulighed, at man på forhånd gør sig overvejelser om, hvor stor en risiko for brud på fortroligheden, man vil acceptere, og efterfølgende indretter sin publiceringspolitik på det grundlag.

En metode til at beskyttelse af fortroligheden er at gå på kompromis med præcisionen i opgørelserne. I stedet for at offentliggøre det tal der faktisk fremgår af de statistiske opgørelser, så offentliggøres et lidt afvigende tal. Er det korrekte tal f.eks 1, kan man vælge at offentliggøre 0 eller 2 i stedet. Den tekniske betegnelse for fremgangsmåden er at indlægge støj i resultaterne. Brugeren vil stadig få en brugbar indikation af størrelsesordenen samtidig med, at det bliver vanskeligere at gennemføre et vellykket angreb på fortrolighedsbeskyttelsen.

Differential privacy er en egenskab ved en matematisk teknik, der gør det muligt, at fastlægge hvor meget støj, der skal implementeres i forbindelse med offentliggørelsen, for at sikre et givet niveau af fortrolighedsbeskyttelse. Før offentliggørelsen påbegyndes fastlægges et såkaldt fortrolighedsbudget, der er et mål for, hvor meget og hvor detaljeret der kan offentliggøres. Differential privacy leverer redskaberne til at opgøre budgettet, når beskyttelsesniveauet er fastlagt. Fastlæggelsen af hvilket beskyttelsesniveau, man vil acceptere, kan differentiel privacy-metoderne derimod ikke bidrage til. Det er og bliver et politisk spørgsmål.

Når fortrolighedsbudgettet er fastlagt, skal det afgøres, hvilke tabeller der skal offentliggøres. Hver tabel, der offentliggøres, trækker på budgettet, så det skal nøje overvejes, hvilke tabeller man vil vælge at offentliggøre. Enhver offentliggørelse belaster budgettet, således at der blive mindre til rådighed for andre offentliggørelser. Og budgettet lægger naturligvis en øvre grænse for, hvor meget der i alt kan offentliggøres.

USA’s folketællingsbureau har besluttet, at differentiel privacy skal være grundlaget for fortrolighedspolitikken i forbindelse med den næste folketælling der finder sted i 2020. Forberedelserne har givet anledning til en række erfaringer og overvejelser om, hvordan anvendelse af differentiel privacy i officiel statistik på en række områder vil ændre den måde hvorpå statistikken opfattes og anvendes. Disse erfaringer og overvejelser vil jeg vende tilbage til i et senere indlæg.

Referencer:
Eurostat: “Adfærdskodeks for Europæiske Statistikker”, Eurostat 2017 (link)
Hector Page, Charlie Cabot & Kobbi Nissim,: “Differential privacy: an introduction for statistical agencies“, Privatar 2018 (link)

23. april 2019

Indvandrere og efterkommere i de nordiske lande

Danmarks Statistik har for nylig (26/3) udgivet en Analyse om indvandrere og efterkommere i de nordiske lande. Statistik om indvandrere og efterkommere har været produceret af Danmarks Statistik i flere år, men da ingen andre lande hidtil har haft tilsvarende opgørelser, har internationale sammenligninger ikke været mulige. Med en række tabeller i den fællesnordiske statistikbank, Nordic Statistics Database, om indvandrere og efterkommere, er der nu opstået en mulighed for sammenligning mellem de nordiske lande. Det er den mulighed Danmarks Statistik har udnyttet i Analysen. Tabellerne er udarbejdet i et samarbejde mellem de nordiske officielle statistikbureaer. Definitionen på indvandrere og efterkommere i den fællesnordiske statistik ligger tæt på, men er ikke helt identisk med, definitionen i den danske statistik.

Analysen fokuserer på antallet af indvandrere og efterkommere og på deres uddannelsesforhold og arbejdsmarkedstilnytning. Nogle af hovedresultaterne er i summarisk form gengivet i dette indlæg. I indlægget skelnes mellem indvandrere fra vestlige og ikke-vestlige lande, således som traditionen har været i Danmarks Statistiks opgørelser, selv om definitionerne ikke er helt identiske. I Analysen (og i den fællesnordiske statistikbank) anvendes en mere detaljeret opdeling af oprindelseslandene på regioner

Tabel 1: Indvandrere og efterkommeres befolkningsandele i nordiske lande

	Samlet befolkning	Indvandrere		Efterkommere		Indvandre- re og efter-kommere i alt
	Samlet befolkning	Vestlige lande¹	Ikke- vestlige lande	Vestlige lande¹	Ikke-vestlige lande	Indvandre- re og efter-kommere i alt
	1000 pers.	pct.
Danmark	5.749	4,2	5,7	0,5	2,5	12,8
Finland	5.503	1,7	3,9	0,2	0,9	6,6
Norge	5.258	6,5	7,3	0,7	2,3	16,8
Sverige	9.995	5,8	11,1	1,7	3,7	22,2

Note: ¹Omfatter regionerne Nordiske lande, EU/EØS og Nordamerika og Oceanien
Kilde: Nordic Statistics Database/CITI03

Indvandreres og efterkommeres andel af de nordiske befolkninger er vist i tabel 1. Størst andel finder man i Sverige og lavest i Finland. I alle landene kommer flertallet af indvandrere og efterkommere fra ikke-vestlige lande, men andelen er særligt høj i Sverige, hvor ikke-vestlige indvandrere mm. udgør omkring 15 pct. af befolkningen.

Tabel 2: Indvandrere og efterkommeres beskæftigelsesfrekvens i nordiske lande

	Indvandrere		Efterkommere		Indfødte
	Vestlige lande¹	Ikke- vestlige lande	Vestlige lande¹	Ikke- vestlige lande	Indfødte
	pct af 20-64 årige
Danmark	66,6	51,3	70,7	60,6	77,9
Finland	62,2	46,2	59,0	52,5	71,8
Norge	74,0	55,8	72,3	67,1	78,8
Sverige	67,8	56,6	79,4	70,4	84,2

Note: ¹Omfatter regionerne Nordiske lande, EU/EØS og Nordamerika og Oceanien
Kilde: Egne beregninger på grundlag af tabeller i Nordic Statistics Database

I tabel 2 er vist beskæftigelsesfrekvensen for indvandrere og efterkommere sammenlignet med den indfødte befolkning. Beskæftigelsesfrekvensen er i alle landede lav for navnlig indvandrere fra ikke vestlige lande. Beskæftigelsesfrekvensen er højere for efterkommere, men dog stadig under frekvensen for den indfødte befolkning. I Analysen påpeges det, at forskellene i beskæftigelsesfrekvens delvis kan forklares af forskelle i køn, alder, uddannelse, længden af opholdet og begrundelsen for opholdstilladelsen (flygtning, familesammenføring, arbejde eller uddannelse). Alle disse forhold er belyst i tabellerne i den fællesnordiske statistikbank.

Referencer:
Nordic Statistics Database , www.nordicstatistics.org/statistics (link)
Danmarks Statistik: “Indvandrere og efterkommere i de nordiske lande”, DSTAnalyse 2018:04 26/3-2019 (link)

9. april 2019

Kvaliteten af det kinesiske nationalregnskab

Der er blandt verdens brugere af officiel statistik en kritisk holdning til kvaliteten af den officielle kinesiske statistik. Landets centrale statistikmyndighed anses generelt for kompetent, men der er naturligt nok store vanskeligheder, der skal overvindes, landets størrelse, historie og administrative system taget i betragtning. Hertil kommer, at åbenheden om problemer og metoder er begrænset. Da Kinas stigende rolle i vedensøkonomien, som den bla. viser sig i bruttonationalproduktet (BNP) og andre størrelser fra nationalregnskabet, medfører et øget behov for pålidelig statistik, har flere forskere førsøgt at vurdere størrelsen af de formodede skævheder i den kinesiske statistik, og at udarbejde alternative skøn, der søger at korrigere for disse skævheder.

Et eksempel er en gruppe forskere — en fra University of Chicago og tre fra Chinese University of Hong Kong — der for nyligt har offentliggjort en kritisk gennemgang af nogle centrale størrelser i det kinesiske nationalregnskab. De kalder ligefrem deres gennemgang for kriminalteknisk (forensic) undersøgelse. Deres fremgangsmåde er. at sammenligne de officielle nationalregnskabstal med andre målinger, som de betragter som mere pålidelige. I tabellen herunder er de officielle opgørelser af Kinas bruttonationalprodukt sammenholdt med ét af forskergruppens skøn.

Årlig vækst i Kinas bruttonationalprodukt (pct.) siden 2007

År	Officielle data	Moms-korrigeret
2007	23,15	23,15
2008	18.24	16,25
2009	9,25	7,92
2010	18,32	14,99
2011	18.47	15,43
2012	10,44	9,86
2013	10,16	8,77
2014	8,19	6,48
2015	7,00	6,20
2016	7,91	6,62
Gennensnit	12,00	10,28

Kilde: Wei Chen Chinese, Xilu Chen, Chang-Tai Hsieh & Zheng (Michael) Song, tabel 2

Tabellens første kolonne viser den officielle opgørelse af væksten i det kinesiske bruttonationalprodukt (BNP). Den anden viser en skønnet vækst opgjort på grundlag of udviklingen i momsprovenuet.

De officielle tal er baseret på indberetninger fra de lokale statistikmyndigheder i Kinas provinser. Det er opfattelsen hos de fire forfattere, at de centrale statistikmyndigheder gør sig store anstrengelser for at etablere pålidelige skøn, men at det samme ikke er tilfældet for de provinsernes lokale myndigheder. De er under pres fra lokale administrative myndigheder for at overvurdere væksten i indberetningerne, fordi væksten indgår som en faktor i deres aflønnings- og forfremmelsessystem. Det er de centrale myndigheder fuldt bevidste om, og søger at kompensere for det, ved at justere de indberettede tal nedad ved opgørelsen af Kinas samlede vækst.

Når det gælder indberetningen af momsprovenuet har de lokale myndigheder ingen interesse i at undervurdere indberetningerne, da de får del i indtægterne. Derfor har de fire forfattere antaget, at man kunne opnå et mere pålideligt skøn, ved at estimere væksten i BNP med udgangspunkt i væksten i momsprovenuet.

Som det fremgår af tabellen, ligger de momsbaserede skøn lavere end de officielle. Konklusionen er, at de officielle tal overvurderer væksten i den kinesiske økonomi. Der er stadig tale om en høj vækst, men den gennemsnitlige årlige vækst er ifølge denne beregning overvurderet med 1,7 procentpoint. Set over en tiårig periode betyder det en overvurdering af det samlede BNP på omkring 14 pct.

Gruppen har også opgjort et alternativt skøn baseret på en model, hvor nationalproduktet bestemmes på grundlag af en række variable uden for nationalregnskabet. De anvendte variable er det samlede skatteprovenu, eksport, import, forbrug af elektricitet, godstransport på jernbane, nye banklån og nattelys registeret af satellitter. Resultaterne fra de modelbaserede skøn peger i samme retning som de momsbaserede.

Referencer:
Wei Chen Chinese, Xilu Chen, Chang-Tai Hsieh & Zheng (Michael) Song: “A Forensic Examination of China’s National Accounts”, Brookings 7/3 2019 (link)
Dmitriy Plekhanov: “Quality of China’s Official Statistics: A Brief Review of Academic Perspectives”, The Copenhagen Journal of Asian Studies, Vol 35., no 1 (2017) (link)
The Economist: “China’s economy might be nearly a seventh smaller than reported”, 7/3-2019 (link)

26. marts 2019

Arbejdsmarkedsregnskabet

Arbejdsmarkedet belyses i en række statistikker fra Danmarks Statistik, bl.a Den Registerbaserede Arbejdsstyrkestatistik (RAS), Fraværsstatistikken, Arbejdskraftundersøgelsen og Lønstrukturstatistikken. Hver af disse statistikker tjener et formål, men da de er forskellige med hensyn til populationsafgrænsning og begrebsdefinitioner, kan det være vanskeligt at danne sig et samlet overblik. Derfor har Danmarks Statistik etableret to såkaldt integrerede arbejdsmarkedsstatistiske systemer — Arbejdsmarkedsregnskabet (AMR) og Arbejdstidsregnskabet (ATR) — der skal bidrage til et samlet overblik. AMR belyser befolkningens tilknytning til arbejdsmarkedet, og ATR belyser den samlede mængde udført arbejde, målt i timer. I dette indlæg giver jeg en kort beskrivelse af AMR. En tilsvarende beskrivelse af ATR følger senere.

En meget summarisk sammenfatning af AMR’s opgørelse af befolkningens arbejdsmarkedstilknytning er vist i tabellen nedenfor. I statistikbanken findes en betydeligt mere detaljeret opgørelse.

Befolkningens tilknytning til arbejdsmarkedet, 2016

Tilknytning til arbejdsmarkedet		1000 fuldtids-personer
I arbejdsstyrken	I beskæftigelse	2.292
I arbejdsstyrken	Arbejdsløs	106
Uden for arbejdsstyrken	Midlertidigt uden for arbejdsstyrken	242
	Pensionist	1.291
	Under uddannelse	1.085
	Barn/Ung (ikke under uddannelse)	375
	Uden for arbejdsstyrke i øvr.	328
Befolkningen i alt		5.719

Kilde: Danmarks Statistik, Statistikbanken/AMR1

Tilknytningen til arbejdsmarkedet opgøres i AMR i fuldtidspersoner. Hver person forudsættes at have 37 timer pr. uge til rådighed for enten beskæftigelse eller for aktivitet uden for arbejdsstyrken. En person, der i den seneste uge har været i beskæftigelse i 37 timer eller mere indgår i kategorien I beskæftigelse som én fuldtidsperson. Har personen været beskæftiget i mindre end 37 timer indgår han med en andel, svarende til den andel beskæftigelsen udgør af du 37 timer. Den resterende andel henføres til en eller flere af de øvrige kategorier. Kun personer med mindre end 37 timers beskæftigelse indgår i de øvrige kategorier og hver person indgår samlet med én fuldtidsperson, også selv om personen har væretbeskæftiget i mere end 37 timer. Det samlede antal fuldtidpersoner er derfor identisk med det samlede folketal.

AMR er dannet ved integration og harmonisering af data fra en række af Danmarks Statistiks registre, bl.a. Erhvervsregistret, Indkomststatistikken, Befolkningsregistret og Elevregistret. Hele befolkningen indgår, og hver persons arbejdsmarkedstilknytning kan opgøres på et vilkårligt tidspunkt. Det gør registret til et stærkt redskab til detaljerede forløbsopgørelser.

I sig selv fylder AMR ikke meget i Danmarks Statistiks løbende publicering. Blot to tabeller i statistikbanken. Til gengæld udgør AMR grundlaget for nogle af de centrale arbejdsmarkedsstatistikker som Den Registerbaserede Arbejdsstyrkestatistik (RAS), Erhvervsbeskæftigelsen (EBS) og Arbejdstidsregnskabet (ATR). Det er dog en såkaldt ikke time-normeret version af AMR, der her anvendes. I den ikke time-normerede version begrænses en persons aktiviteter ikke til 37 ugentlige timer. AMR’s muligheder som forløbsregister udnyttes bla. i den registerbasrede opgørelse af unge der hverken er i beskæftigelse eller under uddannelse (NEET-indikatoren), se tidl. indlæg.

Begrebet fuldtidsperson er et specifikt dansk fænomen, så der er ingen muligheder for internationale sammenligninger. Heller ikke de statistikker, som anvender AMR som kilde er altid velegnede til internationale sammenligner. Generelt gælder det, at ved internationale sammenligninger af tilknytning til arbejdsmarkedet er Arbejdskraftundersøgelsen, der er en fælles EU-undersøgelse, bedre egnet.

Reference:
Danmarks Statistik: “Statistikdokumentation for Arbejdsmarkedsregnskab 2015” (link)

19. marts 2019

Unge, der hverken er i beskæftigelse eller under uddannelse (NEET-indikatoreren)

Blandt de mange aspekter i et godt ungdomsliv skal gerne indgå en forberedelse til et fremtidigt erhvervsliv. I statistikken skal det bl.a. give sig udslag i at unge mennesker enten er registreret som værende i beskæftigelse eller under uddannelse. Det er de fleste unge også, men der er en lille gruppe, som ikke er. Internationalt anvendes den engelske forkortelse NEET (Not in Employment, Education or Training) om denne gruppe. Danmarks Statistik har tilsyneladende opgivet at finde en dansk betegnelse og anvender i sine offentliggørelser også betegnelsen NEET.

EU har opgjort NEET-indikatoren siden 2006. I figuren nedenfor er vist resultaterne for 2017. NEET-gruppen er i EU-opgørelserne afgrænset til personer mellem 15 og 24 år, der i referenceugen ikke var i beskæftigelse og heller ikke i de seneste fire uger havde været i uddannelse eller træning (formel eller uformel) .

Andel af unge (15-24 år), der hverken er i beskæftigelse eller under uddannelse i EU-landene, 2017

Kilde: Eurostats statistikbank lfsi_neet_a, Grafik: Veusz

Der er ganske store forskelle mellem EU-landene. Nederlandene ligger lavest med 4 pct. og Italien højest med 20 pct. Generelt er problemet størst i Syd- og Østeuropa

EU-opgørelsen af NEET-indikatoren er baseret på de kvartalsvise stikprøvebaserede arbejdsstyrkeundersøgelser. Som EU-medlem deltager Danmark naturligvis i disse undersøgelser, men til nationalt brug — dvs. når international sammenlignelighed ikke er vigtig — anvendes en NEET-indikator, baseret på det registerbaserede arbejdsmarkedsregnskab (AMR), frem for arbejdsstyrkeundersøgelsens opgørelse. AMR giver langt bedre muligheder for forløbsundersøgelser og for detaljerede opdelinger af populationen end arbejdsstyrkeundersøgelsen. Til gengæld må begreberne tilpasses de begrænsninger, der kan ligge i registrene.

For den registerbaserede NEET-indikator betyder tilpasningen, at begrebet i under uddannelse defineres lidt mere snævert, idet kun formel uddannelse indgår. Registrene giver nemlig ikke mulighed for at opgøre uformel uddannelse. NEET-gruppen i AMR er således større end i arbejdsstyrkeundersøgelsen, og værdien af NEET-indikatoren derfor højere. Dertil kommer, at man i AMR afgrænser gruppen af unge til 16-24 årige og altså udelader de 15-årige. Det skyldes, at man i dansk statistik traditionelt afgrænser arbejdsstyrken til personer i aldersgruppen 16-64 år. Af hensyn til konsistensen med den øvrige arbejdsmarkedsstatistik har men derfor valgt at udelade de 15-årige fra NEET-gruppen.

De særlige muligheder for detaljeret statistik i AMR har Danmarks Statistik bl.a udnyttet til en sammenligning af NEET-indikatoren for hhv. unge af dansk oprindelse og unge efterkommere fra ikke-vestlige lande. Nogle hovedresultater er vist i tabellen nedenfor.

Registerbaseret NEET-indikator for Danmark 2017.

	Mænd		Kvinder
	Dansk oprindelse	Efterkommer¹	Dansk oprindelse	Efterkommer¹
16-19 år	6,1%	9,2%	5,6%	5,7%
20-24 år	12,8%	20,7%	11,6%	13,9%
16-24 år	9,9%	15,1%	9,0%	9,9%
25-29 år	13,8%	23,4%	15,8%	23,7%

Note: ¹Fra ikke-vestlige lande
Kilde: Dannarks Statistik: “Indvandreres og efterkommeres tilknytning til arbejdsmarkedet nov. 2017” Excell-fil (link)

Danmarks Statistik har også benyttet registerstatistikkens muligheder til at udvide den belyste population til også at omfatte aldersgruppen 25-29 år. Som det fremgår af tabellen er forskellene mellem efterkommere og unge af dansk oprindelse større i denne aldergruppe end i den traditionelle NEET-population, navnlig for kvindernes vedkommende. Mere detaljerede resultater kan findes i en Nyt-artikel om emnet (link) og i et Excel-rgneark knyttet til Nyt-artiklen (link)

Referencer:
Danmarks Statistik: “Metodenotat — registerbaseret NEET-indikator“, 26/4-2017 (link)
Dannarks Statistik: “Efterkommere er oftere ikke i uddannelse eller job”, Nyt 25/2-2019, nr 69 (link)
Dannarks Statistik: “Indvandreres og efterkommeres tilknytning til arbejdsmarkedet nov. 2017″ Excell-fil (link)

12. marts 2019

Ny undersøgelse af den danske befolknings kulturvaner

Danmarks Statistik har påbegyndt offentliggørelsen af en ny kulturvaneunderøgelse for perioden 2018-2020. Den nye undersøgelse omfatter 8 kvartaler (3. kvartal 2018 til 2. kvartal 2020). De nu offentliggjorte resultater vedrører 3. og 4. kvartal 2018. Statistiske undersøgelser af den danske befolknings kulturvaner har været gennemført siden 1964, med med intervaller på mellem fem og tolv år, men det har været kulturministeriet, der stod for undersøgelserne. Den seneste af kulturministeriets undersøgelser er fra 2012.

Det er et meget omfattende kulturbegreb, der anvendes i undersøgelsen. Det omfatter ikke blot traditionelle kulturaktiviteter som litteraturlæsning og koncert- og teaterbesøg men også fritids- og medievaner, herunder motion og brug af digitale spil. De nu offentliggjorte resultater vedrører voksne (16 år og ældre), men undersøgelsen omfatter også børns kulturvaner. Resultater fra børneundersøgelsen vil dog tidligst blive offentliggjort i slutningen af 2019.

Andel af befolkningen, fordelt på alder, der indenfor de seneste tre måneder har deltaget i udvalgte kulturaktiviter. 4. kvartal 2018

	16-24 år	25-34 år	35-44 år	45-54 år	55-64 år	65-74 år	75 år og derover	Alle
Opsøgt billedkunst	49	39	35	35	44	48	45	41
Dyrket motion	94	83	83	80	80	89	83	84
Læst eller lyttet til skønlitteratur	60	57	59	62	61	69	62	61
Brugt digitale spil	80	64	58	46	40	39	25	52
Været (fysisk) på biblioteket	51	44	45	39	36	46	40	42
Været på bibliotekets digitale tjenester	37	32	33	27	23	28	19	29
Læst eller lyttet til faglitteratur	71	61	61	63	64	58	50	62

Kilde: Danmarks Statistikbank/KVUHYP01 (link)

I tabellen ovenfor er vist nogle hovedresultater omkring kulturvaner i forskellige aldersgrupper. Den mest markante forskel mellem aldersgrupperne finder man i brugen af digitale spil, hvor de yngste helt dominerer.

Den nye kulturvaneundersøgelse afviger på flere punkter fra de tidligere, så umiddelbar sammenligning er ikke mulig. Til gengæld er begreberne i den nye undersøgelse søgt tilpasset FN’s retningslinier. Det betyder bedre international sammenlignelighed.

Referencer:

Danmarks Statistik: “Halvdelen af danskerne spiller digitale spil”, Nyt 1/3-2019 nr. 79 (linindenfor k)
Danmarks Statistik: “Statistikdokumentation for Kulturvaneundersøgelsen 2018” (link)

5. marts 2019

Registrering af illegal aktivitet i nationalproduktet
I nationalregnskabets definition af værditilvæksten (nationalproduktet) har det ingen betydning, om aktiviteten bag produktionen er lovlig eller ej. Hæleri og salg af smuglergods indgår derfor principielt i produktionen på lige fod med legal handel. Det er dog et krav, at der bag aktiviteten ligger frivillige transaktioner. Slavehandel kan derfor ikke indgå i nationalproduktet.

En anden ting er, at illegale aktiviteter kan være vanskelige at belyse i statistikken, så i praksis kan man ikke regne med at aktiviteter i forbindelse med illegal produktion altid indgår. I forbindelse med den seneste revision af de internationale retningslinier for opgørelse af nationalregnskaber besluttede EU-landene dog, at tre typer af aktivitet — prostitution, narkotikahandel og smugleri — altid skal indgå , uanset om aktiviteten er lovlig eller ej. Mangler man statistik på området (og det gør man) må man basere opgørelsen på skøn.

Men prostitution, narkotikahandel og smugleri udgør kun en del af den samlede illegale aktivitet. I en artikel i Eurostats tidsskrift, Eurona (Icho Bechev, 2018) opregnes seks andre aktiviteter, der med god ret kunne inddrages, sammen med nogle overvejelser om aktiviteternes økonomisk betydning og de praktiske muligheder for at inddrage dem i statistikken. De seks punkter er:
1. Ulovlig våbenhandel
2. Handel med tyvekoster
3. Smugling af migranter
4. Forfalskning af varer og piratkopiering
5. Bestikkelse
6. Ulovligt spil
Tjenester i forbindelse med hvidvaskning af penge er udeladt af listen med henvisning til, at emnet er så komplekst, at det fortjener en særskilt undersøgelse.

Ikke alle seks punkter er lige betydningsfulde. Det antages i artiklen, at ulovligt spil er det økonomisk set vigtigste af punkterne. På den anden side skønnes ulovlig våbenhandel at have en ringe udbredelse i Europa.

I dette indlæg har fokus været på værditilvæksten. Men nationalnalregnskabet omfatter mange andre poster og i Bechev’s artikel er de illegale transaktioners betydning for disse andre poster også behandlet.

Referencer:
lcho Bechev: “Expanding the coverage of illegal economic activities in national accounts”, Eurona 2/2018 (link)
26. februar 2019
Sammenligning af web-skemaer og telefoninterviews som dataindsamlingsmetode

Udbredelsen af internettet gør det oplagt, at statistikproducenter må overveje at anvende web-skemaer — hvor respondenten bevarer spørgsmålene på sin computer uden medvirken af en interviewer — som alternativ til traditionelle telefoninterviews. I mange tilfælde kombinerer producenten de to metoder. Det rejser naturligt spørgsmålet om metoderne giver samme resultat.

Det gør de nok i nogle tilfælde — måske også i de fleste tilfælde — men de gør det ikke altid. Pew Research Center præsenterer i en ny YouTube-video et kort redegørelse for forskellene mellem de svar, der modtages ved anvendelse af web-skemaer og de svar, der modtages i telefoninterviews. I en rapport fra 2015, har de leveret en mere dybtgående analyse af forskellene. Rapporten er baseret på besvarelser af det samme spørgeskema fra to grupper — en der blev interviewet telefonisk, og en der besvarede et web-skema. I hver gruppe indgik ca. 1500 personer.

Hovedbudskabet er, at ved de fleste typer af spørgsmål er der kun små forskelle mellem resultaterne fra de to metoder. Men undersøgelsen viser også, at navnlig ved tre typer af spørgsmål har interviewformen afgørende betydning. Det gælder nogle, men ikke alle, spørgsmål om livskvalitet, helbred og finansielle problemer, spørgsmål om social diskrimination og spørgsmål om vurderingen af politikere. Ved telefoninterviews var respondenterne mere tilbøjelige til at udtrykke tilfredshed med livskvalitet, helbred og finansiel situation, mere tilbøjelige til at se diskrimination som et problem, og mere tilbøjelige til at udtrykke stærkt negative holdninger til politiske modstandere.

Karakteristisk for de spørgsmål, hvor forskellene i svar er størst, er at der kan indgå et element af social eller politisk korrekthed i opfattelsen af svarende. Ved telefoninterviews, hvor der er direkte kontakt med intervieweren bliver svarene mere socialt og politisk korrekte, end ved web-baserede interviews, hvor den interviewede er alene. Tendens til skævhed i besvarelser i retning af det socialt accepterede eller forventede er et velkendt problem i spørgeskemabaseret statistik, og det er ikke så overrakende, at skævheden bliver større, når der er direkte kontakt til en interviewer. Men det er også et vigtigt resultat af Pew’s undersøgelse, at ikke alle typer spørgsmål er belastet af denne tendens.

Tendensen til socialt acceptable svar er den klart vigtigste kilde til forskelle i undersøgelsen, men Pew understreger, at der er andre. F,eks. er der en tendens til, at den interviewede når han præsenteres for en række svarmuligheder, vil vil vælge det sidste af de opstillede alternativer ved et telefoninterview og det første ved web-undersøgelser, hvor han sidder med spørgeskemaet foran sig.

Pew antager, bl.a. på baggrund af andre undersøgelser, at de observerede forskelle i besvarelser ved de to metoder kan tilskrives, at der svares mere ærligt, når der ikke en interviewer indblandet. Svarene fra web-skemaerne er med andre ord af bedre kvalitet. Da metoden også er billigere at gennemføre end telefoninterviews, er der gode grund til at anvende den. Men ikke alle har adgang til internet og er villige til at besvare web-skemaer. Derimod har stort set alle adgang til telefon og villigheden til at deltage i telefoninterviews er større. Det betyder, at undersøgelser baseret på telefoninterviews er mere repræsentative end web-undersøgelser. Den mulige kvalitetsgevinst ved mere ærlige svar i web-undersøgelserne må derfor holdes op mod det mulige tab i repræsentativitet.

Referencer
Pew Research Center: “Phone vs. online surveys: Why do respondents’ answers sometimes differ by mode?”, YouTube 7/2-2019 (link)
Pew Research Center: “From Telephone to the Web: The Challenge of Mode of Interview Effects in Public Opinion Polls”, 13/5-2015 (link)

19. februar 2019

Statistisk selvforsvar — Hvordan beskytter man sig mod vildledende statistik?

Statistik er en tillidssag. Det har jeg ofte påpeget i denne blog. Det er derfor altid vigtigt at vide, hvem der har produceret en statistik, og at vurdere producentens troværdighed, før man for alvor begynder at anvende den. Men selv om en statistik er produceret af en yderst pålidelig producent, og der ikke kan sættes en finger på dens grundlæggende kvalitet, så kan den blive præsenteret i en form, der gør den mere vildledende end informativ. Den nederlandske journalist, Sanne Blauw, giver i en YouTube video en række råd til brugere af statistik om, hvordan man kan undgå at blive ført bag lyset af en vildledende præsentation. Statistisk selvforsvar kalder hun det.

Blauw tager udgangspunkt i fem kategorier af — bevidst eller ubevidst — statistisk vildledning, og giver eksempler på hver af dem. Om alle eksemplerne er lige velvalgte er åbent for diskussion, men det er uden betydning for relevansen af hendes advarsler. Og gennemgangen er ganske underholdende.

De fem vildledningskategorer er:

Den overbevisende graf (The good-looking graph)	Grafer, der ved første øjekast virker overbevisende, men som ved nærmere eftersyn viser sig at være misvisende
Den misvisende måling (The polluted poll)	Målinger baseret på små stikprøver, lav besvarelsesprocent, og komplicerede spørgsmål, der bliver formidlet, uden at der redegøres for de nødvendige forbehold.
Det overmodige decimalkomma (The overconfident decimal point)	Præcisionen i statistiske opgørelse overvurderes. Det gælder specielt foreløbige opgørelser, der offentliggøres kort efter udløbet af den periode, de vedrører.
Den ikke så spektakulære statistik *(The not so spectacular statistic)*	Statistiske resultater, der bringes uden at blive vurderet i en sammenhæng, kan virke mere spektakulære, end de i virkeligheden er
Den overfortolkede sammenhæng *(The cocky correlation)*	En sammenhæng mellem to variable (korrelation) betyder ikke nødvendigvis en årsagssammenhæng (kausalitet)

På sin hjemmeside præsenterer Sanne Blauw sig som talkorresondent (numeracy correspondent) for den nederlandske nyhedsplatform De Correspondent. De Coorrespondent er en alternativ journalistisk platform, der i sin formidling lægger mere vægt på indhold og sammenhæng end på det seneste døgns mere eller mindre tilfældige begivenheder. De dækker klimaet, men ikke vejret, som de selv udtrykker det. Reglerne for platformens virke er fastlagt i ti principper, der udover det allerede nævnte om vægt på indhold, bl.a. omfatter annoncefrihed, fokus ikke blot på problemer, men også på løsninger, og åbenhed om kilder. Det økonomiske grundlag stammer fra netværksfinansiering (crowdfunding) og salg af medlemskaber (abonnementer). Artiklerne er fortrinvis på nederlandsk, men en engelsksproget udgave er under forberedelse med planlagt start i midten af 2019.

Referencer:
Sanne Blauw: “How to defend yourself against misleading statistics in the news”, YouTube (link)
Sanne Blauw: Hjemmeside (link)
De Correspondent: Hjemmeside (link)

12. februar 2019