År: 2019

  • Arbejdstidsregnskabet

    Den danske arbejdsmarkedsstatistik består dels i en række stikprøvebaserede spørgeskemaunderøgelser, dels i en række registerbaserede totaltællinger, hvor datagrundlaget er oplysninger fra administrative registre. Spørgeskemaunder­søgelserne gør det muligt at anvende de begreber, der giver den bedste mening i statistikken, typisk baseret på internationalt fastlagte definitioner. Til gengæld er pålideligheden og mulighederne for detaljerede opgørelser mindre end i registerstatistikkerne. Ulempen ved registerstatistikkerne er, at begreberne må tilpasses registrenes muligheder og derfor ikke altid er optimale set fra statistikkens synspunkt.

    Med henblik på at skabe rammen om en sammenhængende og integreret arbejdsmarkedsstatistik har Danmarks Statistik etableret to grundlæggende statistiksystemer, Arbejdsmarkedsregnskabet og Arbejdstidregnskabet. Arbejdsmarkedsregnskabet har jeg beskrevet i et tidligere indlæg. Her følger en tilsvarende beskrivelse af Arbejdstidsregnskabet.

    Det grundlæggende objekt (tællingsenheden) i Arbejdstidsregnskabet er jobbet. Arbejdstidsregnskabets populationen udgøres af jobs udført i dansk registrerede virksomheder, herunder skibe under dansk flag. Til et job er knyttet en person, der udfører jobbet,  og jobbet har en varighed målt i timer og en aflønning (kompensation) målt i kr. Der er altid tilknyttet én og kun én person til et job, men én person kan godt have flere jobs.

    Det er opgørelsen af antallet af præsterede arbejdstimer, der er Arbejdstidsregnskabets hovedformål, men i statistikken opgøres også antallet beskæftigede personer, antallet af jobs og lønsummen. Som baggrundsvariable indgår branche, sektor (pivat/offentlig), socioøkonomisk status (lønmodtager/selvstændig) og køn.

    At jobbet er det grundlæggende objekt betyder ikke, at der er etableret et register med data for hvert enkelt job. I praksis opgøres a­rbejdstidsregnskabet som en aggregeret, men detaljeret tabel, der danner grundlaget for publicering og for bidrag til andre statistikker. Den vigtigste kilde til opgørelsen er Arbejdsmarkedsregnskabet. Herudover anvendes Lønstrukturstatistikken, Indkomststatikken og Lønmodtagerbeskæftigelsen som kilder.

    Der offentliggøres i statistikbanken både årlige og kvartalsvise serier for arbejdstidsregnskabet. Nedenfor er vist en summarisk opgørelse for året 2017

     2017 Enhed I alt Mænd Kvinder
    Præsteret tid mio timer 3.896 2.255 1.642
    Beskæftigede 1000 personer 2.878 1.543 1.335
    Job tusinder 3.112 1.692 1.420
    Lønsum mia. kr 1.100 648 452
    Arbejdstid pr. beskæftiget timer 1.354 1.461 1.230

    Kilde: Danmarks Statistikbank/ATR118

    Referencer:
    Danmarks Statistik: “Statistikdokumentation for Arbejdstidsregnskab 2018” (link)

  • Differentiel privacy som grundlag for beskyttelse af statistisk fortrolighed

    Det er et centralt krav til den officielle statistik at den skal levere pålidelige og detaljerede data til alle brugere. Det er også et centralt krav, at den skal sikre statistisk fortrolighed, herunder beskyttelse af dataleverandørernes identitet. Kravene fremgår bla. af EU’s Adfærdskodeks for Europæiske Statistikker. De to krav kan stride imod hinanden, så ved offentliggørelse må der foretages en afvejning af de to krav. I praksis har man hidtil løst problemet ved simple metoder, som at undlade offentliggørelse af celler i tabeller, hvis cellen kun omfatter meget få enheder, eller ved at anonymisere mikrodata, før de stilles til rådighed for forskere.

    De simple metoder har været anset for tilstrækkelige, fordi det er blevet betragtet som utænkeligt, at nogen ville forsøge at udlede beskyttede data fra statistikkerene ved at kombinere forskellige opgørelser fra den samme kilde. Ikke fordi det i princippet var umuligt, men fordi det ville kræve så omfattende ressourcer, bl.a.  i form af computerkraft, at ingen ville finde det umagen værd.

    Det er ikke nødvendigvis tilfældet længere. Computerkraft er blevet billigere og blandt producenter af statistik har den erkendelse bredt sig, at der nu er en seriøs risiko for alvorlige angreb på statistikkernes fortrolighedsbeskyttelse. Det har skærpet bevistheden om afvejningsproblemet, for man har også erkendt, at fuld beskyttelse af fortroligheden kan kun opnås ved helt at undlade offentliggørelse. Derfor er den  eneste praktiske mulighed, at man på forhånd gør sig overvejelser om, hvor stor en risiko for brud på fortroligheden, man vil acceptere, og efterfølgende indretter sin publiceringspolitik på det grundlag.

    En metode til at beskyttelse af fortroligheden er at gå på kompromis med præcisionen i opgørelserne. I stedet for at offentliggøre det tal der faktisk fremgår af de statistiske opgørelser, så offentliggøres et lidt afvigende tal. Er det korrekte tal f.eks 1, kan man vælge at offentliggøre 0 eller 2 i stedet. Den tekniske betegnelse for fremgangsmåden er at indlægge støj i resultaterne. Brugeren vil stadig få en brugbar indikation af størrelsesordenen samtidig med, at det bliver vanskeligere at gennemføre et vellykket angreb på fortrolighedsbeskyttelsen.   

    Differential privacy er en egenskab ved en matematisk teknik, der gør det muligt, at fastlægge hvor meget støj, der skal implementeres i forbindelse med offentliggørelsen, for at sikre et givet niveau af fortrolighedsbeskyttelse. Før offentliggørelsen påbegyndes fastlægges et såkaldt fortrolighedsbudget, der er et mål for, hvor meget og hvor detaljeret der kan offentliggøres. Differential privacy leverer redskaberne til at opgøre budgettet, når beskyttelsesniveauet er fastlagt. Fastlæggelsen af hvilket beskyttelsesniveau, man vil acceptere,  kan differentiel privacy-metoderne derimod ikke bidrage til. Det er og bliver et  politisk spørgsmål.   

    Når fortrolighedsbudgettet er fastlagt, skal det afgøres, hvilke tabeller der skal offentliggøres. Hver tabel, der offentliggøres, trækker på budgettet, så det skal nøje overvejes, hvilke tabeller man vil vælge at offentliggøre. Enhver offentliggørelse belaster budgettet, således at der blive mindre til rådighed for andre offentliggørelser. Og budgettet lægger naturligvis en øvre grænse for, hvor meget der i alt kan offentliggøres.

    USA’s folketællingsbureau har besluttet, at differentiel privacy skal være grundlaget for fortrolighedspolitikken i forbindelse med den næste folketælling der finder sted i 2020. Forberedelserne har givet anledning til en række erfaringer og overvejelser om, hvordan anvendelse af differentiel privacy i officiel statistik på en række områder vil ændre den måde hvorpå statistikken opfattes og anvendes. Disse erfaringer og overvejelser vil jeg vende tilbage til i et senere indlæg.

    Referencer:
    Eurostat:
    “Adfærdskodeks for Europæiske Statistikker”, Eurostat 2017 (link)
    Hector Page, Charlie Cabot & Kobbi Nissim,: Differential privacy: an introduction for statistical agencies,  Privatar 2018 (link)

  • Indvandrere og efterkommere i de nordiske lande

    Danmarks Statistik har for nylig (26/3) udgivet en Analyse om indvandrere og efterkommere i de nordiske lande. Statistik om indvandrere og efterkommere har været produceret af Danmarks Statistik i flere år, men da ingen andre lande hidtil har haft tilsvarende opgørelser, har internationale sammenligninger ikke været mulige. Med en række tabeller i den fællesnordiske statistikbank, Nordic Statistics Database, om indvandrere og  efterkommere, er der nu opstået en mulighed for sammenligning mellem de nordiske lande. Det er den mulighed Danmarks Statistik har udnyttet i Analysen. Tabellerne er udarbejdet i et samarbejde mellem de nordiske officielle statistikbureaer. Definitionen på indvandrere og efterkommere i den fællesnordiske statistik ligger tæt på, men er ikke helt identisk med, definitionen i den danske statistik.

    Analysen fokuserer på antallet af indvandrere og efterkommere og på deres uddannelsesforhold og arbejdsmarkedstilnytning. Nogle af hovedresultaterne er i summarisk form gengivet i dette indlæg. I indlægget skelnes mellem indvandrere fra vestlige og ikke-vestlige lande, således som traditionen har været i Danmarks Statistiks opgørelser, selv om definitionerne ikke er helt identiske. I Analysen (og i den fællesnordiske statistikbank) anvendes en mere detaljeret opdeling af oprindelseslandene på regioner

    Tabel 1: Indvandrere og efterkommeres befolkningsandele i nordiske lande

    Samlet befolkning Indvandrere Efterkommere
    Indvandre-
    re og efter-kommere i alt
    Vestlige lande1 Ikke-
    vestlige lande
    Vestlige lande1 Ikke-vestlige lande
    1000 pers. pct.
    Danmark 5.749 4,2 5,7 0,5 2,5 12,8
    Finland 5.503 1,7 3,9 0,2 0,9 6,6
    Norge 5.258 6,5 7,3 0,7 2,3 16,8
    Sverige 9.995 5,8 11,1 1,7 3,7 22,2

    Note: 1Omfatter regionerne Nordiske lande, EU/EØS og Nordamerika og Oceanien
    Kilde: Nordic Statistics Database/CITI03

    Indvandreres og efterkommeres andel af de nordiske befolkninger er vist i tabel 1. Størst andel finder man i Sverige og lavest i Finland. I alle landene kommer flertallet af indvandrere og efterkommere fra ikke-vestlige lande, men andelen er særligt høj i Sverige, hvor ikke-vestlige indvandrere mm. udgør omkring 15 pct. af befolkningen.

    Tabel 2: Indvandrere og efterkommeres beskæftigelsesfrekvens i nordiske lande

    Indvandrere Efterkommere
    Indfødte
    Vestlige lande1 Ikke-
    vestlige lande
    Vestlige lande1 Ikke-
    vestlige lande
    pct af 20-64 årige
    Danmark 66,6 51,3 70,7 60,6 77,9
    Finland 62,2 46,2 59,0 52,5 71,8
    Norge 74,0 55,8 72,3 67,1 78,8
    Sverige 67,8 56,6 79,4 70,4 84,2

    Note: 1Omfatter regionerne Nordiske lande, EU/EØS og Nordamerika og Oceanien
    Kilde: Egne beregninger på grundlag af tabeller i Nordic Statistics Database

    I tabel 2 er vist beskæftigelsesfrekvensen for indvandrere og efterkommere sammenlignet med den indfødte befolkning. Beskæftigelsesfrekvensen er i alle landede lav for navnlig indvandrere fra ikke vestlige lande. Beskæftigelsesfrekvensen er højere for efterkommere, men dog stadig under frekvensen for den indfødte befolkning. I Analysen påpeges det, at forskellene i beskæftigelsesfrekvens delvis kan forklares af forskelle i køn, alder, uddannelse, længden af opholdet og begrundelsen for opholdstilladelsen (flygtning, familesammenføring, arbejde eller uddannelse). Alle disse forhold er belyst i tabellerne i den fællesnordiske statistikbank.

    Referencer:
    Nordic Statistics Database , www.nordicstatistics.org/statistics (link)
    Danmarks Statistik: “Indvandrere og efterkommere i de nordiske lande”, DSTAnalyse 2018:04 26/3-2019 (link)

  • Kvaliteten af det kinesiske nationalregnskab

    Der er blandt verdens brugere af officiel statistik en kritisk holdning til kvaliteten af den officielle kinesiske statistik. Landets centrale statistikmyndighed anses generelt for kompetent, men der er naturligt nok store vanskeligheder, der skal overvindes, landets størrelse, historie og administrative system taget i betragtning. Hertil kommer, at åbenheden om problemer og metoder er begrænset. Da Kinas stigende rolle i vedensøkonomien, som den bla. viser sig i bruttonationalproduktet (BNP) og andre størrelser fra nationalregnskabet, medfører et øget behov for pålidelig statistik, har flere forskere førsøgt at vurdere størrelsen af de formodede skævheder i den kinesiske statistik, og at udarbejde alternative skøn, der søger at korrigere for disse skævheder.

    Et eksempel er en gruppe forskere — en fra University of Chicago og tre fra Chinese University of Hong Kong — der for nyligt har offentliggjort en kritisk gennemgang af nogle centrale størrelser i det kinesiske nationalregnskab. De kalder ligefrem deres gennemgang for kriminalteknisk (forensic) undersøgelse. Deres fremgangsmåde er. at sammenligne de officielle nationalregnskabstal med andre målinger, som de betragter som mere pålidelige. I tabellen herunder er de officielle opgørelser af Kinas bruttonationalprodukt sammenholdt med ét af forskergruppens skøn.

    Årlig vækst i Kinas bruttonationalprodukt (pct.) siden 2007

    År Officielle data Moms-korrigeret
    2007 23,15 23,15
    2008 18.24 16,25
    2009 9,25 7,92
    2010 18,32 14,99
    2011 18.47 15,43
    2012 10,44 9,86
    2013 10,16 8,77
    2014 8,19 6,48
    2015 7,00 6,20
    2016 7,91 6,62
    Gennensnit 12,00 10,28

    Kilde: Wei Chen Chinese, Xilu Chen, Chang-Tai Hsieh & Zheng (Michael) Song, tabel 2

    Tabellens første kolonne viser den officielle opgørelse af væksten i det kinesiske bruttonationalprodukt (BNP). Den anden viser en skønnet vækst opgjort på grundlag of udviklingen i momsprovenuet.

    De officielle tal er baseret på indberetninger fra de lokale statistikmyndigheder i Kinas provinser. Det er opfattelsen hos de fire forfattere, at de centrale statistikmyndigheder gør sig store anstrengelser for at etablere pålidelige skøn, men at det samme ikke er tilfældet for de provinsernes lokale myndigheder. De er under pres fra lokale administrative myndigheder for at overvurdere væksten i indberetningerne, fordi væksten indgår som en faktor i deres aflønnings- og forfremmelsessystem. Det er de centrale myndigheder fuldt bevidste om, og søger at kompensere for det, ved at justere de indberettede tal nedad ved opgørelsen af Kinas samlede vækst.

    Når det gælder indberetningen af momsprovenuet har de lokale myndigheder ingen interesse i at undervurdere indberetningerne, da de får del i indtægterne. Derfor har de fire forfattere antaget, at man kunne opnå et mere pålideligt skøn, ved at estimere væksten i BNP med udgangspunkt i væksten i momsprovenuet.

    Som det fremgår af tabellen, ligger de momsbaserede skøn lavere end de officielle. Konklusionen er, at de  officielle tal overvurderer væksten i den kinesiske økonomi. Der er stadig tale om en høj vækst, men den gennemsnitlige årlige vækst er ifølge denne beregning overvurderet med 1,7 procentpoint. Set over en tiårig periode betyder det en overvurdering af det samlede BNP på omkring 14 pct.

    Gruppen har også opgjort et alternativt skøn baseret på en model, hvor nationalproduktet bestemmes på grundlag af en række variable uden for nationalregnskabet. De anvendte variable er  det samlede skatteprovenu, eksport, import, forbrug af elektricitet, godstransport på jernbane, nye banklån og nattelys registeret af satellitter. Resultaterne fra de modelbaserede skøn peger i samme retning som de momsbaserede.

    Referencer:
    Wei Chen Chinese, Xilu Chen, Chang-Tai Hsieh & Zheng (Michael) Song: “A Forensic Examination of China’s National Accounts”, Brookings 7/3 2019 (link)
    Dmitriy Plekhanov: “Quality of China’s Official Statistics: A Brief Review of Academic Perspectives”, The Copenhagen Journal of Asian Studies, Vol 35., no 1 (2017) (link)
    The Economist: “China’s economy might be nearly a seventh smaller than reported”, 7/3-2019 (link)

     

  • Arbejdsmarkedsregnskabet

    Arbejdsmarkedet belyses i en række statistikker fra Danmarks Statistik, bl.a  Den Registerbaserede Arbejdsstyrkestatistik (RAS), Fraværsstatistikken, Arbejdskraftundersøgelsen og Lønstrukturstatistikken. Hver af disse statistikker tjener et formål, men da de er forskellige med hensyn til populationsafgrænsning og begrebsdefinitioner, kan det være vanskeligt at danne sig et samlet overblik. Derfor har Danmarks Statistik etableret to såkaldt integrerede arbejdsmarkedsstatistiske systemer — Arbejdsmarkedsregnskabet (AMR) og Arbejdstidsregnskabet (ATR) — der skal bidrage til et samlet overblik. AMR belyser befolkningens tilknytning til arbejdsmarkedet, og ATR belyser den samlede mængde udført arbejde, målt i timer. I dette indlæg giver jeg en kort beskrivelse af AMR. En tilsvarende beskrivelse af ATR følger senere.

    En meget summarisk sammenfatning af AMR’s opgørelse af befolkningens arbejdsmarkedstilknytning er vist i tabellen nedenfor. I statistikbanken findes en betydeligt mere detaljeret opgørelse.

    Befolkningens tilknytning til arbejdsmarkedet, 2016

    Tilknytning til arbejdsmarkedet 1000
    fuldtids-personer
    I arbejdsstyrken I beskæftigelse 2.292
    Arbejdsløs 106
    Uden for arbejdsstyrken Midlertidigt uden for arbejdsstyrken 242
    Pensionist 1.291
    Under uddannelse 1.085
    Barn/Ung (ikke under uddannelse) 375
    Uden for arbejdsstyrke i øvr. 328
    Befolkningen i alt 5.719

    Kilde: Danmarks Statistik, Statistikbanken/AMR1

    Tilknytningen til arbejdsmarkedet opgøres i AMR i fuldtidspersoner. Hver person forudsættes at have 37 timer pr. uge til rådighed for enten beskæftigelse eller for aktivitet uden for arbejdsstyrken. En person, der i den seneste uge har været i beskæftigelse i 37 timer eller mere indgår i kategorien I beskæftigelse som én fuldtidsperson. Har personen været beskæftiget i mindre end 37 timer indgår han med en andel, svarende til den andel beskæftigelsen udgør af du 37 timer. Den resterende andel henføres til en eller flere af de øvrige kategorier. Kun personer med mindre end 37 timers beskæftigelse indgår i de øvrige kategorier og hver person indgår samlet med én fuldtidsperson, også selv om personen har væretbeskæftiget i mere end 37 timer. Det samlede antal fuldtidpersoner er derfor identisk med det samlede folketal.

    AMR er dannet ved integration og harmonisering af data fra en række af Danmarks Statistiks registre, bl.a. Erhvervsregistret, Indkomststatistikken, Befolkningsregistret og Elevregistret. Hele befolkningen indgår, og hver persons  arbejdsmarkedstilknytning kan opgøres på et vilkårligt tidspunkt. Det gør registret til et stærkt redskab til detaljerede forløbsopgørelser.

    I sig selv fylder AMR ikke meget i Danmarks Statistiks løbende publicering. Blot to tabeller  i statistikbanken. Til gengæld udgør AMR grundlaget for nogle af de centrale arbejdsmarkedsstatistikker som Den Registerbaserede Arbejdsstyrkestatistik (RAS), Erhvervsbeskæftigelsen (EBS) og Arbejdstidsregnskabet (ATR). Det er dog en såkaldt ikke time-normeret version af AMR, der her anvendes. I den ikke time-normerede version begrænses en persons aktiviteter ikke til 37 ugentlige timer. AMR’s muligheder som forløbsregister udnyttes bla. i den registerbasrede opgørelse af unge der hverken er i beskæftigelse eller under uddannelse (NEET-indikatoren), se tidl. indlæg.

    Begrebet fuldtidsperson er et specifikt dansk fænomen, så der er ingen muligheder for internationale sammenligninger. Heller ikke de statistikker, som anvender AMR som kilde er altid velegnede til internationale sammenligner. Generelt gælder det, at ved internationale sammenligninger af tilknytning til arbejdsmarkedet er Arbejdskraftundersøgelsen,  der er en fælles EU-undersøgelse, bedre egnet.

    Reference:
    Danmarks Statistik: “Statistikdokumentation for Arbejdsmarkedsregnskab 2015” (link)

  • Unge, der hverken er i beskæftigelse eller under uddannelse (NEET-indikatoreren)

    Blandt de mange aspekter i et godt ungdomsliv skal gerne indgå en forberedelse til et fremtidigt erhvervsliv. I statistikken skal det bl.a. give sig udslag i at unge mennesker enten er registreret som værende i beskæftigelse eller under uddannelse. Det er de fleste unge også, men der er en lille gruppe, som ikke er. Internationalt anvendes den engelske forkortelse NEET (Not in Employment, Education or Training) om denne gruppe. Danmarks Statistik har tilsyneladende opgivet at finde en dansk betegnelse og anvender i sine offentliggørelser også betegnelsen NEET.

    EU har opgjort NEET-indikatoren siden 2006. I figuren nedenfor er vist resultaterne for 2017. NEET-gruppen er i EU-opgørelserne afgrænset til personer mellem 15 og 24 år, der i referenceugen ikke var i beskæftigelse og heller ikke i de seneste fire uger havde været i uddannelse eller træning (formel eller uformel) . 

    Andel af unge (15-24 år), der hverken er i beskæftigelse eller under uddannelse i EU-landene, 2017

     Kilde: Eurostats statistikbank lfsi_neet_aGrafik: Veusz

    Der er ganske store forskelle mellem EU-landene. Nederlandene ligger lavest med 4 pct. og Italien højest med 20 pct. Generelt er problemet størst i Syd- og Østeuropa 

    EU-opgørelsen af NEET-indikatoren er baseret på de kvartalsvise stikprøvebaserede arbejdsstyrkeundersøgelser. Som EU-medlem deltager Danmark naturligvis i disse undersøgelser, men til nationalt brug — dvs. når international sammenlignelighed ikke er vigtig — anvendes en NEET-indikator, baseret på det registerbaserede arbejdsmarkedsregnskab (AMR), frem for arbejdsstyrkeundersøgelsens opgørelse. AMR giver langt bedre muligheder for forløbsundersøgelser og for detaljerede opdelinger af populationen end arbejdsstyrkeundersøgelsen. Til gengæld må begreberne tilpasses de begrænsninger, der kan ligge i registrene.

    For den registerbaserede NEET-indikator betyder tilpasningen, at begrebet i under uddannelse defineres lidt mere snævert, idet kun formel uddannelse indgår. Registrene giver nemlig ikke mulighed for at opgøre uformel uddannelse. NEET-gruppen i AMR er således større end i arbejdsstyrkeundersøgelsen, og værdien af NEET-indikatoren derfor højere. Dertil kommer, at man i AMR afgrænser gruppen af unge til 16-24 årige og altså udelader de 15-årige. Det skyldes, at man i dansk statistik traditionelt afgrænser arbejdsstyrken til personer i aldersgruppen 16-64 år. Af hensyn til konsistensen med den øvrige arbejdsmarkedsstatistik har men derfor valgt at udelade de 15-årige fra NEET-gruppen.

    De særlige muligheder for detaljeret statistik i AMR har Danmarks Statistik bl.a udnyttet til en sammenligning af NEET-indikatoren for hhv. unge af dansk oprindelse og unge efterkommere fra ikke-vestlige lande. Nogle hovedresultater er vist i tabellen nedenfor.

    Registerbaseret NEET-indikator for Danmark 2017.

      Mænd Kvinder
    Dansk oprindelse Efterkommer1 Dansk oprindelse Efterkommer1
    16-19 år 6,1% 9,2% 5,6% 5,7%
    20-24 år 12,8% 20,7% 11,6% 13,9%
    16-24 år 9,9% 15,1% 9,0% 9,9%
    25-29 år 13,8% 23,4% 15,8% 23,7%

    Note: 1Fra ikke-vestlige lande
    Kilde:
     Dannarks Statistik:  “Indvandreres og efterkommeres tilknytning til arbejdsmarkedet nov. 2017”  Excell-fil (link)

    Danmarks Statistik har også benyttet registerstatistikkens muligheder til at udvide den belyste population til også at omfatte aldersgruppen 25-29 år. Som det fremgår af tabellen er forskellene mellem efterkommere og unge af dansk oprindelse større i denne aldergruppe end i den traditionelle NEET-population, navnlig for kvindernes vedkommende. Mere detaljerede resultater kan findes i en Nyt-artikel om emnet (link) og i et Excel-rgneark knyttet til Nyt-artiklen (link)

    Referencer:
    Danmarks Statistik: “Metodenotat — registerbaseret NEET-indikator“, 26/4-2017 (link)
    Dannarks Statistik:  “Efterkommere er oftere ikke i uddannelse eller job”, Nyt 25/2-2019, nr 69 (link)
    Dannarks Statistik:  Indvandreres og efterkommeres tilknytning til arbejdsmarkedet nov. 2017″  Excell-fil (link)

  • Ny undersøgelse af den danske befolknings kulturvaner

    Danmarks Statistik har påbegyndt offentliggørelsen af en ny kulturvaneunderøgelse for perioden 2018-2020. Den nye undersøgelse omfatter 8 kvartaler (3. kvartal 2018 til 2. kvartal 2020). De nu offentliggjorte resultater vedrører 3. og 4. kvartal 2018. Statistiske undersøgelser af den danske befolknings kulturvaner har været gennemført siden 1964, med med intervaller på mellem fem og tolv år, men det har været kulturministeriet, der stod for undersøgelserne. Den seneste af kulturministeriets undersøgelser er fra 2012.

    Det er et meget omfattende kulturbegreb, der anvendes i undersøgelsen. Det omfatter ikke blot traditionelle kulturaktiviteter som litteraturlæsning og koncert- og teaterbesøg men også fritids- og medievaner, herunder motion og brug af digitale spil. De nu offentliggjorte resultater vedrører voksne (16 år og ældre), men undersøgelsen omfatter også børns kulturvaner. Resultater fra børneundersøgelsen vil dog tidligst blive offentliggjort i slutningen af 2019.

    Andel af befolkningen, fordelt på alder, der indenfor de seneste tre måneder har deltaget i udvalgte kulturaktiviter. 4. kvartal 2018

    16-24 år25-34 år35-44 år45-54 år55-64 år65-74 år75 år og deroverAlle
    Opsøgt billedkunst4939353544484541
    Dyrket motion9483838080898384
    Læst eller lyttet til skønlitteratur6057596261696261
    Brugt digitale spil8064584640392552
    Været (fysisk) på biblioteket5144453936464042
    Været på bibliotekets digitale tjenester3732332723281929
    Læst eller lyttet til faglitteratur7161616364585062

    Kilde: Danmarks Statistikbank/KVUHYP01 (link)

    I tabellen ovenfor er vist nogle hovedresultater omkring kulturvaner i forskellige aldersgrupper. Den mest markante forskel mellem aldersgrupperne finder man i brugen af digitale spil, hvor de yngste helt dominerer.

    Den nye kulturvaneundersøgelse afviger på flere punkter fra de tidligere, så umiddelbar sammenligning er ikke mulig. Til gengæld er begreberne i den nye undersøgelse søgt tilpasset FN’s retningslinier. Det betyder bedre international sammenlignelighed.

    Referencer:

    Danmarks Statistik: “Halvdelen af danskerne spiller digitale spil”, Nyt 1/3-2019 nr. 79 (linindenfor k)
    Danmarks Statistik: “Statistikdokumentation for Kulturvaneundersøgelsen 2018” (link)

  • Registrering af illegal aktivitet i nationalproduktet

    I nationalregnskabets definition af værditilvæksten (nationalproduktet) har det ingen betydning, om aktiviteten bag produktionen er lovlig eller ej. Hæleri og salg af smuglergods indgår derfor principielt i produktionen på lige fod med legal handel. Det er dog et krav, at der bag aktiviteten ligger frivillige transaktioner. Slavehandel kan derfor ikke indgå i nationalproduktet.

    En anden ting er, at illegale aktiviteter kan være vanskelige at belyse i statistikken, så i praksis kan man ikke regne med at aktiviteter i forbindelse med illegal produktion altid indgår. I forbindelse med den seneste revision af de internationale retningslinier for opgørelse af nationalregnskaber besluttede EU-landene dog, at tre typer af aktivitet — prostitution, narkotikahandel og smugleri — altid skal indgå , uanset om aktiviteten er lovlig eller ej. Mangler man statistik på området (og det gør man) må man basere opgørelsen på skøn.

    Men prostitution, narkotikahandel og smugleri udgør kun en del af den samlede illegale aktivitet. I en artikel i Eurostats tidsskrift, Eurona (Icho Bechev, 2018) opregnes seks andre aktiviteter, der med god ret kunne inddrages, sammen med nogle overvejelser om aktiviteternes økonomisk betydning og de praktiske muligheder for at inddrage dem i statistikken. De seks punkter er:

    1. Ulovlig våbenhandel
    2. Handel med tyvekoster
    3. Smugling af migranter
    4. Forfalskning af varer og piratkopiering
    5. Bestikkelse
    6. Ulovligt spil

    Tjenester i forbindelse med hvidvaskning af penge er udeladt af listen med henvisning til, at emnet er så komplekst, at det fortjener en særskilt undersøgelse.

    Ikke alle seks punkter er lige betydningsfulde. Det antages i artiklen, at ulovligt spil er det økonomisk set vigtigste af punkterne.  På den anden side skønnes ulovlig våbenhandel at have en ringe udbredelse i Europa.

    I dette indlæg har fokus været på værditilvæksten. Men nationalnalregnskabet omfatter mange andre poster og i Bechev’s artikel er de illegale transaktioners betydning for disse andre poster også behandlet.

    Referencer:
    lcho Bechev: “Expanding the coverage of illegal economic activities in national accounts”, Eurona 2/2018 (link)

  • Sammenligning af web-skemaer og telefoninterviews som dataindsamlingsmetode

    Udbredelsen af internettet gør det oplagt, at statistikproducenter må overveje at anvende web-skemaer — hvor respondenten bevarer spørgsmålene på sin computer uden medvirken af en interviewer — som alternativ til traditionelle telefoninterviews. I mange tilfælde kombinerer producenten de to metoder. Det rejser naturligt spørgsmålet om metoderne giver samme resultat.

    Det gør de nok i nogle tilfælde — måske også i de fleste tilfælde — men de gør det ikke altid. Pew Research Center præsenterer i en ny YouTube-video et kort redegørelse for forskellene mellem de svar, der modtages ved anvendelse af web-skemaer og de svar, der modtages i telefoninterviews. I en rapport fra 2015, har de leveret en mere dybtgående analyse af forskellene. Rapporten er baseret på besvarelser af det samme spørgeskema fra to grupper — en der blev interviewet telefonisk, og en der besvarede et web-skema. I hver gruppe indgik ca. 1500 personer.

    Hovedbudskabet er, at ved de fleste typer af spørgsmål er der kun små forskelle mellem resultaterne fra de to metoder. Men undersøgelsen viser også, at navnlig ved tre typer af spørgsmål har interviewformen afgørende betydning. Det gælder nogle, men ikke alle, spørgsmål om livskvalitet, helbred og finansielle problemer, spørgsmål om social diskrimination og spørgsmål om vurderingen af  politikere. Ved telefoninterviews var respondenterne mere  tilbøjelige til at udtrykke tilfredshed med livskvalitet, helbred og finansiel situation, mere tilbøjelige til at se diskrimination som et problem, og mere tilbøjelige til at udtrykke stærkt negative holdninger til politiske modstandere.

    Karakteristisk for de spørgsmål,  hvor forskellene i svar er størst, er at der kan indgå et element af social eller politisk korrekthed i opfattelsen af svarende. Ved telefoninterviews, hvor der er direkte kontakt med intervieweren bliver svarene mere socialt og politisk korrekte, end ved web-baserede interviews, hvor den interviewede er alene. Tendens til skævhed i besvarelser i retning af det socialt accepterede eller forventede er et velkendt problem i spørgeskemabaseret statistik, og det er ikke så overrakende, at skævheden bliver større, når der er direkte kontakt til en interviewer. Men det er også et vigtigt resultat af Pew’s undersøgelse, at ikke alle typer spørgsmål er belastet af denne tendens.

    Tendensen til socialt acceptable svar er den klart vigtigste kilde til forskelle i undersøgelsen, men Pew understreger, at der er andre. F,eks. er der en tendens til, at den interviewede når han præsenteres for en række svarmuligheder, vil vil vælge det sidste af de opstillede alternativer ved et telefoninterview og det første ved web-undersøgelser, hvor han sidder med spørgeskemaet foran sig. 

    Pew antager, bl.a. på baggrund af andre undersøgelser, at de observerede forskelle i besvarelser ved de to metoder kan tilskrives, at der svares mere ærligt, når der ikke en interviewer indblandet. Svarene fra web-skemaerne er med andre ord af bedre kvalitet. Da metoden også er billigere at gennemføre end telefoninterviews, er der gode grund til at anvende den. Men ikke alle har adgang til internet og er villige til at besvare web-skemaer. Derimod har stort set alle adgang til telefon og villigheden til at deltage i telefoninterviews er større. Det betyder, at undersøgelser baseret på telefoninterviews er mere repræsentative end web-undersøgelser. Den mulige kvalitetsgevinst ved mere ærlige svar i web-undersøgelserne må derfor holdes op mod det mulige tab i repræsentativitet.

    Referencer
    Pew Research Center: 
    “Phone vs. online surveys: Why do respondents’ answers sometimes differ by mode?”,  YouTube 7/2-2019 (link)
    Pew Research Center: “From Telephone to the Web: The Challenge of Mode of Interview Effects in Public Opinion Polls”, 13/5-2015 (link)

     

  • Statistisk selvforsvar — Hvordan beskytter man sig mod vildledende statistik?

    Statistik er en tillidssag. Det har jeg ofte påpeget i denne blog. Det er derfor altid vigtigt at vide, hvem der har produceret en statistik, og at vurdere producentens troværdighed, før man for alvor begynder at anvende den. Men selv om en statistik er  produceret af en yderst pålidelig producent, og der ikke kan sættes en finger på dens grundlæggende kvalitet, så kan den blive præsenteret i en form, der gør den mere vildledende end informativ. Den nederlandske journalist, Sanne Blauw, giver i en YouTube video en række råd til brugere af statistik om, hvordan man kan undgå at blive ført bag lyset af en vildledende præsentation. Statistisk selvforsvar kalder hun det.

    Blauw tager udgangspunkt i fem kategorier af  — bevidst eller ubevidst — statistisk vildledning, og giver eksempler på hver af dem. Om alle eksemplerne er lige velvalgte er åbent for diskussion, men det er uden betydning for relevansen af hendes advarsler. Og gennemgangen er ganske underholdende.

    De fem vildledningskategorer er:

    Den overbevisende graf
    (The good-looking graph)
    Grafer, der ved første øjekast virker overbevisende, men som ved nærmere eftersyn viser sig at være misvisende
    Den misvisende måling
    (The polluted poll)
    Målinger baseret på små stikprøver, lav besvarelsesprocent, og komplicerede spørgsmål,  der bliver  formidlet, uden at der redegøres for de nødvendige forbehold.
    Det overmodige decimalkomma
    (The overconfident decimal point)
    Præcisionen i statistiske opgørelse overvurderes. Det gælder specielt foreløbige opgørelser, der offentliggøres kort efter udløbet af den periode, de vedrører.
    Den ikke så spektakulære statistik
    (The not so spectacular statistic)
    Statistiske resultater, der bringes uden at blive vurderet i en sammenhæng, kan virke mere spektakulære, end de i virkeligheden er
    Den overfortolkede sammenhæng
    (The cocky correlation)
    En sammenhæng mellem to variable (korrelation) betyder ikke nødvendigvis en årsagssammenhæng (kausalitet)

    På sin hjemmeside præsenterer Sanne Blauw sig som talkorresondent (numeracy correspondent) for den nederlandske nyhedsplatform De Correspondent. De Coorrespondent er en alternativ journalistisk platform, der i sin formidling lægger mere vægt på indhold og sammenhæng end på det seneste døgns mere eller mindre tilfældige begivenheder. De dækker klimaet, men ikke vejret, som de selv udtrykker det. Reglerne for platformens virke er fastlagt i ti principper, der udover det allerede nævnte om vægt på indhold, bl.a. omfatter annoncefrihed, fokus ikke blot på problemer, men også på løsninger, og åbenhed om kilder. Det økonomiske grundlag stammer fra netværksfinansiering (crowdfunding)  og salg af  medlemskaber (abonnementer). Artiklerne er fortrinvis på nederlandsk, men en engelsksproget udgave er under forberedelse med planlagt start i midten af 2019.

    Referencer:
    Sanne Blauw: “How to defend yourself against misleading statistics in the news”, YouTube (link)
    Sanne Blauw: Hjemmeside (link)
    De Correspondent: Hjemmeside (link)