Kategori: Statistikkvalitet

  • Den officielle statistiks rolle i et digitaliseret og globaliseret samfund

    Vilkårene for de officielle statistikmyndigheders arbejde er i hastig forandring, især drevet af digitataliseringen og globaliseringen. Digitaliseringen giver nye muligheder, men rejser også store forventninger hos brugerne, og globaliseringen påvirker både det forventede/krævede indhold af statistikken og sætter nye rammer for produktionen. En tidligere generaldirektør for Eurostat — EU’s statistiske kontor — Walter J. Radermacher har i en interessant artikel gjort sig nogle overvejelser over både karakteren af udfordringerne og de mulige måder at håndtere dem på.

    Forståeligt nok ønsker politikere og andre beslutningstagere at udnytte de store mængder information, der — bl.a. som følge af digitaliseringen  — er til rådighed. Forskellige betegnelser, f.eks, “evidensbaseret beslutningstagning”, “data for politics” og  “governing by the number” har været anvendt om den type bestræbelser. Emnet er meget omfattende og berører mange former for informationssøgning og -behandling. Den officielle statistik er blot et af elementerne, men dog et af de væsentlige.

    Et af de markante træk i udviklingen i offentlig administration i de senere år  har været en privatisering af funktioner, der traditionelt har været anset for en del af det offentlige system. Postvæsen jernbaner og radio og TV er eksempler. Men det er også markant, at privatisering af den officielle statistik ikke har været forsøgt, og der er heller ikke er udsigt til, at det vil ske. Der ser ud til at være en generel erkendelse af, at den traditionelle officielle statistik er en vigtig del af et moderne samfunds infrastruktur. Eller sagt på en anden måde: der er forventninger til at den officielle statistik kan yde et vigtigt bidrag til til den information, beslutningstagerne har brug for. Det centrale spørgsmål er så, hvori forventningerne mere præcist består, og hvordan statistikmyndighederne kan leve op til disse forventninger. Radermacher søger at finde svaret ved at analysere den officielle statistiks fumktion og vilkår, både i et historisk og et nutidigt perspektiv og i lyset af nogle forventninger omkring den fremtidige udvikling.

    En af de vigtigste opgaver statistikmyndighederne skal løse er at sikre opretholdelse (eller måske i nogle tilfælde genoprettelse) af tilliden til den officielle statistik i en tid, hvor tilliden til autoriteter er faldende. En offentlig statistikmyndighed skal levere fakta, og det er i den forbindelse efter Radermachers opfattelse vigtigt at gøre sig klart, at fakta er et resulatat af en proces, dvs. at fakta er noget, der produceres. Råvaren for faktaproduktionen er data. Data kan f.eks. bestå i digitale registreringer, der kan være meget omfattende, men som ikke er direkte anvendelige som grundlag for beslutninger. De skal først omformes til fakta gennem en proces, der kan være både meget ressourcekrævende, herunder meget vidensintensiv. Men det er fakta — ikke data — der efterspørges af beslutningstagerne.

    En konsekvens af at fakta er produceret er at de som alle andre produkter kan være af forskellig kvalitet og normalt ikke kan være fuldkomne. Fakta er med andre ord ikke lig med sandheden. I det hele taget er sandhed ikke efter Radermachers opfattelse et hensigtmæssigt begreb i denne sammenhæng. Det hensigtsmæssige begreb er kvalitet. Fakta af høj kvalitet er ønskelige, og de fremkommer gennem en produktionsproces, der opfylder en række kvalitetskrav. Men de er aldrig perfekte, og det er heller ikke tilstræbt at gøre dem perfekte. Kvaliteten er et resultat af de ressourcer, der er anvendt på at producere dem, og indsatsen af ressurcer sker efter en afvejning af ønsket om høj kvalitet og begrænsning af produktionsomkostningerne. I sidste ende er denne afvejning en politisk beslutning. En af Radermachers bekymringer er, at der opbygges store forventninger til omfanget af de fakta, der kan leveres på grundlag af de enorme datatmængder den digitale udvikling skaber, men at forståelsen af kvalitetskravene og de omkostninger der er forbundet med høj kvalitet, ikke helt kan følge med. At der altså kan opstå forventninger om en både omfattende og billig statistik, som statistikmyndighederne ikke samtidig kan leve op til. Et dilemma, der helt sikkert  kan genkendes af mange andre institutioner.

    Et gennemgående træk i Radermachers overvejelser er en konstatering af at faktaproduktion er en omfattende proces der involverer mange typer af ressourcer og mange fag- og brugergrupper. Det bliver derfor vigtigt på produktionssiden både at forbedre eksisterende modeller for samarbejde mellem faggrupper og at udvikle nye. Men også i beslutningsprocessen er det nødvendigt med øget inddragelse af brugerne for at sikre, at forventningerne både til omfang og kvalitet er realistiske, og at de i videst muligt omfang opfyldes.

    Radermacher har øje for, at statistikmyndighederne er helt bevidste om både de mange krav og de mange muligheder, og også har iværksat initiativer der udnytter og udforsker mulighederne. Men en stor indsats er også nødvendig. Mister brugerne tilliden til kvaliteten af den officielle statistik bliver den irrelevant og vil ikke kunne overleve, samtidig med at de problemer, som den skulle  bidrage til at løse ikke bliver mindre. Samfundet får svært ved at undvære den officielle statistik, så det er et stort ansvar, der hviler på statistikmyndighederne.

    Referencer:
    Walter J. Radermacher : “Governing-by-the-numbers/Statistical governance: Reflections on the future of official statistics in a digital and globalised society”, Statistical Journal of the IAOS 35 , 2019 (link)

  • Retssagerne mod Andreas Georgiou — tidligere græsk statistikschef

    Græsk statistik har ikke noget godt ry. Tilbage i 2010 leverede EU-kommisionen en sønderlemmende kritik af den officielle græske statistik, og krævede en revision af både metoder og organisation. Den græske regering udpegede Andreas Georgiou — en velrennomeret økonom, der på det tidspunkt arbejdede for IMF — til at stå for genopretningen. Den gennemførte han med stor succes, og på forholdsvis kort tid fik han genskabt den internationale tillid til den officielle græske statistik. Det var af stor betydning, da de græske statsfinanser på det tidpunkt var i en kritisk forfatning og landet lå i vanskelige forhandlinger med sine debitorer. Debitorerne krævede etablering af en pålidelig statistik som en af betingelserne for at yde hjælp.

    Men hvor George Georgiou høstede megen international anerkendelse for sin indsats, så var den gæske reaktion noget anderledes. En del af prisen for den ganskabte tillid til statistikken var, at den skulle være pålidelig, og at det ikke måtte være muligt for regeringen at  manipulere den. Det er et grundlæggende krav i både EU’s lovgivning og i FN’s retningslinier omkring officiel statsitik, men grækerne så det som en indskrænkning af de redskaber, de havde til rådighed i internationale forhandlinger. De mente, at de kunne have opnået bedre hjælpeaftaler hvis man — i strid med EU-reglerne — havde pyntet lidt på de officielle statistikker. Georgiou blev derfor opfattet som en forræder, der havde skadet Grækenlands nationale interesser.

    Det førte til, at der blev rejst en række retsager  mod ham. Sagerne har tidligere været behandlet i denne blog (16/10-2018 og 15/8-2017). En række statistiske institutioner har udtrykt støtte til Gerogiou, og i november 2019 har American Statistical Association (ASA) udsendt en ny støtteerklæring, der opfordrer den nye gæske regering til at råde bod på den uretfærdige behandling, Georgiou har været udsat for . Det er dog ikke sandsynligt, at det vil ske. Medlemmer af premierminister Mitsotakis’ parti, Nyt Demokrati, som har en stor del af ansvaret for landets finansielle sammenbrud og manipulationen med statistikken, har været ivrige fortalere for retsforfølgelsen af Georgiou.

    I en af sagene er han idømt to års betinget fængsel for pligtforsømmelse. Forseelsen bestod i, at han havde indberettet data til EU, uden først at have forelagt dem til godkendelse i statistikbureauets ledelse. Gorgious fremgangsmåde var i fuld  overensstemmelse med EU’s regler om chefstatistikerens rolle i forbindelse med sikringen af den officielle statistiks uafhængighed, som også Grækenland er forpligtet til at overholde. I en anden sag, et privat søgsmål om æreskrænkelse, er han dømt til at betale erstatning og at offentliggøre en undskyldning. Sagen er  rejst af Georgious forgænger som statistikchef, der føler sig krænket over Georgious udtalelser om den tidligere statistiske praksis. Sandheden i Geogious udtalelser er ikke anfægtet, men  græsk lov gør det muligt at sagsøge for æreskrænkelse, selvom de krænkende ytringer er i overensstemmelse med sandheden. Denne sag er appeleret og er for tiden under behandling af en appeldomstol. Herudover verserer yderligere to kriminalsager i systemet.

    Referencer:
    American Statisticel Association: “ASA Issues New Statement of Support for Greek Statistician Andreas Georgiou”, (link)
    American Statisticel Association: “
    Eight Years of Government Persecution of Greek Statistician” (link)
    Miranda Xafa: “A Statistician’s Ordeal – The Case of Andreas Georgiou“, World Economics vol 20 No  3 July-Sept  2019 (link)
    Miranda Xafa: A Statistician’s Prosecution For Slander”, World Economics 16 Januar 2020 (link)
    European Commision: “Report on Greek Government Deficit and Debt Statistics”, Brussels 8/1-2010 (link)

  • Nationernes statistiske kapacitet

    For brugere af officiel statistik er det afgørende at kunne stole på, at statistikproducenten har viljen og evnen til at levere statistik af tilstrækkelig høj kvalitet. FN’s “Fundamentale Principper for Officiel Statistik” stiller krav om, at statistikproducenterne skal oplyse om deres kilder, metoder og procedurer, således at en bruger kan vurdere, om kvaliteten er tilstrækkelig til hans formål. For de fleste brugere vil det dog, selvom den nødvendige information er tilgængelig, være en stor og uoverskuelig opgave, selv at skulle foretage en grundig vurdering.

    Heldigvis kan brugerne finde støtte i de vurderinger centrale statistikbrugere som EU og Verdensbanken stiller til rådighed. For EU-landene har EU’s statistiske kontor — Eurostat —  offentliggjort detaljerede rapporter, de såkaldte peer reviews, for alle medlemslande, og verdenbanken har beregnet og offentliggjort et kapacitetsindeks (Statistical Capacity Index, SCI) for en række lande.

    Eurostats peer reviews er baseret på en grundig gennemgang af hvert lands statistiske system, hvor en lille gruppe eksperter, i samarbejde med landets statistiske myndigheder, undersøger og vurderer alle væsentlige aspekter af systemet. De resulterende rapporter er grundige, men systemet er kostbart og tidskrævene, så der går flere år mellem hver vurdering. Den seneste række af landerapporter er udarbejdet i perioden 2013-2015, og erstatter rapporter fra perioden 2006-2008.

     Verdensbankens SCI-indeks er baseret på en simplere metode, baseret på offentligt tilgængelige data. Det muliggør beregning af indeks hvert år, således at indekset kan anvendes som indikator for den løbende udbygning af et lands statistiske kapacitet, hvilket også er et af formålene. I teorien kunne indekset beregnes for alle lande, men er i praksis kun beregnet for 146  fortrinsvis lav- og mellemindkomstlande.

    SCI blev udviklet i 2004. Siden da har kravene til den officielle statistikproduktion ændret sig, bl.a som følge af globalisering og fremkomsten af nye datakilder, nye beregningsmetoder og nye præsentationsformer. Det har ført til overvejelser om en revision af SCI, og i et arbejdsnotat fra Verdensbanken præsenteres et forslag til et nyt indeks, Statistical Performance Index (SPI). Det planlagte nye SPI-indeks adskiller sig fra det hidtidige SCI-indeks bl.a. ved at  inddrage flere dimensioner og omfatte flere lande, herunder også højindkomstlande.  

    Referencer:
    Michael M. Lokshin, Hai-Anh H. Dang, James Foster, Mustafa Dinc og Grant J. Cameron:
    Measuring the Statistical Capacity of Nations”, WORLD BANK…BLOGS, 5/2-2019 (link)
    Grant J. Cameron, Hai-Anh H. Dang, Mustafa Dinc, James Foster og Michael M. Lokshin: 
    “Measuring the Statistical Capacity of Nations”, World Bank Group, Policy Research Working Paper 8693, januar 2019 (link)
    UN Statistics Division: “Fundamental Principles of Official Statistics”, E/RES/2013/21 (link)
    Eurostat: “Peer Reviews in the European Statistical System”, (link)
    The World Bank: “Data on Statistical Capacity”, (link)

     

  • Differential privacy i den amerikanske folketælling

    Som omtalt i mit tidligere indlæg om differentiel privacy (link) har man i USA besluttet, at differential privacy (i det følgende kaldet DP) skal være grundlaget for fortrolighedsbeskyttelsen i den amerikanske folketælling for 2020.  Den beslutning har stillet Folketællingsbureauet (Census Bureau) over for en række udfordringer. Bureauets afdelingsdirektør for forskning og metode — John Abowd — har i et foredrag offentliggjort på YouTube leveret nogle overvejelser omkring disse udfordringer. Han har også sammen med  Simson L. Garfinkel og Sarah Powazek lidt dybere redegjort for udfordringerne i artiklen Issues Encountered Deploying Differential Privacy“.

    DP er et ret nyt forskningsobjekt — de første artikler om emnet udkom i begyndelsen af dette årtusind —  så en af udfordringerne har været, at finde kvalificeret personale og egnede redskaber bl.a i form af programmel og matematiske metoder. I det omfang programmel og metoder eksisterer, har de vist sig ikke umiddelbart at kunne opfylde bureauets konkrete behov, så udviklingen af nye metoder er også en udfordring. Men den største udfordring er efter Abowds opfattelse at få brugerne til at forstå, at de nye offentliggørelsesprincipper, som bliver følgen af DP, i mange tilfælde kræver, at de de hidtil anvendte modeller, værktøjer og metoder må ændres.

    Det er et centralt led i en DP-baseret fortrolighedpolitik, at den samlede information, der kan offentliggøres på grundlag af en given database, i dette tilfælde folketællingsresultaterne, må begrænses. Det kan ske ved lægge loft over omfanget af data , der offentliggøres, eller ved af mindske præcisionen i offentliggørelserne. Præcisionen mindskes ved de tal der offentliggøres afviger lidt fra de faktisk opgjorte tal. Det kaldes at indlægge støj i opgørelserne. I praksis vil en kombination af de to metoder blive anvendt

    Hvor megen information, der tillades udtrukket af databasen, skal afgøres på forhånd ud fra en afvejning mellem risikoen for fortrolighedsbrud og ønsket om mest mulig information. Det er en politisk og ikke en teknisk afvejning, så den afgørelse vil blive truffet i en politisk beslutningsproces. Resultatet bliver et informationsbudget, som herefter skal fordeles mellem forskellige anvendelser. Det kan næppe undgå at give konflikter mellem forskellige brugerinteresser. Det vil nok også skabe utilfredshed hos brugerne, at deres hidtidige metoder og programmer skal tilpasses.  F.,eks. vil mikrodatasæt ikke nødvendigvis kunne leveres i den hidtidige form.

    Referencer:
    Simson L. Garfinkel, John M. Abowd og Sarah Powazek:  “Issues Encountered Deploying Differential Privacy”, arXiv:1809.02201v1 [cs.CR] 6 Sep 2018 (link)
     John M. Abowd: “
    Stepping-up: The Census Bureau Sets an Example of How to Be a Good Data Steward in the 21st Century”, YouTube (link) 

  • Offentliggørelse af usikkerhed i officiel statistik — COMUNIKOS-projektet

    Resultatene fra en officiel statistisk opgørelse præsenteres sædvanligvis som en række observationer, f.eks antal personer og gennemsnitlig indkomst, vedrørende en række klart afgrænsede delpopulationer, f.eks. aldersgrupper. I enkelte tilfælde bliver der i forbindelse med offentliggørelsen leveret nogle oplysninger omkring usikkerheden på opgørelserne, og i dokumentationen af statistikkerne findes altid en vurdering af usikkerheden. Denne vurdering er dog oftest ret generel og holdt i vage vendinger. Der er ikke tradition for en systematisk, formaliseret og standardiseret præsentation af usikkerheden i statistiske opgørelser.

    Med henblik på dels at skabe bedre overblik over eksisterende metoder og praksis for præsentation af usikkerheden i opgørelse af officiel statistik, og dels at vurdere mulighederne for forbedringer i præsentationen, er der i EU-regi blevet etableret et projekt under overskriften “Communicating Uncertainty in Key Official Statistics” — forkortet COMUNIKOS. Som pilotprojekt er valgt opgørelsen af forbrugerprisindeks på grundlag af scannerdata. Projektet forventes afsluttet i juni2020 og resultaterne vil løbende blive rapporteret.

    Referencer:
    EU: “Conunikos-projektets hjemmeside” (link)

  • Differentiel privacy som grundlag for beskyttelse af statistisk fortrolighed

    Det er et centralt krav til den officielle statistik at den skal levere pålidelige og detaljerede data til alle brugere. Det er også et centralt krav, at den skal sikre statistisk fortrolighed, herunder beskyttelse af dataleverandørernes identitet. Kravene fremgår bla. af EU’s Adfærdskodeks for Europæiske Statistikker. De to krav kan stride imod hinanden, så ved offentliggørelse må der foretages en afvejning af de to krav. I praksis har man hidtil løst problemet ved simple metoder, som at undlade offentliggørelse af celler i tabeller, hvis cellen kun omfatter meget få enheder, eller ved at anonymisere mikrodata, før de stilles til rådighed for forskere.

    De simple metoder har været anset for tilstrækkelige, fordi det er blevet betragtet som utænkeligt, at nogen ville forsøge at udlede beskyttede data fra statistikkerene ved at kombinere forskellige opgørelser fra den samme kilde. Ikke fordi det i princippet var umuligt, men fordi det ville kræve så omfattende ressourcer, bl.a.  i form af computerkraft, at ingen ville finde det umagen værd.

    Det er ikke nødvendigvis tilfældet længere. Computerkraft er blevet billigere og blandt producenter af statistik har den erkendelse bredt sig, at der nu er en seriøs risiko for alvorlige angreb på statistikkernes fortrolighedsbeskyttelse. Det har skærpet bevistheden om afvejningsproblemet, for man har også erkendt, at fuld beskyttelse af fortroligheden kan kun opnås ved helt at undlade offentliggørelse. Derfor er den  eneste praktiske mulighed, at man på forhånd gør sig overvejelser om, hvor stor en risiko for brud på fortroligheden, man vil acceptere, og efterfølgende indretter sin publiceringspolitik på det grundlag.

    En metode til at beskyttelse af fortroligheden er at gå på kompromis med præcisionen i opgørelserne. I stedet for at offentliggøre det tal der faktisk fremgår af de statistiske opgørelser, så offentliggøres et lidt afvigende tal. Er det korrekte tal f.eks 1, kan man vælge at offentliggøre 0 eller 2 i stedet. Den tekniske betegnelse for fremgangsmåden er at indlægge støj i resultaterne. Brugeren vil stadig få en brugbar indikation af størrelsesordenen samtidig med, at det bliver vanskeligere at gennemføre et vellykket angreb på fortrolighedsbeskyttelsen.   

    Differential privacy er en egenskab ved en matematisk teknik, der gør det muligt, at fastlægge hvor meget støj, der skal implementeres i forbindelse med offentliggørelsen, for at sikre et givet niveau af fortrolighedsbeskyttelse. Før offentliggørelsen påbegyndes fastlægges et såkaldt fortrolighedsbudget, der er et mål for, hvor meget og hvor detaljeret der kan offentliggøres. Differential privacy leverer redskaberne til at opgøre budgettet, når beskyttelsesniveauet er fastlagt. Fastlæggelsen af hvilket beskyttelsesniveau, man vil acceptere,  kan differentiel privacy-metoderne derimod ikke bidrage til. Det er og bliver et  politisk spørgsmål.   

    Når fortrolighedsbudgettet er fastlagt, skal det afgøres, hvilke tabeller der skal offentliggøres. Hver tabel, der offentliggøres, trækker på budgettet, så det skal nøje overvejes, hvilke tabeller man vil vælge at offentliggøre. Enhver offentliggørelse belaster budgettet, således at der blive mindre til rådighed for andre offentliggørelser. Og budgettet lægger naturligvis en øvre grænse for, hvor meget der i alt kan offentliggøres.

    USA’s folketællingsbureau har besluttet, at differentiel privacy skal være grundlaget for fortrolighedspolitikken i forbindelse med den næste folketælling der finder sted i 2020. Forberedelserne har givet anledning til en række erfaringer og overvejelser om, hvordan anvendelse af differentiel privacy i officiel statistik på en række områder vil ændre den måde hvorpå statistikken opfattes og anvendes. Disse erfaringer og overvejelser vil jeg vende tilbage til i et senere indlæg.

    Referencer:
    Eurostat:
    “Adfærdskodeks for Europæiske Statistikker”, Eurostat 2017 (link)
    Hector Page, Charlie Cabot & Kobbi Nissim,: Differential privacy: an introduction for statistical agencies,  Privatar 2018 (link)

  • Kvaliteten af det kinesiske nationalregnskab

    Der er blandt verdens brugere af officiel statistik en kritisk holdning til kvaliteten af den officielle kinesiske statistik. Landets centrale statistikmyndighed anses generelt for kompetent, men der er naturligt nok store vanskeligheder, der skal overvindes, landets størrelse, historie og administrative system taget i betragtning. Hertil kommer, at åbenheden om problemer og metoder er begrænset. Da Kinas stigende rolle i vedensøkonomien, som den bla. viser sig i bruttonationalproduktet (BNP) og andre størrelser fra nationalregnskabet, medfører et øget behov for pålidelig statistik, har flere forskere førsøgt at vurdere størrelsen af de formodede skævheder i den kinesiske statistik, og at udarbejde alternative skøn, der søger at korrigere for disse skævheder.

    Et eksempel er en gruppe forskere — en fra University of Chicago og tre fra Chinese University of Hong Kong — der for nyligt har offentliggjort en kritisk gennemgang af nogle centrale størrelser i det kinesiske nationalregnskab. De kalder ligefrem deres gennemgang for kriminalteknisk (forensic) undersøgelse. Deres fremgangsmåde er. at sammenligne de officielle nationalregnskabstal med andre målinger, som de betragter som mere pålidelige. I tabellen herunder er de officielle opgørelser af Kinas bruttonationalprodukt sammenholdt med ét af forskergruppens skøn.

    Årlig vækst i Kinas bruttonationalprodukt (pct.) siden 2007

    År Officielle data Moms-korrigeret
    2007 23,15 23,15
    2008 18.24 16,25
    2009 9,25 7,92
    2010 18,32 14,99
    2011 18.47 15,43
    2012 10,44 9,86
    2013 10,16 8,77
    2014 8,19 6,48
    2015 7,00 6,20
    2016 7,91 6,62
    Gennensnit 12,00 10,28

    Kilde: Wei Chen Chinese, Xilu Chen, Chang-Tai Hsieh & Zheng (Michael) Song, tabel 2

    Tabellens første kolonne viser den officielle opgørelse af væksten i det kinesiske bruttonationalprodukt (BNP). Den anden viser en skønnet vækst opgjort på grundlag of udviklingen i momsprovenuet.

    De officielle tal er baseret på indberetninger fra de lokale statistikmyndigheder i Kinas provinser. Det er opfattelsen hos de fire forfattere, at de centrale statistikmyndigheder gør sig store anstrengelser for at etablere pålidelige skøn, men at det samme ikke er tilfældet for de provinsernes lokale myndigheder. De er under pres fra lokale administrative myndigheder for at overvurdere væksten i indberetningerne, fordi væksten indgår som en faktor i deres aflønnings- og forfremmelsessystem. Det er de centrale myndigheder fuldt bevidste om, og søger at kompensere for det, ved at justere de indberettede tal nedad ved opgørelsen af Kinas samlede vækst.

    Når det gælder indberetningen af momsprovenuet har de lokale myndigheder ingen interesse i at undervurdere indberetningerne, da de får del i indtægterne. Derfor har de fire forfattere antaget, at man kunne opnå et mere pålideligt skøn, ved at estimere væksten i BNP med udgangspunkt i væksten i momsprovenuet.

    Som det fremgår af tabellen, ligger de momsbaserede skøn lavere end de officielle. Konklusionen er, at de  officielle tal overvurderer væksten i den kinesiske økonomi. Der er stadig tale om en høj vækst, men den gennemsnitlige årlige vækst er ifølge denne beregning overvurderet med 1,7 procentpoint. Set over en tiårig periode betyder det en overvurdering af det samlede BNP på omkring 14 pct.

    Gruppen har også opgjort et alternativt skøn baseret på en model, hvor nationalproduktet bestemmes på grundlag af en række variable uden for nationalregnskabet. De anvendte variable er  det samlede skatteprovenu, eksport, import, forbrug af elektricitet, godstransport på jernbane, nye banklån og nattelys registeret af satellitter. Resultaterne fra de modelbaserede skøn peger i samme retning som de momsbaserede.

    Referencer:
    Wei Chen Chinese, Xilu Chen, Chang-Tai Hsieh & Zheng (Michael) Song: “A Forensic Examination of China’s National Accounts”, Brookings 7/3 2019 (link)
    Dmitriy Plekhanov: “Quality of China’s Official Statistics: A Brief Review of Academic Perspectives”, The Copenhagen Journal of Asian Studies, Vol 35., no 1 (2017) (link)
    The Economist: “China’s economy might be nearly a seventh smaller than reported”, 7/3-2019 (link)

     

  • Statistisk selvforsvar — Hvordan beskytter man sig mod vildledende statistik?

    Statistik er en tillidssag. Det har jeg ofte påpeget i denne blog. Det er derfor altid vigtigt at vide, hvem der har produceret en statistik, og at vurdere producentens troværdighed, før man for alvor begynder at anvende den. Men selv om en statistik er  produceret af en yderst pålidelig producent, og der ikke kan sættes en finger på dens grundlæggende kvalitet, så kan den blive præsenteret i en form, der gør den mere vildledende end informativ. Den nederlandske journalist, Sanne Blauw, giver i en YouTube video en række råd til brugere af statistik om, hvordan man kan undgå at blive ført bag lyset af en vildledende præsentation. Statistisk selvforsvar kalder hun det.

    Blauw tager udgangspunkt i fem kategorier af  — bevidst eller ubevidst — statistisk vildledning, og giver eksempler på hver af dem. Om alle eksemplerne er lige velvalgte er åbent for diskussion, men det er uden betydning for relevansen af hendes advarsler. Og gennemgangen er ganske underholdende.

    De fem vildledningskategorer er:

    Den overbevisende graf
    (The good-looking graph)
    Grafer, der ved første øjekast virker overbevisende, men som ved nærmere eftersyn viser sig at være misvisende
    Den misvisende måling
    (The polluted poll)
    Målinger baseret på små stikprøver, lav besvarelsesprocent, og komplicerede spørgsmål,  der bliver  formidlet, uden at der redegøres for de nødvendige forbehold.
    Det overmodige decimalkomma
    (The overconfident decimal point)
    Præcisionen i statistiske opgørelse overvurderes. Det gælder specielt foreløbige opgørelser, der offentliggøres kort efter udløbet af den periode, de vedrører.
    Den ikke så spektakulære statistik
    (The not so spectacular statistic)
    Statistiske resultater, der bringes uden at blive vurderet i en sammenhæng, kan virke mere spektakulære, end de i virkeligheden er
    Den overfortolkede sammenhæng
    (The cocky correlation)
    En sammenhæng mellem to variable (korrelation) betyder ikke nødvendigvis en årsagssammenhæng (kausalitet)

    På sin hjemmeside præsenterer Sanne Blauw sig som talkorresondent (numeracy correspondent) for den nederlandske nyhedsplatform De Correspondent. De Coorrespondent er en alternativ journalistisk platform, der i sin formidling lægger mere vægt på indhold og sammenhæng end på det seneste døgns mere eller mindre tilfældige begivenheder. De dækker klimaet, men ikke vejret, som de selv udtrykker det. Reglerne for platformens virke er fastlagt i ti principper, der udover det allerede nævnte om vægt på indhold, bl.a. omfatter annoncefrihed, fokus ikke blot på problemer, men også på løsninger, og åbenhed om kilder. Det økonomiske grundlag stammer fra netværksfinansiering (crowdfunding)  og salg af  medlemskaber (abonnementer). Artiklerne er fortrinvis på nederlandsk, men en engelsksproget udgave er under forberedelse med planlagt start i midten af 2019.

    Referencer:
    Sanne Blauw: “How to defend yourself against misleading statistics in the news”, YouTube (link)
    Sanne Blauw: Hjemmeside (link)
    De Correspondent: Hjemmeside (link)

  • Andreas Georgiou — tidligere græsk statistikchef — hædres for sin indsats for sikring af kvalitet og uafhængighed i den officielle statistik

    Den tidligere græske chefstatistiker — Andreas Georgiou — er af seks internationale statistikorganisationer (se noten) blevet tildelt en særlig hædersbevisning for sin indsats for opretholde den højeste professionelle standard i sin stræben efter integritet i statistiske systemer. Bag hæderen ligger især hans indsats for genoprettelse af tilliden til den græske økonomiske statistik. Han var chef for den nationale græske statistikmyndighed (ELSTAT) i perioden august 2010 til august 2015. Før hans tiltræden havde EU-kommisionen i en rapport fastslået, at den græske økonomiske statistik var så fejlbehæftet og upålidelig, at den var uanvendelig. Det lykkedes Georgiou i løbet af sin embedsperiode  at genskabe den internationale tillid til græsk statistik.

    Uheldigvis deles den respekt, Georgiou nyder internationalt, ikke af de græske myndigheder. De ser hans insisteren på — i overensstemmelse med EU-reglerne — at levere pålidelige statistiske opgørelser som ubekvem i forbindelse med Grækenlands forhandlinger med landets kreditorer. Han og andre topchefer fra ELSTAT har været udsat for en række retsager, der for Georgieu’s vedkommende kulminerende i en dom på 2 års fængsel for pligtforsømmelse (se tidl. indlæg).

    Geogiou har tidligere modtaget international støtte, bl.a. fra FENStatS, hvis medlemmer er de nationale statistiske selskaber fra 23 europæiske lande. Det danske medlem er Dansk Selskab for Teoretisk Statistik. FENStatS har i et brev til den græske regering i oktober 2017 opfordret til at standse den retslige forfølgelse af Geogieu og andre tidligere ansatte i ELSTSAT. FENStaTs påpeger også i brevet det paradoks, at man forfølger de personer, der genoprettede den græske statistik, hvorimod ingen af de ansvarlige for manipulationerne før Georgiou’s embedsperiode er blevet retsforfulgt.

    Note: De seks organisationer bag hædersbevisningen er International Statistical Institute (ISI), American Statistical Association (ASA), International Association for Official Statistics (IAOS), Federation of European National Statistical Societies (FENStatS) og Société Française de Statistique (SFdS).

    Referencer:
    Royal Statistical Society:
    Stats community honours Andreas Georgiou, Statslife 25/9-2018 (link)

    Internation Statistical Institute: Commendation of Andreas Georgiou, Pressemeddelelse 18/9-2018
    Internation Statistical Institute: Court proceedings against Andreas Georgiou, former President of ELSTAT (the Hellenic Statistical Authority), (link)
    FENStatS: Brev til den græske regering, (link)
    Bruegel: The European Union must defend Andreas Georgiou, 26/6-2018 (link)

  • LIBOR — en vigtig rentestatistik — skal afvikles

    Det er ikke altid at vigtig statistik også er officiel statistik. Et eksempel er statistikken om den rente Londons banker betaler for korte lån uden sikkerhed hos hinanden — den såkaldte interbankrente. Statistikken går under navnet LIBOR (London Interbank Offered Rate) og den bliver sommetider kaldt verdens vigtigste tal.

    LIBOR’s store betydning skyldes i første omgang, at London er verdens finanscentrum, og at den rente Londons banker anvender indbyrdes derfor er vigtig for renteniveauet i hele verden. Men betydningen øges af, at den også anvendes som grundlag for fastlæggelse af renten for andre lån, f.eks. visse obligationslån med variabel rente. Den indgår også i beregningen af værdien af mange finansielle instrumenter, f.eks. derivater. LIBOR har været betragtet som den mest anerkendte indikator for for den kortfristede rente.

    Men trods vigtigheden er den ikke en officiel statistik, og den er ikke underlagt de kvalitets- og kontrolregler, der gælder for officiel statistik. Den blev oprindeligt udarbejdet og offentliggjort af den britiske bankforening (British Bankers Association), men efter at det i 2012 blev afsløret, at nogle af de store banker var faldet for fristelsen til at manipulere med indberetningerne, med henblik på at øge indtjeningen, blev opgørelsen overtaget af tilsynsmyndigheden (Financial Services Agency) og senere af  ICE Benchmark Administration (IBA). IBA er et datterselskab af Euronext — et stort børsselskab, der ejer en række børser i bl.a. i Paris, Amsterdam, London og New York.

    Manipulationerne var mulige fordi beregningen sker på grundlag af relativt få indberetninger, så indberetterne havde god mulighed for at påvirke opgørelsen ved at tilpasse indberetningerne til det ønskede resultat. Manipulationerne var klart ulovlige og udløste nogle store bøder til de involverede banker. Også ved en tidligere lejlighed havde opgørelsen været manipuleret, men dengang med henblik på at undgå en generel panik på markedet, og muligvis med kontrolmyndighedernes stiltiende indforståelse (Economist 29/9-2018)

    De to manipulationsaffærer har svækket respekten for LIBOR. Hertil kommer, at pålideligheden af opgørelsen er blevet svækket, fordi omfanget af interbanklån er faldet, såldes at der er blevet færre transaktioner at basere statistikken på. Derfor har de britiske bankmyndigheder besluttet, at opgørelsen af LIBOR skal afvikles i 2021.

    Afviklingen betyder naturligvis ikke, at de behov, som LIBOR opfylder, bare forsvinder. Der  må findes et  alternativ. Den amerikanske centralbank har i samarbejde med finansministeriet etableret et muligt  alternativ, SOFR (the Secured Overnight Financing Rate). SOFR er som statistikprodukt af højere kvalitet end LIBOR, og skulle være vanskeligere at manipulere.

    Referencer:
    The Economist: The end of LIBOR, The Economist 27/9-2018 (link)
    The Economist: Replacing LIBOR — The Price of Everything, The Economist 29/9-2018 

    ICE: ICE LIBOR (link)
    Philip Stafford: Global regulators warn banks must abandon reliance on Libor, Finacial Times 12/7-2018 (link)
    Why Libor Will Disappear—and What It Means for You, 30/7-2018 (link)

    James McBride: Understanding the Libor Scandal, Council on Foreign Relations 12/10-2016 (link)