Kategori: Statistikkvalitet

  • Chefen for USA’s folketællingsbureau har overraskende opsagt sin stilling

    John H Thomsen, chef for det amerikanske folketællingsbureau (Census Bureau) har overraskende opsagt sin stilling med virkning fra 1. juli. Det var ellers ventet at han ville forsætte  året ud, hvor hans embedsperiode udløber. Thompson begrunder sin fratræden med, at han ønsker et job i den private sektor, men hans opsigelse vækker en del  opmærksomhed, da den kommer umiddelbart efter, at kongressen har beskåret den af Obama-administrationen foreslåede forhøjelse af bureauets budget.

    USA afholder folketællinger hvert tiende år, og den næste skal finde sted i 2020, Forberedelserne er i fuld gang, men der er i kongressen uenighed om finansieringen af disse forberedelser. Kritikere — i kongressen repræsenteret af demokraterne — mener at der er bevilget alt for få midler til den store opgave. Noget af diskussionen vedrører et nyt it-system, der naturligvis har til formål at nedbringe omkostningerne, men har vist sig at blive langt dyrere at udvikle end først antaget.

    Den amerikanske forfatning fastslår, at delegerede til Repræsentanternes Hus og direkte skatter skal fordeles på staterne i forhold til deres indbyggertal. Derfor indeholder forfatningen også et krav om folketællinger. Forfatningen forudsætter kun en simpel optælling, men i praksis har man ved folketællingerne altid indsamlet supplerende oplysninger om køn, alder, beskæftigelse og race mm. Oplysningerne anvendes ikke blot til de i forfatningen fastlagte formål, men også til en lang række andre fordelings- og planlægningsformål, f.eks. fordelingen af forbundsregeringens tilskud til sundhed, uddannelse og transport.

    En fuldstændig optælling af hele den amerikanske befolkning er umulig. Der vil altid være nogle, der ikke bliver talt. F.eks. udgør hjemløse et problem, selvom der udfoldes store bestræbelser på også at få dem talt. Samlet set vil der altid være en underdækning i folketællingen. Underdækningen er naturligvis ikke ligeligt fordelt, men vil typisk være størst for de svageste samfundsgrupper. En konsekvens af direkte anvendelse af folketællingsresultaterne vil derfor være, at de underdækkede grupper også bliver underrepræsenteret i de valgte forsamlinger, og at deres andel af støtteordninger bliver mindre end deres virkelige antal berettiger. Der findes anerkendte og pålidelige statistiske metoder til opregning, og dem gør folketællingsbureauet også brug af. Men da opregningen som nævnt har vigtige fordelingsmæssige konsekvenser, så er overvejelserne omkring den blevet genstand for både politiske og juridiske slagsmål. Også andre sider af folketællingen, f.eks. hvilke emner, der skal og må belyses, er genstand for konflikt.

    I USA er folketællingen således en del af den polititiske dagsorden, og det er baggrunden for, at præsidentens og kongressens udtalelser og beslutninger omkring den kan være kontroversielle og give anledning til mistanker om skjulte dagsordener. I forvejen har præsident Trumps udtalelser om den officielle statistik givet anledning til bekymring blandt statistikere, jf. mine blog-indlæg fra 31/1 og  7/2-2017.

    Referencer
    Biografi på folketællingsburauets hjemmeside
    Officiel meddelelse om fratræden fra Department of Commerce
    Artikel fra The Washington Posts netavis

  • Problemer med tolkningen af BNP

    Rigsstatistiker Jørgen Elmeskov har i sin klumme på Danmarks Statistiks hjemmeside peget på nogle problemer omkring tolkningen at BNP (Virksomhedenes globalisering udfordrer tolkningen af BNP) . Han gør det klart, at det fremover kan blive sværere at fortolke BNP-tal. Der er mange årsager til, at BNP-begrebet er under pres (se evt. mine indlæg fra  og 3/6 og 14/6 2016), men i klummen koncentrerer rigsstatistikeren sig om de problemer, der skyldes internationaliseringen af virksomhederne.

    Multinationale selskaber spiller en stor rolle i Irlands økonomi, så det er ikke overraskende at problemerne har været særligt tydelige her. De irske problemer fylder en del i klummen, men dens egentlige baggrund er, at Danmarks Statistik i november 2016 også måtte ændre skønnene for BNP-væksten i opadgående retning (Bag Tallene, 21. januar 2017) . Korrektionerne var ikke nær så dramatiske som de irske, med førte dog til en ret ophedet debat, hvor den hypotese blev luftet, at hvis korrektionerne var sket før folketingsvalget, så havde regeringen Thorning-Schmidt regeringen måske kunnet fortsætte (se f.eks. Ekstrabladet 21/1 2017).

    Konklusionen i klummen er, at vi lejlighedsvis vil komme til at se tal for BNP, som kan være svært fortolkelige, men at Danmarks Statistik (og andre nationale statistikbureauer) vil finde måder at håndtere problemet, således at det stadig vil være muligt, at følge økonomien. Et vigtigt element her er anvendelse af andre økonomiske indikatorer, til supplering af BNP.

  • Præsident Trump og statistikken

    Det er vist ingen overdrivelse at påstå, at præsidentskiftet i USA har rejst forventninger om betydelige ændringer i amerikansk administrativ praksis. Der er en del usikkerhed omkring ændringernes omfang og karakter, og usikkerhed er en kilde til frygt. Frygten har også ramt de amerikanske statistikere. De er navnlig bekymrede for, at kvaliteten af den officielle amerikanske statistik kan komme i fare.

    I en artikel i The Guardian: “Statisticians fear Trump White House will manipulate figures to fit narrative” refereres nogle af  bekymringerne, sådan som de udtrykkes af fremtrædende amerikanske statistikkere. Blandt de bekymrede er Katherine Wallman, som netop er trådt tilbage som USA’s chefstatistiker efter næsten 25 år på posten. Hendes bekymring går på, at der kan komme en tendens til kun at producere og offentliggøre  den statistik, der fremmer regeringens politik. F.eks. kan statistikker om abort, fattigdom og racemæssig ulighed være i fare.

    Knap så pessimistisk er Erica Groshen, en anden netop afgået topstatistiker. Hun var af præsident Obama udpeget som chef for The Bureau of Labor Statistics (BLS), som er en central del af USA’s statistiske system. Selv om hun frygter følgerne af nedskæringer i et budget, der i forvejen hænger dårligt sammen, så har hun tillid til at den nye administration vil respektere BLS’ uafhængighed. Flere statitstikere mener også, at de økonomiske indikatorer er så vigtige for erhvervslivet, at regeringen ikke vil turde røre dem.

    Fra det Hvide Hus forklares situationen med, at præsidenten ikke er fokuseret på statistikken i sig selv, men på om det som helhed går fremad for det amerikanske folk. Det fokus vil statistikerne nok være enig i, så længe man gør sig klart, at statistik af høj kvalitet er en forudsætning for, at kunne afgøre i hvilken retning et folk og et samfund bevæger sig.

  • Benfords lov

    Kolonne 2 og 3 i tabellen nedenfor viser resultatet af et eksperiment. Fra Danmarks Statistikbank har jeg udtrukket alle regnskabstallene (undtagen totaler og undersummer) fra tabellen med regnskabsstatistik for byeerhverv (REGN5) . Derefter har jeg fordelt alle tallene efter første ciffer, uanset hvor mange cifre, der i alt var i tallet. Tallene 3, 34, -34, 30.458 og 0,345 er altså alle optalt i rækken med 3 som første ciffer. Nuller er helt udeladt.

    Første
    ciffer

    Regnskabsstatistik Benfords
    lov
    pct.
    Græsk
    nationalregskab
    2009, pct.
    Optælling Fordeling
    pct.
    1  558  31  30 29
    2 324  18  18 26
    3 212  12  13 20
    4 180  10  10 10
    5 124  7  8 2
    6 108  6  7 4
    7 102  6 6 5
    8 85  5  5 3
    9 102  6  6 0

    Kilde: Bernhard Rauch, Max Göttsche & Gernot Brähler, Fact and Fiction in EU-Governmental Economic Data, German Economic Review 12(3).
    Danmarks Statistikbank REGN5

    I kolonne 4 er til sammenligning vist en fordeling, der går, under navnet Benfords lov. Den beskriver hvordan første ciffer i en række tal fordeler sig, hvis tallene er fremkommet fuldt tilfældigt, hvor tilfældig også betyder, at intervalgrænserne for hvert tal er tilfældigt. Tilfældige (eller pseudotilfældige) tal, dannet af en tilfældighedsgenerator ligger normalt i et bestemt interval, f.eks. mellem nul og en, og vil ikke følge Benfords lov. Men regnskabsstatistikkens tal kan formodes at opfylde kravene om fuld tilfældighed, og det er derfor ganske betryggende, at det ser ud til, at de er i nogenlunde overensstemmelse med Benfords lov. Hvis en statistik, der opfylder tilfældighedskravene, ikke følger Benfords lov, kan det være en indikation af, at der er noget galt, f.eks. at tallene er manipulerede.

    I den sidste kolonne er vist første-ciffer fordelingen i det græske nationalregnskab for 2009. Her ser ikke ud til at være overensstemmelse med Benfords lov. Der kan være gode grunde til, at en statistisk talserie ikke følger Benfords lov, men i dette tilfælde er grundene nok ikke så gode. I hvert fald udgav Kommisionen for EU i januar 2010 en rapport (Report on Greek Government Deficit and Debt Statistics) , hvori det blev konstateret, at den græske økonomiske statistik var i en meget dårlig forfatning og stærkt fejlbehæftet.

    Det kan virke overraskende, at første ciffer i statistiske talserier ikke er ligeligt fordelt, men det har naturligvis en god og naturlig årsag. Den vil jeg ikke komme nærmere ind på her, men henvise til denne udmærkede forklaring.