Kategori: Publicering

  • Tres år med Danmarks Statistik

    Danmarks Statistik kan den 1. juli 2026 fejre 60 års jubilæum. I Danmarks Statistiks selvforståelse er der dog kun tale en navneændring for en institution, der blev oprettet i 1850 under navnet Det Statistiske Bureau, og allerede en gang tidligere i 1913 havde skiftet navn til Det Statistiske Departement. Derfor fejrede Danmarks Statistik officielt sit 175 års jubilæum i 2025. Danmarks Statistiks fortolkning af sin historie giver god mening, men det giver også mening, at se 1. juli 1966 som mere en blot et navneskifte. Den statistiklov – Lov om Danmarks Statistik — der trådte i kraft på denne dato, og som gav institutionen sit nye navn, var så moderne og så fremsynet at den markerede en helt ny epoke i den danske officielle statistik.

    Den tyske statisti­ker Walter Radermacher1, der bl.a. har været generaldirektør for EU’s statistiske kontor (Eurostat), har i sin doktordisputats afgrænset fire faser i udviklingen af den officielle statistik fra 1880 og frem, De fire faser er kort opregnet i tabel­len nedenfor.

    Radermachers faser i den officielle statistiks historie

    Fase

    Periode

    Vigtige udviklingstræk

    1.0

    1800-1899

    • Officiel statistik som komponent i den moderne nationalstat
    • Metodologier for beskrivende statistik

    2.0

    1900-1969

    • Uddybning og udvidelse af metodologi for moderne (inferentiel) statistik
    • Stikprøveundersøgelser
    • Makroøkonomisk statistik
    • Økonomiske modeller og beslutningsteori

    3.0

    1970-2009

    • Computere (Informations- og kommunikationsteknologi)
    • Databeskyttelse
    • Registerbaseret statistik
    • Europæiske Statistiske System
    • Integration af nye datakilder
    • Tilpasning af surveymetodologier
    • Tranformation af statistiske systemer i tidligere kommunistiske

    4.0

    2010-

    • Datarevolution
    • Evidensbaseret beslutningstagning
    • Globalisering

    Kilde: Radermacher (2019)

    Radermacher sætter 1970 som begyndelsesåret for fase 3.0, men den i 1966 vedtagne Lov om Danmarks Statistik var så fremsy­net, at den kan ses som markeringen af Danmarks indtræden i fase 3.0.

    Der er således god grund til markere 60-året for navneændringen til Danmarks Statistik, så det vil jeg gøre ved at udgive et lille skrift om nogle af de centrale udviklinger i denne 60-års periode, dvs. faserne 3.0 og 4.0 i Radermachers kronologi. Skriftet er stærkt inspireret af Radermachers indfaldsvinkel, men i stedet for opdelingen i faser har jeg valgt at tage udgangspunkt i embedsperioderne for de hidtidige seks rigsstatistikere. Rigsstatistiker er den titel, loven fra 1966 gav chefen for Danmarks Statistik.

    Rigsstatistiker

    Periode

    N.V Skak Nielsen

    1966-1988

    Hans E. Zeuthen

    1988-1996

    Jan Plovsing

    1996-2014

    Jørgen Elmeskov

    2014-2020

    Birgitte Anker

    2020-2024

    Martin Ulrik Jensen

    2024-


    Skriftet udkommer 1. august 2026, og e-bogs udgaven bliver gratis. Den vil kunne downloades fra denne blog.

    Referencer:
    Walter J. Radermacher,: ”Official Statistics 4.0, Facts for People in the 21. Century”, Doktordisputats, https://iris.uniroma1.it/retrieve/handle/11573/1237923/1032618/Tesi_dottorato_Radermacher.pdf (besøgt 4/6-2026)

  • Danmarks Datavindue

    Kort efter sin tiltræden som rigsstatistiker i oktober 2020 præsenterede Birgitte Anker sin ide om Danmarks Datavindue — en samlet national indgang til samfundsdata, fortrinsvis rettet mod forskere og analytikere. Danmarks Statistik gik hurtigt i gang med forberedelserne, støttet af en bevilling fra Carlsbergfondet på 10 mio.kr., og i juni 2022 blev der åbnet for en begrænset brugerkreds. Efter planen skal der åbnes for alle brugere i løbet af efteråret 2022.

    Der er ikke tale om en umiddelbart offentligt tilgængelig datakilde, som det kendes fra Danmarks Statistikbank. Brug af datavinduet kræver at der oprettes et projekt, som skal godkendes af Danmarks Statistik, og brugeren skal have en brugeraftale med en institution, der er autoriseret til adgang til Danmarks Statistiks mikrodata. Herudover skal brugeren certificeres, og certificering kræver dokumenteret kendskab til de gældende datasikkerhedsregler.

    Kernen i Danmarks Datavindue er naturligvis de mikrodata, der i forvejen findes i Danmarks Statistik, men vil også omfatte data fra andre dataejere. Gennem datavinduet får brugerne en samlet overblik over hvilke data, der er til rådighed, og data vil være kvalitetssikrede og dokumenterede.

    Datavinduet er ikke blot en samling mikrodatasæt, men også et automatiseret administrativt system til håndtering af projekterne, under hensyntagen til kravene om fortrolighed og datasikkerhed, og redskaber til behandling og analyse af data. I den forbindelse arbejdes der på, at gøre det muligt at knytte såkaldt high performance faciliteter — dvs. meget store og meget hurtige computere — til projekterne.  

    Referencer:
    Danmarks Statistik: “Danmarks Datavindue” (link 15/6-2022)
    Danmarks Statistik: “Arbejdsplan 2022”, januar 2022 (link 15/6-2022)
    Birgitte Anker:Et fælles vindue til Danmarks data vil give stor værdi for alle”, Danmarks Statistik, Rigsstatistikerens Klumme 17/6-2021 (link15/6-2022)
    Carlsbgfondet: “Bevillingsoversigt: Danmarks Datavindue”, 2021 (link 16/6-2022)

  • Danmarks Statistiks portal for officiel statistik

    Fra Danmarks Statistiks portal for officiel statistik får man et samlet overblik over statistik produceret af offentlige myndigheder. Portalen er en udmøntning af § 4 i den lov om Danmarks Statistik, der trådte i kraft i 2018. Loven pålægger Danmarks Statistik dels at offentliggøre en liste over offenligt produceret samfundsbelysende statistik, og dels at vedligeholde en portal, der giver adgang til al officiel offentligt produceret statistik — i det følgende blot betegnet officiel statistik. Officiel statistik er statistik, som er produceret af en offentlig myndighed og som opfylder de kvalitetskrav, som er fastlagt i EU’s statistiklov og kvalitetskodeks. For at en officiel statistik kan optages i portalen kræves det dog også, at den producerende myndighed tilmelder sig  Ordningen for Officiel Statistik, der bl.a betyder, at Danmarks Statistik overvåger overholdelsen af retningslinierne. Retningslinlierne er beskrevet i et særligt dokument, udarbejdet af Danmarks Statistik.

    Som udgangspunkt er det således frivilligt for en offentlig statistikproducent at tilmelde sig ordningen og dermed underkaste sig vilkårene. Denne frivillighed gælder dog ikke statistik, der indsamles til EU’s statistiske program. Myndigheder der inberetter til EU’s statistikprogram er forpligtet til at være tilmeldt ordningen. I forbindelse med indberetningen skelner EU mellem det nationale statistiske institut, som har det overordnede ansvar for statistikindberetningerne, og andre nationale statistiske myndigheder, som indberetter til systemet. Danmarks Statistik er det danske nationale statistikinstitut, men på EU’s liste over indberettere står herudover 14 danske myndigheder.

    Portalen opdeler den officielle statistik i samme tolv emner, som Danmarks Statistik anvender ved præsentation af sin egen statistik. Man søger i emner og underemner på præcis samme måde som i Statistikbanken. Et underemne indeholder enten en liste over nye underemner, som man må vælge iblandt, eller et eller flere link til sider med officiel statistik. Ved hvert link er angivet navnet på den institution, der er ansvarlig for den statistik, der linkes til. Oftest vil den ansvarlige institution være Danmarks Statistik, og linket vil da normalt være til Statistikbanken. Hvor andre institutioner er ansvarlige vil linket føre til en side, hvor statistikken offentliggøres. Det kan være en side, der vedligeholdes af den ansvarlige institution selv, men kan også være til en side, der vedligeholdes af en anden institution, der står for offentliggørelsen af statistikken, f.eks Eurostat.  Er man vant til at bruge Statistikbanken vil man føle sig helt hjemme i portalen. Faktisk er det nærmest fuldstændigt som at søge i Statistikbanken, blot med adgang til flere tabeller.

    Den del af den offentlige statistik, der ikke tilhører kategorien officiel statistik, enten fordi den ikke opfylder kvalitetskravene, eller fordi producenten har valgt ikke at tilmelde den ordningen, er listet på portalens hjemmeside under overskriften Anden offentligt produceret statistik“.  Også denne liste er opdelt efter samme emner som Danmarks Statistik i øvrigt anvender, men uden opdeling på underemner. I stedet er under hver emne angivet navnene på de institutioner, der producerer offentlig statistik vedrørende emnet, og under hver institution en liste med et eller flere link(s) til de statistikker, institutionen stiller til rådighed.

    Referencer:
    Danmarks Statistik: “Portal for Officiel Statistik“, (link)
    Danmarks Statistik: “Retningslinjer for officiel statistik”, august 2019 (link)
    Eurostat: “List of National Statistical Institutes and aother national authorities” (link)
    Retsinformation: “Bekendtgørelse af lov om Danmarks Statistik”, LBK nr 610 af 30/05/2018 (link)

  • Indvandrere og efterkommere i de nordiske lande

    Danmarks Statistik har for nylig (26/3) udgivet en Analyse om indvandrere og efterkommere i de nordiske lande. Statistik om indvandrere og efterkommere har været produceret af Danmarks Statistik i flere år, men da ingen andre lande hidtil har haft tilsvarende opgørelser, har internationale sammenligninger ikke været mulige. Med en række tabeller i den fællesnordiske statistikbank, Nordic Statistics Database, om indvandrere og  efterkommere, er der nu opstået en mulighed for sammenligning mellem de nordiske lande. Det er den mulighed Danmarks Statistik har udnyttet i Analysen. Tabellerne er udarbejdet i et samarbejde mellem de nordiske officielle statistikbureaer. Definitionen på indvandrere og efterkommere i den fællesnordiske statistik ligger tæt på, men er ikke helt identisk med, definitionen i den danske statistik.

    Analysen fokuserer på antallet af indvandrere og efterkommere og på deres uddannelsesforhold og arbejdsmarkedstilnytning. Nogle af hovedresultaterne er i summarisk form gengivet i dette indlæg. I indlægget skelnes mellem indvandrere fra vestlige og ikke-vestlige lande, således som traditionen har været i Danmarks Statistiks opgørelser, selv om definitionerne ikke er helt identiske. I Analysen (og i den fællesnordiske statistikbank) anvendes en mere detaljeret opdeling af oprindelseslandene på regioner

    Tabel 1: Indvandrere og efterkommeres befolkningsandele i nordiske lande

    Samlet befolkning Indvandrere Efterkommere
    Indvandre-
    re og efter-kommere i alt
    Vestlige lande1 Ikke-
    vestlige lande
    Vestlige lande1 Ikke-vestlige lande
    1000 pers. pct.
    Danmark 5.749 4,2 5,7 0,5 2,5 12,8
    Finland 5.503 1,7 3,9 0,2 0,9 6,6
    Norge 5.258 6,5 7,3 0,7 2,3 16,8
    Sverige 9.995 5,8 11,1 1,7 3,7 22,2

    Note: 1Omfatter regionerne Nordiske lande, EU/EØS og Nordamerika og Oceanien
    Kilde: Nordic Statistics Database/CITI03

    Indvandreres og efterkommeres andel af de nordiske befolkninger er vist i tabel 1. Størst andel finder man i Sverige og lavest i Finland. I alle landene kommer flertallet af indvandrere og efterkommere fra ikke-vestlige lande, men andelen er særligt høj i Sverige, hvor ikke-vestlige indvandrere mm. udgør omkring 15 pct. af befolkningen.

    Tabel 2: Indvandrere og efterkommeres beskæftigelsesfrekvens i nordiske lande

    Indvandrere Efterkommere
    Indfødte
    Vestlige lande1 Ikke-
    vestlige lande
    Vestlige lande1 Ikke-
    vestlige lande
    pct af 20-64 årige
    Danmark 66,6 51,3 70,7 60,6 77,9
    Finland 62,2 46,2 59,0 52,5 71,8
    Norge 74,0 55,8 72,3 67,1 78,8
    Sverige 67,8 56,6 79,4 70,4 84,2

    Note: 1Omfatter regionerne Nordiske lande, EU/EØS og Nordamerika og Oceanien
    Kilde: Egne beregninger på grundlag af tabeller i Nordic Statistics Database

    I tabel 2 er vist beskæftigelsesfrekvensen for indvandrere og efterkommere sammenlignet med den indfødte befolkning. Beskæftigelsesfrekvensen er i alle landede lav for navnlig indvandrere fra ikke vestlige lande. Beskæftigelsesfrekvensen er højere for efterkommere, men dog stadig under frekvensen for den indfødte befolkning. I Analysen påpeges det, at forskellene i beskæftigelsesfrekvens delvis kan forklares af forskelle i køn, alder, uddannelse, længden af opholdet og begrundelsen for opholdstilladelsen (flygtning, familesammenføring, arbejde eller uddannelse). Alle disse forhold er belyst i tabellerne i den fællesnordiske statistikbank.

    Referencer:
    Nordic Statistics Database , www.nordicstatistics.org/statistics (link)
    Danmarks Statistik: “Indvandrere og efterkommere i de nordiske lande”, DSTAnalyse 2018:04 26/3-2019 (link)

  • Euroen fylder tyve år

    Den 1. januar 1999 etablerede en række EU-lande en valutaunion der betød, at de erstattede deres hidtidige nationale valutaer — D-mark, Frank, Lire osv. — med den fælles Euro. Euroen har således nu eksisteret i tyve år, og det britiske tidsskrift The Economist har i den anledning i en artikel analyseret den hidtidige udvikling og vurderet fremtidsudsigterne. Til støtte for analyse og vurdering anvender Economist tre grafer baseret på data fra Eurostat — EU’s statistiske kontor — til at belyse udviklingen i tre centrale økonomiske indikatorer i seks udvalgte Euro-lande. I dette indlæg gengiver jeg graferne fra The Economists artikel, men udvider med data for Danmark, der jo ikke er et Euro-land. Mit indlæg er koncentreret om de tre grafer og kommer kun i meget begrænset omfang ind på de mange interessante observationer og overvejelser i The Economist’s artikel.

    Kilde: The Economist   Grafik: Veusz

    Den første graf viser udviklingen i de samlede nettotilgodehavender overfor udlandet målt i pct. af bruttonationalproduktet (BNP). For lande med svage valutaer, hvor risikoen for devaluering var stor, betød tilslutningen til Euroen, at det blev nemmere og billigere at låne i udlandet. Landene fik så at sige del i Tysklands kreditværdighed. Som det fremgår af figuren benyttede navnlig Spanien, Portugal og Grækenland sig af de nye muligheder og øgede deres gæld til udlandet. Især Grækenland, hvis udenlandske nettogæld i 2017 udgjorde næsten 150 pct, af BNP. Tyskland har til gengæld øget sine tilgodehavender i udlandet betydeligt i perioden. Danmark har stort set fulgt den tyske udvikling.

    Ser  man  specifikt på den offentlige gæld (midterste graf) viser et tilsvarende mønster sig. Den tyske gæld er nogenlunde konstant, hvorimod de sydeuropæiske Euro-medlemmer har øget gælden. Igen ligger den danske udvikling tæt på den tyske.

    Den sidste graf viser udviklingen i BNP. Tyskland ligger i toppen med et BNP, der i 2017 ligger 25 pct. over niveuaet i 1999. For både Grækenland og Italien er BNP nogenlunde det samme i 1999 og 2017, men udviklingen har været meget forskellig i de to lande. Det italienske BNP har ligget ret konstant i perioden, hvorimod grækerne i begyndelsen af perioden oplevede en betydelig stigning, der imidlertid i 2017 vendte brat. De øvrige tre Euro-lande har haft en mere jævn udvikling. Det gælder også Danmark, der ikke på dette punkt har kunnet følge med Tyskland.

    Referencer:
    The Economist: “Incomplete union, The Euro enters its third decade in need of reform”, 5/1-2019 (link)

  • StatistikCampus — tysk internetportal om officiel statistik

    StatstikCampus er en internetportal om officiel tysk statistik, specielt henvendt til universitetsstuderende. Bag portalen står Tysklands officielle statistikbureau (Statistiches Bundesamt eller Destatis, se tidligere indlæg). Portalen indeholder bl. andet en generel introduktion til statistiksøgning, en række dokumenter med information om Destatis relationer til universiteterne og et E-learning kursus. Og naturligvis fortæller portalen også om ansættelses- og uddannelsesmuligheder hos Destatis.

    De universitetsrelevante dokumenter præsenteres i en sektion under overskriften Statistikken møder videnskaben (Statistik trifft Wissenschaft). Studerende, der overvejer at gøre officiel statistik til tema for deres bachelor- kandidat- eller ph.d-afhandling, kan her finde en liste over relevante emner. Til hvert af de foreslåede emner er tilknyttet en kort beskrivelse — en til to sider — omkring baggrund  og eventuel eksisterende litteratur, samt henvisning til en kontaktperson i Destatis. Herudover indeholder sektionen bl.a. en beskrivelse af mulighederne for adgang til mikrodata til forskningsbrug, information om Gerhard Fürst prisen (se indlæg fra 22/11-2015), og et link til Destatis liste over konferencer og andre begivenheder vedrørende officiel statistik.

     I sektionen om statistiksøgning (Datenrecherche) er først og fremmest en kort beskrivelse af de tre vigtigske kilder til den tyske officielle statistik: Destatis hjemmesideStatistisk årbog (Statistisches Jahrbuch) og statistikbanken GENESIS-Online. Også en mere generel beskrivelse af, hvad man kan forvente at finde form af statistik, herunder statistik fra de tyske delstater (Länder) og links til hjælpemidler som bibliotek og en tysk/engelsk ordbog over statistiske fagudtryk kan findes her. Sidst men ikke mindst finder man et link til en række mikrodatasæt med anonymise­rede individdata — de såkaldte CAMPUS-files — som studerende kan få adgang til gennem en simpel procedure. Datasættene er beregnet til øvelsesbrug, og er generelt ikke egnet til egentlige analyser, men de giver de studerende en bekvem mulighed for at træne anvendelse og bearbejdning af mikrodata på realistiske materialer.

    E-learning sektionen består af ni moduler til afspilning med emner som statistiske kilderdataindsamlingsmetoder og fremstilling af grafik, tabeller og kort. Længden af modulerne er mellem 20 minutter og to timer.

    Referencer:
    Destatis: StatistikCampus – internetportal (link)
    Destatis: Hjemmeside (link)

  • Journalistisk brug af statistik — BBC’s retningslinier

    I marts 2017 offentliggjorde BBC et sæt retningslinier for formidling af statistik, Reporting Statistics. Formålet var at vejlede BBC’s journalister i at tolke og formidle statistiske data korrekt, og baggrunden var anbefalingerne i en rapport om BBC’s upartiskhed. (tidligere behandlet i denne blog)

    Allerførst i retningslinierne slås det fast, at statistik er en fremragende kilde til information og gode historier for journalister, under forudsætning af, at journalisten stiller de rigtige spørgsmål, og undgår visse faldgruber. Derefter gennemgås en række overvejelser, journalisten børe gøre, i forbindelse med anvendelse af statistik.

    Først og fremmest skal statistikken naturligvis være pålidelig. Det vil i praksis sige, at producenten skal være troværdig. Den officielle statistik — der i UK overvåges af UK Statistics Authority — fremhæves som upartisk og fri for politisk indflydelse. Office for National Statistics er den vigtigste, men ikke eneste, producent af officiel statistik. Andre kilder, f.eks. universiteter og uafhængige  tænketanke kan også opfylde kravet om pålidelighed, med her kræves mere forsigtighed ved vurderingen. Et kriterium kan være om kilden tidligere har vist sig at være pålidelig. Eksplicit opfordres der til, at statistik formidlet af andre end producenten selv kun anvendes, hvis der er særlige grunde. Det gælder især hvis der er tale om kilder med særlige interesser at varetage.

    Retninglinierne finder det udmærket at anvende pressemeddelelser, men opfordrer til at gå bag om overskrifterne.  Bla. opfordres til ikke udelukkende at fokusere på nationale gennemsnit, men også at vurdere opdeling på f.eks. forskellige befolkningsgrupper eller forskellige geografiske områder.

    Konkret gennemgås en række statistiske begreber, bl.a. gennemsnit, ekstreme værdier, fremskrivninger, regression og procentopgørelser, og der gives anvisninger på, hvordan misfortolkninger undgås. Der advares imod at overdrive de statistiske resultater, og opfordres til at redegøre for forbehold og begrænsninger, hvor det er rimeligt. Helt specielt anbefales det at undgå overdrivelser i forbindelse med statistikker, der udtrykker en konkret risiko for befolkningen, f.eks. statistik om kriminalitet og sygdom.

    BBC henviser på deres hjemmeside også til at journalister kan finde vejledning hos Royal Statistical Society. Bl.a. tilbyder Royal Statistical Society et kort kursus i statistikbrug for journalister i form af en video.

    Referencer:
    BBC:
    Retningslinier om statistikformidling (link)
    Royal Statistical Society: Statistics for Journalists (link)

  • Weblogs om officiel statistik – Efter to år med Offstat

    I mit første indlæg i denne blog for to år siden gennemgik jeg nogle af de ret få weblogs, der specialiserede sig i officiel statistik. Efter to år benytter jeg lejligheden til en genvurdering og opdatering af mine betragtninger fra dengang.

    Offstat’s nærmeste forbillede og inspirationskilde var (og er) Blogstats, en weblog om formidling af officiel statistik, oprettet af Armin Grossenbacher, der er tidligere publikationschef i det schweitziske statsitikbureau. Blogstats eksisterer heldigvis stadig, men opdateres ikke så ofte. Den er tænkt som en flerbrugerblog, hvor navnlig ansatte i statistikinstitutioner kan bidrage, men i praksis kommer alle bidragene fra Armin Grossenbacher selv. En funktion i Blogstats, der særligt er værd at nævne, er menupunktet Agenda, hvor man finder en liste over kommende og tidligere begivenheder med relevans for formidlingen af officiel statistik.

    Udover Blogstats ( og naturligvis Offstat) har jeg ikke kendskab til andre blogs, der fokuserer bredt på officiel statistik. Nærmest kommer det svenske Statistikfrämjandet, der ofte har indlæg om officiel statistik. Noget større bliver udvalget, hvis man ser på blogs, der behandler emneområdet statistik mere generelt. Blandt dem vil jeg fremhæve StatsBlogs, der er blevet et af mine vigtigste redskaber til at finde emner og materiale til Offstat. StatsBlogs producerer ikke selv indhold, men bringer korte resumeer af indhold fra andre blogs (content syndication). De blogs, der er omfattet af StatsBlogs, repræsenterer alle sider af statistik, og ikke blot officiel statistik, men dels kan mange blogindlæg — uanset emne —  have relevens for officiel statistik, og dels vil man, hvis man er interesseret i officiel statistik, også være interessereret i andre aspekter af statistik.

    Alt i alt har situationen ikke ændret sig meget i de seneste to år.  Trods stor interesse for anvendelse af officiel statistik, så er weblogs, der fokuserer på emnet, fortsat sjældne.

  • Hvad sker der i denne graf? — New York Times vil fremme statistisk læsefærdighed

    Den 19. september etablerede New York Times (NYTimes) i samarbejde med ASA (American Statistical Association) en ny web-funktion, hvis vigtigste formål er at understøtte opbygningen af statistik læsefærdighed, navnlig hos skole- og gymnasieelever. Hver anden tirsdag vil NYTimes på en særlig web-side — What’s Going On in This Graph? — offentliggøre en graf, der belyser et statistisk emne. Grafen hentes fra en anden del af NYTimes’ webside, men overskriften og vigtige nøgleord kan være fjernet, for at inspirere brugerne til selv at overveje, hvad grafen fortæller. Elever og studenter inviteres til at kommentere grafen online, og i de første timer efter offentliggørelsen vil moderatorer fra ASA bidrage med råd og vejledning. Den følgende fredag indsættes yderligere en række uddybende bemærkninger sammen med et link til den oprindelige graf.

    Den første graf er et kort over USA med teksten “Da orkanen Harvey forlod Texas havde dele af Houston været oversvømmet med mere end 127 cm (50 inches) regn“. Kortet er farvekodet med en skala der går fra under 4 måneder — f.eks. enkelte områder i Californien og Oregon — til over 5 år— f.eks. store ørkenområder i Nevada og Arizona. Det er overladt til eleverne og studenterne at regne ud, at skalaen går på den periode, det normalt vil tage, før man har fået en regnmængde svarende til de 127 cm Harvey forårsagede i Houston. Fra få måneder langs den regnfulde vestlige stillehavskyst til flere år i ørkenområderne øst herfor.

    Omkring 400 elever og studerende har kommenteret grafen. I de uddybende bemærkninger, under overskriften statistiske guldkorn, fortælles generelt om anvendelsen af landkort i forbindelse med statistik og der gives en forklaring på begreberne kvantitative og kategoriske variable. Næste udgave af What’s Going On in This Graph?  udkommer den 10. oktober,

    Referencer:
    New York Times: What’s Going On in This Graph? (link)

  • Bedre tabeldesign

    Howard Wainer er en af de statistikere, der har beskæftiget sig længst og mest med præsentation af statistiske data, herunder tabeldesign. I et indlæg i net-udgaven af  Significance — et tidsskift udgivet i fællesskab af det britiske Royal Statistical Society og det amerikanske American Statistical Association — giver han nogle gode råd til, hvordan statistiske tabeller kan udformes, så de bliver tydelige og informative. Egentlig er han ikke så begejstret for anvendelse af tabeller i formidling af statistisk, men han har konstateret, at tabeller, trods deres mangler, i praksis er den mest udbredte præsentationsform for statistik i videnskabelige tidsskrifter.

    Det er ikke fordi Wainer helt afviser, at der kan være gode grunde til at anvende tabeller. F.eks. at de er velegnede til arkivering af data. Men de gode grunde er mest af historisk interesse, og da arkivering i vore dage sker elektronisk, bør den statistik, der præsenteres på papir være rettet mod formidling. Og her findes grafiske præsentationsformer, der er tabellen overlegne.

    Det må dog forventes, at det vil tage noget tid, før nyere og bedre grafiske præsentationsformer for alvor slår igennem, så helt pragmatisk foreslår han, at man i mellemtiden bruger lidt kræfter på  et bedre tabeldesign.

    Udgangspunktet er tre hovedregler for udformningen af de tabeller, der anvendes til præsentation af statistiske resultater.

    1. Tabellen skal indeholde opsummering af rækker og søjler, f.eks. i form af totalrække og totalsøjle med gennemsnit. Opsummeringer skal være tydeligt adskilt fra tabellens øvrige inhold.
    2. Rækkefølgen af rækker og/eller søjler skal være meningsfuld. Rækker eller søjler kan f.eks. være sorteret efter størrelsen af totalen eller indholdet af en af rækkerne/søjlerne. Alfabetisk orden er sjældent  meningsfuld.
    3. Tallene afrundes (f.eks. til tusinder eller millioner), så der i de fleste celler kun er et- eller tocifrede tal.

    Udover de tre hovedregler foreslår han, at man overvejer yderligere muligheder for at tydeliggøre resultaterne. F.eks. at lægge luft ind mellem grupper af rækker, hvor det giver mening, og at fremhæve særligt interessante celler, f.eks. ved farvemarkering.

    Wainer mener, at reglerne er så simple, at der ikke er nogen grund til ikke at bruge dem. Eneste ulempe, siger han, er at man måske opdager noget, man ellers havde overset!