Kategori: Publicering

Danmarks Datavindue

21/06/2022          Taleboble Kommentarer

Kort efter sin tiltræden som rigsstatistiker i oktober 2020 præsenterede Birgitte Anker sin ide om Danmarks Datavindue — en samlet national indgang til samfundsdata, fortrinsvis rettet mod forskere og analytikere. Danmarks Statistik gik hurtigt i gang med forberedelserne, støttet af en bevilling fra Carlsbergfondet på 10 mio.kr., og i juni 2022 blev der åbnet for en begrænset brugerkreds. Efter planen skal der åbnes for alle brugere i løbet af efteråret 2022.

Der er ikke tale om en umiddelbart offentligt tilgængelig datakilde, som det kendes fra Danmarks Statistikbank. Brug af datavinduet kræver at der oprettes et projekt, som skal godkendes af Danmarks Statistik, og brugeren skal have en brugeraftale med en institution, der er autoriseret til adgang til Danmarks Statistiks mikrodata. Herudover skal brugeren certificeres, og certificering kræver dokumenteret kendskab til de gældende datasikkerhedsregler.

Kernen i Danmarks Datavindue er naturligvis de mikrodata, der i forvejen findes i Danmarks Statistik, men vil også omfatte data fra andre dataejere. Gennem datavinduet får brugerne en samlet overblik over hvilke data, der er til rådighed, og data vil være kvalitetssikrede og dokumenterede.

Datavinduet er ikke blot en samling mikrodatasæt, men også et automatiseret administrativt system til håndtering af projekterne, under hensyntagen til kravene om fortrolighed og datasikkerhed, og redskaber til behandling og analyse af data. I den forbindelse arbejdes der på, at gøre det muligt at knytte såkaldt high performance faciliteter — dvs. meget store og meget hurtige computere — til projekterne.  

Referencer:
Danmarks Statistik: “Danmarks Datavindue” (link 15/6-2022)
Danmarks Statistik: “Arbejdsplan 2022”, januar 2022 (link 15/6-2022)
Birgitte Anker:Et fælles vindue til Danmarks data vil give stor værdi for alle”, Danmarks Statistik, Rigsstatistikerens Klumme 17/6-2021 (link15/6-2022)
Carlsbgfondet: “Bevillingsoversigt: Danmarks Datavindue”, 2021 (link 16/6-2022)


Danmarks Statistiks portal for officiel statistik

16/06/2020          Taleboble Kommentarer

Fra Danmarks Statistiks portal for officiel statistik får man et samlet overblik over statistik produceret af offentlige myndigheder. Portalen er en udmøntning af § 4 i den lov om Danmarks Statistik, der trådte i kraft i 2018. Loven pålægger Danmarks Statistik dels at offentliggøre en liste over offenligt produceret samfundsbelysende statistik, og dels at vedligeholde en portal, der giver adgang til al officiel offentligt produceret statistik — i det følgende blot betegnet officiel statistik. Officiel statistik er statistik, som er produceret af en offentlig myndighed og som opfylder de kvalitetskrav, som er fastlagt i EU’s statistiklov og kvalitetskodeks. For at en officiel statistik kan optages i portalen kræves det dog også, at den producerende myndighed tilmelder sig  Ordningen for Officiel Statistik, der bl.a betyder, at Danmarks Statistik overvåger overholdelsen af retningslinierne. Retningslinlierne er beskrevet i et særligt dokument, udarbejdet af Danmarks Statistik.

Som udgangspunkt er det således frivilligt for en offentlig statistikproducent at tilmelde sig ordningen og dermed underkaste sig vilkårene. Denne frivillighed gælder dog ikke statistik, der indsamles til EU’s statistiske program. Myndigheder der inberetter til EU’s statistikprogram er forpligtet til at være tilmeldt ordningen. I forbindelse med indberetningen skelner EU mellem det nationale statistiske institut, som har det overordnede ansvar for statistikindberetningerne, og andre nationale statistiske myndigheder, som indberetter til systemet. Danmarks Statistik er det danske nationale statistikinstitut, men på EU’s liste over indberettere står herudover 14 danske myndigheder.

Portalen opdeler den officielle statistik i samme tolv emner, som Danmarks Statistik anvender ved præsentation af sin egen statistik. Man søger i emner og underemner på præcis samme måde som i Statistikbanken. Et underemne indeholder enten en liste over nye underemner, som man må vælge iblandt, eller et eller flere link til sider med officiel statistik. Ved hvert link er angivet navnet på den institution, der er ansvarlig for den statistik, der linkes til. Oftest vil den ansvarlige institution være Danmarks Statistik, og linket vil da normalt være til Statistikbanken. Hvor andre institutioner er ansvarlige vil linket føre til en side, hvor statistikken offentliggøres. Det kan være en side, der vedligeholdes af den ansvarlige institution selv, men kan også være til en side, der vedligeholdes af en anden institution, der står for offentliggørelsen af statistikken, f.eks Eurostat.  Er man vant til at bruge Statistikbanken vil man føle sig helt hjemme i portalen. Faktisk er det nærmest fuldstændigt som at søge i Statistikbanken, blot med adgang til flere tabeller.

Den del af den offentlige statistik, der ikke tilhører kategorien officiel statistik, enten fordi den ikke opfylder kvalitetskravene, eller fordi producenten har valgt ikke at tilmelde den ordningen, er listet på portalens hjemmeside under overskriften Anden offentligt produceret statistik“.  Også denne liste er opdelt efter samme emner som Danmarks Statistik i øvrigt anvender, men uden opdeling på underemner. I stedet er under hver emne angivet navnene på de institutioner, der producerer offentlig statistik vedrørende emnet, og under hver institution en liste med et eller flere link(s) til de statistikker, institutionen stiller til rådighed.

Referencer:
Danmarks Statistik: “Portal for Officiel Statistik“, (link)
Danmarks Statistik: “Retningslinjer for officiel statistik”, august 2019 (link)
Eurostat: “List of National Statistical Institutes and aother national authorities” (link)
Retsinformation: “Bekendtgørelse af lov om Danmarks Statistik”, LBK nr 610 af 30/05/2018 (link)


Indvandrere og efterkommere i de nordiske lande

09/04/2019          Taleboble Kommentarer

Danmarks Statistik har for nylig (26/3) udgivet en Analyse om indvandrere og efterkommere i de nordiske lande. Statistik om indvandrere og efterkommere har været produceret af Danmarks Statistik i flere år, men da ingen andre lande hidtil har haft tilsvarende opgørelser, har internationale sammenligninger ikke været mulige. Med en række tabeller i den fællesnordiske statistikbank, Nordic Statistics Database, om indvandrere og  efterkommere, er der nu opstået en mulighed for sammenligning mellem de nordiske lande. Det er den mulighed Danmarks Statistik har udnyttet i Analysen. Tabellerne er udarbejdet i et samarbejde mellem de nordiske officielle statistikbureaer. Definitionen på indvandrere og efterkommere i den fællesnordiske statistik ligger tæt på, men er ikke helt identisk med, definitionen i den danske statistik.

Analysen fokuserer på antallet af indvandrere og efterkommere og på deres uddannelsesforhold og arbejdsmarkedstilnytning. Nogle af hovedresultaterne er i summarisk form gengivet i dette indlæg. I indlægget skelnes mellem indvandrere fra vestlige og ikke-vestlige lande, således som traditionen har været i Danmarks Statistiks opgørelser, selv om definitionerne ikke er helt identiske. I Analysen (og i den fællesnordiske statistikbank) anvendes en mere detaljeret opdeling af oprindelseslandene på regioner

Tabel 1: Indvandrere og efterkommeres befolkningsandele i nordiske lande

Samlet befolkning Indvandrere Efterkommere
Indvandre-
re og efter-kommere i alt
Vestlige lande1 Ikke-
vestlige lande
Vestlige lande1 Ikke-vestlige lande
1000 pers. pct.
Danmark 5.749 4,2 5,7 0,5 2,5 12,8
Finland 5.503 1,7 3,9 0,2 0,9 6,6
Norge 5.258 6,5 7,3 0,7 2,3 16,8
Sverige 9.995 5,8 11,1 1,7 3,7 22,2

Note: 1Omfatter regionerne Nordiske lande, EU/EØS og Nordamerika og Oceanien
Kilde: Nordic Statistics Database/CITI03

Indvandreres og efterkommeres andel af de nordiske befolkninger er vist i tabel 1. Størst andel finder man i Sverige og lavest i Finland. I alle landene kommer flertallet af indvandrere og efterkommere fra ikke-vestlige lande, men andelen er særligt høj i Sverige, hvor ikke-vestlige indvandrere mm. udgør omkring 15 pct. af befolkningen.

Tabel 2: Indvandrere og efterkommeres beskæftigelsesfrekvens i nordiske lande

Indvandrere Efterkommere
Indfødte
Vestlige lande1 Ikke-
vestlige lande
Vestlige lande1 Ikke-
vestlige lande
pct af 20-64 årige
Danmark 66,6 51,3 70,7 60,6 77,9
Finland 62,2 46,2 59,0 52,5 71,8
Norge 74,0 55,8 72,3 67,1 78,8
Sverige 67,8 56,6 79,4 70,4 84,2

Note: 1Omfatter regionerne Nordiske lande, EU/EØS og Nordamerika og Oceanien
Kilde: Egne beregninger på grundlag af tabeller i Nordic Statistics Database

I tabel 2 er vist beskæftigelsesfrekvensen for indvandrere og efterkommere sammenlignet med den indfødte befolkning. Beskæftigelsesfrekvensen er i alle landede lav for navnlig indvandrere fra ikke vestlige lande. Beskæftigelsesfrekvensen er højere for efterkommere, men dog stadig under frekvensen for den indfødte befolkning. I Analysen påpeges det, at forskellene i beskæftigelsesfrekvens delvis kan forklares af forskelle i køn, alder, uddannelse, længden af opholdet og begrundelsen for opholdstilladelsen (flygtning, familesammenføring, arbejde eller uddannelse). Alle disse forhold er belyst i tabellerne i den fællesnordiske statistikbank.

Referencer:
Nordic Statistics Database , www.nordicstatistics.org/statistics (link)
Danmarks Statistik: “Indvandrere og efterkommere i de nordiske lande”, DSTAnalyse 2018:04 26/3-2019 (link)


Euroen fylder tyve år

29/01/2019          Taleboble Kommentarer

Den 1. januar 1999 etablerede en række EU-lande en valutaunion der betød, at de erstattede deres hidtidige nationale valutaer — D-mark, Frank, Lire osv. — med den fælles Euro. Euroen har således nu eksisteret i tyve år, og det britiske tidsskrift The Economist har i den anledning i en artikel analyseret den hidtidige udvikling og vurderet fremtidsudsigterne. Til støtte for analyse og vurdering anvender Economist tre grafer baseret på data fra Eurostat — EU’s statistiske kontor — til at belyse udviklingen i tre centrale økonomiske indikatorer i seks udvalgte Euro-lande. I dette indlæg gengiver jeg graferne fra The Economists artikel, men udvider med data for Danmark, der jo ikke er et Euro-land. Mit indlæg er koncentreret om de tre grafer og kommer kun i meget begrænset omfang ind på de mange interessante observationer og overvejelser i The Economist’s artikel.

Kilde: The Economist   Grafik: Veusz

Den første graf viser udviklingen i de samlede nettotilgodehavender overfor udlandet målt i pct. af bruttonationalproduktet (BNP). For lande med svage valutaer, hvor risikoen for devaluering var stor, betød tilslutningen til Euroen, at det blev nemmere og billigere at låne i udlandet. Landene fik så at sige del i Tysklands kreditværdighed. Som det fremgår af figuren benyttede navnlig Spanien, Portugal og Grækenland sig af de nye muligheder og øgede deres gæld til udlandet. Især Grækenland, hvis udenlandske nettogæld i 2017 udgjorde næsten 150 pct, af BNP. Tyskland har til gengæld øget sine tilgodehavender i udlandet betydeligt i perioden. Danmark har stort set fulgt den tyske udvikling.

Ser  man  specifikt på den offentlige gæld (midterste graf) viser et tilsvarende mønster sig. Den tyske gæld er nogenlunde konstant, hvorimod de sydeuropæiske Euro-medlemmer har øget gælden. Igen ligger den danske udvikling tæt på den tyske.

Den sidste graf viser udviklingen i BNP. Tyskland ligger i toppen med et BNP, der i 2017 ligger 25 pct. over niveuaet i 1999. For både Grækenland og Italien er BNP nogenlunde det samme i 1999 og 2017, men udviklingen har været meget forskellig i de to lande. Det italienske BNP har ligget ret konstant i perioden, hvorimod grækerne i begyndelsen af perioden oplevede en betydelig stigning, der imidlertid i 2017 vendte brat. De øvrige tre Euro-lande har haft en mere jævn udvikling. Det gælder også Danmark, der ikke på dette punkt har kunnet følge med Tyskland.

Referencer:
The Economist: “Incomplete union, The Euro enters its third decade in need of reform”, 5/1-2019 (link)


StatistikCampus — tysk internetportal om officiel statistik

02/10/2018          Taleboble Kommentarer

StatstikCampus er en internetportal om officiel tysk statistik, specielt henvendt til universitetsstuderende. Bag portalen står Tysklands officielle statistikbureau (Statistiches Bundesamt eller Destatis, se tidligere indlæg). Portalen indeholder bl. andet en generel introduktion til statistiksøgning, en række dokumenter med information om Destatis relationer til universiteterne og et E-learning kursus. Og naturligvis fortæller portalen også om ansættelses- og uddannelsesmuligheder hos Destatis.

De universitetsrelevante dokumenter præsenteres i en sektion under overskriften Statistikken møder videnskaben (Statistik trifft Wissenschaft). Studerende, der overvejer at gøre officiel statistik til tema for deres bachelor- kandidat- eller ph.d-afhandling, kan her finde en liste over relevante emner. Til hvert af de foreslåede emner er tilknyttet en kort beskrivelse — en til to sider — omkring baggrund  og eventuel eksisterende litteratur, samt henvisning til en kontaktperson i Destatis. Herudover indeholder sektionen bl.a. en beskrivelse af mulighederne for adgang til mikrodata til forskningsbrug, information om Gerhard Fürst prisen (se indlæg fra 22/11-2015), og et link til Destatis liste over konferencer og andre begivenheder vedrørende officiel statistik.

 I sektionen om statistiksøgning (Datenrecherche) er først og fremmest en kort beskrivelse af de tre vigtigske kilder til den tyske officielle statistik: Destatis hjemmesideStatistisk årbog (Statistisches Jahrbuch) og statistikbanken GENESIS-Online. Også en mere generel beskrivelse af, hvad man kan forvente at finde form af statistik, herunder statistik fra de tyske delstater (Länder) og links til hjælpemidler som bibliotek og en tysk/engelsk ordbog over statistiske fagudtryk kan findes her. Sidst men ikke mindst finder man et link til en række mikrodatasæt med anonymise­rede individdata — de såkaldte CAMPUS-files — som studerende kan få adgang til gennem en simpel procedure. Datasættene er beregnet til øvelsesbrug, og er generelt ikke egnet til egentlige analyser, men de giver de studerende en bekvem mulighed for at træne anvendelse og bearbejdning af mikrodata på realistiske materialer.

E-learning sektionen består af ni moduler til afspilning med emner som statistiske kilderdataindsamlingsmetoder og fremstilling af grafik, tabeller og kort. Længden af modulerne er mellem 20 minutter og to timer.

Referencer:
Destatis: StatistikCampus – internetportal (link)
Destatis: Hjemmeside (link)


Journalistisk brug af statistik — BBC’s retningslinier

14/11/2017          Taleboble Kommentarer

I marts 2017 offentliggjorde BBC et sæt retningslinier for formidling af statistik, Reporting Statistics. Formålet var at vejlede BBC’s journalister i at tolke og formidle statistiske data korrekt, og baggrunden var anbefalingerne i en rapport om BBC’s upartiskhed. (tidligere behandlet i denne blog)

Allerførst i retningslinierne slås det fast, at statistik er en fremragende kilde til information og gode historier for journalister, under forudsætning af, at journalisten stiller de rigtige spørgsmål, og undgår visse faldgruber. Derefter gennemgås en række overvejelser, journalisten børe gøre, i forbindelse med anvendelse af statistik.

Først og fremmest skal statistikken naturligvis være pålidelig. Det vil i praksis sige, at producenten skal være troværdig. Den officielle statistik — der i UK overvåges af UK Statistics Authority — fremhæves som upartisk og fri for politisk indflydelse. Office for National Statistics er den vigtigste, men ikke eneste, producent af officiel statistik. Andre kilder, f.eks. universiteter og uafhængige  tænketanke kan også opfylde kravet om pålidelighed, med her kræves mere forsigtighed ved vurderingen. Et kriterium kan være om kilden tidligere har vist sig at være pålidelig. Eksplicit opfordres der til, at statistik formidlet af andre end producenten selv kun anvendes, hvis der er særlige grunde. Det gælder især hvis der er tale om kilder med særlige interesser at varetage.

Retninglinierne finder det udmærket at anvende pressemeddelelser, men opfordrer til at gå bag om overskrifterne.  Bla. opfordres til ikke udelukkende at fokusere på nationale gennemsnit, men også at vurdere opdeling på f.eks. forskellige befolkningsgrupper eller forskellige geografiske områder.

Konkret gennemgås en række statistiske begreber, bl.a. gennemsnit, ekstreme værdier, fremskrivninger, regression og procentopgørelser, og der gives anvisninger på, hvordan misfortolkninger undgås. Der advares imod at overdrive de statistiske resultater, og opfordres til at redegøre for forbehold og begrænsninger, hvor det er rimeligt. Helt specielt anbefales det at undgå overdrivelser i forbindelse med statistikker, der udtrykker en konkret risiko for befolkningen, f.eks. statistik om kriminalitet og sygdom.

BBC henviser på deres hjemmeside også til at journalister kan finde vejledning hos Royal Statistical Society. Bl.a. tilbyder Royal Statistical Society et kort kursus i statistikbrug for journalister i form af en video.

Referencer:
BBC:
Retningslinier om statistikformidling (link)
Royal Statistical Society: Statistics for Journalists (link)


Weblogs om officiel statistik – Efter to år med Offstat

10/10/2017          Taleboble Kommentarer

I mit første indlæg i denne blog for to år siden gennemgik jeg nogle af de ret få weblogs, der specialiserede sig i officiel statistik. Efter to år benytter jeg lejligheden til en genvurdering og opdatering af mine betragtninger fra dengang.

Offstat’s nærmeste forbillede og inspirationskilde var (og er) Blogstats, en weblog om formidling af officiel statistik, oprettet af Armin Grossenbacher, der er tidligere publikationschef i det schweitziske statsitikbureau. Blogstats eksisterer heldigvis stadig, men opdateres ikke så ofte. Den er tænkt som en flerbrugerblog, hvor navnlig ansatte i statistikinstitutioner kan bidrage, men i praksis kommer alle bidragene fra Armin Grossenbacher selv. En funktion i Blogstats, der særligt er værd at nævne, er menupunktet Agenda, hvor man finder en liste over kommende og tidligere begivenheder med relevans for formidlingen af officiel statistik.

Udover Blogstats ( og naturligvis Offstat) har jeg ikke kendskab til andre blogs, der fokuserer bredt på officiel statistik. Nærmest kommer det svenske Statistikfrämjandet, der ofte har indlæg om officiel statistik. Noget større bliver udvalget, hvis man ser på blogs, der behandler emneområdet statistik mere generelt. Blandt dem vil jeg fremhæve StatsBlogs, der er blevet et af mine vigtigste redskaber til at finde emner og materiale til Offstat. StatsBlogs producerer ikke selv indhold, men bringer korte resumeer af indhold fra andre blogs (content syndication). De blogs, der er omfattet af StatsBlogs, repræsenterer alle sider af statistik, og ikke blot officiel statistik, men dels kan mange blogindlæg — uanset emne —  have relevens for officiel statistik, og dels vil man, hvis man er interesseret i officiel statistik, også være interessereret i andre aspekter af statistik.

Alt i alt har situationen ikke ændret sig meget i de seneste to år.  Trods stor interesse for anvendelse af officiel statistik, så er weblogs, der fokuserer på emnet, fortsat sjældne.


Hvad sker der i denne graf? — New York Times vil fremme statistisk læsefærdighed

26/09/2017          Taleboble Kommentarer

Den 19. september etablerede New York Times (NYTimes) i samarbejde med ASA (American Statistical Association) en ny web-funktion, hvis vigtigste formål er at understøtte opbygningen af statistik læsefærdighed, navnlig hos skole- og gymnasieelever. Hver anden tirsdag vil NYTimes på en særlig web-side — What’s Going On in This Graph? — offentliggøre en graf, der belyser et statistisk emne. Grafen hentes fra en anden del af NYTimes’ webside, men overskriften og vigtige nøgleord kan være fjernet, for at inspirere brugerne til selv at overveje, hvad grafen fortæller. Elever og studenter inviteres til at kommentere grafen online, og i de første timer efter offentliggørelsen vil moderatorer fra ASA bidrage med råd og vejledning. Den følgende fredag indsættes yderligere en række uddybende bemærkninger sammen med et link til den oprindelige graf.

Den første graf er et kort over USA med teksten “Da orkanen Harvey forlod Texas havde dele af Houston været oversvømmet med mere end 127 cm (50 inches) regn“. Kortet er farvekodet med en skala der går fra under 4 måneder — f.eks. enkelte områder i Californien og Oregon — til over 5 år— f.eks. store ørkenområder i Nevada og Arizona. Det er overladt til eleverne og studenterne at regne ud, at skalaen går på den periode, det normalt vil tage, før man har fået en regnmængde svarende til de 127 cm Harvey forårsagede i Houston. Fra få måneder langs den regnfulde vestlige stillehavskyst til flere år i ørkenområderne øst herfor.

Omkring 400 elever og studerende har kommenteret grafen. I de uddybende bemærkninger, under overskriften statistiske guldkorn, fortælles generelt om anvendelsen af landkort i forbindelse med statistik og der gives en forklaring på begreberne kvantitative og kategoriske variable. Næste udgave af What’s Going On in This Graph?  udkommer den 10. oktober,

Referencer:
New York Times: What’s Going On in This Graph? (link)


Bedre tabeldesign

21/04/2016          Taleboble Kommentarer

Howard Wainer er en af de statistikere, der har beskæftiget sig længst og mest med præsentation af statistiske data, herunder tabeldesign. I et indlæg i net-udgaven af  Significance — et tidsskift udgivet i fællesskab af det britiske Royal Statistical Society og det amerikanske American Statistical Association — giver han nogle gode råd til, hvordan statistiske tabeller kan udformes, så de bliver tydelige og informative. Egentlig er han ikke så begejstret for anvendelse af tabeller i formidling af statistisk, men han har konstateret, at tabeller, trods deres mangler, i praksis er den mest udbredte præsentationsform for statistik i videnskabelige tidsskrifter.

Det er ikke fordi Wainer helt afviser, at der kan være gode grunde til at anvende tabeller. F.eks. at de er velegnede til arkivering af data. Men de gode grunde er mest af historisk interesse, og da arkivering i vore dage sker elektronisk, bør den statistik, der præsenteres på papir være rettet mod formidling. Og her findes grafiske præsentationsformer, der er tabellen overlegne.

Det må dog forventes, at det vil tage noget tid, før nyere og bedre grafiske præsentationsformer for alvor slår igennem, så helt pragmatisk foreslår han, at man i mellemtiden bruger lidt kræfter på  et bedre tabeldesign.

Udgangspunktet er tre hovedregler for udformningen af de tabeller, der anvendes til præsentation af statistiske resultater.

  1. Tabellen skal indeholde opsummering af rækker og søjler, f.eks. i form af totalrække og totalsøjle med gennemsnit. Opsummeringer skal være tydeligt adskilt fra tabellens øvrige inhold.
  2. Rækkefølgen af rækker og/eller søjler skal være meningsfuld. Rækker eller søjler kan f.eks. være sorteret efter størrelsen af totalen eller indholdet af en af rækkerne/søjlerne. Alfabetisk orden er sjældent  meningsfuld.
  3. Tallene afrundes (f.eks. til tusinder eller millioner), så der i de fleste celler kun er et- eller tocifrede tal.

Udover de tre hovedregler foreslår han, at man overvejer yderligere muligheder for at tydeliggøre resultaterne. F.eks. at lægge luft ind mellem grupper af rækker, hvor det giver mening, og at fremhæve særligt interessante celler, f.eks. ved farvemarkering.

Wainer mener, at reglerne er så simple, at der ikke er nogen grund til ikke at bruge dem. Eneste ulempe, siger han, er at man måske opdager noget, man ellers havde overset!


Visuel statistik med Gapminder World

09/11/2015          Taleboble Kommentarer

Gapminder World er et værktøj til visuel præsentation af statistiske data (visuel statistik) om alle verdens lande. Værktøjet gør det muligt på samme tid at overskue fem variable, jf. figuren. To variable, i dette tilfælde indkomst og indeks for udvikling, repræsenteres ved hhv. den vandrette og den lodrette akse. To andre variable, i dette tilfælde befolkningsstørrelse og geografisk region,  repræsenteres ved hhv. størrelsen og farven af de cirkler (eller bobler) , der angiver de enkelte lande. Den femte variabel er tiden. I figuren ses kun situationen for får året 2007, men ved at trykke på play-knappen (efter at have linket til Gapminder World) startes en animation, hvor cirklerne som bobler vil bevæge sig i forhold til akserne og skifte størrelse i takt med de tre udvalgte variables udvikling over tiden.

Visuel statistik med Gapminder World

Brugeren kan foretage en række tilpasninger af diagrammet som f.eks. animationens hastighed, hvilke lande, der skal vises bobler for, hvilke variable størrelsen og farven af boblerne skal indikere og hvilke variable, der skal vises på hhv. den vandrette og den lodrette akse. Med hensyn til variable, så er valgmulighederne  begrænset til de variable, der er indbygget i Gapminder World. Det er ikke muligt, at indlæse egne variable, men til gengæld er antal af indbyggede variable meget stort. Data stammer fra en lang række kilder, typisk internationale statistikproducenter som OECD, WHO og Verdensbanken.

De mange muligheder i et interaktivt værktøj som Gapminder kan ikke beskrives i et kort blogindlæg som dette. Og slet ikke fornøjelsen ved at eksperimentere med det. Et beøg på deres hjemmeside må absolut anbefales.  Nogle eksempler på anvendelsesmuligheder kan findes her.

Bag Gapminder World står non-profit organisationen Gapminder Foundation, der har som formål at fremme bæredygtig global udvikling og opnåelse af FN’s millennium udviklingsmål. Formålet fremmes ved at udbrede kendskab til indhold og brug af statistik om verdens lande og deres udvikling. Blandt grundlæggerne er den svenske læge Hans Rosling, der i dag nærmest personificerer Gapminder. Hans Rosling er en fremragende og engageret formidler af statistikbaseret viden.  Han kan opleves i en række videoer på YouTube.

Programmellet bag Gapminder Word er Trendalyzer, som også er udviklet af Gapminder Foundation. Trendalyzer blev  i 2007 solgt til Google, og er nu integreret i nogle af Googles  produkter f.eks. Google Sheets.


Weblogs om officiel statistik

12/10/2015          Taleboble Kommentarer

Velkommen til OffStat, min blog om officiel statistik. Jeg vil her blogge om alt, hvad der vedrører officiel statistik, f.eks. vigtige begivenheder, interessante offentliggørelser og nye metoder.

Blogs, der har officiel statistik som emne, er sjældne. Faktisk har jeg kun kendskab til en enkelt, nemlig Blogstats, Den blev oprettet af Armin Grossenbacher i maj 2006, men er tænkt som en multi-forfatter blog, hvor alle interesserede er indbudt til at bidrage. Grossenbacher ser den således ikke som sin personlige blog, selv om han er den vigtigste bidragsyder.  Da han oprettede bloggen var han ansat i det schweiziske statistikbureau (Bundesamt für Statistik), men herfra blev han pensioneret i december 2014.

Blogstats præsenterer sig  som et netværk, hvor professionelle inden for formidling af officiel statistik, kan udveksle nyheder og synspunkter. Der lægges vægt på, at det er en personlig og ikke en officiel blog, men det er  tydeligvis forventningen, at bidragsyderne hovedsageligt er ansatte i nationale eller internationale statistikbureauer. Bidragsyderne udtrykker egne synspunkter og ikke synspunkter på vegne af de organisationer, de er ansat i. Der er dog den begrænsning, at statistikbureauernes strategier og politikker ikke må kommenteres

Selvom Blogstats måske er den eneste blog, der indtil nu har haft officiel statistik som som sit hovedtema, så er der naturligvis andre blogs, der lejlighedsvis eller ofte beskæftiger sig med officiel statistik.  Det gælder f.eks.  Civil Statistician, der  er en personlig blog oprettet af Jerzy Wieczorek. Wieczorek er uddannet statistiker og har været ansat i det amerikanske folketællingsbureau (U.S. Census Bureau).  Hans blog handler om statistik generelt,  men mange af indlæggene er  interessante for brugere og producenter  af officiel statistik. Ikke mindst indlæggene om visualisering af statistisk information, der er en af Wiedzoreks hovedinteresser.

Den officielle statistik spiller en stor rolle som informationskilde i mange sammenhænge.  Det er derfor ikke så overraskende at  resultater, analyser og kommentarer, der har officiel statistik som emne, grundlag eller kilde optræder hyppigt i mange former for blogs. Ikke mindst nyhedsmedierne er storforbrugere af officiel statistik, også i deres blogs. Den britiske avis The Guardian har ligefrem en særlig blog —  Datablog — der har formidling af data, herunder officiel statistik, som sit tema.

Er man interesseret i officiel statistik er men nok også interesseret i andre grene af statistikken, og her bliver antallet af weblogs anderledes stort. I den forbindelse kan kan StatsBlogs , der samler og viderebringer indlæg fra en række statistikrelaterede weblogs (syndikering) være af interesse.

Som det er fremgået, så er Grossenbachers BlogStats nærmeste forbillede for OffStat, men adskiller sig navnlig på følgende områder:

At her er tale om en personlig enkelt-forfatter blog betyder bestemt ikke, at andres synspunkter og andre indlæg ikke er velkomne. Tværtimod håber jeg på livlig aktivitet i form af kommentarer.