Pew Research Center — en velanset privat statistikproducent

25/07/2017          Taleboble Kommentarer

Det vigtigste kendetegn ved officiel statistik er at den er pålidelig. I EU-landene søges pålideligheden sikret dels ved at producenterne er underkastet regler om professionalisme og offentlighed omkring metoder og dels ved at Eurostat overvåger reglernes overholdelse. Men officiel statistik har ikke monopol på pålidelighed. Der er intet i vejen for, at private statistikproducenter kan opfylde de samme krav, som stilles til offentlige producenter. At dømme efter den anvendelse og omtale, som institutionens resultater får, er Pew Research Center et eksempel på en privat statistikproducent, der nyder samme tillid, som de bedste offentlige producenter.

Pew Research Center præsenterer sig selv som en upartisk faktatank, som informerer offentligheden om de emner, holdninger og tendenser, som former Amerika og verden. Centret er en underafdeling af The Pew Charitable Trusts, som står for hovedparten af finansieringen. The Pew Charitable Trusts har sine midler fra en række fonde etableret af fire børn af grundlæggeren af Sun Oil Company, Joseph Newton Pew.

Betegnelsen faktatank (fact tank) skal understrege at Pew Research Center — i modsætning til en tænketank (think tank) — ikke beskæftiger sig med politisk rådgivning, men udelukkende meddeler information. Centret har en række regler, der skal sikre, at det ikke bliver taget til indtægt for politiske synspunkter. Reglerne er dels rettet mod de ansatte og deres adfærd og metoder (code of ethics) og dels mod brugernes anvendelse af centres data og analyser (use policy). Brugerreglerne har ikke til formål at begrænse anvendelsen af resultaterne, men skal hindre, at centret knyttes til særlige politiske eller andre interesser.

Hovedparten af forskningscentrets aktivitet udgøres af internationale sammenligninger. Grundlaget er  en række interviewbaserede meningsmålinger, der gennemføres i omkring 90 af verdens lande. Det meste af Nord- og Sydamerika, Europa, Asien og Australien er dækket, hvorimod dækningen af Afrika er mere begrænset. Danmark er et af de få europæiske lande, der ikke er dækket.  Metoderne er tilpasset de enkelte lande og er omhyggeligt dokumenterede. Stikprøvestørrelsen ligger typisk omkring 1000.

Der offentliggøres næsten hver dag en eller flere nye analyser på centrets hjemmeside.

Referencer:
Pew Research Center’s hjemmeside
Pew Charitable Trusts’ hjemmeside


Generationsstatistik

29/09/2020          Taleboble Kommentarer

De generationer, der er vokset op med internettet — forstået som personer, der er født i 1981 eller senere — udgør fra 2019 flertallet af USA’s befolkning. Det er udgangspunktet for en analyse af den demografiske udvikling i USA, udført af  William H. Frey — seniorforsker ved Brookings Metropolitan Policy Program. Med udgangspunkt i en afgrænsning af generationer, foreslået af PEW Research Center, og data fra Folketællingsbureauet (Census Bureau), beskriver han udviklingen i befolkningens racemæssige og etniske sammensætning. De mest markante træk er, at andelen af hvide er lavere, jo yngre generationen er. Andre analyser viser, at uddannelsesniveauet er højere i de yngre generationer, og at der er betydelige holdningsforskelle mellem generationerne. Der kan derfor forventes ændringer i det politiske billede i USA, efterhånden som de yngre generationer overtager de centrale poster.

I skemaet nedenfor er PEW’s opdeling i generationer vist. Post-Z generationen ved vi ikke så meget om endnu. Den optræder mest for fuldstændighedens skyld. På et tidspunkt vil den blive afgrænset og muligvis få et andet navn.

PEW’s opdeling i generationer

Generation Fødselsårgange Alder 1. januar 2020
Præ-boomere 1945 og tidligere 74 år og ældre
Baby-boomere 1946-1964 55-73 år
Generation-X 1965-1980 39-54 år
Millennium generation 1981-1996 23-38 år
Generation-Z 1997-2012 7-22 år
Post-Z generation 2013 og senere 6 år og yngre

Kilde: Michael Dimock: “Defining generations: Where Millennials end and Generation Z begins”

Der er ikke tale om  en autoriseret eller officiel kategorisering, og PEW har udviklet den specielt til brug for amerikanske forhold. Ikke desto mindre vil jeg i det følgende anvende den til en belysning af generationerne i Danmark, idet jeg antager, at de ønskelige tilpasninger er så begrænsede, at umiddelbar anvendelse på danske data giver mening.

Millennium-generationen er den første, der er der er opvokset med internettet. Den efterfølges af generation-Z, der ikke blot er vokset op med internettet, men for hvem hele den internetbaserede teknologi er en selvfølge. Fra 2019 udgør millennium-generationen og dens efterfølgere, som tidliger nævnt, flertallet af USA’s befolkning. Det er endnu ikke tilfældet for Danmark — den danske befolkning er ældre end den amerikanske — men det vil ske i løbet af få år (se graf nedenfor)

Andel af befolkningen i Danmark født i 1981 eller senere


Kilde:
Danmarks Statistikbank, www.statistikbanken.dk FOLK2

Forskellene mellem generationernes uddannelsesmæssige status er beskrevet i tabel 1 nedenfor. Som det ses, er tendensen klart at andelen med grundskole som højeste uddannelse er faldende og andelen med lang videregående uddannelse stigende gennem generationerne. Sålænge generationerne ikke er uddøde kan uddannelsesbilledet ændre sig, men for generation-X og tidligere må ændringerne forventes at blive små. En del af millennium-generationen er derimod stadig under uddannelse, så her vil andelen med grundskole falde og andelen med lang videregående uddannelse stige i de kommende år. Det skal også bemærkes, at grundskoleuddannelse i 1972 blev forlænget fra 7 til 9 år. Det betyder, at grundskolen for generation-X og senere repræsenterer en længere uddannelse end for de foregående generationer.

Tabel 1: Højeste fuldførte uddannelse i generationer, Danmark 2019

Andel i pct.
Grundskole Kort og mellemlang uddannelse Lang videregående uddannelse I alt
Præ-boomere 30 64 6 100
Baby-boomere 25 67 8 100
Generation-X 17 68 14 100
Millennium generation 18 67 16 100

Kilde: Danmarks Statistikbank www.statistikbanken.dk/FOLK2 og HFUDD11 samt egne beregninger

Opgørelser af  befolkningen efter etnicitet og race, som de findes i den amerikanske befolkningsstatistik,  findes ikke i den officielle danske statistik. I stedet findes opgørelser efter herkomst, hvor der skelnes mellem personer med dansk oprindelse, indvandrere og efterkommere af indvandrere. Indvandrere og efterkommere er yderligere opdelt på oprindelsesland. I tabel 2 nedenfor er generationernes sammensætning efter oprindelse vist.

Tabel 2. Befolkningen efter oprindelse, 2020 og 2035 (prognose), Danmark

Pct.
Personer med dansk oprindelse
Indvandrere og efterkommere
I alt
Vestlig oprindelse Ikke-vestlig oprindlse
Befolkningsstatistik 2020
Præ-boomere 96 3 2 100
Baby-boomere 92 3 5 100
Generation-X 85 5 10 100
Millennium generation 76 10 14 100
Generation-Z 86 3 10 100
Prognose 2035
Præ-boomere 95 3 2 100
Baby-boomere 92 3 5 100
Generation-X 86 5 9 100
Millennium generation 77 9 14 100
Generation-Z 76 10 14 100

Kilde: Danmarks Statistikbank, www.statistikbanken.dk/FOLK2 og FRDK120

Indvandreres og efterkommeres andel er, som det fremgår, størst i de yngste generationer. Der forventes også i de kommende år en betydelig indvandring, og da hovedparten af indvandrere er unge, undervurderer befolkningsstatistikken de yngste generationers fremtidige andel, Derfor er tabellen suppleret med data fra Danmarks Statistiks befolkningsprognose.

Referencer:
William H. Frey:  “Now more than half of Americans are millennials or younger”,  Brookings Blog Posts 30/7-2020 (link)
Michael Dimock: “Defining generations: Where Millennials end and Generation Z begins”. Pew Research Center Facttank, 17/1-2019 (link)


Sammenligning af web-skemaer og telefoninterviews som dataindsamlingsmetode

19/02/2019          Taleboble Kommentarer

Udbredelsen af internettet gør det oplagt, at statistikproducenter må overveje at anvende web-skemaer — hvor respondenten bevarer spørgsmålene på sin computer uden medvirken af en interviewer — som alternativ til traditionelle telefoninterviews. I mange tilfælde kombinerer producenten de to metoder. Det rejser naturligt spørgsmålet om metoderne giver samme resultat.

Det gør de nok i nogle tilfælde — måske også i de fleste tilfælde — men de gør det ikke altid. Pew Research Center præsenterer i en ny YouTube-video et kort redegørelse for forskellene mellem de svar, der modtages ved anvendelse af web-skemaer og de svar, der modtages i telefoninterviews. I en rapport fra 2015, har de leveret en mere dybtgående analyse af forskellene. Rapporten er baseret på besvarelser af det samme spørgeskema fra to grupper — en der blev interviewet telefonisk, og en der besvarede et web-skema. I hver gruppe indgik ca. 1500 personer.

Hovedbudskabet er, at ved de fleste typer af spørgsmål er der kun små forskelle mellem resultaterne fra de to metoder. Men undersøgelsen viser også, at navnlig ved tre typer af spørgsmål har interviewformen afgørende betydning. Det gælder nogle, men ikke alle, spørgsmål om livskvalitet, helbred og finansielle problemer, spørgsmål om social diskrimination og spørgsmål om vurderingen af  politikere. Ved telefoninterviews var respondenterne mere  tilbøjelige til at udtrykke tilfredshed med livskvalitet, helbred og finansiel situation, mere tilbøjelige til at se diskrimination som et problem, og mere tilbøjelige til at udtrykke stærkt negative holdninger til politiske modstandere.

Karakteristisk for de spørgsmål,  hvor forskellene i svar er størst, er at der kan indgå et element af social eller politisk korrekthed i opfattelsen af svarende. Ved telefoninterviews, hvor der er direkte kontakt med intervieweren bliver svarene mere socialt og politisk korrekte, end ved web-baserede interviews, hvor den interviewede er alene. Tendens til skævhed i besvarelser i retning af det socialt accepterede eller forventede er et velkendt problem i spørgeskemabaseret statistik, og det er ikke så overrakende, at skævheden bliver større, når der er direkte kontakt til en interviewer. Men det er også et vigtigt resultat af Pew’s undersøgelse, at ikke alle typer spørgsmål er belastet af denne tendens.

Tendensen til socialt acceptable svar er den klart vigtigste kilde til forskelle i undersøgelsen, men Pew understreger, at der er andre. F,eks. er der en tendens til, at den interviewede når han præsenteres for en række svarmuligheder, vil vil vælge det sidste af de opstillede alternativer ved et telefoninterview og det første ved web-undersøgelser, hvor han sidder med spørgeskemaet foran sig. 

Pew antager, bl.a. på baggrund af andre undersøgelser, at de observerede forskelle i besvarelser ved de to metoder kan tilskrives, at der svares mere ærligt, når der ikke en interviewer indblandet. Svarene fra web-skemaerne er med andre ord af bedre kvalitet. Da metoden også er billigere at gennemføre end telefoninterviews, er der gode grund til at anvende den. Men ikke alle har adgang til internet og er villige til at besvare web-skemaer. Derimod har stort set alle adgang til telefon og villigheden til at deltage i telefoninterviews er større. Det betyder, at undersøgelser baseret på telefoninterviews er mere repræsentative end web-undersøgelser. Den mulige kvalitetsgevinst ved mere ærlige svar i web-undersøgelserne må derfor holdes op mod det mulige tab i repræsentativitet.

Referencer
Pew Research Center: 
“Phone vs. online surveys: Why do respondents’ answers sometimes differ by mode?”,  YouTube 7/2-2019 (link)
Pew Research Center: “From Telephone to the Web: The Challenge of Mode of Interview Effects in Public Opinion Polls”, 13/5-2015 (link)

 


USA’s budgetkrise rammer også den officielle statistik

22/01/2019          Taleboble Kommentarer

I lidt over en måned har en stor del af den amerikanske forbundsadministration nu været delvist lammet på grund af budgetstriden mellem præsidenten og kongressen. Det går natuturligvis også ud over den officielle statistik, men i lidt forskellig grad for de forskellige statistikområder. Faktatanken Pew Research Center har offentliggjort en oversigt over situationen og udsigterne for de vigtigste statistikker.

Et af de helt store projekter i den amerikanske statistikverden er folketællingen, der skal afholdes i 2020. Den har i forvejen været udsat for budgetnedskæringer og andre problemer (se tidl. indlæg). I første omgang ser det dog ud til, at Folketællingskontoret (Census Bureau) kan fortsætte planlægningen i omkring halvanden måned på basis af tidligere bevilgede midler. Varer krisen længere kan planlægningen blive ramt. Folketællingekontoret producerer også andre statistikker, f.eks. om boligsalg og udenrigshandel. Disse statistikker er indstillet under budgetkrisen.

Producenten af nationalregnskabet — Bureau of Economic Analysis — er lukket ned, så en planlagt offentliggørelse den 30. januar  af de første skøn for 2018 må nok udskydes. Også en række andre statistikproducenter er lukket i forbindelse med krisen. Det går bl.a. ud over landbrugsstatitsikken og kriminalstatistikken.

Sundhedsstatistik, uddannelsesstatitik og energistatistik kan fortsætte fordi bevillingerne til producenterne var på plads inden budgetkrisens udbrud. Den del af den finansielle statistik, der leveres af Centralbanken (The Federal Reserve) kan også fortsætte, da Centralbanken ikke er afhængig af bevillinger fra kongressen.

Referencer:
Drew Desilver: “The Data Casualities of the Federal Government Shutdown”, Pew Research Center 9/1-2019 (link)


Status for den kommende amerikanske folketælling i 2020

12/06/2018          Taleboble Kommentarer

Der har altid været stor politisk og juridisk bevågenhed omkring den amerikanske folketælling. Det skyldes, at folketællingen spiller en stor rolle i forbindelse med fordelingen af mandater i lovgivende forsamlinger, herunder især kongressen, og i forbindelse med fordelingen af bevillinger fra forbundsregeringen (se indlæg 19/9-2017 og 23/5-2017). I forbindelse med den kommende folketælling i 2020 har der navnlig været fokus på fire punkter (Chang, 2018):

Det centrale spørgsmål er om — eller i hvilket omfang — særlige grupper underrepræsenteres i folketællingen. Eksempler på grupper, der muligvis underrepræsenteres, er ikke-hvide, fattige og hjemløse. Der har været en formodning om, at underrepræsentationen var størst blandt Demokraternes kærnevælgere, hvilket nok er årsagen til, at Republikanerne traditionelt har været de mest kristiske overfor tiltag, der havde til formål at øge repræsentativiteten.

Omkring finansieringen er forholdene lettet lidt, efter at Folketællingen i år har fået en større bevilling end tidligere forventet. Kritikere frygter dog, at den øgede bevilling kun sikrer, at forfatningens grundlæggende krav opfyldes, men ikke er tilstrækkelig til en indsats for at forbedre repræsentativiteten.

Spørgsmålet om statsborgerskab er måske det af punkterne der har skabt mest debat. Det omstridte spørgmål vedrører kun statsborgerskabet og afslører intet om illegal indvandring. Desuden er det ikke tilladt, at anvende folketællingsdata i forbindelse med administrative afgørelser vedrørende enkeltpersoner. Alligevel frygter skeptikerne, at inddragelsen af spørgsmålet i folketællingsskemaet vil gøre det vanskeligere at opnå svar fra mange indvandrere.

Referencer:
Alvin Chang: How Republicans are Undermining the 2020 Census, Explained with a Cartoon,  Vox 8/5-2018 (link)
D’Vera Cohn: What to know about the citizenship question the Census Bureau is planning to ask in 2020, Pew Research Center  30/3-2018 (link)


Statistik om religion

05/12/2017          Taleboble Kommentarer

Statistik om religion er ikke noget kærneområde for den officielle statistik. I de officielle statistikbanker finder man kun meget sporadiske oplysninger om området. Det skyldes næppe, at emnet anses for uvæsentligt, men snarere at det ses som et særligt følsomt område, hvor myndigheder, herunder officielle statistikinstitutter, skal træde varsomt. I Frankrig, og sikkert også i andre lande, er det ligefrem ved lov forbudt myndighederne at indsamle data om religion. Der findes dog også lande, hvor et spørgsmål om religiøst tilhørsforhold indgår i folketællingerne.

Da emnet måske nok er følsomt, men samtidigt har stor interesse, så åbner den officielle statistiks tilbageholdenhed pladsen for andre aktører. Pew Research Center, jf. indlæg fra 25/7-17, har valgt religion som et af sine fokusområder. og har udgivet en serie rapporter, der belyser emnet statistisk (se Pew’s hjemmeside under fanen RELIGION). Den seneste rapport udkom den 29. november, og handler om den voksende muslimske befolkning i Europa. Andre rapporter fra de seneste måneder har handlet om udviklingen i de ortodokse kristnes andel af verdens befolkning (8. november) og om  meningsforskellene mellem lutheranere og katolikker 500 år efter konflikten begyndte (31. august).

Analysen af muslimerne i Europa er et led i det måske mest interessante af Pews religionsprojekter, der omfatter en større analyse af de forskellige religioners udbredelse nu og fremover. I tabellen nedenfor vises analysens resultater for religionernes udbredelse i verden  i 2015 og prognosen for udbredelsen i 2060.

Verdens befolkning fordelt efter religion i 2015 og 2060

2015 2060 2015 2060
mio. personer pct.
Kristne 2.276 3.054 31,2 31,8
Muslimer 1.753 2.987 24,1 31,1
Uden religiøs tilknytning 1.165 1.202 16,0 12,5
Hinduer 1.099 1.392 15,1 14,5
Buddhister 499 462 6,9 4,8
Andre 492 517 7,7 5,4
I alt 7.285 9.616 100,0 100.0

Kilde: Pew: The Changing Global Religious Landscape

Grundmaterielet for Pew’s analyse stammer fra et meget stort antal meget forskellige kilder, herunder officiel statistik. Resultaterne afspejler, hvordan udviklingen vil blive, hvis de træk vi kender i dag omkring aldersfordeling, fødsels- og dødhyppighed og konvertering mm. for de forskellige religiøse grupper fortsætter uændret. Også migrationsmønstre er inddraget i analysens belysning af den fremtidige regionale udbredelse af de forskellige religioner. Eventuelle større ændringer i de i dag kendte mønstre er der af gode grunde ikke taget højde for. På samme måde som ved befolkningsfremskrivninger er der med andre ord ikke tale om en forudsigelse, men om en fremskrivning der belyser konsekvenserne af en fortsættelse af de kendte mønstre.

Analysens mest markante resultat er den stærke forøgelse af muslimernes andel af verdensbefolkningen. I 2060 vil islam have samme relative udbredelse som kristendommen, der i dag er  den mest udbredte religion. Samlet kommer religionerne til at stå stærkere — andelen af ateister og andre uden religiøs tilknytning er faldende.

Fremskrivningerne i den seneste rapport om Europa viser drastiske forøgelser i  muslimernes andel af befolkningen i navnlig de nord- og centraleuropæiske lande. Sverige og Tyskland er blandt de lande med udsigt til den største forøgelse. Pew opererer med tre scenarier for den fremtidige indvandring: en fortsættelse af det nuværende niveau for indvandring, en vis opbremsning og et totalt stop. For Sverige bliver den muslimske andel af befolkningen i 2050 under de tre scenarier hhv. 31 %, 21 % og 11 %, mod 8 % i 2016. For Danmark er de tilsvarende tal 16 %, 12 % og 8 %, mod 5 % i 2016. (Bemærk, at tallene for Europa vedrører 2050, hvor tallene for hele verden i tabellen vedrører 2060)

Referencer:
Pew Research Center: Hjemmeside (link)
Pew Research Center: Europe’s Growing Muslim Population (link)
Pew Research Center: 
Orthodox Christianity in the 21st Century (link)
Pew Research Center: 
After 500 Years, Reformation-Era Divisions Have Lost Much of Their Potency (link)
Pew Research Center: The Changing Global Religious Landscape (link)


Økonomiens tilstand, som målt i statistikken og som oplevet af befolkningen

22/08/2017          Taleboble Kommentarer

Pew Research Center (se tidligere indlæg) har på grundlag af deres Global Attitudes Survey analyseret befolkningernes tilfredshed med tilstanden i den nationale økonomi i foråret 2017 i en række af verdens lande. I en anden undersøgelse har PRC sammenlignet disse data om befolkningernes vurdering med det billede af  den økonomiske situation, man får fra den officielle statistik

Fra Verdensbanken (World Bank) og Den Internationale Valutafond (IMF) har de hentet oplysninger om den gennemsnitlige årlige vækst i realt BNP pr capita i perioden 2011 til 2016 og om arbejdsløshedprocenten for 2016. For hvert af landene er disse to størrelser sammenholdt med den andel af befolkningen, der i foråret 2017 finder, at tilstanden for den nationale økonomi er god. Resultatet er, at der overordnet set er en vis sammenhæng mellem den økonomiske situation, som den måles i statistikken, og som den opfattes af befolkningen, men at der er mange afvigelser fra den generelle tendens.

Danmark er ikke omfattet af PRC’s undersøgelser, men på grundlag af Eurobarometer og Eurostats statistikbank kan kan tilsvarende oplysninger fremskaffes for EU-landene. I figuren nedenfor har jeg konstrueret grafer svarende til de grafer PRC har offentliggjort, men baseret på EU’s statistikker og kun omfattende EU-landene, men til gengæld samtlige EU-lande.

Sammenhæng mellem målt og oplevet økonomisk tilstand

Kilder: Eurostats statistikbank nama_10_pe, nama_10_gdp og une_rt_a; Eurobarometer maj 2017
G
rafik: Veusz

For BNP-væksten minder resultaterne meget om dem PRC når frem til for deres bredere kreds af lande. For arbejdsløsheden er overensstemmelsen mellem den oplevede situation og statistikens resultater langt højere i  min EU-opgørelse end i PRC’s bredere opgørelse.

Referencer:
Pew Research Center: Hjemmeside (link)
Pew Research Center: People’s views of their national economies don’t always square with data (link)
Pew Research Center: Global Publics More Upbeat About the Economy (link)