Benfords lov
05/09/2016
Kommentarer
Kolonne 2 og 3 i tabellen nedenfor viser resultatet af et eksperiment. Fra Danmarks Statistikbank har jeg udtrukket alle regnskabstallene (undtagen totaler og undersummer) fra tabellen med regnskabsstatistik for byeerhverv (REGN5) . Derefter har jeg fordelt alle tallene efter første ciffer, uanset hvor mange cifre, der i alt var i tallet. Tallene 3, 34, -34, 30.458 og 0,345 er altså alle optalt i rækken med 3 som første ciffer. Nuller er helt udeladt.
|
Første |
Regnskabsstatistik | Benfords lov pct. |
Græsk nationalregskab 2009, pct. |
|
| Optælling | Fordeling pct. |
|||
| 1 | 558 | 31 | 30 | 29 |
| 2 | 324 | 18 | 18 | 26 |
| 3 | 212 | 12 | 13 | 20 |
| 4 | 180 | 10 | 10 | 10 |
| 5 | 124 | 7 | 8 | 2 |
| 6 | 108 | 6 | 7 | 4 |
| 7 | 102 | 6 | 6 | 5 |
| 8 | 85 | 5 | 5 | 3 |
| 9 | 102 | 6 | 6 | 0 |
Kilde: Bernhard Rauch, Max Göttsche & Gernot Brähler, Fact and Fiction in EU-Governmental Economic Data, German Economic Review 12(3).
Danmarks Statistikbank REGN5
I kolonne 4 er til sammenligning vist en fordeling, der går, under navnet Benfords lov. Den beskriver hvordan første ciffer i en række tal fordeler sig, hvis tallene er fremkommet fuldt tilfældigt, hvor tilfældig også betyder, at intervalgrænserne for hvert tal er tilfældigt. Tilfældige (eller pseudotilfældige) tal, dannet af en tilfældighedsgenerator ligger normalt i et bestemt interval, f.eks. mellem nul og en, og vil ikke følge Benfords lov. Men regnskabsstatistikkens tal kan formodes at opfylde kravene om fuld tilfældighed, og det er derfor ganske betryggende, at det ser ud til, at de er i nogenlunde overensstemmelse med Benfords lov. Hvis en statistik, der opfylder tilfældighedskravene, ikke følger Benfords lov, kan det være en indikation af, at der er noget galt, f.eks. at tallene er manipulerede.
I den sidste kolonne er vist første-ciffer fordelingen i det græske nationalregnskab for 2009. Her ser ikke ud til at være overensstemmelse med Benfords lov. Der kan være gode grunde til, at en statistisk talserie ikke følger Benfords lov, men i dette tilfælde er grundene nok ikke så gode. I hvert fald udgav Kommisionen for EU i januar 2010 en rapport (Report on Greek Government Deficit and Debt Statistics) , hvori det blev konstateret, at den græske økonomiske statistik var i en meget dårlig forfatning og stærkt fejlbehæftet.
Det kan virke overraskende, at første ciffer i statistiske talserier ikke er ligeligt fordelt, men det har naturligvis en god og naturlig årsag. Den vil jeg ikke komme nærmere ind på her, men henvise til denne udmærkede forklaring.
