Tal er som bikinier. Derfor behøver vi taldannelse

“Statistikker er som bikinier: De afslører meget, men skjuler det væsentligste.” Det fyndige citat tilskrives amerikaneren Aaron Levenstein og minder os om at tallene ikke er noget i sig selv – de dækker over noget andet og vigtigere. Så når tal og statistik præsenteres som dele af argumenter, er det vigtigt at være bevidst om hvor tallene kommer fra, og forholde sig kritisk til hvorvidt de måler det man måtte være interesseret i. 

Tal er som bikinier. Derfor behøver vi taldannelse

Henrik Kragh Sørensen

I det moderne samfund har vi en forkærlighed for at benytte tal til at forstå og kontrollere den fysiske og sociale verden omkring os. Statistik består i at indsamle, bearbejde og analysere de stadigt større mængder af tal som udgør grundlaget for videnskabelige konklusioner og politiske beslutninger. Denne kvantificering er fantastisk effektiv som et logospræget grundlag at argumentere ud fra. Idehistorikeren Ted Porter har netop karakteriseret vores moderne tidsalder ved dens ‘tillid til tal’.

Vi kan bruge tal til at angive afstanden fra København til Beijing, prisstigningen på mælk igennem de sidste 100 år, Danmarks bruttonationalprodukt, odds på morgendagens basketballkamp eller risikoen for en atomkraftulykke. Men hver af disse angivelser er behæftet med en masse antagelser og idealiseringer der gør at tallene kun er meningsfulde i deres kontekster.

Når tal indgår i argumenter, står vi altså over for en konflikt i forhold til deres objektivitet: På den ene side er tal, og matematikken og statikken som studerer dem, enormt regelbundne og gennemsyret af den højeste grad af stringens og bevisførelse. På den anden side er al brug af tal i offentligheden betinget af fortolkning og framing. Derfor har vi som forbrugere af tal brug for kritisk at vurdere tallenes oprindelse, modellernes idealiseringer og fortolkningernes rækkevidde og pålidelighed.

“Tal lyver ikke” – eller gør de?

Et af de vigtigste steder hvor tallenes objektivitet bliver udfordret, er når vi er interesserede i sammenhænge mellem kvantitative data. For selv om vi kan finde på at sige at “tallene lyver ikke” eller måske endda “statistikken taler for sig selv”, så indgår store dele fortolkning og statistisk analyse i at afkode tallenes hemmeligheder.

Der er skrevet bøger om hvordan man kan lyve med statistik, for som Winston Churchill har udtrykt det, så bør man ikke have tillid til en statistik man ikke selv har forfalsket. Nogle af løgnene opstår ved fordrejninger af tallenes repræsentation. For typisk anskueliggør man tal i visuelle former som grafer eller lagkagediagrammer. I sin nytårstale i 2011 ønskede statsminister Lars Løkke Rasmussen at argumentere for at indtægterne fra nordsøolien ikke kunne blive ved med at dække de stigende udgifter til ældreforsørgelsen. Og på den graf som han viste, men som siden blev fjernet fra Venstres hjemmeside, var der ganske rigtigt et væsentligt knæk i indtægterne. Men knækket var et fatamorgana, for grafens vandrette akse ændrede målestok undervejs. Og når man tager den slags tricks i brug, kan man ‘massere’ tallenes grafiske form til at vise væsentlige pointer der ikke er kvantitativt belæg for.

Druknedød og Nicolas Cage

En anden, og dybere, grund til at gå tallene kritisk efter stammer fra den vigtige, men tit svære, sondering mellem korrelation og årsag. For det at to talfænomener optræder samtidig, betyder jo ikke uden videre at de er forbundne på nogen interessant måde. Den slags tilfældige sammenhænge er der mange af. For eksempel følger USA’s udgifter til videnskab i perioden 1999-2009 nært antallet af selvmord ved hængning i samme periode. Tilsvarende følger antallet af mennesker som er druknet i en svømmepøl, nøje udviklingen i antallet af film med Nicolas Cage. Men der er jo ikke nogen årsagssammenhæng mellem de sammenlignede talserier selv om tallene er korrelerede.

Statistik udgør et matematisk apparat til at skelne støj og tilfældighed fra relevante sammenhænge i talmaterialer. Det gør man typisk ved at opstille en matematisk model for forsøget og angive et kvantitativt mål for hvor sandsynligt et observeret udfald er. Dette kvantitative mål er ofte en såkaldt p-værdi som hvis den er mindre end 5 procent, fører til at vi accepterer at sammenhængen er statistisk signifikant. Men i sprogbrugen ligger der en indbygget fælde: For statistisk signifikant sammenhæng betyder ikke årsagssammenhæng og ikke engang fuldstændig korrelation. Derfor skal man omgå p-værdier og signifikans med forsigtighed, både i videnskaben og i den offentlige formidling af den.

I 2015 satte den tyske journalist John Bohannon sig for at påvise hvor let det var at producere statistisk signifikante observationer og få dem publiceret. Han valgte et emne med offentlig bevågenhed, nemlig kostråd, og anstillede et forsøg med 15 forsøgspersoner der blev delt i grupper med forskellige diæter: En gruppe blev sat på en kaloriereduceret diæt, en anden blev også sat på samme diæt, men bedt om at spise en chokoladebar dagligt, og en tredje gruppe blev brugt som kontrolgruppe uden diætændringer. Så målte Bohannon på 18 forskellige parametre, og han havde på forhånd kunnet regne ud, at der var 60 procent chance for at opnå et statistisk signifikant resultat. Det han fandt, og valgte at gå videre med, var at hvis du er ved at tabe dig, så vil indtagelse af en daglig chokoladebar øge hastigheden af dit vægttab.

Resultatet var statistisk signifikant, og Bohannon udnyttede et grådigt marked af parasitiske videnskabelige tidsskrifter til at få det udgivet. Så snart det var udgivet, gik han til medierne, og ved at forsyne redaktionerne med fortyggede pressemeddelelser lykkedes det ham at få omtale i mange store aviser. Men resultatet var selvfølgelig ikke robust: Der var alt for få forsøgspersoner, og ved at måle på så mange parametre uden på forhånd at have en teori om mulige årsagssammenhænge begik Bohannon det der i akademiske kredse kaldes p-hacking og selektiv rapportering. Hans eksperiment kunne synes uskyldigt, men det peger på dybe problemer i videnskaben og i offentlighedens forståelse af den: Bohannon formåede på den ene side at omgå den interne akademiske kvalitetskontrol, og på den anden side slugte flere medier historien råt fordi den var sensationel og fremstod troværdig alene igennem sin appel til statistikkens objektivitet.

Taldannelse i den postfaktuelle verdensorden

Eksemplerne på sensationslystens betydning for statistikkens objektivitet er selvfølgelig ikke begrænset til videnskaberne. I den politiske debat og i medierne svirrer det med tal som er effektive dele af argumenter. I april 2017 blev det besluttet at sætte tal på hvad en ikke-vestlig indvandrer koster den danske stat. Og beløbet, som blev rapporteret i pressen, var sensationelt når det i overskrifterne blev angivet uden et ordentligt sammenligningsgrundlag og uden en kritisk diskussion af beregningsmodellen. Tidligere havde man fra politisk hold afholdt sig fra at foretage sådanne beregninger med henvisning til at beregningen var nærmest umulig og for øvrigt irrelevant. Men diskussionen om tallenes rigtighed blev effektivt modvirket af en alternativ framing: Nogen med magt ville holde tallene hemmelige. Dette er et eksempel på det man nogle steder er begyndt at kalde postnormal eller postfaktuel videnskab: I erkendelse af at tal og videnskab ikke i sig selv besidder den objektivitet vi troede, er fokus flyttet til at påvirke opfattelsen og forståelsen af tal og videnskab i den offentlige diskurs. Dette blev måske mest tydeligt i diskussionen om landbrugspakken hvor kritikerne pegede på decideret kreativ bogføring i opstillingen af den centrale model og fortolkningerne af dens resultater.

Som modsvar på denne framing af tal og videnskab må vi i den kritiske dannelses navn tilstræbe en form for demokratisk taldannelse der blandt andet omfatter forståelse af tallenes pålidelighed og rækkevidde. Men foruden behovet for talfornemmelse har vi også brug for en udviklet form for talkritik som starter med at indse at tal er resultatet af en modelleringsproces hvor valg og fortolkninger er uundgåelige. Så det er helt oplagt at regnedrengenes præmisser drages frem i lyset, og det er vigtigt at vi kan stille spørgsmål som “hvilke antagelser er gjort?”, “hvilke data er indsamlet?”, “hvilke data er ikke indsamlet og udgør altså mørketal?” og så videre. Denne modelkritik er essentiel for vores indsigt i modellens resultater. Men vi skal også have en mulighed for at se regnedrengene over skuldrene og forstå rækkevidden af de forudsigelser som de matematiske og økonomiske modeller munder ud i. For i takt med at modellerne og deres kvantitative resultater bliver stadig flere, mere komplekse og mere uomgængelige, har vi brug for talkritik, modelkritik og statistikforståelse – med andre ord ‘taldannelse’.

Bestræbelserne på at nå denne udvidede taldannelse er ikke undergravende for videnskab, statistik eller matematik. I stedet påviser den at, og på hvilken måde, kvantitative modeller er vores bedste tilgængelige viden. Igennem dette pragmatiske, men kritisk reflekterede modsvar til den naive tiltro til tallenes objektivitet bliver taldannelsen til et vigtigt aspekt af den videnskabelige dannelse.

R


Læs mere

Theodore M. Porter: Trust in numbers. The pursuit of objectivity in science and public life. Princeton (NJ): Princeton University Press, 1995.

Fabienne Crettaz von Roten: “Do we need a public understanding of statistics?”, i Public Understanding of Science, bd. 15. 2006.

Henrik Kragh Sørensen: Tal. Tænkepauser: Viden til hverdagen 47. Aarhus: Aarhus Universitetsforlag. 2017.

Bibliografisk
Af Henrik Kragh Sørensen, professor m.s.o., Sektion for videnskabsteori og videnskabshistorie, Institut for Naturfagenes Didaktik, Københavns Universitet.
RetorikMagasinet 104 (2017), s 9-11.

Om skribenten

professor m.s.o., Sektion for videnskabsteori og videnskabshistorie, Institut
for Naturfagenes Didaktik, Københavns Universitet.

Lämna ett svar