10 spørgsmål at stille om videnskabelige undersøgelser

Her på Greater Good dækker vi forskning i social og følelsesmæssig trivsel og forsøger at hjælpe folk med at anvende resultaterne i deres personlige og professionelle liv. Vi er udmærket klar over, at vores branche er vanskelig.

Det er ikke kun vanskeligt at opsummere videnskabelige undersøgelser og anvende dem på folks liv af indlysende årsager, f.eks. at forstå og derefter forklare videnskabeligt jargon eller videnskabelige metoder til ikke-specialister. Det er også sådan, at konteksten går tabt, når vi omsætter resultater til historier, tips og værktøjer til et mere meningsfuldt liv, især når vi presser det hele gennem internettets nuanceforvrængningsmaskine. Mange mennesker læser aldrig mere end overskrifterne, som i sig selv har til formål at overgeneralisere og fremkalde interesse. Da vores artikler aldrig kan være lige så omfattende som de originale undersøgelser, udelader de næsten altid nogle afgørende forbehold, f.eks. begrænsninger, som forskerne har erkendt. For at få dem skal man have adgang til selve undersøgelserne.

Og det er meget almindeligt, at resultaterne synes at være i modstrid med hinanden. For eksempel dækkede vi for nylig et eksperiment, der tyder på, at stress reducerer empati – efter at vi tidligere havde omtalt anden forskning, der tyder på, at stressramte mennesker kan være mere empatiske. Nogle læsere spurgte: Hvilken af dem er korrekt? (Du kan finde mit svar her.)

Men den vigtigste manglende brik er nok fremtiden. Det lyder måske som en sjov ting at sige, men faktisk er en ny undersøgelse ikke den PDF værd, som den er trykt på, før dens resultater er gentaget og valideret af andre undersøgelser – undersøgelser, der endnu ikke er foretaget. Et eksperiment er blot interessant, indtil tid og afprøvning gør dets resultater til en kendsgerning.

Videnskabsfolk ved dette, og de er trænet til at reagere meget skeptisk på enhver ny artikel. De forventer også at blive mødt med skepsis, når de præsenterer resultater. Tillid er godt, men videnskab handler ikke om tillid. Det handler om verifikation.

Derimod er journalister som mig og medlemmer af den brede offentlighed ofte tilbøjelige til at behandle hver ny undersøgelse, som om den repræsenterer det sidste ord om det behandlede spørgsmål. Dette særlige problem blev fremhævet i sidste uge af – vent på det – en ny undersøgelse, der forsøgte at reproducere 100 tidligere psykologiske undersøgelser for at se, om deres resultater holdt stik. Resultatet af det treårige initiativ er skræmmende: Holdet, der blev ledet af psykologen Brian Nosek fra University of Virginia, fik de samme resultater i kun 36 procent af de eksperimenter, de replicerede. Dette har ført til nogle forudsigeligt provokerende, overgeneraliserende overskrifter, der antyder, at vi ikke bør tage psykologien alvorligt.

Jeg er ikke enig.

Trods alle fejl og overdrevne påstande og kritik og modsigelser og argumenter – eller måske på grund af dem – er vores viden om menneskers hjerner og sind blevet udvidet dramatisk i løbet af det sidste århundrede. Psykologi og neurovidenskab har dokumenteret fænomener som kognitiv dissonans, identificeret mange af de hjernestrukturer, der understøtter vores følelser, og bevist placeboeffekten og andre dimensioner af krop-sind-forbindelsen, blandt andre resultater, der er blevet testet igen og igen.

Disse opdagelser har hjulpet os med at forstå og behandle de sande årsager til mange sygdomme. Jeg har hørt det hævdet, at stigende antal diagnoser af psykiske sygdomme er et bevis på, at psykologien fejler, men faktisk er det modsatte tilfældet: Vi ser flere og bedre diagnoser af problemer, som tidligere generationer ville have tvunget folk til at afvise dem som “dumme” eller “skøre” eller “overdrevne” eller “blå”. Det vigtige at huske på er, at det har taget meget, meget lang tid for videnskaben at nå frem til disse indsigter og behandlinger efter mange forsøg og fejltagelser.

Videnskab er ikke en tro, men snarere en metode, som det tager tid at udfolde. Derfor er det lige så forkert at tage ukritisk alt, hvad man læser, ukritisk til sig, også det du læser på denne side.

I betragtning af kompleksiteten og tvetydigheden i den videnskabelige bestræbelse, er det da muligt for en ikke-videnskabsmand at finde en balance mellem en generel afvisning og ukritisk tro? Er der røde flag, man skal kigge efter, når man læser om en undersøgelse på et websted som Greater Good eller i en populær selvhjælpsbog? Hvis du læser en af de faktiske undersøgelser, hvordan skal du som ikke-videnskabsmand så vurdere dens troværdighed?

Jeg trak på min egen erfaring som videnskabsjournalist og spurgte mine kolleger her på UC Berkeley Greater Good Science Center. Vi fandt frem til 10 spørgsmål, som du kan stille, når du læser om de seneste videnskabelige resultater. Det er også spørgsmål, som vi stiller os selv, før vi dækker en undersøgelse.

1. Er undersøgelsen udkommet i et peer-reviewed tidsskrift?
2. Hvem blev undersøgt, hvor?
3. Hvor stor var stikprøven?
4. Har forskerne kontrolleret for vigtige forskelle?
5. Var der en kontrolgruppe?
6. Har forskerne fastslået kausalitet, korrelation, afhængighed eller en anden form for sammenhæng?
7. Overvurderer journalisten eller endog videnskabsmanden resultatet?
8. Er der nogen interessekonflikt, der antydes af finansieringen eller forskernes tilknytning?
9. Har forskeren tilsyneladende en dagsorden?
10. Anerkender forskerne begrænsninger og overvejer alternative forklaringer?

1. Er undersøgelsen udkommet i et peer-reviewed tidsskrift?

Peer review – at indsende artikler til andre eksperter til uafhængig gennemgang, inden de accepteres – er fortsat en af de bedste måder, vi har til at fastslå undersøgelsens grundlæggende seriøsitet, og mange forskere beskriver peer review som en virkelig ydmygende smeltedigel. Hvis en undersøgelse ikke har gennemgået denne proces, uanset årsagen, skal den tages med et meget større gran salt.

2. Hvem blev undersøgt, hvor?

Dyreforsøg fortæller forskerne en masse, men deres anvendelighed i vores daglige liv som mennesker vil være begrænset. På samme måde vil konklusionerne, hvis forskerne kun har undersøgt mænd, måske ikke være relevante for kvinder, og omvendt.

Dette var faktisk et stort problem med Nosek’s forsøg på at replikere andres eksperimenter. I forsøget på at replikere en tysk undersøgelse måtte de f.eks. bruge andre kort (nogle, som ville være velkendte for studerende fra University of Virginia) og ændre en skala, der målte aggression, så den afspejlede amerikanske normer. Denne form for varians kunne forklare de forskellige resultater. Det kan også tyde på begrænsningerne ved at generalisere resultaterne fra en undersøgelse til andre befolkningsgrupper, der ikke er omfattet af den pågældende undersøgelse.

Som tilgang skal læserne huske, at mange psykologiske undersøgelser er baseret på WEIRD-prøver (vestlige, uddannede, industrialiserede, rige og demokratiske), hovedsageligt universitetsstuderende, hvilket skaber en indbygget skævhed i disciplinens konklusioner. Betyder det, at man skal afvise den vestlige psykologi? Selvfølgelig ikke. Det svarer blot til et “Pas på”- eller “Yield”-skilt på vejen til forståelse.

3. Hvor stor var stikprøven?

Generelt gælder det, at jo flere deltagere i en undersøgelse, jo mere valide er dens resultater. Når det er sagt, er en stor stikprøve nogle gange umulig eller endog uønsket for visse typer undersøgelser. Dette gælder især i dyre neurovidenskabelige eksperimenter, der involverer funktionelle magnetiske resonansbilleder eller fMRI-scanninger.

Og mange mindfulness-undersøgelser har scannet hjernen hos mennesker med mange tusinde timers meditationserfaring – en relativt lille gruppe. Men selv i disse tilfælde er en undersøgelse, der ser på 30 erfarne mediterende personer, sandsynligvis mere solid end en lignende undersøgelse, der kun har scannet hjernen på 15.

4. Har forskerne kontrolleret for vigtige forskelle?

Mangfoldighed eller kønsbalance er ikke nødvendigvis dyder i en forskningsundersøgelse; det er faktisk en god ting, når en undersøgelsespopulation er så homogen som muligt, fordi det giver forskerne mulighed for at begrænse antallet af forskelle, der kan påvirke resultatet. En god forsker forsøger at sammenligne æbler med æbler og kontrollere for så mange forskelle som muligt i sin analyse.

5. Var der en kontrolgruppe?

En af de første ting, man skal kigge efter i metodologien, er, om stikprøven er randomiseret og omfattede en kontrolgruppe; dette er især vigtigt, hvis en undersøgelse skal antyde, at en bestemt variabel faktisk kan forårsage et bestemt resultat, snarere end blot at være korreleret med det (se næste punkt).

For eksempel: Blev nogle i stikprøven tilfældigt tildelt en bestemt meditationspraksis, mens andre ikke blev det? Hvis stikprøven er stor nok, kan randomiserede forsøg give solide konklusioner. Men nogle gange vil en undersøgelse ikke have en kontrolgruppe, fordi det er etisk umuligt. (Ville folk stadig omdirigere en vogn for at dræbe én person for at redde fem liv, hvis deres beslutning dræbte en rigtig person i stedet for blot at være et tankeeksperiment? Vi vil aldrig vide det med sikkerhed!)

Konklusionerne kan stadig give en vis indsigt, men de skal holdes i perspektiv.

6. Har forskerne fastslået kausalitet, korrelation, afhængighed eller en anden form for sammenhæng?

Jeg hører ofte “Korrelation er ikke årsagssammenhæng” råbt som en slags kampråb, for at forsøge at miskreditere en undersøgelse. Men korrelation – den grad, hvormed to eller flere målinger synes at ændre sig samtidig – er vigtig og er et skridt på vejen til i sidste ende at finde årsagssammenhæng – dvs. at fastslå, at en ændring i en variabel direkte udløser en ændring i en anden variabel.

Det vigtige er at identificere sammenhængen korrekt.

7. Overvurderer journalisten eller endog videnskabsmanden resultatet?

Sprog, der antyder, at en kendsgerning er “bevist” af én undersøgelse, eller som fremmer én løsning for alle mennesker, overvurderer højst sandsynligt sagen. Generaliseringer af enhver art tyder ofte på en mangel på ydmyghed, som bør være et rødt flag for læserne. En undersøgelse kan meget vel “antyde” en bestemt konklusion, men den “beviser” den sjældent, hvis overhovedet nogensinde.

Det er derfor, vi bruger en masse forsigtigt, afdækkende sprogbrug i Greater Good, som “måske” eller “antyder”.

8. Er der nogen interessekonflikt, der antydes af finansieringen eller forskernes tilknytning?

En nylig undersøgelse viste, at man kunne drikke masser af sukkerholdige drikkevarer uden at være bange for at blive fed, så længe man dyrkede motion. Finansieren? Coca Cola, som ivrigt promoverede resultaterne. Det betyder ikke, at resultaterne er forkerte. Men det tyder på, at du bør søge en anden mening.

9. Har forskeren tilsyneladende en dagsorden?

Læsere kan forståeligt nok være skeptiske over for undersøgelser af mindfulness-meditation, der fremmes af praktiserende buddhister, eller eksperimenter om værdien af bøn, der udføres af kristne. Igen, det betyder ikke automatisk, at konklusionerne er forkerte. Det hæver imidlertid barren for peer review og replikation. For eksempel krævede det hundredvis af eksperimenter, før vi med sikkerhed kunne begynde at sige, at mindfulness faktisk kan reducere stress.

10. Anerkender forskerne begrænsninger og overvejer alternative forklaringer?

Er undersøgelsen kun fokuseret på én side af historien eller én fortolkning af dataene? Har den undladt at overveje eller tilbagevise alternative forklaringer? Viser de bevidsthed om, hvilke spørgsmål der besvares, og hvilke der ikke besvares af deres metoder?

Jeg opsummerer min personlige holdning som ikke-videnskabsmand over for videnskabelige resultater således: Nysgerrig, men skeptisk. Jeg tager det hele alvorligt, og jeg tager det hele med et gran salt. Jeg vurderer det i forhold til min erfaring, vel vidende at min erfaring skaber bias. Jeg forsøger at dyrke ydmyghed, tvivl og tålmodighed. Det lykkes mig ikke altid; når jeg fejler, forsøger jeg at indrømme mine fejl og tilgive mig selv. Min egen forståelse er ufuldstændig, og jeg minder mig selv om, at en undersøgelse kun er et skridt i retning af forståelse. Frem for alt forsøger jeg at huske på, at videnskab er en proces, og at konklusioner altid rejser flere spørgsmål, som vi skal besvare.

Maternidad y todo

Store ideerArtikler og mere