Wir von Greater Good befassen uns mit der Forschung im Bereich des sozialen und emotionalen Wohlbefindens und versuchen, den Menschen dabei zu helfen, die Ergebnisse auf ihr persönliches und berufliches Leben anzuwenden. Wir sind uns bewusst, dass unser Geschäft ein heikles ist.
Wissenschaftliche Studien zusammenzufassen und sie auf das Leben der Menschen anzuwenden, ist nicht nur aus den offensichtlichen Gründen schwierig, z. B. wenn es darum geht, wissenschaftlichen Fachjargon oder wissenschaftliche Methoden zu verstehen und sie dann Nicht-Fachleuten zu erklären. Es ist auch so, dass der Kontext verloren geht, wenn wir Erkenntnisse in Geschichten, Tipps und Hilfsmittel für ein sinnvolleres Leben umwandeln, vor allem, wenn wir das alles durch die nuancenverdrängende Maschine des Internets schieben. Viele Menschen lesen nie über die Schlagzeilen hinaus, die von Natur aus darauf abzielen, zu verallgemeinern und Interesse zu wecken. Da unsere Artikel nie so umfassend sein können wie die Originalstudien, fehlen in ihnen fast immer einige wichtige Vorbehalte, wie die von den Forschern eingeräumten Einschränkungen. Um diese zu erfahren, müssen Sie Zugang zu den Studien selbst haben.
Und es kommt sehr häufig vor, dass sich die Ergebnisse scheinbar widersprechen. Zum Beispiel berichteten wir kürzlich über ein Experiment, das nahelegt, dass Stress die Empathie verringert – nachdem wir zuvor andere Forschungsergebnisse diskutiert hatten, die nahelegen, dass stressanfällige Menschen empathischer sein können. Einige Leser fragten: Welche der beiden Aussagen ist richtig? (Meine Antwort finden Sie hier.)
Aber das wahrscheinlich wichtigste fehlende Stück ist die Zukunft. Das hört sich vielleicht komisch an, aber eine neue Studie ist das PDF, auf dem sie gedruckt ist, nicht wert, solange ihre Ergebnisse nicht durch andere Studien wiederholt und bestätigt werden – Studien, die noch nicht stattgefunden haben. Ein Experiment ist nur so lange interessant, bis seine Ergebnisse mit der Zeit und durch Tests zu einer Tatsache werden.
Wissenschaftler wissen das, und sie sind darauf trainiert, auf jede neue Arbeit sehr skeptisch zu reagieren. Sie erwarten auch, dass man ihnen mit Skepsis begegnet, wenn sie ihre Ergebnisse präsentieren. Vertrauen ist gut, aber in der Wissenschaft geht es nicht um Vertrauen. Es geht um Verifikation.
Journalisten wie ich und die breite Öffentlichkeit neigen jedoch oft dazu, jede neue Studie so zu behandeln, als sei sie das letzte Wort zu der behandelten Frage. Dieses besondere Problem wurde letzte Woche durch eine neue Studie hervorgehoben, in der versucht wurde, 100 frühere psychologische Studien zu reproduzieren, um zu sehen, ob ihre Ergebnisse Bestand haben. Das Ergebnis der dreijährigen Initiative ist erschreckend: Das Team unter der Leitung des Psychologen Brian Nosek von der University of Virginia kam in nur 36 % der wiederholten Experimente zu den gleichen Ergebnissen. Das hat zu einigen vorhersehbar provokanten, überverallgemeinernden Schlagzeilen geführt, die implizieren, dass wir die Psychologie nicht ernst nehmen sollten.
Ich stimme dem nicht zu.
Trotz all der Fehler und übertriebenen Behauptungen, der Kritik, der Widersprüche und Argumente – oder vielleicht gerade deswegen – hat sich unser Wissen über das menschliche Gehirn und den Verstand im letzten Jahrhundert dramatisch erweitert. Psychologie und Neurowissenschaft haben Phänomene wie kognitive Dissonanz dokumentiert, viele der Gehirnstrukturen identifiziert, die unsere Emotionen unterstützen, und den Placebo-Effekt und andere Dimensionen der Verbindung zwischen Geist und Körper nachgewiesen, neben anderen Erkenntnissen, die immer wieder getestet wurden.
Diese Entdeckungen haben uns geholfen, die wahren Ursachen vieler Krankheiten zu verstehen und zu behandeln. Ich habe gehört, dass die steigenden Raten von Diagnosen psychischer Erkrankungen ein Beweis dafür sind, dass die Psychologie versagt, aber in Wirklichkeit ist das Gegenteil der Fall: Es gibt mehr und bessere Diagnosen von Problemen, die frühere Generationen dazu veranlasst hätten, Menschen als “dumm” oder “verrückt” oder “hyper” oder “blau” abzutun. Man darf nicht vergessen, dass es sehr, sehr lange gedauert hat, bis die Wissenschaft nach vielen Versuchen und Irrtümern zu diesen Erkenntnissen und Behandlungen gekommen ist.
Die Wissenschaft ist kein Glaube, sondern eine Methode, die Zeit braucht, um sich zu entfalten. Deshalb ist es auch falsch, unkritisch alles zu übernehmen, was man liest, auch das, was man auf dieser Seite liest.
Ist es für einen Nicht-Wissenschaftler angesichts der Komplexität und Mehrdeutigkeit des wissenschaftlichen Unterfangens möglich, ein Gleichgewicht zwischen pauschaler Ablehnung und unkritischem Glauben zu finden? Gibt es Warnhinweise, auf die man achten sollte, wenn man über eine Studie auf einer Website wie Greater Good oder in einem populären Selbsthilfebuch liest? Wenn Sie eine der tatsächlichen Studien lesen, wie sollten Sie als Nicht-Wissenschaftler deren Glaubwürdigkeit einschätzen?
Ich habe auf meine eigenen Erfahrungen als Wissenschaftsjournalist zurückgegriffen und meine Kollegen hier im Greater Good Science Center der UC Berkeley befragt. Wir haben uns 10 Fragen ausgedacht, die man sich stellen könnte, wenn man über die neuesten wissenschaftlichen Erkenntnisse liest. Es sind auch Fragen, die wir uns selbst stellen, bevor wir über eine Studie berichten.
- 1. Wurde die Studie in einer von Fachleuten begutachteten Zeitschrift veröffentlicht?
- 2. Wer wurde wo untersucht?
- 3. Wie groß war die Stichprobe?
- 4. Haben die Forscher die wichtigsten Unterschiede berücksichtigt?
- 5. Gab es eine Kontrollgruppe?
- 6. Haben die Forscher Kausalität, Korrelation, Abhängigkeit oder eine andere Art von Beziehung festgestellt?
- 7. Übertreibt der Journalist oder sogar der Wissenschaftler das Ergebnis?
- 8. Gibt es einen Interessenkonflikt, der durch die Finanzierung oder die Verbindungen der Forscher nahegelegt wird?
- 9. Scheint der Forscher ein bestimmtes Ziel zu verfolgen?
- 10. Erkennen die Forscher Einschränkungen an und ziehen alternative Erklärungen in Betracht?
1. Wurde die Studie in einer von Fachleuten begutachteten Zeitschrift veröffentlicht?
Das Peer-Review-Verfahren – die Vorlage von Arbeiten bei anderen Experten zur unabhängigen Überprüfung vor der Annahme – ist nach wie vor eine der besten Möglichkeiten, um die grundlegende Seriosität einer Studie festzustellen, und viele Wissenschaftler beschreiben das Peer-Review-Verfahren als einen wahrhaft demütigenden Schmelztiegel. Wenn eine Studie diesen Prozess nicht durchlaufen hat, aus welchem Grund auch immer, sollte sie mit einem viel größeren Körnchen Salz betrachtet werden.
2. Wer wurde wo untersucht?
Tierexperimente sagen Wissenschaftlern viel, aber ihre Anwendbarkeit auf unser tägliches menschliches Leben ist begrenzt. Wenn Forscher nur Männer untersuchten, könnten die Schlussfolgerungen für Frauen nicht relevant sein und umgekehrt.
Dies war in der Tat ein großes Problem bei Noseks Bemühungen, die Experimente anderer Leute zu wiederholen. Bei dem Versuch, eine deutsche Studie zu replizieren, mussten sie zum Beispiel andere Karten verwenden (die den Studenten der University of Virginia vertraut waren) und eine Skala zur Messung der Aggression so ändern, dass sie amerikanische Normen widerspiegelt. Diese Art von Varianz könnte die unterschiedlichen Ergebnisse erklären. Sie könnte auch auf die Grenzen der Verallgemeinerung der Ergebnisse einer Studie auf andere Bevölkerungsgruppen hinweisen, die nicht in diese Studie einbezogen wurden.
Der Leser sollte sich daran erinnern, dass viele psychologische Studien sich auf WEIRD (westlich, gebildet, industrialisiert, reich und demokratisch) Stichproben stützen, vor allem auf College-Studenten, was zu einer eingebauten Verzerrung der Schlussfolgerungen in der Disziplin führt. Bedeutet das, dass man die westliche Psychologie ablehnen sollte? Nein, natürlich nicht. Es ist nur das Äquivalent eines “Vorsicht”- oder “Vorfahrt achten”-Schildes auf dem Weg zum Verständnis.
3. Wie groß war die Stichprobe?
Im Allgemeinen gilt: Je mehr Teilnehmer an einer Studie teilnehmen, desto valider sind die Ergebnisse. Allerdings ist eine große Stichprobe bei bestimmten Studien nicht immer möglich oder sogar unerwünscht. Dies gilt vor allem für teure neurowissenschaftliche Experimente mit funktioneller Magnetresonanztomographie (fMRI).
Und viele Achtsamkeitsstudien haben die Gehirne von Menschen mit vielen tausend Stunden Meditationserfahrung gescannt – eine relativ kleine Gruppe. Aber selbst in diesen Fällen ist eine Studie, die 30 erfahrene Meditierende untersucht, wahrscheinlich solider als eine ähnliche, bei der nur die Gehirne von 15 Personen gescannt wurden.
4. Haben die Forscher die wichtigsten Unterschiede berücksichtigt?
Vielfalt oder Ausgewogenheit zwischen den Geschlechtern sind in einer Forschungsstudie nicht unbedingt von Vorteil; es ist sogar gut, wenn eine Studienpopulation so homogen wie möglich ist, denn so können die Forscher die Zahl der Unterschiede, die das Ergebnis beeinflussen könnten, begrenzen. Ein guter Forscher versucht, Äpfel mit Äpfeln zu vergleichen und so viele Unterschiede wie möglich in seiner Analyse zu berücksichtigen.
5. Gab es eine Kontrollgruppe?
Eines der ersten Dinge, auf die man bei der Methodik achten sollte, ist, ob die Stichprobe randomisiert ist und eine Kontrollgruppe umfasst; dies ist besonders wichtig, wenn eine Studie nahelegen soll, dass eine bestimmte Variable tatsächlich ein bestimmtes Ergebnis verursacht und nicht nur damit korreliert ist (siehe nächster Punkt).
Wurde beispielsweise einigen Mitgliedern der Stichprobe zufällig eine bestimmte Meditationspraxis zugewiesen, während andere nicht daran teilnahmen? Wenn die Stichprobe groß genug ist, können randomisierte Studien solide Schlussfolgerungen liefern. Aber manchmal gibt es in einer Studie keine Kontrollgruppe, weil das ethisch unmöglich ist. (Würden Menschen immer noch einen Einkaufswagen umleiten, um eine Person zu töten, um fünf Leben zu retten, wenn ihre Entscheidung einen echten Menschen töten würde, anstatt nur ein Gedankenexperiment zu sein? Wir werden es nie mit Sicherheit wissen!)
Die Schlussfolgerungen können immer noch einen gewissen Einblick geben, aber sie müssen in der richtigen Perspektive betrachtet werden.
6. Haben die Forscher Kausalität, Korrelation, Abhängigkeit oder eine andere Art von Beziehung festgestellt?
Ich höre oft “Korrelation ist keine Kausalität” als eine Art Schlachtruf, um eine Studie zu diskreditieren. Aber die Korrelation – das Ausmaß, in dem sich zwei oder mehr Messwerte gleichzeitig zu ändern scheinen – ist wichtig und ein Schritt, um schließlich eine Kausalität zu finden, d. h. festzustellen, dass eine Änderung in einer Variablen direkt eine Änderung in einer anderen auslöst.
Das Wichtigste ist, die Beziehung richtig zu identifizieren.
7. Übertreibt der Journalist oder sogar der Wissenschaftler das Ergebnis?
Eine Sprache, die suggeriert, dass eine Tatsache durch eine Studie “bewiesen” ist, oder die eine Lösung für alle Menschen propagiert, übertreibt höchstwahrscheinlich die Sache. Pauschale Verallgemeinerungen jeglicher Art zeugen oft von einem Mangel an Bescheidenheit, der den Lesern ein rotes Tuch sein sollte. Eine Studie kann sehr wohl eine bestimmte Schlussfolgerung “nahelegen”, aber sie “beweist” sie selten, wenn überhaupt.
Deshalb verwenden wir bei Greater Good eine Menge vorsichtiger, absichernder Formulierungen, wie “könnte” oder “impliziert”.
8. Gibt es einen Interessenkonflikt, der durch die Finanzierung oder die Verbindungen der Forscher nahegelegt wird?
Eine kürzlich durchgeführte Studie ergab, dass man viel zuckerhaltige Getränke trinken kann, ohne Angst zu haben, dick zu werden, solange man Sport treibt. Der Geldgeber? Coca Cola, das die Ergebnisse eifrig beworben hat. Das heißt nicht, dass die Ergebnisse falsch sind. Aber es bedeutet, dass Sie eine zweite Meinung einholen sollten.
9. Scheint der Forscher ein bestimmtes Ziel zu verfolgen?
Leser könnten verständlicherweise skeptisch sein gegenüber Studien zur Achtsamkeitsmeditation, die von praktizierenden Buddhisten gefördert werden, oder gegenüber Experimenten über den Wert des Gebets, die von Christen durchgeführt werden. Auch hier bedeutet das nicht automatisch, dass die Schlussfolgerungen falsch sind. Es legt jedoch die Messlatte für Peer-Reviews und Replikationen höher. Es waren zum Beispiel Hunderte von Experimenten nötig, bevor wir mit Sicherheit sagen konnten, dass Achtsamkeit tatsächlich Stress reduzieren kann.
10. Erkennen die Forscher Einschränkungen an und ziehen alternative Erklärungen in Betracht?
Konzentriert sich die Studie nur auf eine Seite der Geschichte oder eine Interpretation der Daten? Hat sie es versäumt, alternative Erklärungen in Betracht zu ziehen oder zu widerlegen? Zeigen sie ein Bewusstsein dafür, welche Fragen durch ihre Methoden beantwortet werden und welche nicht?
Ich fasse meine persönliche Haltung als Nicht-Wissenschaftler gegenüber wissenschaftlichen Erkenntnissen wie folgt zusammen: Neugierig, aber skeptisch. Ich nehme alles ernst und nehme alles mit einem Körnchen Salz. Ich beurteile sie anhand meiner Erfahrung, wohl wissend, dass meine Erfahrung zu Verzerrungen führt. Ich versuche, Demut, Zweifel und Geduld zu kultivieren. Es gelingt mir nicht immer; wenn ich versage, versuche ich, meine Fehler einzugestehen und mir selbst zu verzeihen. Mein eigenes Verständnis ist unvollkommen, und ich erinnere mich daran, dass eine Studie nur ein Schritt zum Verständnis ist. Vor allem versuche ich zu bedenken, dass Wissenschaft ein Prozess ist und dass Schlussfolgerungen immer weitere Fragen aufwerfen, die wir beantworten müssen.