Mehr Ärzte, bessere Diagnosen

Zweitmeinung lohnt sich

Ein Team von Ärzten ermöglicht eine präzisere Diagnose als ein Individuum: Die Genauigkeit schwankt zwischen 63 Prozent mit einem und 86 Prozent mit neun Ärzten. Darauf deuten Fallbeurteilungen auf einer Onlineplattform.

Von Thomas Müller Veröffentlicht:
Auf der Online-Plattform des "Human Diagnosis Project" können Ärzte und Studenten ihre diagnostischen Fähigkeiten trainieren.

Auf der Online-Plattform des "Human Diagnosis Project" können Ärzte und Studenten ihre diagnostischen Fähigkeiten trainieren.

© Yuri Arcurs / stock.adobe.com

Die Studie in Kürze

  • Ergebnis: Die Diagnose eines Ärztekollektivs ist wesentlich genauer als die eines einzelnen Arztes. Eine Analyse ergab bis zu 30 Prozentpunkte Unterschied bei der Trefferrate auf einer Onlineplattform.
  • Einschränkung: Rund 80 Prozent der Teilnehmer waren Assistenzärzte oder Studenten.

Viele Köche mögen zwar den Brei verderben, viele Ärzte verbessern aber die Diagnose, haben US-Forscher mit einer Analyse auf der Online-Plattform des „Human Diagnosis Project“ herausgefunden.

Dort können Ärzte Fallberichte mit bestätigten Diagnosen eingeben, ein Maschinen-Lernprozess verwertet die Daten und kann bei unklaren Fällen die wahrscheinlichsten Diagnosen auflisten. Dies können etwa Studenten nutzen, um Hinweise auf die Diagnose zu erhalten.

Oder aber Ärzte und Studenten trainieren anhand der bestätigten Diagnosen ihre diagnostischen Fähigkeiten. Zusätzlich werden Fälle von anderen Ärzten bewertet, die wiederum die aus ihrer Sicht wahrscheinlichsten Diagnosen listen.

Forscher um Dr. Michael Barnett von der Harvard School of Public Health in Boston haben nun geschaut, wie groß die Übereinstimmung von einzelnen Ärzten und einem Ärztekollektiv mit bis zu neun Teilnehmern ist, wenn sie Lehrbeispiele beurteilen (JAMA Netw Open 2019;2: e190096).

Es zeigte sich, dass die Genauigkeit der Diagnose zunimmt, je mehr Ärzte sich beteiligen. Allerdings verläuft die Kurve asymptotisch auf eine Genauigkeit von 90 Prozent zu – ab einer bestimmten Zahl führen mehr Ärzte zu keiner weiteren Verbesserung.

Beispiele aus der Praxis

Für die Analyse haben die Forscher 1572 Lehrbeispiele ausgewählt, die von mindestens zehn Ärzten beurteilt worden waren. Alle Lehrbeispiele stammen aus der klinischen Praxis und enthalten Angaben zu Anamnese, körperlichen und labormedizinischen Untersuchungen, Krankheitsverlauf sowie Diagnose oder Differenzialdiagnose.

Ausgewertet wurden Diagnosen von etwas mehr als 2000 Usern, die mit der Plattform vertraut waren, also schon mehrere Beurteilungen abgegeben hatten. Die meisten der User hatten mehrere Lehrbeispiele beurteilt.

Die Teilnehmer waren zum größten Teil Ärzte in der Facharztausbildung (60 Prozent), 20 Prozent stellten Medizinstudenten, die übrigen 20 Prozent Oberärzte. Die Assistenz- und Oberärzte arbeiteten meist in der Inneren Medizin oder im allgemeinmedizinischen Bereich, 90 Prozent stammten aus den USA.

Für die Berechnungen wurde eine Diagnose als korrekt beurteilt, wenn die ersten drei Vorschläge die hinterlegte Diagnose enthielten. Entsprechend berechneten die Forscher die drei wahrscheinlichsten Diagnosen eines Kollektivs von zwei bis neun Ärzten und prüften, ob auch diese Liste die hinterlegte Diagnose enthielt.

Kollektiv um 26 Punkte genauer

Nach diesen Kriterien lagen einzelne Ärzte über alle Lehrbeispiele gemittelt zu 63 Prozent richtig. Assistenzärzte erreichten eine Genauigkeit von 66 Prozent, Oberärzte von 64 Prozent, Medizinstudenten von 56 Prozent.

Poolten die Forscher die Antworten von mehreren Ärzten, nahm die Genauigkeit mit der Zahl der Ärzte zu und erreichte über alle Ärzte und Fälle gemittelt bei neun Ärzten knapp 86 Prozent – was einer absoluten Verbesserung der Genauigkeit um 26 Prozentpunkte gegenüber einer Einzelmeinung entspricht.

Doch schon zwei Ärzte führten zu einer Verbesserung der Genauigkeit um rund 13 Punkte – es lohnt sich für Patienten also, eine zweite Meinung einzuholen. Wurden nur Ärzte berücksichtigt, die mindestens fünf Fälle beurteilten, so erreichte die Genauigkeit bei einem Neuner-Kollektiv knapp 90 Prozent; nur 70 Prozent dagegen bei Ärzten, die im Kollektiv nur eine Diagnose wagten.

Der Unterschied zwischen der korrekten Einzelmeinung und der des Kollektivs hing stark von den Fällen ab. Am geringsten war er mit 17 Prozentpunkten bei Patienten mit Bauchschmerzen als vorherrschendem Symptom – hier lagen auch schon die einzelnen Ärzte mit ihrer Diagnose zu über 70 Prozent richtig.

30 Prozentpunkte Unterschied berechneten die Forscher hingegen bei den Diagnosen zu Patienten mit Fieber als Hauptsymptom – hier kamen die einzelnen Ärzte auf eine Genauigkeit von lediglich etwas über 50 Prozent.

Entsprechende Resultate erzielten die Forscher um Barnett, wenn sie Diagnosen von Spezialisten in ihrem Spezialgebiet auswerteten. Auch hier erreichte eine Gruppe von neun Spezialisten eine Genauigkeit von 86 Prozent, ein einzelner lag hingegen im Schnitt nur zu 66 Prozent richtig.

Das Ärztekollektiv kommt nach diesen Berechnungen also stets zu einer präziseren Diagnose als ein einzelner Arzt.

Mehr zum Thema

Kommunikation und Datenschutz

Neue Perspektiven für IT in der Praxis

Wenige Genehmigungen entzogen

KBV veröffentlicht Qualitätsbericht für 2022

Kommentare
Vorteile des Logins

Über unser kostenloses Login erhalten Ärzte und Ärztinnen sowie andere Mitarbeiter der Gesundheitsbranche Zugriff auf mehr Hintergründe, Interviews und Praxis-Tipps.

Haben Sie schon unsere Newsletter abonniert?

Von Diabetologie bis E-Health: Unsere praxisrelevanten Themen-Newsletter.

Das war der Tag: Der tägliche Nachrichtenüberblick mit den neuesten Infos aus Gesundheitspolitik, Medizin, Beruf und Praxis-/Klinikalltag.

Eil-Meldungen: Erhalten Sie die wichtigsten Nachrichten direkt zugestellt!

Newsletter bestellen »

Top-Meldungen
Lesetipps
Ulrike Elsner

© Rolf Schulten

Interview

vdek-Chefin Elsner: „Es werden munter weiter Lasten auf die GKV verlagert!“