Metaanalyse: Künstliche Intelligenz erkennt Krankheiten so gut wie Ärzte

Künstliche Intelligenz (KI) diagnostiziert Krankheiten auf Basis bildge­bender Untersuchungen offenbar vergleichbar gut wie Ärzte. Zu diesem Ergebnis kommt eine Metaanalyse.

Künstliche Intelligenz erkennt Krankheiten so gut wie Ärzte

Kann künstliche Intelligenz die Arbeit menschlicher Mediziner künftig verstärkt ergänzen – oder sogar ersetzen? Besonders die diagnostischen Leistungen der KI wird ständig besser. Aber es gibt auch Kritik. | vege - stock.adobe.com

Deren Ergebnisse beruhen allerdings „nur auf einer Handvoll qualitativ hoch­wertiger Studien“ und sollten deshalb mit einer gewissen Vorsicht interpretiert werden, wie die Forscher um Seniorautor Alastair Denniston vom University Hospitals Birmingham NHS Foundation Trust in Lancet Digital Health berichten.

Als qualitativ hochwertig bewerteten Denniston und seine Koautoren Studien, die 2 Kriterien erfüllten: Die KI-Modelle mussten zum einen extern validiert sein, sprich mittels medizinischer Aufnahmen (MRT, CT, Ultraschall, optische Kohärenztomographie, Röntgen) einer anderen Patientenpopulation. Zum anderen musste ein direkter Vergleich der KI mit Ärzten im gleichen Datensatz erfolgen.

Diese Qualitätskriterien erfüllten den Autoren zufolge gerade einmal 14 von mehr als 30.000 in einer Literatursuche identifizierten Studien. Eine Metaanalyse dieser wenigen Studien zeigte allerdings, das KIs tatsächlich in der Lage sind, ein breites Spektrum von Krankheiten – von Krebs bis Augenerkrankungen - ebenso akkurat zu erkennen wie Ärzte. „Aber es ist wichtig anzumerken, dass KIs nicht substanziell besser abschnitten als die menschlichen Diagnostiker“, wird Denniston in einer Pressemitteilung zitiert.

KIs erreichten im Schnitt eine Sensitivität von 87 Prozent, während Ärzte 86,4 Prozent der Krank­heiten anhand der Bildgebung richtig erkannten. Die Spezifität der KIs lag bei 92,5 Prozent, während Ärzte Krankheiten in 90,5  Prozent der Fälle sicher ausschließen konnten.

Im Vergleich zu jungen Kinderärzten mit wenig Berufserfahrung stellt künstliche Intelligenz (KI) treffsicherere Diagnosen bei Kindern und Jugendlichen – das ist das Ergebnis einer chinesisch-US-amerikanischen Studie.

weiterlesen

KIs nutzen eine Technik namens Deep Learning, dabei handelt es sich um den Einsatz von Algorithmen, Big Data und Rechenleistung, um menschliches Lernen und Intelligenz nachzubilden. Mithilfe des Deep Learning können KIs Tausende von bildgebenden Aufnahmen analysieren, um Erkrankungsmuster zu identifizieren. Das Potenzial dieser Technik, die Genauigkeit und Geschwindigkeit von Diagnosen zu verbessern, gilt als enorm. Berichte, dass Deep-Learning-Modelle Menschen bei der Diagnostik überlegen sein könnten, haben für viel Aufregung und Diskussion gesorgt.

Doch die wahre diagnostische Leistungskraft von KIs bleibe weitgehend unklar, da es an Studien mangele, die die Leistung von Mensch und Maschine direkt verglichen oder die Leistung der KI in einer echten klinischen Umgebung validierten, so die Autoren um Denniston.

Kritik an praxisfernen Studien

Die Autoren bemängeln darüber hinaus, dass Deep Learning häufig isoliert beurteilt worden sei, in einer Art und Weise, die die klinische Praxis nicht widerspiegele – auch in den 14 analysierten Studien. So erhielten beispielsweise nur in vier davon die Ärzte zusätzliche klinische Informationen, die sie in der klinischen Praxis normalerweise nutzen würden, um eine Diagnose zu stellen.

Außerdem seien nur wenige prospektive Studien in einer echten klinischen Umgebung durchgeführt worden. Doch um die diagnostische Genauigkeit zu ermitteln, seien qualitativ hochwertige Vergleiche in Patienten erforderlich, nicht nur in Datensätzen, so Denniston und seine Koautoren.

Das richtige Studiendesign ist entscheidend

Auf der einen Seite bestehe der Wunsch, neue, potenziell lebensrettende Diagnoseverfahren einzusetzen. Auf der anderen Seite müsse aber hochwertige Evidenz in einer Art und Weise gesammelt werden, dass Patienten und Gesundheitssysteme in der klinischen Praxis auch davon profitieren könnten, so Erstautor Xiaoxuanso Erstautor Xiaoxuan Liu von der University of Birmingham, UK, laut einer Pressemitteilung.

Liu warnt davor, dass ohne ein geeignetes Studiendesign leicht ein Bias entstehen könne, der die Ergebnisse verzerre. Mögliche Folge: Die KIs schneiden in den Studien hervor­ragend ab, aber die diagnostische Leistung lässt sich anschließend nicht auf die klinische Praxis übertragen.

Livia Faes vom Moorfields Eye Hospital in London, gemeinsam mit Liu Erstautorin des Papers, ergänzte, dass letztlich gezeigt werden müsse, wie sich die Anwendung einer KI auf Patienten-Outcomes auswirke: „Diese Evidenz muss aus randomisiert-kontrol­lierten Studien mit alternativen Diagnosetests kommen“. Bislang gebe es aber kaum Studien, in denen tatsächlich basierend auf den diagnostischen Entscheidungen der KIs behandelt wurde, um sich dann Outcomes anzusehen, die für den Patienten wirklich zählen, wie eine zeitnahe Behandlung, die Länge des Kranken­haus­auf­enthalts und das Überleben.

Dieser Artikel wurde uns zur Verfügung gestellt von