Datenschutzsichere KI hilft radiologische Textbefunde zu erschließen

Datenschutzsichere KI hilft radiologische Textbefunde zu erschließen

21 Sprachmodelle zur Analyse radiologischer Befunde in Textform haben Bonner Forschende miteinander verglichen. Kommerzielle Modelle mit Datenübertrag auf externe Server zeigen dabei keinen Vorteil zu datenschutzkonformen Modellen.

  • Datum:
    04.02.2025
  • Autor:
    I. Väth (mh/ktg)
  • Quelle:
    Universitätsklinikum Bonn

Forschende des Universitätsklinikums Bonn (UKB) und der Universität Bonn konnten jetzt zeigen: Lokale 'Large Language Models' (LLM), bei denen alle Daten datenschutzsicher innerhalb der Klinik verbleiben, können dabei helfen, radiologische Befunde zu strukturieren.

Dazu haben sie verschiedene LLMs an öffentlich verfügbaren Befunden ohne Datenschutz und an datengeschützten Befunden verglichen. Kommerzielle Modelle mit Datenübertrag auf externe Server zeigen dabei keinen Vorteil zu datenschutzkonformen Modellen.

„Das Problem bei den kommerziellen, geschlossenen Modellen ist, dass man, um diese zu nutzen, die Daten auf externe Server übertragen muss, welche sich häufig sogar außerhalb der EU befinden. So etwas ist mit Patientendaten nicht zu empfehlen“, betont Prof. Julian Luetkens, kommissarischer Direktor der Klinik für Diagnostische und Interventionelle Radiologie am UKB.

21 Sprachmodelle getestet

Das Forschungsteam führte eine Analyse von 17 offenen und vier geschlossenen Sprachmodellen durch:

  • Offene Modelle lassen sich auf klinikinternen Servern ausführen und sogar weiter trainieren.
  • Geschlossene Modelle sind die kommerziellen, bekannten KI-Varianten, die unter anderem auch bei Chatbots wie Chat-GPT und Co. eingesetzt werden.

Alle getesteten Modelle hatten mehrere tausend Röntgenberichte in Freitextform zu analysieren. Für die Auswertung wurden sowohl öffentliche radiologische Befunde in englischer Sprache und ohne Datenschutz, als auch datengeschützte Befunde aus dem UKB in deutscher Sprache genutzt.

Ausblick: Radiologischen Datenschatz erschließen

Das gewonnene Wissen birgt das Potenzial, den reichen Datenschatz klinischer Datenbanken für umfassende epidemiologische Studien und zur Forschung über krankheitsvorhersagende KI nutzbar zu machen. „Letztendlich kommt das dem Patienten zugute, all dies sogar unter strenger Beachtung des Datenschutzes“, erklärt Dr. Sebastian Nowak, Erst- und Korrespondenzautor der Studie.

Den Programmcode und die Methoden zur Nutzung und zum Training unter offener Lizenz haben die Forschenden bei github veröffentlicht.

Der Open-Access-Publikationsfonds der Rheinischen Friedrich-Wilhelms-Universität Bonn und durch das Land Nordrhein-Westfalen (SIM-1-1, Innovative Secure Medical Campus) hat die Studie gefördert.

Zur Publikation in Radiology 2025.

Ihr direkter Draht zu uns