Kombinierte Algorithmen beschreiben zu erwartenden Verlauf von Krebserkrankungen

Kombinierte Algorithmen beschreiben zu erwartenden Verlauf von Krebserkrankungen

Mit der parallelen Anwendung von Textanalyse-Werkzeugen und maschinellen Lernprozessen gelingt eine sehr gutes Verständnis manuell erstellter Befunde.

  • Datum:
    14.05.2018 0 Kommentare
  • Journal:
    J Digit Imaging 2018;31(2):178-184
  • Titel:
    Integrating Natural Language Processing and Machine Learning Algorithms to Categorize Oncologic Response in Radiology Reports
  • Autor:
    Chen PH et al.
    Zur Originalstudie

Die maschinelle Extraktion Diagnose-relevanter Textbausteine aus manuellen, nicht strukturierten radiologischen Befunden ist komplex. Po-Hao Chen von der Perelman School of Medicine in Pennsylvania, USA, und KollegInnen untersuchten, ob eine Kombination aus natürlicher Sprachverarbeitungssoftware (NLP) und maschinellem Lernen (ML) Informationen über den zu erwartenden Verlauf einer Krebserkrankung aus dem radiologischen Bericht korrekt eingruppieren kann.

Methode

Chen et al. werteten insgesamt 8.614 MRT- und CT-Befunde von Krebsuntersuchungen des Bauch- und Beckenraums mit Hilfe Künstlicher Intelligenz neu aus. Alle Berichte waren im Voraus durch die BefunderInnen manuell in eine von vier Kategorien eingestuft worden:

  • progrediente Erkrankung,
  • stabile Erkrankung,
  • Verbesserung,
  • kein Krebs.

Die Neuauswertung der Berichte erfolgte mit einer Kombination aus NLP und ML-Algorithmen, wobei Chen et al. insgesamt drei verschiedene NLP- und fünf unterschiedliche ML-Algorithmen miteinander kombinierten.

Zunächst „trainierten“ Chen et al. die einzelnen Kombinationen anhand von 70% der Berichte. Chen et al. ließen die Computer dann die verbliebenen 30% analysieren (Testset), um herauszufinden, welche NLP/ML-Kombination den manuell zugeordneten Kategorien treffgenau entsprach.

Verwendete NLP- und ML-Kombinationen:

NLP

ML

·      Term frequency-inverse document frequency weighting (TF-IDF)

·      Term frequency weighting (TF)

·      16-bit feature hashing

·      Logistische Regression (LR)

·      RDF

·      „One vs. all“ Stützvektormethode (SVM)

·      „One vs. all“ Bayes Punktmaschine (BPM)

·      Vollständig angeschlossenes Neuronales Netzwerk (NN)

Ergebnisse

Die Kombination der NLP-TF-IDF und ML-SVM erzielte mit 90,6% die höchste Übereinstimmung mit der manuellen Zuordnung.

Fazit

Die Optimierung von ML- und NLP-Algorithmen kann bei der Extraktion von Textbausteinen eine sehr hohe Genauigkeit zu erzielen. Chen et al. legen dar, wie wichtig das Testen verschiedener Kombinationen von Algorithmen ist.

biho/ktg
14.05.2018

Sie müssen sich einloggen, um Kommentare zu verfassen.