© SMITH-Geschäftsstelle

Medizinische Dokumente datenschutzgerecht für die Forschung verfügbar machen | 7. GeMTeX-Plenarmeeting am 19.11.2024 in München

Im GeMTeX-Projekt der Medizininformatik-Initiative (MII) arbeitet ein interdisziplinäres Team daran, medizinische Texte aus der Routineversorgung, wie Arzt- und Entlassbriefe, datenschutzgerecht für die Forschung und Versorgung zugänglich zu machen. Hierfür werden Dokumente aus der medizinischen Versorgung mit Hilfe von Annotationen mit Metadaten angereichert, sodass diese maschinenlesbar werden. Ziel ist es, das größte Korpus medizinischer Texte in deutscher Sprache zu erstellen. Um die Fortschritte an den beteiligten Standorten zu besprechen und die nächsten Projektschritte zu planen, haben sich am Dienstag, den 19. November 2024, 33 GeMTeX-Mitarbeitende an der Technischen Universität München zum letzten Plenarmeeting dieses Jahres getroffen.

Medizinische Texte werden an das Forschungsdatenportal für Gesundheit angebunden

Dr. Frank Meineke, technischer Leiter in GeMTeX, eröffnete das Plenarmeeting mit einem Überblick über den technischen Stand im Projekt. Ein zentraler Punkt war dabei die Anbindung der medizinischen Dokumente an das Deutsche Forschungsdatenportal für Gesundheit (FDPG). Über das FDPG können Forschende Gesundheitsdaten und Bioproben aus den Standorten der Medizininformatik-Initiative beantragen. In Zukunft sollen auch im Rahmen von GeMTeX bearbeitete medizinische Dokumente in das FDPG integriert werden. Zudem wurde die Entwicklung eines MII-Kerndatensatzmoduls „Dokument“ diskutiert. Der MII-Kerndatensatz legt fest, welche Datensätze die Datenintegrationszentren (DIZ) der MII für alle stationären Patientendaten mindestens vorhalten sollen. Hier werden künftig auch Daten zu Dokumenten aus der medizinischen Versorgung verfügbar sein.

Darüber hinaus war die Implementierung von Annotationswerkzeugen an den beteiligten Standorten Thema. Hierbei wurde das Zusammenspiel von Werkzeugen aus der Industrie, wie den Systemen von ID Berlin GmbH & Co. KGaA und Averbis GmbH, diskutiert. Ergänzend dazu präsentierte Serwar Basch, Doktorand an der Technischen Universität Darmstadt, Erweiterungen des Annotationstools INCEpTION sowie ein begleitendes Dashboard, das den Fortschritt und die Ergebnisse der Annotationsarbeiten übersichtlich zusammenfasst. Auch der Stand der technischen Implementierung an den DIZ sowie dessen Erfahrungen im Umgang mit den neuen Tools wurden besprochen.

Ein standardisiertes Vorgehen zur Annotation von klinisch relevanten Informationen wurde entwickelt

In der zweiten Hälfte des Meetings standen die laufenden Annotationsarbeiten sowie die Vorbereitung der domänenspezifischen Annotation in den Bereichen Kardiologie, Onkologie, Neurologie und Medikamentenwechselwirkungen im Fokus. Ein weiteres Thema war die De-Identifikation und Pseudonymisierung der Texte, bei der personenidentifizierende Daten unkenntlich gemacht werden. Im Herbst dieses Jahres hat das GeMTeX-Team hierzu eine Publikation veröffentlicht, in der die im Projekt entwickelte Vorgehensweise zur De-Identifikation anhand eines Textkorpus mit fiktiven Arztbriefen beschrieben wird. Inzwischen haben alle Projektstandorte Annotationsgruppen aufgebaut und mit der De-Identifikation von Arztbriefen begonnen.

Auch in der Annotation von klinisch relevanten Informationen, wie z. B. Diagnosen, gibt es Fortschritte: Diese wurde bereits an der Technischen Universität München begonnen. Luise Modersohn, Leiterin der Annotationsarbeiten, präsentierte hierzu erste Ergebnisse, die in die Weiterentwicklung der Annotationsleitlinien einfließen werden. Das Vorgehen soll an einem Standort erprobt, feinjustiert und dann künftig auf die weiteren Standorte ausgeweitet werden, um den Annotationsprozess weiter zu standardisieren.

Das nächste GeMTeX-Plenarmeeting findet am 05. Februar 2025 online statt.