Erste Grundlagen für die automatische Verarbeitung von Texten aus der Patientenversorgung werden geschaffen | 2. GeMTeX-Plenarmeeting

Die Arbeiten an der Methodenplattform GeMTeX, einem Projekt der Medizininformatik-Initiative (MII) zur Verarbeitung von Texten aus der klinischen Patientenversorgung, sind bereits seit einigen Monaten angelaufen. Nun haben sich Ende September rund 40 GeMTeX-Mitarbeitende in einem Webmeeting getroffen, um die ersten Fortschritte seit dem Kick-Off im Juni zu besprechen. Eines der zentralen Themen auf der Agenda war der aktuelle technische Stand der Datenintegrationszentren (DIZ) an den sechs beteiligten Universitätskliniken in Berlin, Dresden, Erlangen, Essen, Leipzig und München.

Die technische Leitung des GeMTeX-Projekts liegt bei Dr. Frank Meineke vom Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE) der Universität Leipzig. Er hat die Ergebnisse einer Statuserhebung der DIZ präsentiert, die in Form von Interviews durchgeführt wurde. Geprüft wurden beispielsweise die technischen Grundlagen für die Verarbeitung von Arztbriefen, die für den Aufbau des Textkorpus notwendig sind.

Die Einwilligung der Patientinnen und Patienten ist wesentlich für den Aufbau eines Textkorpus

„Die technischen Voraussetzungen sind zwar von Standort zu Standort unterschiedlich, aber die DIZ sind bereits gut aufgestellt“ fasste Dr. Meineke zusammen. Besonders beobachtet werden müsse hierbei  die Entwicklung der Zahlen zur breiten Patienteneinwilligung (Broad Consent). Die über die Medizininformatik-Initiative (MII) abgestimmte Einwilligung bildet die Grundlage für den Aufbau des Textkorpus. GeMTeX verwendet ausschließlich klinische Daten, für die Patientinnen und Patienten einer Nutzung für Forschungszwecke zugestimmt haben.

Neben den technischen Aspekten waren Strategien zur Anonymisierung und Pseudonymisierung der Arztbriefe im Textkorpus sowie die Arbeit an den Studienprotokollen ein wesentlicher Bestandteil der Diskussionen auf dem Plenarmeeting. Diese Schritte sind notwendig, um Textdokumente aus der Versorgung verarbeiten zu können.

Annotationen machen klinische Dokumente für Künstliche Intelligenz lesbar

Im kommenden Frühjahr sollen die Annotationsarbeiten im GeMTeX-Projekt beginnen. Dafür werden die Arztbriefe von Medizinstudierenden gelesen und in einem Computerprogramm gemäß bestimmter Vorgaben hinsichtlich Struktur und Inhalt markiert. Diese Markierungen werden als Annotate bezeichnet und bilden die Grundlage für Anwendungen der Künstlichen Intelligenz.

In GeMTeX werden diese Annotationsarbeiten mit dem Programm INCEpTION durchgeführt. Auf dem Plenarmeeting hat Serwar Basch, wissenschaftlicher Mitarbeiter an der Technischen Universität Darmstadt, eine Erweiterung des Annotationswerkzeugs INCEpTION vorgestellt, mit dem Fortschritte im Annotationsprozess detaillierter verfolgt werden können.

Anschließend hat GeMTeX-Projektleiter Professor Martin Boeker von der Technischen Universität München einen Ausblick auf die organisatorischen Schritte in den kommenden Monaten gegeben. Der Schwerpunkt lag dabei auf dem weiteren Ausbau der Arbeitsgruppen zu Technik und Annotation durch die Projektpartner sowie die Darstellung von Meilensteinen.

Zum Ende der Tagung stand noch ein aktuelles Thema auf der Agenda: der Einsatz von generativen Sprachmodellen bzw. Chatbots. Hierzu haben die Teilnehmenden diskutiert, wie die Entwicklungen um ChatGPT sinnvoll für den Aufbau des GeMTeX-Textkorpus genutzt werden können.

Die nächste GeMTeX-Klausurtagung findet am 20. und 21. November 2023 an der TU München statt.