Potenziale von KI-Sprachmodellen in der klinischen Praxis nutzen
GeMTeX LLM-Workshop & Plenarmeeting am 10./11.11.2025
Rund 50 GeMTeX-Projektmitarbeitende sowie weitere Interessierte aus Forschung, Klinik und Informatik trafen sich am 10. November 2025 in München, um sich beim vierten Large Language Model (LLM)-Workshop über aktuelle Entwicklungen und den Einsatz von Sprachmodellen in der Medizin auszutauschen. Im anschließenden GeMTeX-Plenarmeeting am 11. November stand der Projektfortschritt in GeMTeX im Mittelpunkt.
Im GeMTeX-Projekt werden klinische Dokumente wie Arzt- und Entlassbriefe so aufbereitet, dass sie datenschutzgerecht für Forschung und Anwendungen Künstlicher Intelligenz (KI) nutzbar werden. KI-gestützte Sprachmodelle wie LLMs lernen aus umfangreichen Textdaten und können für vielfältige Aufgaben eingesetzt werden, z. B. für die Generierung eigenständiger Texte. Um Möglichkeiten, Rahmenbedingungen und Herausforderungen der Nutzung von LLMs in der Klinik zu diskutieren, lädt das GeMTeX-Team zweimal jährlich Expertinnen und Experten zu einem LLM-Workshop ein.
Rund 14.700 klinische Dokumente datenschutzgerecht aufbereitet
Zum Auftakt des vierten LLM-Workshops am 10. November präsentierten Dr. Frank Meineke, Christina Lohr (Universität Leipzig) sowie Justin Hofenbitzer (TUM Klinikum rechts der Isar) den aktuellen Stand im GeMTeX-Projekt. Bereits rund 14.700 klinische Dokumente wurden an den universitätsmedizinischen Partnerstandorten München, Leipzig, Essen, Berlin, Dresden und Erlangen de-identifiziert. Dabei haben studentische Hilfskräfte Daten, die auf Personen oder Institutionen schließen lassen, unkenntlich gemacht. Parallel hat an allen Standorten die semantische Annotation begonnen, um Inhalte wie Diagnosen, Prozeduren oder Therapiebezüge mithilfe von Metadaten strukturiert erfassbar zu machen.
Auch international wird an der Bereitstellung von Gesundheitsdaten aus klinischen Texten gearbeitet. Im Anschluss an den Beitrag des GeMTeX-Teams gab Prof. Dr. Markus Kreuzthaler (Medizinische Universität Graz) Einblicke in das EU-Projekt AIDAVA, in dem, ähnlich wie in GeMTeX, umfangreiche manuelle Annotationen klinischer Dokumente entstehen.
LLMs bieten Potenzial für Augenheilkunde und Entscheidungsunterstützung
Im weiteren Verlauf des LLM-Workshops rückten klinische Anwendungsszenarien in den Fokus: Prof. Dr. Danny Kowerko (TU Chemnitz) demonstrierte das Potenzial generativer Sprachmodelle in der Augenheilkunde. In seinem Vortrag zeigte er, wie klinische Informationen mithilfe LLM-basierter Extraktionsmethoden nutzbar gemacht werden können. Ein weiteres Beispiel aus der klinischen Praxis lieferte Prof. Dr. Florian Matthes (TU München). Sein Team entwickelt mit Mevidence einen Prototyp für ein LLM-basiertes Frage-Antwort-System zur Unterstützung klinischer Entscheidungen. Daneben gab er in seinem Beitrag einen kompakten Überblick über rechtliche Anforderungen, die bei der Nutzung klinischer Daten in KI-Systemen beachtet werden müssen.
Neuer Supercomputer liefert Grundlage für LLMs
Damit Sprachmodelle funktionieren, müsse sie mit großen Datenmengen trainiert werden. Hierfür benötigen Forschende enorme Rechenleistung – Supercomputer können hierfür eine Lösung bieten. Mathis Bode (Forschungszentrum Jülich) stellte auf dem LLM-Workshop mit JUPITER den ersten europäischen Exascale-Supercomputer vor, der im September 2025 in Betrieb ging.
JUPITER zählt mit einem Exabyte Speicher und einer Kapazität für mehr als eine Trillion Rechenoperationen pro Sekunde zu den leistungsstärksten Supercomputern der Welt. Nur mithilfe von Supercomputern sind perspektivisch große Sprachmodelle berechenbar, die vergleichbar mit vorhandenen kommerziellen Modellen sind.
Paneldiskussion zeigt Erfordernisse für LLM in der Klinik auf
Im zweiten Teil der Veranstaltung diskutierten Expertinnen und Experten aus Graz, Leipzig, München und weiteren Standorten in einem Panel, wie LLMs sinnvoll in klinische Arbeitsabläufe eingebettet werden können. Die Panelisten waren sich einig: LLMs in der Klinik müssen besonders Nutzer- und patientenzentriert entwickelt werden und sich nahtlos in die klinischen Workflows einfügen. Darüber hinaus ist ein Goldstandard für die Evaluation von LLMs nötig.
Dokumente werden in Datenintegrationszentren verfügbar gemacht
Auf dem GeMTeX-Plenarmeeting am zweiten Tag drehte sich alles um den internen Projektfortschritt. Ein Highlight: die erfolgreiche Spezifizierung des MII Kerndatensatz-Moduls Dokument – damit wurde ein zentraler Meilenstein im GeMTeX-Projekt erreicht. Der Kerndatensatz der Medizininformatik-Initiative (MII) definiert, in welcher Form Daten in den Datenintegrationszentren (DIZ) an Kliniken vorgehalten werden müssen. Nun wird das Modul Dokument schrittweise in den DIZ implementiert, sodass Daten aus klinischen Dokumenten standardisiert bereitgestellt werden können.
Das Projektteam arbeitet derzeit außerdem an einem Konzept für die Nachnutzung des in GeMTeX entstehenden Textkorpus. Abanoub Abdelbmalak (ZB MED) zeigte auf dem Plenarmeeting erste Planungen für den öffentlichen Zugriff auf das Korpus.
GeMTeX arbeitet auf ein deutsches Textkorpus hin
Nach fast zweieinhalb Jahren Projektlaufzeit zeigt sich: Das GeMTeX-Team kommt seinem Ziel – der Erstellung eines großen deutschen Korpus mit Texten aus der klinischen Versorgung – immer näher. Zugleich können diese Arbeiten zunehmend mit der dynamischen Entwicklung großer klinischer Sprachmodelle verknüpft werden.
Das nächste Plenarmeeting findet 18. März 2026 online statt, ein weiteres Präsenzmeeting ist für Ende Juni 2026 in München geplant.