{"id":26273,"date":"2026-07-01T12:24:42","date_gmt":"2026-07-01T10:24:42","guid":{"rendered":"https:\/\/www.smith.care\/?p=26273"},"modified":"2026-07-01T12:38:36","modified_gmt":"2026-07-01T10:38:36","slug":"gemtex-llm-workshop-plenarmeeting-06-26","status":"publish","type":"post","link":"https:\/\/www.smith.care\/de\/2026\/07\/01\/gemtex-llm-workshop-plenarmeeting-06-26\/","title":{"rendered":"Fortschritte bei der Erschlie\u00dfung klinischer Texte f\u00fcr Forschung und KI"},"content":{"rendered":"\n<p><strong>GeMTeX LLM-Workshop und Plenarmeeting am 22.\/23. <\/strong><strong>Juni 2026<\/strong><\/p>\n\n\n\n<p>In unstrukturierten klinischen Dokumenten wie Arzt- und Entlassbriefen steckt ein enormer Datenschatz f\u00fcr die medizinische Forschung. Diese wertvollen Daten sicher und datenschutzkonform f\u00fcr die Forschung und Anwendungen k\u00fcnstlicher Intelligenz (KI) nutzbar zu machen, ist ein Ziel des <a href=\"https:\/\/www.smith.care\/de\/gemtex_mii\/ueber-gemtex\/\">GeMTeX<\/a>-Projektes der <a href=\"https:\/\/www.medizininformatik-initiative.de\/de\/start\" target=\"_blank\" rel=\"noreferrer noopener\">Medizininformatik-Initiative (MII)<\/a>.\u00a0<\/p>\n\n\n\n<p>Am 22. und 23. Juni 2026 kamen GeMTeX-Projektmitarbeitende am TUM Klinikum rechts der Isar zu einem internen Large Language Model (LLM)-Workshop und einem Plenarmeeting zusammen.<\/p>\n\n\n\n<p><strong>Finale Phase des GeMTeX-Projektes wird vorbereitet<\/strong><\/p>\n\n\n\n<p>Im Mittelpunkt des Plenarmeetings stand der aktuelle Projektfortschritt und die Vorbereitung der finalen Arbeitsphase. Justin Hofenbitzer (TUM Klinikum rechts der Isar) stellte einen zentralen Meilenstein vor: Mehr als 1.000 klinische Dokumente aus sechs Universit\u00e4tskliniken wurden inzwischen semantisch annotiert. Im Rahmen der Annotationsarbeiten kennzeichnen angehende Medizinerinnen und Mediziner relevante Informationen in klinischen Dokumenten und versehen sie mit Metadaten, sodass die Texte maschinenlesbar werden. Diese hochwertigen Datens\u00e4tze bilden die Grundlage f\u00fcr die Forschung und die Entwicklung neuer Verfahren der medizinischen Sprachverarbeitung.<\/p>\n\n\n\n<p><strong>Ver\u00f6ffentlichung des GeMTeX-Textkorpus r\u00fcckt n\u00e4her<\/strong><\/p>\n\n\n\n<p>Wesentliche Fortschritte gab es zudem auf technischer Ebene: Jakob Faller (Universit\u00e4tsklinikum Erlangen) pr\u00e4sentierte das neue <a href=\"https:\/\/www.smith.care\/de\/2026\/05\/13\/kds-modul-dokument\/\">Kerndatensatz (KDS)-Modul Dokument<\/a>, das gemeinsam mit dem <a href=\"https:\/\/www.medizininformatik-initiative.de\/de\/digitaler-fortschrittshub-mihub\" target=\"_blank\" rel=\"noreferrer noopener\">Digitalen FortschrittsHub MiHUB<\/a> entwickelt wurde. Das KDS-Modul erm\u00f6glicht es, in GeMTeX erschlossene Textdokumente aus den Datenintegrationszentren an das Forschungsportal f\u00fcr Gesundheit (FDPG) anzubinden. Sowohl de-identifizierte als auch semantisch annotierte Dokumente k\u00f6nnen dadurch k\u00fcnftig standardisiert f\u00fcr Forschung und Klinik bereitgestellt werden. Erste Ergebnisse dieser Entwicklungen wurden bereits auf den internationalen Fachkonferenzen <a href=\"https:\/\/lrec2026.info\/\" target=\"_blank\" rel=\"noreferrer noopener\">Language Resources and Evaluation Conference (LREC)<\/a> und <a href=\"https:\/\/mie2026.efmi.org\/\" target=\"_blank\" rel=\"noreferrer noopener\">Medical Informatics Europe (MIE)<\/a> pr\u00e4sentiert.<\/p>\n\n\n\n<p>Dar\u00fcber hinaus plant das GeMTeX-Team in Zusammenarbeit mit der Deutschen Zentralbibliothek f\u00fcr Medizin (ZBMED) einen ersten prototypischen Anwendungsfall. Das Ethikvotum hierf\u00fcr liegt bereits vor, alle sechs beteiligten Universit\u00e4tskliniken haben ihre Zustimmung \u00fcber die jeweiligen Use-and-Access-Committees erteilt. Damit kann das im Projekt aufgebaute Textkorpus k\u00fcnftig unter festgelegten Voraussetzungen f\u00fcr wissenschaftliche Forschungsvorhaben beantragt und genutzt werden.<\/p>\n\n\n\n<p><strong>LLM-Workshop zeigte Nutzungsm\u00f6glichkeiten von KI-Sprachmodellen f\u00fcr die Medizin<\/strong><\/p>\n\n\n\n<p>Am Vortag hatten die Projektmitarbeitenden auf einem internen GeMTeX LLM-Workshop aktuelle Forschungsarbeiten und Praxisbeispiele rund um die Verarbeitung klinischer Dokumente mithilfe von LLMs diskutiert. LLMs sind KI-gest\u00fctzte Sprachmodelle, die aus umfangreichen Textdaten lernen und beispielsweise f\u00fcr die Generierung eigenst\u00e4ndiger Texte eingesetzt werden k\u00f6nnen.<\/p>\n\n\n\n<p>Im Mittelpunkt des LLM-Workshops standen unter anderem folgende Themen:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Verfahren zur De-Identifikation sensibler Informationen<\/li>\n\n\n\n<li>Die automatisierte Erkennung klinischer Entit\u00e4ten<\/li>\n\n\n\n<li>Der Vergleich synthetisch erzeugter und authentischer Anamnesedialoge<\/li>\n\n\n\n<li>Die strukturierte Aufbereitung medizinischer Leitlinien<\/li>\n\n\n\n<li>Der Einsatz LLM-gest\u00fctzter Software in der Forschung<\/li>\n<\/ul>\n\n\n\n<p><br>Auf der Veranstaltung wurde deutlich, dass Sprachmodelle inzwischen das Potenzial besitzen, zahlreiche Aufgaben der klinischen Textverarbeitung zu unterst\u00fctzen. Zugleich sind eine sorgf\u00e4ltige wissenschaftliche Evaluation und datenschutzgerechte Rahmenbedingungen zwingend notwendig \u2013 beides Voraussetzungen, die im GeMTeX-Projekt geschaffen werden.<\/p>\n\n\n\n<p>Das GeMTeX-Abschlussmeeting findet am 20. Oktober 2026 in der Albertina Bibliothek der Universit\u00e4t Leipzig statt.<\/p>\n\n\n\n<p><strong>K\u00fcrzlich erschienene Publikationen:<\/strong><\/p>\n\n\n\n<p>Jakob Faller, Marcel Susky, Noemi Deppenwiese, Justin Hofenbitzer, Christina Lohr, Thomas Ganslandt, Martin Boeker, Frank Meineke. <a href=\"https:\/\/ebooks.iospress.nl\/doi\/10.3233\/SHTI260389\" target=\"_blank\" rel=\"noreferrer noopener\">Standardized Information Model for Clinical Texts: The MII Core Data Set Module Document<\/a>. <em>Stud Health Technol Inform<\/em>. 2026 May 21;336:1202-1206. DOI: 10.3233\/SHTI260389.<\/p>\n\n\n\n<p>Christina Lohr, Marvin Seiferling, Philipp Wiesenbach, Jakob Faller, Christoph Dieterich. <a href=\"https:\/\/ebooks.iospress.nl\/doi\/10.3233\/SHTI260440\" target=\"_blank\" rel=\"noreferrer noopener\">The SURROGATOR Framework for Context-Aware Surrogation of Privacy Sensitive Information in Medical Text<\/a>. <em>Stud Health Technol Inform<\/em>. 2026 May 21;336:1405-1409. DOI: 10.3233\/SHTI260440. [<a href=\"https:\/\/chlor.github.io\/materials\/202605_mie_surrogator\/20260526_GeMTeX_Surrogator.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Slides<\/a>] [<a href=\"https:\/\/github.com\/medizininformatik-initiative\/GeMTeX\/tree\/main\/surrogator\" target=\"_blank\" rel=\"noreferrer noopener\">Code SURROGATOR<\/a>] [<a href=\"https:\/\/github.com\/dieterich-lab\/SurrogatorEval\" target=\"_blank\" rel=\"noreferrer noopener\">Code Evaluation<\/a>]<\/p>\n\n\n\n<p>Justin Hofenbitzer, Christina Lohr, Andrea Riedel, Rebekka Kiser, Aliaksandra Shutsko, Abanoub Abdelmalak, Peter Kl\u00fcgl, Jutta Romberg, Sarah Riepenhausen, Miriam Schechner, Jakob Faller, Frank Meineke, Luise Modersohn, Markus L\u00f6ffler, Juliane Fluck, Udo Hahn, Stefan Schulz, Martin Boeker. <a href=\"https:\/\/lrec.elra.info\/lrec2026-main-122\" target=\"_blank\" rel=\"noreferrer noopener\">Developing the German Medical Text Corpus (GeMTeX): Legal Compliance and Semantic Enrichment<\/a>. In <em>Proceedings of the Fifteenth Language Resources and Evaluation Conference <\/em>(LREC 2026) (pp. 1571\u20131584). <em>European Language Resources Association (ELRA).<\/em> DOI: 10.63317\/4eqiegnqbu96.<\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Am 22. und 23. Juni 2026 kamen GeMTeX-Projektmitarbeitende am TUM Klinikum rechts der Isar zu einem internen Large Language Model (LLM)-Workshop und einem Plenarmeeting zusammen, um den aktuellen Projektfortschritt zu diskutieren und die finale Arbeitsphase vorzubereiten.<\/p>\n","protected":false},"author":14,"featured_media":26287,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-26273","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-neuigkeiten"],"_links":{"self":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts\/26273","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/users\/14"}],"replies":[{"embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/comments?post=26273"}],"version-history":[{"count":9,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts\/26273\/revisions"}],"predecessor-version":[{"id":26286,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts\/26273\/revisions\/26286"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/media\/26287"}],"wp:attachment":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/media?parent=26273"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/categories?post=26273"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/tags?post=26273"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}