{"id":24580,"date":"2025-05-07T16:52:28","date_gmt":"2025-05-07T14:52:28","guid":{"rendered":"https:\/\/www.smith.care\/?p=24580"},"modified":"2025-09-30T15:25:19","modified_gmt":"2025-09-30T13:25:19","slug":"5-fragen-an-gemtex-annotation","status":"publish","type":"post","link":"https:\/\/www.smith.care\/de\/2025\/05\/07\/5-fragen-an-gemtex-annotation\/","title":{"rendered":"Wie medizinische Texte f\u00fcr KI-Modelle nutzbar gemacht werden"},"content":{"rendered":"\n<p><strong>5 Fragen an&#8230; Marie-Sophie Polifka und Sarina Shams, Annotatorinnen im GeMTeX-Projekt<\/strong><\/p>\n\n\n\n<p><em>Der Einsatz von Sprachmodellen und k\u00fcnstlicher Intelligenz (KI) ist in vielen Fachbereichen bereits Berufsalltag. Auch \u00c4rztinnen und \u00c4rzte k\u00f6nnten davon profitieren \u2013 doch angepasste Sprachmodelle f\u00fcr die Medizin ben\u00f6tigen umfangreiche Datens\u00e4tze in deutscher Sprache.<\/em><\/p>\n\n\n\n<p><em>Im Projekt <a href=\"https:\/\/www.smith.care\/de\/gemtex_mii\/ueber-gemtex\/\">GeMTeX<\/a> soll eines der gr\u00f6\u00dften verf\u00fcgbaren Korpora medizinischer Texte in deutscher Sprache entstehen. Hierf\u00fcr werden unstrukturierte Texte aus der klinischen Dokumentation datenschutzkonform f\u00fcr die Forschung und KI-Anwendungen erschlossen. Eine entscheidende Rolle spielt dabei die Annotation durch studentische Hilfskr\u00e4fte: Sie markieren relevante Textstellen in medizinischen Dokumenten und versehen sie mit Metadaten zum Inhalt, sodass die Texte maschinenlesbar werden. Im Interview geben die Medizinstudentinnen Marie-Sophie Polifka und Sarina Shams einen Einblick in ihre Arbeit als Annotatorinnen am Standort Leipzig und verraten, was sie aus dem Projekt f\u00fcr ihren k\u00fcnftigen Berufsweg mitnehmen.<\/em><\/p>\n\n\n\n<p><strong>Wie l\u00e4uft Ihre Arbeit als Annotatorin f\u00fcr GeMTeX im Konkreten ab?<\/strong><\/p>\n\n\n\n<p><strong>Marie-Sophie Polifka:<\/strong> Wir lesen eine gro\u00dfe Anzahl unterschiedlicher medizinischer Texte wie Arztbriefe oder Befundberichte. In einem ersten Schritt haben wir darin enthaltene personenbezogene Daten, also Informationen, die R\u00fcckschl\u00fcsse auf Identit\u00e4ten erm\u00f6glichen k\u00f6nnten, unkenntlich gemacht, damit die Dokumente f\u00fcr die Weiterbearbeitung genutzt werden k\u00f6nnen. Diesen Prozess bezeichnen wir als De-Identifikation.<br>Im n\u00e4chsten Schritt, der aktuell noch vorbereitet wird, markieren wir in den Texten konkrete medizinische Inhalte wie Symptome, Diagnosen und Untersuchungen.<\/p>\n\n\n\n<p><strong>Sarina Shams: <\/strong>F\u00fcr die Annotation nutzen wir eine Software, die uns die M\u00f6glichkeit gibt, die Informationen aus dem Text in Kategorien einzuordnen. Das Ziel ist, die Daten aus den Dokumenten so zun\u00e4chst maschinenlesbar zu machen. Im Anschluss k\u00f6nnen diese rein medizinischen Informationen f\u00fcr Forschungszwecke und die Entwicklung von KI-Modellen genutzt werden.<\/p>\n\n\n\n<p><strong>Was finden Sie an dieser Arbeit herausfordernd?<\/strong><\/p>\n\n\n\n<p><strong>Marie-Sophie Polifka:<\/strong> Bei der Bearbeitung sto\u00dfen wir immer wieder auf Uneindeutigkeiten. Etwa, wenn bestimmte Inhalte nicht eindeutig den vorgesehenen Kategorien zugeordnet werden k\u00f6nnen. Das liegt oft daran, dass solche Sonderf\u00e4lle in den Leitf\u00e4den noch nicht ber\u00fccksichtigt sind. In solchen F\u00e4llen stimmen wir uns im Team oder auch mit anderen Arbeitsgruppen ab, bevor das Dokument abgeschlossen wird.<\/p>\n\n\n\n<p>Pers\u00f6nlich schwierig finde ich auch die Verwendung medizinischer Abk\u00fcrzungen in den Texten, die mir noch nicht gel\u00e4ufig sind. Dann muss Google weiterhelfen.<\/p>\n\n\n\n<p><strong>Sarina Shams:<\/strong> Manchmal ist es nicht einfach zu erkennen, ob bestimmte Informationen identifizierend sein k\u00f6nnen, selbst wenn sie nur indirekt im Text erscheinen. Manche Erkrankungen stehen im Zusammenhang mit bestimmten Berufen. Teilweise gibt es in den Dokumenten dann Abschnitte, die detailliert beschreiben, welche Beschwerden in unterschiedlichen Situationen aus dem Berufsleben vorkommen. Da k\u00f6nnen wir nicht einfach nur den \u201eBeruf\u201c markieren, da Beruf und Symptome im Text miteinander verwoben sind. Diese F\u00e4lle besprechen wir im Team. Ob das dann de-identifiziert werden muss, ist fallabh\u00e4ngig.<\/p>\n\n\n\n<p>Eine zus\u00e4tzliche Herausforderung sind komplexe Texte, da Deutsch nicht meine Muttersprache ist. Manche Texte muss ich deshalb mehrmals durchlesen. Zum Gl\u00fcck ist mein Team f\u00fcr mich da, wenn ich sprachliche Fragen habe.<\/p>\n\n\n\n<p><strong>Auf welche neuen oder unerwarteten Erkenntnisse sind Sie w\u00e4hrend Ihrer T\u00e4tigkeit gesto\u00dfen?<\/strong><\/p>\n\n\n\n<p><strong>Sarina Shams: <\/strong>Mir wurde deutlich, wie unterschiedlich medizinische Dokumentation ausf\u00e4llt \u2013 jede \u00c4rztin, jeder Arzt und jede Klinik formuliert anders. Das ist ein Problem, wenn wir medizinische Dokumente f\u00fcr die Automatisierung und KI nutzen m\u00f6chten. Durch GeMTeX habe ich gelernt, wie wichtig eine klare und einheitliche Sprache in der Dokumentation ist \u2013 etwas, das ich auch sp\u00e4ter in meinem Berufsalltag umsetzen m\u00f6chte.<\/p>\n\n\n\n<p><strong>Marie-Sophie Polifka: <\/strong>In fast jedem Gruppentreffen sto\u00dfen wir auf neue Sonderf\u00e4lle, die wir in unsere Leitf\u00e4den aufnehmen m\u00fcssen. Viele davon w\u00e4ren mir allein vermutlich gar nicht aufgefallen. Das hat mir gezeigt, wie wichtig das Mehraugenprinzip bei dieser Art von Arbeit ist.<\/p>\n\n\n\n<p><strong>Inwiefern wird diese Erfahrung Ihnen in Ihrem zuk\u00fcnftigen Beruf helfen?<\/strong><\/p>\n\n\n\n<p><strong>Marie-Sophie Polifka<\/strong><strong>: <\/strong>Ein gro\u00dfer Teil der Stationsarbeit besteht f\u00fcr \u00c4rztinnen und \u00c4rzte darin, die Krankengeschichte ihrer Patientinnen und Patienten im Arztbrief niederzuschreiben, damit auch zuk\u00fcnftige Behandlerinnen und Behandler dar\u00fcber informiert sind. Im Studium bekommen wir kaum vermittelt, wie man einen ordentlichen Arztbrief formuliert \u2013 das passiert h\u00f6chstens in den Klinikpraktika au\u00dferhalb der Uni. Mit dem Start ins Berufsleben wird jedoch von uns erwartet, dieser Aufgabe gerecht zu werden. Insofern ist es sehr hilfreich, einen Einblick in eine gro\u00dfe Anzahl an Arztbriefen zu bekommen.<\/p>\n\n\n\n<p><strong>Sarina Shams:<\/strong> Ich habe im GeMTeX-Projekt gelernt pr\u00e4zise zu lesen, zu verstehen und kritisch zu hinterfragen. Das hilft nat\u00fcrlich nicht nur beim Arztbriefe schreiben. Auch sp\u00e4ter in der Kommunikation mit Kolleginnen und Kollegen werde ich verstehen: Wir haben vielleicht einen unterschiedlichen Sprachstil, aber meinen das Gleiche. Au\u00dferdem habe ich ein Gef\u00fchl daf\u00fcr bekommen, wie wichtig eine hohe Datenqualit\u00e4t f\u00fcr die Forschung und digitale Anwendungen in der Medizin ist.<\/p>\n\n\n\n<p><strong>Das GeMeTeX-Projekt kann die medizinische Forschung vorantreiben, weil&#8230;<\/strong><\/p>\n\n\n\n<p><strong>Sarina Shams: <\/strong>&#8230;es hilft, gro\u00dfe Mengen an medizinischen Textdaten strukturiert und datenschutzkonform nutzbar zu machen. Das ist eine wichtige Grundlage f\u00fcr die Entwicklung von KI-Anwendungen, die \u00c4rztinnen und \u00c4rzte im Alltag entlasten k\u00f6nnen.<\/p>\n\n\n\n<p><strong>Marie-Sophie Polifka: <\/strong>&#8230;bestimmte Automatisierungsprozesse in der Medizin gebraucht werden, damit \u00c4rztinnen und \u00c4rzte wieder mehr Zeit haben, sich auf ihre Patientinnen und Patienten zu konzentrieren.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Im Projekt GeMTeX entsteht derzeit ein gro\u00dfes deutschsprachiges Korpus klinischer Texte f\u00fcr KI und Forschung. Zwei Medizinstudentinnen sprechen im Interview \u00fcber ihre Arbeit an der Annotation klinischer Texte.<\/p>\n","protected":false},"author":14,"featured_media":24587,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[41],"tags":[],"class_list":["post-24580","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-5-fragen-an"],"_links":{"self":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts\/24580","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/users\/14"}],"replies":[{"embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/comments?post=24580"}],"version-history":[{"count":10,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts\/24580\/revisions"}],"predecessor-version":[{"id":25281,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts\/24580\/revisions\/25281"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/media\/24587"}],"wp:attachment":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/media?parent=24580"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/categories?post=24580"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/tags?post=24580"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}