{"id":23865,"date":"2024-10-04T11:56:42","date_gmt":"2024-10-04T09:56:42","guid":{"rendered":"https:\/\/www.smith.care\/?p=23865"},"modified":"2024-10-04T11:59:35","modified_gmt":"2024-10-04T09:59:35","slug":"gemtex-de-identifikation","status":"publish","type":"post","link":"https:\/\/www.smith.care\/de\/2024\/10\/04\/gemtex-de-identifikation\/","title":{"rendered":"GeMTeX schafft ersten Standard zur De-Identifikation deutschsprachiger medizinischer Dokumente"},"content":{"rendered":"\n<p>Im <a href=\"https:\/\/www.smith.care\/de\/gemtex_mii\/ueber-gemtex\/\">GeMTeX<\/a>-Projekt der <a href=\"https:\/\/www.medizininformatik-initiative.de\/de\/start\" target=\"_blank\" rel=\"noreferrer noopener\">Medizininformatik-Initiative (MII)<\/a> arbeitet ein interdisziplin\u00e4res Team daran, Texte aus der klinischen Routineversorgung f\u00fcr Forschung und Klinik nutzbar zu machen. Ziel ist es, einen der gr\u00f6\u00dften Datens\u00e4tze zur automatischen Verarbeitung medizinischer Texte in deutscher Sprache zu schaffen. Nun hat das GeMTeX-Team einen zentralen Meilenstein erreicht: Forschende der Universit\u00e4tskliniken Leipzig und Erlangen haben erstmals Annotate f\u00fcr ein Textkorpus ver\u00f6ffentlicht, die als Vorlage f\u00fcr die De-Identifikation deutschsprachiger medizinischer Texte dienen.<br>Annotate sind Markierungen von Textstellen, die Metadaten zum Inhalt liefern. Diese Markierungen machen die Texte beispielsweise f\u00fcr Anwendungen K\u00fcnstlicher Intelligenz und Large Language Models nutzbar.<\/p>\n\n\n\n<p><strong>Pilotstudie zur Annotation personenidentifizierender Informationen<\/strong><\/p>\n\n\n\n<p>Im Prozess der De-Identifikation werden Daten, die R\u00fcckschluss auf Personen zulassen, unkenntlich gemacht. Hierf\u00fcr haben Medizinstudierende der Universit\u00e4ten Leipzig und Erlangen gemeinsam mit einem Expertenteam aus Linguistik, Medizin und Informatik in einer Pilotstudie 1.438 Annotate auf fiktiven Arztbriefen erstellt. Die Arztbriefe stammen aus dem Graz Synthetic Text Corpus (GRASCCO).<\/p>\n\n\n\n<p>Bei der Annotation hat sich das GeMTeX-Team auf Textstellen fokussiert, die sensible Informationen wie Namen, Daten, Adressen oder Berufe enthalten. Diese Annotationen erm\u00f6glichen es, Software so anzupassen, dass personenbezogene Informationen in klinischen Dokumenten automatisch erkannt und verschl\u00fcsselt werden k\u00f6nnen.<\/p>\n\n\n\n<p><strong>Ein Beispiel f\u00fcr die datenschutzgerechte Verarbeitung medizinischer Texte<\/strong><\/p>\n\n\n\n<p>Die annotierten Dokumente wurden auf der internationalen Forschungsdatenplattform <a href=\"https:\/\/zenodo.org\/records\/11502329\" target=\"_blank\" rel=\"noreferrer noopener\">Zenodo<\/a> ver\u00f6ffentlicht und sollen als Vorlage f\u00fcr zuk\u00fcnftige Projekte dienen. Zusammen mit dem annotierten Korpus ist eine Publikation erschienen, die eine Vorgehensweise zur De-Identifikation von medizinischen Dokumenten beschreibt. Die so genannte \u201eDe-Idenfikationspipeline\u201c umfasst folgende Schritte:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Export der klinischen Texte als Rohdaten aus dem lokalen Krankenhausinformationssystem<\/li>\n\n\n\n<li>Import auf die Annotationsplattform INCEpTION<\/li>\n\n\n\n<li>Automatisierte Vorannotation relevanter Textstellen mit personenidentifizierenden Informationen durch die Averbis Health Discovery Pipeline<\/li>\n\n\n\n<li>Manuelle \u00dcberpr\u00fcfung und Korrektur der Annotationen im Vier-Augen-Prinzip<\/li>\n\n\n\n<li>Automatisiertes Ersetzen der vorannotierten und korrigierten Daten durch passende Pseudonyme (siehe Abbildung)<\/li>\n<\/ul>\n\n\n\n<p><\/p>\n\n\n\n<figure class=\"wp-block-image size-large is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"506\" src=\"https:\/\/www.smith.care\/wp-content\/uploads\/2024\/10\/Grafik_Gemtex-De-Identifikation_DE-1024x506.png\" alt=\"Grafik der GeMTeX De-Identifikation veranschaulicht\" class=\"wp-image-23850\" style=\"width:1130px;height:auto\" srcset=\"https:\/\/www.smith.care\/wp-content\/uploads\/2024\/10\/Grafik_Gemtex-De-Identifikation_DE-1024x506.png 1024w, https:\/\/www.smith.care\/wp-content\/uploads\/2024\/10\/Grafik_Gemtex-De-Identifikation_DE-300x148.png 300w, https:\/\/www.smith.care\/wp-content\/uploads\/2024\/10\/Grafik_Gemtex-De-Identifikation_DE-768x380.png 768w, https:\/\/www.smith.care\/wp-content\/uploads\/2024\/10\/Grafik_Gemtex-De-Identifikation_DE-1536x760.png 1536w, https:\/\/www.smith.care\/wp-content\/uploads\/2024\/10\/Grafik_Gemtex-De-Identifikation_DE-2048x1013.png 2048w, https:\/\/www.smith.care\/wp-content\/uploads\/2024\/10\/Grafik_Gemtex-De-Identifikation_DE-700x346.png 700w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Prozess der De-Identifikation im GeMTeX-Projekt. \u00a9 SMITH-Gesch\u00e4ftsstelle\/GeMTeX<\/figcaption><\/figure>\n\n\n\n<p><br>Die Ergebnisse der Pilotstudie wurden in einer Publikation zusammengefasst.<\/p>\n\n\n\n<p><a href=\"https:\/\/pubmed.ncbi.nlm.nih.gov\/39234720\/\" target=\"_blank\" rel=\"noreferrer noopener\">Zur Publikation in PubMed<\/a><br><a href=\"https:\/\/zenodo.org\/records\/11502329\" target=\"_blank\" rel=\"noreferrer noopener\">Zum annotierten Textkorpus und den Annotationsleitlinien (Zenodo)<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Das GeMTeX-Team hat einen zentralen Meilenstein erreicht: Forschende der Universit\u00e4tskliniken Leipzig und Erlangen haben erstmals Annotate f\u00fcr ein Textkorpus ver\u00f6ffentlicht, die als Vorlage f\u00fcr die De-Identifikation deutschsprachiger medizinischer Texte dienen. Damit wird eine erste Basis Nutzung medizinischer Text f\u00fcr z. B. das Training von KI-Anwendungen gelegt.<\/p>\n","protected":false},"author":19,"featured_media":23858,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-23865","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-neuigkeiten"],"_links":{"self":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts\/23865","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/users\/19"}],"replies":[{"embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/comments?post=23865"}],"version-history":[{"count":8,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts\/23865\/revisions"}],"predecessor-version":[{"id":23885,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/posts\/23865\/revisions\/23885"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/media\/23858"}],"wp:attachment":[{"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/media?parent=23865"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/categories?post=23865"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.smith.care\/de\/wp-json\/wp\/v2\/tags?post=23865"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}