Durch die Medizininformatik-Initiative (MII) und den Aufbau der Datenintegrationszentren (DIZ) werden klinische Versorgungdaten aus verschiedenen Quellen des Krankenhausinformationssystems (KIS) für die medizinische Forschung nutzbar gemacht. Dabei entsteht ein einzigartiger und reicher Bestand klinischer Daten, die präzise über alle teilnehmenden Standorte definiert sind. Mit dem methodischen Anwendungsfall Phänotypisierungspipeline, kurz PheP, unterstützt das SMITH-Konsortium den Aufbau, die qualitative Anreicherung und die Auswertung des Datenbestandes. Die Federführung liegt bei der Universität Leipzig.
PheP ist eine Plattform, über die klinische Forscherinnen und Forscher in interdisziplinärer Zusammenarbeit mit Statistikerinnen und Statistikern sowie Informatikerinnern und Informatikern Forschungsfragestellungen nachgehen können, die zuvor wirtschaftlich und technologisch undenkbar schienen. Hierfür ist es notwendig Datensätze aufzubauen, die für klinisch-epidemiologische und gesundheitsökonomische Fragestellungen nutzbar sind.
Aus Phänotypen, d. h. bestimmbaren Merkmalen von Patientinnen und Patienten, können über Phänotypisierung weitere Merkmale abgeleitet und bereitgestellt werden. PheP unterstützt dabei auch das Record-Linkage-Verfahren, über welches Daten eines Patienten aus unterschiedlichen Informationsquellen zusammengeführt werden, beispielsweise von Krankenkassen oder Sterbedaten aus Melderegistern.
Eine der Herausforderungen hierbei ist, dass zu wenige klinische Informationen als maschinenlesbare Datensätze vorliegen. Gerade in Einweisungsbriefen, Befunden oder OP-Berichten finden sich wertvolle Informationen wie Diagnosen, Medikamente, Nebenwirkungen oder Labordaten, die nur mit Methoden der natürlichen Sprachverarbeitung und der semantischen Textanalyse extrahiert werden können. Mittels Natural Language Processing (NLP), d. h. der Verarbeitung natürlicher Sprache, werden Dokumente aus dem Krankenhausinformationssystem (KIS) aufbereitet. Der Prozess wird akademisch geleitet durch das Jena University Language & Information Engineering Lab (JULIE Lab) in Zusammenarbeit mit führenden Unternehmen auf dem Gebiet der Sprachverarbeitung.
Im Mittelpunkt von PheP steht die standardisierte Einführung immer wieder neuer Datennutzungsprojekte (engl. Data Use Project – DUP) sowie deren Entwicklung. DUPs dienen vielfältigen Aufgaben – der versorgungsnahen Qualitätssicherung, der Vernetzung mit externen Daten, der dynamischen Anreicherung des Datenbestandes, der wissenschaftlichen Hypothesenbildung oder der statistischen Analyse medizinischer Sachverhalte. Die Bündelung dieser Prozesse nennen wir PheP-Factory.
Die technische Voraussetzung liefert eine an allen Standorten aufgebaute Plattform – die PheP-Engine. Die sichere Technologie ermöglicht die Ausführung verteilter Analysen auf den semantisch und technisch standardisierten Daten an allen Standorten. Sensible Patientendaten verbleiben in der Klinik – die Algorithmen kommen zu den Daten. Diese Technologie erlaubt ein flexibles und datenschutzkonformes Vorgehen für unterschiedliche klinische Fragestellungen.
Der Use Case PheP wurde vom 01.01.2018 bis zum 31.05.2023 im Rahmen des SMITH-Konsortiums vom Bundesministerium für Bildung und Forschung (BMBF) gefördert.
„SMITH orientiert sich in seinen Arbeiten an den aktuellen Herausforderungen der Digitalisierung. Durch die nachhaltige Nutzung von Versorgungsdaten in der medizinischen Forschung werden entscheidende Schritte zur Verbesserung von Diagnose, Prävention und Therapie geleistet. Die Gesundheitsversorgung kann so auf eine neue Stufe gehoben werden.“
Prof. Dr. Markus Löffler
Konsortialleiter SMITH
Leiter Use Case PheP
Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE) | Universität Leipzig