Aus Kassendaten frühzeitig Gesundheitsrisiken erkennen
Wie lassen sich Gesundheitsrisiken vorhersagen, bevor eine Erkrankung schwer verläuft oder ein Krankenhausaufenthalt nötig wird? Im gemeinsamen Forschungsprojekt ClaimsBERT analysieren Fraunhofer SCAI und Wissenschaftliches Institut der AOK (WIdO) dazu mithilfe Künstlicher Intelligenz Abrechnungsdaten der Versicherten. „Ziel ist es vor allem, Prävention und Versorgung gezielter und individueller zu gestalten“, sagt Christian Günster, Leiter des Forschungsbereichs Qualitäts- und Versorgungsforschung beim WIdO.
Herr Günster, in dem Projekt ClaimsBERT wird die Methode des „Deep Learnings“ eingesetzt. Wie funktioniert das genau?
Günster: Beim Deep Learning lernt ein Modell die Muster und Zusammenhänge der Daten, auf denen es trainiert wurde. Ähnlich wie Sprachmodelle Zusammenhänge zwischen Wörtern erkennen, identifiziert ClaimsBERT typische Abfolgen medizinischer Ereignisse in den Abrechnungsdaten und berechnet Wahrscheinlichkeiten für das Auftreten zukünftiger Ereignisse. Das sind in unserem Projekt Erkrankungen oder Behandlungen. Die statistischen Risikoeinschätzungen ermöglichen eine frühzeitige Intervention. Voraussetzung für das Deep Learning sind sehr große Mengen an qualitativ hochwertigen Versorgungsdaten, die wir dann mit modernen Transformer-Architekturen bearbeiten.
Zu welchen Zwecken sollen die Erkenntnisse aus den Auswertungen genutzt werden – und wie können die einzelnen AOK-Versicherten künftig davon profitieren?
Günster: Ziel ist es vor allem, Prävention Prävention bezeichnet gesundheitspolitische Strategien und Maßnahmen, die darauf abzielen,… und Versorgung gezielter und individueller zu gestalten. Wenn Risiken frühzeitig erkannt werden, können Versicherte beispielsweise durch passende Präventionsangebote, Beratungen oder Programme unterstützt werden. Dies wird durch das Gesundheitsdatennutzungsgesetz und die Regelung gemäß Paragraph 25b SGB V möglich. Kranken- und Pflegekassen dürfen Versichertendaten nutzen, um das versichertenindividuelle Risiko einer konkreten Gesundheitsgefährdung, eines drohenden Erkrankungsrisikos oder Pflegebedürftigkeit Mit dem Zweiten Pflegestärkungsgesetz (PSG II) vom 27. November 2015 wurde der Begriff der… , oder auch für das Vorliegen einer Impfindikation zu ermitteln. Im Projekt ClaimsBERT leisten wir die wissenschaftliche Vorarbeit, um eine solche Risikoprädiktion über verschiedene medizinische Fragestellungen hinweg zu vereinfachen oder überhaupt erst zu ermöglichen.
„Der Schutz der Daten hat höchste Priorität. Die Analysen erfolgen ausschließlich auf streng geschützten und anonymisierten Daten.“
Vielen Menschen ist es vermutlich nicht ganz geheuer, dass mit ihren Daten solche individuellen Vorhersagen erstellt werden. Wie wird der Datenschutz bei den Auswertungen gewährleistet?
Günster: Der Schutz der Daten hat im Projekt höchste Priorität. Die Analysen erfolgen ausschließlich auf streng geschützten und anonymisierten Daten. Direkte Rückschlüsse auf einzelne Personen sind ausgeschlossen. Da wir im Projekt ClaimsBERT zunächst nur theoretisch arbeiten, sind anonymisierte Daten ausreichend. Dennoch unterliegt das Projekt den strengen gesetzlichen Vorgaben des Datenschutzes mit zahlreichen technischen und organisatorischen Sicherheitsmaßnahmen. Der Zugriff auf Daten ist klar geregelt und stark eingeschränkt. Wenn die Modelle nach Projektabschluss genutzt werden, um Versicherte gezielt zu informieren, dann gelten die Informationspflichten des Paragraphen 25b SGB V.
Wann sollen die ersten Ergebnisse des Projektes vorliegen? Und wagen Sie schon eine Prognose, wann die KI-Methoden dann im „Echtbetrieb“ zum Einsatz kommen werden?
Günster: Aktuell sind wir noch mit den Vorarbeiten beschäftigt, das heißt wir erarbeiten das Datenschutzkonzept und den statistischen Analyseplan. Außerdem testen wir, welches Modell das passendste für unsere Zwecke ist. Im Anschluss beginnt dann das Pre-Training des Basismodells. Die Feinjustierung zur Vorhersage von bestimmten Risiken folgt Ende 2027. Die finalen Ergebnisse werden Ende 2028 vorliegen. Anders als bei klassischen Methoden steht dann nicht nur ein Vorhersagemodell für eine einzelne Erkrankung zur Verfügung, sondern ein Grundmodell, das für eine Vielzahl von Gesundheitsrisiken adaptiert werden kann.