Forschungsdatensicherheit
Was tun gegen die Abhängigkeit der Forschung von US-Datenbanken?
Die Grünen-Fraktion im Bundestag hatte im Dezember in einer Kleinen Anfrage nach den Maßnahmen der Bundesregierung zur Stärkung der Unabhängigkeit der medizinischen Forschung von US-amerikanischen Datenbanken gefragt. Die Antwort der Bundesregierung vom 9. Januar klingt vage – sowohl was die Einschätzung der Gefahrensituation als auch den Stand der Maßnahmen angeht.
Die Deutsche Zentralbibliothek für Medizin (ZB MED) – Informationszentrum Lebenswissenschaften kritisiert die Antwort der Bundesregierung in einem Blog-Beitrag vom vergangenen Freitag und im Gespräch mit Forschung & Lehre. Das Infrastruktur- und Forschungszentrum stellt eine "Diskrepanz zwischen politischen Zielen und deren Umsetzung durch Ablehnung konkreter Lösungsansätze" fest.
Bundesregierung sieht bisher keine signifikanten Datenausfälle
Die Bundesregierung sieht laut ihrer Antwort durchaus die Gefahr, dass von US-Einrichtungen unterhaltene medizinische Informationsangebote und Recherchequellen wie PubMed nicht mehr uneingeschränkt verfügbar sein könnten. Die bibliografische Referenzdatenbank der U.S. National Library of Medicine (NLM) enthält nach eigenen Angaben Referenzen und Abstracts für mehr als 39 Millionen Veröffentlichungen aus dem Bereich Biomedizin und Lebenswissenschaften sowie verwandter Wissenschaftsbereiche und verlinkt, wo verfügbar, die Volltexte.
Die Regierung schreibt über die US-Recherchequellen, dass "bislang keine signifikanten Ausfälle oder Einschränkungen zu verzeichnen sind". Dies "unterschätzt die strukturellen Risiken" konstatiert ZB MED: Bereits seit vergangenem Jahr gebe es für gewisse Länder aus geopolitischen Erwägungen Zugangsbeschränkungen bei mehreren Datenbanken der National Institutes of Health (NIH). Diese sind über die untergeordnete U.S. National Library of Medicine auch Träger von PubMed.
Es seien bereits zahlreiche Inhalte auf Seiten von US-Behörden gelöscht worden, darunter auch wissenschaftliche Daten. Zudem seien Finanzierung und Zukunft von PubMed unklar: Aus den Haushaltsplänen der NIH für das Jahr 2026 geht die Absicht hervor, NLM in das National Institute of General Medical Sciences (NIGMS) zu integrieren, was den organisationsinternen Stellenwert von PubMed und somit die zur Verfügung stehenden Mittel verringern könnte. Außerdem habe es bereits strukturelle Veränderungen gegeben, wie beispielsweise bei den Verfahren zur Aufnahme neuer Zeitschriften in PubMed, die die Transparenz und Nachvollziehbarkeit der Qualitätssicherung verringerten.
Umfassendes Monitoring der Datenverfügbarkeit gefordert
Ein unabhängiges Monitoring von PubMed wäre ein "sehr sinnvoller Beitrag", schreibt ZB MED: Bestehende Infrastrukturen könnten koordiniert durch die vom Bundesministerium für Forschung, Technologie und Raumfahrt (BMFTR) geplante Nationale Plattform für Forschungssicherheit die Aufgabe übernehmen. Ein erstes Werkzeug liege dazu mit dem ZB MED-eigenen Pubservatory bereits vor. Das Programm dokumentiere neu eingespielte Publikationen in PubMed ebenso wie gelöschte oder entfernte Einträge. Um ein umfassendes Monitoring-System darzustellen, müsse es allerdings mit Möglichkeiten zur Dokumentation von Performance-Metriken, Verfügbarkeit und Ausfallzeiten ergänzt werden.
"Wir dürfen nicht unvorbereitet ins erwartbare Chaos rutschen und dabei die deutsche und europäische medizinische Forschung gefährden." Dr. Andrea Lübcke, Die Grünen
Die Bundesregierung plant laut ihrer Antwort auf die Kleine Anfrage aktuell allerdings kein Monitoring-System auf Regierungsebene. Das kritisiert die Verfasserin der Kleinen Anfrage, Dr. Andrea Lübcke, die für die Grünen im Ausschuss für Forschung, Technologie, Raumfahrt und Technikfolgenabschätzung sitzt. Gegenüber Forschung &Lehre fordert sie, dass die Bundesregierung "ein gezieltes Monitoring der Entwicklungen bei den Zugängen zu medizinischen Forschungsdaten in den USA" einrichtet. "Wir dürfen nicht unvorbereitet ins erwartbare Chaos rutschen und dabei die deutsche und europäische medizinische Forschung gefährden."
Notfallalternativen zu PubMed derzeit unzureichend?
Die Bundesregierung verweist bei Ausfällen von PubMed auf das ZB MED-eigene Suchportal LIVIVO für Literatur und Forschungsdaten in den Bereichen Medizin, Gesundheit, Agrar-, Ernährungs- und Umweltwissenschaften sowie auf Europe PubMed Central (Europe PMC). Letzteres spiegelt den Inhalt von PubMed Central, das die Volltexte von Open-Access-veröffentlichten Artikeln in der Biomedizin und den Lebenswissenschaften archiviert und zu PubMed gehört. ZB MED kritisiert beide Alternativen als nicht ausreichend: Eine Notfallalternative zu PubMed müsste auch "die Fähigkeit umfassen, Daten zu aktuellen Publikationen eigenständig bereitzustellen". Das sei bei den bestehenden Spiegelungsansätzen nicht gegeben, denn sie gäben nur den Status quo wieder. Bei einem Ausfall oder einer Einschränkung sei dieser schnell überholt. Insbesondere im Bereich der Lebenswissenschaften sei die Bereitstellung des aktuellen Stands der Forschung mitunter sogar lebensentscheidend. Das Projekt OLSPub (Open Life Science Publication Database) von ZB MED ziele allerdings genau darauf ab. Hier sollen die Daten über eigene Pipelines eingesammelt werden.
"Es geht darum, die notwendige technische und organische Infrastruktur aufzubauen, damit ein Zustrom von neuen Artikeln und Metadaten erfolgen kann." Professor Konrad Förstner, ZB MED
"Es geht darum, die notwendige technische und organische Infrastruktur aufzubauen, damit ein Zustrom von neuen Artikeln und Metadaten erfolgen kann", erläutert Professor Konrad Förstner, Leiter des Programmbereichs Data Science and Services von ZB MED im Gespräch. Dazu müssten auch Verträge und Vereinbarungen mit den Verlagen getroffen werden, bei denen die Fachzeitschriften erscheinen. Während der Vorarbeiten zum Projekt hätten sie bereits mit vielen Verlagen Gespräche geführt und sich geeinigt, andere stünden noch aus.
Eigene Datenbanken als "Versicherung" gegen Datenverluste
Außerdem müsse eine Alternative zu PubMed auch andere Aspekte sicherstellen, etwa die Darstellung der Inhalte und ihre Auswahl. "Dazu müssen wir ein System aufbauen, das offen, nachhaltig und kollaborativ ist", sagt Förstner. "Wir brauchen für diese Aufgaben Expertinnen und Experten. Wir brauchen Redundanzen für eine resiliente Lösung." Das Projekt OLSPub beschreibt er als "Versicherung", die im besten Fall zusätzlich zu der weiterhin funktionierenden PubMed-Datenbank existiert.
"Die digitale Sicherung von Inhalten reicht nicht mehr aus. Jetzt brauchen wir Redundanz und Open-Source-Lösungen." Dr. Miriam Albers, ZB MED
Dr. Miriam Albers, kommissarische Leiterin des Programmbereichs Bibliothek von ZB MED, stimmt zu: "Das Paradigma für Informationssicherheit hat sich verändert. Die digitale Sicherung von Inhalten reicht nicht mehr aus. Jetzt brauchen wir Redundanz und Open-Source-Lösungen. Aber das ist aus meiner Sicht in der Konzeption der Förderstrukturen noch nicht angekommen."
DFG-Absage: Entsprechen die Förderkriterien der Situation?
Die Bundesregierung erläutert in ihrer Antwort auf die Kleine Anfrage, dass sie zwischen 2026 und 2027 etwa 30 Millionen Euro im Rahmen eines nationalen Förderprogramms für kurzfristige Projekte zur Unterstützung von Datenrettungsmaßnahmen investiere, die die Abhängigkeit verringern sollen. Sie beschreibt, dass sich die ersten Anträge in der Begutachtungsphase durch die Deutsche Forschungsgemeinschaft (DFG) befänden, darunter auch OLSPub.
Allerdings hat das Projekt in seinen beiden Varianten OLSPub und in reduzierter Form als RESILMED bereits im November und Dezember Förderabsagen von der DFG erhalten, wie Albers und Förstner im Gespräch mit Forschung & Lehre berichten. Dazu schreiben sie im Blog-Beitrag, dass einer Überprüfung der Förderkriterien angezeigt sei, "da sie möglicherweise kontraproduktiv zu den erklärten Zielen digitaler Souveränität wirken". Sie schlagen vor, dass "technische Realisierbarkeit und strategische Notwendigkeit stärker gewichtet werden könnten gegenüber formalen Kooperationsanforderungen".
Konkret sei in den Absagen die fehlende Zusammenarbeit mit European Molecular Biology Laboratory – European Bioinformatics Institute (EMBL-EBI), dem Träger von Europe PMC, sowie mit der US-amerikanischen NLM kritisiert worden, obwohl Kooperationen bestünden. Albers erläutert, dass es Teil des ZB MED-Antrags gewesen sei, auch innerhalb der Projektlaufzeit die beteiligte Community zu erweitern. "Wir wissen, dass dieses Projekt und seine Umsetzung viele Kooperationen brauchen, mehr noch als in unseren Anträgen enthalten waren. Wir glauben aber, es wäre falsch zu warten, bis die perfekte Ausgangslage gegeben ist. Jetzt deshalb nichts zu tun, ist für uns nicht nachvollziehbar."
Zusammenarbeit für eine europäische Lösung
Die Bundesregierung betont in ihrer Antwort das geplante Engagement auf europäischer Ebene. Vor allem mit der European Open Science Cloud (EOSC) der Europäischen Kommission sei eine Zusammenarbeit beabsichtigt, da das langfristige Ziel die europäische Datensouveränität sei. OLSPub hätte eine Einbindung in die EOSC vorgesehen, die durch die Ablehnung nun nicht verfolgt werde, moniert ZB MED.
ZB MED hofft jetzt auf direkte politische Unterstützung für OLSPub/RESILMED außerhalb der DFG-Verfahren, sowie eine strukturelle Förderung von Pubservatory als evidenzbasiertes Monitoring-System. Zunächst werde ZB MED aber im Februar eine internationale Fundraisingkampagne starten, um insgesamt 2 Millionen Euro zu sammeln. In der ersten Projektphase werde mit Kosten von 600.0000 Euro gerechnet.
Knappe Million für Datenrettung in Geo- und Umweltwissenschaften
Im Unterschied zu OLSPub ist die Datenplattform PANGAEA ein Projekt, das im Rahmen des Programms der Bundesregierung zur Unterstützung von Datenrettungsmaßnahmen gefördert wird. Über die Zusage haben die Träger, das Alfred-Wegener-Institut, Helmholtz-Zentrum für Polar- und Meeresforschung (AWI) und das MARUM, Zentrum für Marine Umweltwissenschaften der Universität Bremen, am 17. Dezember 2025 informiert.
Die DFG hat ihnen rund 860.000 Euro Fördergelder bewilligt, um mit PANGAEA gefährdete Daten aus den Erde- und Umweltwissenschaften zu sichern. Die Gelder gelten für das aktuelle und das kommende Jahr, wurden aber auch rückwirkend für 2025 genehmigt, währenddessen die Plattform bereits umfassende Datensätze aus den USA gesichert hat. Während dieser Zeit sei das AWI bei der Datensicherung personell und finanziell in Vorleistung gegangen.
Frank Oliver Glöckner, Leiter des Bereichs DATA am AWI und Professor für Erdsystemdatenwissenschaften am MARUM, erläuterte im Gespräch mit Forschung & Lehre, dass er die größte Gefahr für die Wissenschaft aktuell nicht in der Rettung bestehender Daten sehe. Das eigentliche Problem sei, dass die Expertise bei den datenverarbeitenden Institutionen in den USA durch Entlassungen und Kürzungen nicht mehr gegeben sei. Möglicherweise kämen in einigen Fällen weniger, qualitativ schlechtere oder gar keine Daten nach.
"Resilienz aufzubauen ist kein Sprint, sondern ein Marathon." Professor Frank Oliver Glöckner, AWI/MARUM
Daher ginge es darum, "eine intelligente Redundanz der Dateninfrastrukturen" und Expertise aufzubauen: Menschen, die die Daten verstehen und aufbereiten könnten, müssten ausgebildet werden. Zudem sei ein langfristiges Programm auf EU-Ebene wichtig: "Digitale Souveränität ist eine europäische Aufgabe". Die PANGAEA nun gewährte Zweijahresfinanzierung sieht er lediglich als Anfinanzierung. "Resilienz aufzubauen ist kein Sprint, sondern ein Marathon."