Reihen von menschlichen Silhouetten über Computer-Code-Muster
mauritius images / Ikon Images / Gary Waters

Datentracking in der Wissenschaft
DFG warnt vor Datenmissbrauch durch Verlage

Jeder Forschende hinterlässt bei seiner Arbeit Spuren im Netz. Diese Daten würden von Wissenschaftsverlagen getrackt und verkauft, warnt die DFG.

25.05.2021

Viele Forschungsaktivitäten greifen auf digitale wissenschaftliche Quellen zurück und können dort über digitale Nutzungsspuren nachverfolgt werden. Die Anbietenden der Informationsressourcen – zum Beispiel große Wissenschaftsverlage – können diese Spuren festhalten, aggregieren und weiterverwenden oder verkaufen, warnt ein Ausschuss der Deutschen Forschungsgemeinschaft (DFG). Um auf das Thema "Datentracking in der Wissenschaft" und deren Folgen aufmerksam zu machen, hat der Ausschuss für Wissenschaftliche Bibliotheken und Informationssysteme (AWBI) vergangene Woche ein 13-seitiges Informationspapier veröffentlicht.

Wissenschaftlerinnen und Wissenschaftler nutzen für ihre Arbeit demnach täglich digitale Informationsquellen wie zum Beispiel Literatur- und Volltextdatenbanken. Dabei hinterlassen sie Spuren, die unter anderem Aufschluss über gesuchte und genutzte Inhalte, Verweildauern und Downloads geben, heißt es in dem Papier. Die Daten einer Person aus verschiedenen Quellen könnten dabei miteinander und mit weiteren persönlichen Informationen, auch aus dem nicht wissenschaftlichen Umfeld, kombiniert werden. Wer beispielsweise Artikel in der Zeitschrift "Nature" aufrufe, werde von mehr als 70 Tracking-Instrumenten nachverfolgt, heißt es in dem Papier.

Neben der Bereitstellung und Verwaltung von wissenschaftlicher Literatur böten Verlage zunehmend Services wie Forschungsdatenmanagement und Forschungssoftware an. Die Wissenschaftsverlage wandelten sich so von reinen Content Providern immer weiter hin zu Data Analytics Businesses und würden dafür auch die Nutzerdaten sammeln und teils weiterverkaufen. Möglich sei dies durch Regelungslücken und unterschiedliche internationale Gesetzeslagen. Das habe Konsequenzen für die Wissenschaft und deren Institutionen, die oft unzureichend über das Vorgehen informiert seien. Wissenschaft als öffentliches Gut würde dabei zunehmend privatisiert.

Hochschulen können sich mitschuldig machen

So entstünden umfassende Datensammlungen über wissenschaftliche Aktivitäten Einzelner und ganzer Einrichtungen in kommerzieller Hand, die für Datenmissbrauch oder Wissenschaftsspionage verwendet werden könnten. Hochschulen und Bibliotheken könnten dabei auch ohne ihr Wissen zu Mitwirkenden in der Verletzung von Datenrecht, Wissenschaftsfreiheit und Wettbewerbsrecht werden – beispielsweise durch unzureichende Klauseln in Verträgen mit Großverlagen.

Teilweise könne die Datenerhebung auch sinnvoll sein – etwa für die Verbesserung der Dienstleistungen der Verlage oder zur Steuerung von Wissenschaftseinrichtungen –, aber nur, wenn sie transparent erfolge und die Daten nicht in den falschen Händen landeten. Hier nennt das Papier zum Beispiel ausländische Regierungen, autoritäre Regime und kommerzielle Forschungskonkurrenten.

Tracking könne daher der Wissenschaftsfreiheit widersprechen und Forschende gefährden, schließt der DFG-Ausschuss aus diesem Vorgehen der Verlage. Deshalb müssten Wissenschaftlerinnen und Wissenschaftler sowie Forschungseinrichtungen die Problematik kennen, um sie reflektieren und geeigenete Maßnahmen starten zu können. "Die Wissenschaftsorganisationen sollten dafür einstehen, dass die Datensammlung und Datennutzung – wo sie nötig ist – nicht nur legal, sondern auch durch ethische Werte geprägt sind", so der Appell der DFG.

Wie die Daten der Wissenschaftler gewonnen werden

Die Daten über die wissenschaftlichen Aktivitäten von Forschenden gewinnen die Verlage der Bestandsaufnahme der DFG zufolge über drei Wege:

  • Third Party Data durch Microtargeting: Die großen Internetfirmen helfen hierbei den Verlagen mit Informationen über das plattformübergreifende Onlineleben der Nutzer bei deren zielgruppenspezifischen Adressierung. Dafür lesen diese beispielsweise aus, mit welchen Texten ein Wissenschaftler sich beschäftigt, in welcher Reihenfolge dies geschieht und welche Suchworte er auf der Plattform des Verlags eingibt. Diese Daten verknüpfen die Drittanbieter mit den bestehenden Datenprofilen.
  • Bidstream Data und Port Scanning: Diese Methode kommt zum Einsatz, wo Drittanbieter explizit ausgeschlossen werden. Hierbei werden unter anderem Lokalisierungsdaten, IP-Nummern und Geräteinformationen genutzt, um Einzelpersonen zu identifizieren.
  • Verlagstrojaner: Hierbei handelt es sich um Software, die Verlage in Bibliotheken installieren lassen, vorgeblich um "Schattenbibliotheken" zu verhindern. Diese sammelt biometrische Daten wie Tippgeschwindigkeit oder Art der Mausbewegung, um Nutzer zu personalisieren.

ckr

0 Kommentare