Symbolbild für Netzwerke und abgegrenzte Räume
mauritius images / Watcharaphong Pratasu / Alamy / Alamy Stock Photos

Forschung mit und zu Social Media
Die Tücken des Datenzugangs in Sozialen Medien

Wie funktionieren die Algorithmen Sozialer Medien? Wer diese und ähnliche Fragen erforschen will, kommt nicht so leicht an verwendbare Daten. Warum?

Von Birgit Stark 27.02.2023

Elon Musk hat viel Staub aufgewirbelt, seit er Twitter im letzten Jahr übernommen hat. Als einer der reichsten Männer der Welt kontrolliert er eine relevante Plattform für den öffentlichen (politischen) Diskurs. Er kündigte vielen Mitarbeiterinnen und Mitarbeitern, schaltete den Trump-Account wieder frei, ließ die Konten verschiedener US-Journalisten sperren, veränderte Moderationsregeln und hat über seinen eigenen Rücktritt abstimmen lassen. Aus demokratietheoretischer Sicht stellt er nicht nur eine große Gefahr für unsere Öffentlichkeit dar, weil er Kommunikationsstrukturen kontrolliert, sondern auch über Twitter das Meinungsklima beeinflussen kann. Denn Meinungen in Sozialen Medien gehören oft einer "lauten Minderheit" an und können ein falsches Bild der Mehrheitsmeinung suggerieren, wenn sie als Stimmungsbarometer für die Gesamtgesellschaft gedeutet werden.

"Erforscht werden die Auswirkungen der nahezu ubiquitären Mediennutzung in vielerlei Hinsicht."

Zweifelsohne haben Soziale Medien unsere Kommunikation, aber auch das Zusammenleben in der Gesellschaft tiefgreifend verändert. Sie machen nicht nur Informationen aller Art zugänglich, sondern helfen uns, soziale Beziehungen zu pflegen oder neue Kontakte zu knüpfen. Der mobile Zugang über Smartphones erlaubt zudem die ständige Verfügbarkeit und Verbundenheit ihrer Nutzerinnen und Nutzer. Erforscht werden die Auswirkungen der mittlerweile nahezu ubiquitären Mediennutzung in vielerlei Hinsicht. Auf individueller Ebene interessiert vor allem, welche positiven und negativen Auswirkungen haben Soziale Medien? Inwieweit verändern sie unser Wohlbefinden? Auf welche Art und Weise erweitern sie politische Partizipation? Wie beeinflussen sie die Identitätsbildung von Kindern und Jugendlichen? Gleichwohl werden aber auch mögliche Gefahren einer exzessiven Nutzung (Internetsucht), digitaler Stress oder die Risiken des permanenten sozialen Vergleichs diskutiert.

Einfluss und Macht der Tech-Unternehmen

Soziale Medien funktionieren nach eigenen Kommunikations- und Vermittlungslogiken, deren leitendes Prinzip die Generierung von Aufmerksamkeit ist. Plattform-Affordanzen wie Design, Funktionen und Sprache prägen bestimmte Gebrauchsweisen und soziale Praktiken. Dabei orientiert sich die algorithmenbasierte Aufmerksamkeitssteuerung am größtmöglichen Publikum, weil das Geschäftsmodell der Tech-Plattformen rein werbefinanziert ist und ausschließlich der Profitmaximierung dient. Je passgenauer sie Inhalte und Werbung auf ihre Nutzerinnen und Nutzer zuschneiden können, umso attraktiver wird das Angebot und die Bindung an die Plattform steigt. So werden beispielsweise soziale Interaktionen in Form von Likes, Shares oder Retweets fortlaufend quantifiziert und generieren nicht nur Emotionen und Reichweite, sondern erhöhen die Verweildauer.

Durch die Implementierung von Algorithmen gewinnen Plattformen an Macht, die mit einer Reihe von Risiken verbunden ist. Sie reichen von Diskriminierung über Manipulation (im Wahlkampf) und den Missbrauch von Markt- und Meinungsmacht bis hin zu Verletzungen der Privatsphäre. Über die Risiken algorithmischer Kuratierung wird seit Jahren intensiv diskutiert. Nutzerinnen und Nutzer können durch algorithmenbasierte Empfehlungssysteme in sogenannte "Filterblasen" geraten, in denen sie von gesellschaftlich relevanten Diskussionen weitgehend abgekoppelt sind, beziehungsweise sich in die Nischen von Paralleldiskursen, auch "Echokammern" genannt, begeben, da sie von den personalisierten Algorithmen nur noch Nachrichten vorgesetzt bekommen, die ihr Weltbild bestätigen. Mit überraschenden Meinungen oder Standpunkten, die von den eigenen abweichen könnten, kommen sie dann nicht mehr in Kontakt. Gewarnt wird deshalb eindringlich vor den gesellschaftlichen Folgen, denn die Einschränkung der individuellen Themenhorizonte kann zu einer wachsenden Fragmentierung bzw. Polarisierung führen.

Algorithmen von Social Media sind nur schwer erforschbar

In methodischer Hinsicht gilt, dass die Erfassung der Effekte nach wie vor schwierig ist und bessere Einblicke in die "Black Box" der Algorithmen für Wissenschaftlerinnen und Wissenschaftler unerlässlich bleiben. Trotz der verstärkten Bemühungen um Transparenz sind algorithmenbasierte Auswahllogiken in ihrer Gesamtkomplexität kaum fassbar. Denn in der Regel wird eine Vielzahl von Anweisungen verwendet, die voneinander und auch von wechselnden Nutzerdaten abhängen. Die unterschiedliche Verknüpfung der Kuratierungslogiken stellt deshalb eine Herausforderung für die Messung dar, da die algorithmische Anpassung des Nachrichtenangebots auf der Basis des bisherigen Nutzerverhaltens erfolgt. Wissen­schaftlerinnen und Wissenschaftler greifen auf Daten aus sozialen Netzwerken unter anderem über so genannte API-Schnittstellen (Application Programming Interface) zu. Diese Programmierschnittstellen ermöglichen es den Forscherinnen und Forschern, automatisiert Daten abzuspeichern, die Auskunft über das Nutzungsverhalten geben. Allerdings sind vollständige oder repräsentative Datenerhebungen aufgrund der Zugangsmechanismen der Plattformen kaum realisierbar.

Die spezifischen Herausforderungen sind vielfältig, da insbesondere die Datenzugänge durch die entsprechenden Plattformen kontrolliert und unterschiedlich gehandhabt werden. So mussten Forscherinnen und Forscher bereits Datenspende-Projekte, bei denen sich Nutzende freiwillig verpflichten, Daten weiterzugeben, abbrechen, um mögliche Sanktionen von Face­book (Meta) zu umgehen. Sprich, die automatisierte Erfassung von Daten kann von den Plattformen durchaus unterbunden werden, wobei als Gründe meist die Privatsphäre der Nutzenden oder Nutzungsbedingungen vorgeschoben werden. Zudem können sich Forscherinnen und Forscher nicht unbedingt auf die von Facebook freiwillig zur Verfügung gestellten Daten verlassen. Das haben Forschungsinitiativen wie "Social Science One" gezeigt, die explizit die Zusammenarbeit zwischen Industrie und Wissenschaft fördern und die Nutzung von Facebook-Daten im Kontext von Wahlen sicherstellen sollen. Einblick in die Nutzung können außerdem so genannte Tracking-Verfahren geben. Sie zeichnen das Nutzerverhalten technisch auf und messen die Online-Nutzung direkt an den Endgeräten. Aber auch sie stoßen auf technische Besonderheiten, die die Aussagekraft der Daten einschränken können. Erst langsam etablieren sich institutionelle Forschungsinfrastrukturen, die Wissenschaftlerinnen und Wissenschaftler in methodischer Hinsicht bei der Erfassung digitaler Verhaltensdaten unterstützen. Eine wichtige Rolle spielt dabei die langfristige Archivierung von Social Media-Daten, um sie für Analysen überhaupt zugänglich zu machen.

"Eine wichtige Rolle spielt die langfristige Archivierung von Social Media-Daten."

Neue Gesetze zu Social-Media-Daten

Neue EU-Regeln zur Plattformregulierung sollen Abhilfe schaffen: Das Gesetz über digitale Dienste (Digital Services Act, DSA) und das Gesetz über digitale Märkte (Digital Markets Act, DMA) verstärken seit November 2022 die Sorgfaltspflichten von Online-Plattformen und schaffen für große Digitalunternehmen einen neuen Verhaltenskodex, nicht zuletzt um ihre marktbeherrschende Macht zu beschränken. Für Forschende sind die Regeln im DSA maßgeblich, weil sie das Recht auf einen breiten Zugang zu Plattformdaten sicherstellen sollen und unternehmerische Sorgfaltspflichten fordern, die mehr Transparenz und Rechenschaft verlangen. Die Unternehmen sollen nicht nur Risikobewertungen durchführen und ihre algorithmischen Empfehlungssysteme besser erklären, sondern unabhängige Forschung im öffentlichen Interesse für autorisierte Wissenschaftlerinnen und Wissenschaftler ermöglichen. Eine Vorreiterrolle hat Deutschland mit den bereits etablierten Transparenzregeln und dem Diskriminierungsverbot im Medienstaatsvertrag eingenommen.

Gesetzgeber in Deutschland, Europa und anderen Ländern versuchen aktuell, Regeln für Tech-Konzerne zu entwickeln und über verschiedene Instrumente den systemischen Risiken besser zu begegnen. Allerdings müssen Durchsetzung und Aufsichtspflichten auf nationaler und europäischer Ebene noch konkretisiert und geklärt werden. Die Umsetzung wird zeigen, wie effektiv die Datenzugangsregeln für die Forschung sind und ob bei der Klärung von Detailfragen nicht doch wieder neue Hürden geschaffen werden. Die Wissenschaft braucht einen zuverlässigen Zugang, um die digitale Transformation der demokratischen Öffentlichkeit kontinuierlich zu beobachten.

Datenzugang für Akademiker über API

Vor Kurzem hat Twitter angekündigt, den Datenzugang über die API-Schnittstelle kostenpflichtig zu machen. Die Umsetzung wurde allerdings seit der ersten Ankündigung am 2. Februar bereits mehrfach verschoben, zunächst um "einige Tage", dann um "einige Wochen". Ein genauer Starttermin und Details zu den Kosten, die auf Forschende zukommen, liegen aktuell nicht vor. Zuletzt sprach Twitter von einem gestaffelten Preissystem je nach Umfang der zugänglichen Daten, beginnend ab 100 US-Dollar pro Monat für einen "Basiszugang".

ckr