Große Daten, analytische Gesten und praktische Datenkritik

 Die Utrecht Data School hat am 25. April im Zuge der Big Data Week ein Symposium zum Umgang mit Big Data veranstaltet. In diesem Kontext fokussierte sich das Symposium sowohl auf akademische als auch wirtschaftliche Perspektiven auf Big Data und verdeutlichte dadurch die Unterschiede zwischen Datenkritik und Datenverwertung.

Die akademischen Beiträge von Bernhard Rieder (Universiteit van Amsterdam), Johannes Paßmann (Universität Siegen), Ellen Bijsterbosch  und Thomas Boeschoten (beide Universiteit Utrecht) lenkten ihre Aufmerksamkeit vor allem auf die analytischen Operationen und den Umgang mit Algorithmen, APIs und statistischen Analyseverfahren.

Bernhard Rieder fokussierte seinen Vortrag auf sogenannte analytische Gesten und die Frage, wie Big Data qualitative und quantitative Forschungsmethoden zusammenbringen. Ausgehend von Philip Agres Idee der „Grammars of action“ diskutierte er, wie digitale Medien eine Grammatik der Interaktion und Formalisierung von Datenerhebung schaffen, welche im Kontext von Big Data in neue Sinnzusammenhänge gebracht werden kann. Nicht nur die Datensätze und Referenzpopulationen werden grösser, argumentierte Rieder, Big Data Forschung trägt selbst zur Multiplizierung von Daten bei. Zentrale Analysetechniken dabei sind Statistik und Netzwerktheorie, deren epistemischen Grundannahmen spezifische Sinnzusammenhänge von Daten schaffen und daher als analytischen Gesten zu verstehen sind.

Wie sehr solche analytischen Gesten von der Technizität der Medien abhängen verdeutlichte der Vortrag von Ellen Bijsterbosch über Twitter als Gatekeeper. Während die Plattform täglich fast 600 Millionen Tweets speichert, haben Forschungsprojekte und Unternehmen nur sehr begrenzten freien Zugang über APIs, zum Beispiel zum Garden-Hose Sample (10% aller Tweets) oder zum ‚Spritzer’ (1%). Obwohl die Plattform betont, dass diese Auswahl auf zufälligen Stichproben basiert, verbleibt die der assoziierte Algorithmus als Blackbox und ist daher Subjekt von Kritik (boyd et al).

Der Vortrag von Johannes Paßmann entwickelte die Idee einer „praktischen Datenkritik“, die sich eben solchen analytischen Gesten zuwendet, wie Rieder sie vorher beschrieben hat und die nach einer Dokumentation und Reflektion von Analyseschritten im Umgang von Big Data fragt. Basierend auf seiner ethnografisch-digitalen Forschung zur „Favstar-Sphäre“ im deutschsprachigen Twitter nähert sich Paßmann dem Umgang mit Big Data mit der Metapher von Karte und Territorium. Um die Beziehung zwischen beiden nicht zu einer BlackBox werden zu lassen, fordert Paßmann eine verstärkte Explikation der Analyseschritte sowie eine situierte Nutzung von Algorithmen. Seine Antwort auf die Frage, wie man Algorithmen – wie zum Beispiel Twitter Accounts, die automatisch Deutschlands interaktions-stärkste Tweets berechnen – überhaupt für die eigene empirische Arbeit nutzen kann, rückt den Fokus zurück ins Feld: Wenn ein Algorithmus Relevanz für mediale Nutzungspraktiken hat, gewinnt er diese auch für methodologische Ansätze. Dieses Argument schließt an eine Idee in dem Aufsatz „Scraping the Social“ von Noortje Marres (Goldsmiths) und Esther Weltevrede (Universität von Amsterdam)  an.

In der Diskussion kristallisierten sich einige zentrale Herausforderungen für einen datenkritischen Umgang mit Big Data heraus: (1) Die zentrale Rolle von proprietären Algorithmen in der empirischen Forschung eröffnet Accountabilitäts-Probleme für ihre analytischen Gesten. Rieder schlägt in diesem Kontext vor, Algorithmen als mehr oder weniger glaubwürdige Informanten zu betrachten, während Paßmann einfordert, dass die Medienwissenschaft neue und spezifische Kriterien benötigt, um ihre Valenz oder Glaubwürdigkeit zu prüfen, um nicht mit „zwielichtigen Agenten“ zu arbeiten. Diese Kriterien können, so Paßmann, zum Beispiel durch ethnografische Dokumentation des Handelns mit Daten entwickelt werden. (2) Big Data verdeutlicht einmal mehr, wie dezentralisiert analytischen Kompetenzen in der Medienwissenschaft sind und wie problematisch eine zu diskrete Trennung von Erhebung, Ergebnissen und Analyse in der Forschung ist. (3) Daten, Methoden und Analyseverfahren im Kontext von Big Data überschneiden nicht nur disziplinäre Grenzen, viel mehr bedienen sich akademische Projekte kommerzieller Daten, Tools und Algorithmen und vice versa. Daten und Methoden kommen mit unterschiedlichen Valenzen für MediennutzerInnen, für die Forschung, für Plattformbetreiber sowie für Werbende. Die Rolle von medienwissenschaftlicher Datenkritik könnte daher sein, die Performativiät von analytischen Gesten zu verfolgen und die unterschiedlichen Wert- und Sinnzusammenhänge, in die Big Data geführt werden zu erfassen.

Nachtrag zum iLearning

Vor etwa einer Woche haben wir auf eine Debatte verwiesen, die sich damit befasst, wie deutsche Universitäten iTunes U nutzen und auf diese Weise ‚Platform Politics‘ betreiben. Diese Debatte hat sich nun ein Stück weiter gedreht: Wie die TagesWEBschau berichtet, lässt die FU Berlin verlauten, iTunes U solle nicht exklusiv, sondern nur als erste Plattform zum Einsatz kommen: 

Leonhard Dobusch bewertet dies auf netzpolitik.org als ein „Zurückrudern“ wegen des starken öffentlichen Echos und gibt sich besänftigt.

Was auch immer der Anlass für die zuerst von der FU geforderte Exklusivität gewesen ist – die Frage nach dem Verhältnis der Universitäten zu proprietären Plattformen stellt sich damit immer lauter. Diese Frage hat mindestens zwei Dimensionen:

1. Welche (Plattform-)Abhängigkeiten schafft die Universität? (Wird vermutlich am ehesten problematisch im Misserfolgsfall)

Ein Beispiel, wie problematisch die Abhängigkeit von Plattform-Diensten sein kann, lieferte gerade erst Google mit dem Einstellen seines RSS-Readers: Für Google lohnte er sich nicht mehr, und so gab es erst quasi keine Updates mehr; nun wird er ganz eingestellt. Wessen Arbeitsroutinen und -möglichkeiten dies hemmt, behindert oder unmöglich macht, zählt freilich nicht (wer will dies Google auch verübeln…?). Im Falle von iTunes U müsste es dabei gar nicht so weit kommen, dass Apple den Dienst eines Tages einstellt oder damit droht. Denn angesichts überfüllter Hörsäle (und den Ursachen dafür) dürfte eher das Gegenteil eintreten:

2. Zu wessen Produkt macht sich die Universität zu welchem Preis? (Wird vermutlich am ehesten problematisch im Erfolgsfall)

Der netzökonomische Merksatz „If you don’t pay, you’re the product“ zählt natürlich auch hier. Welchen Preis also zahlt die Universität dafür, dass sie nicht selbst eine äquivalente Plattform betreiben oder mit unterstützen muss? Ist es die Aufmerksamkeit der Studierenden für Produkte im iTunes-Store? Eine Steigerung von Apples Markenwert als Anbieter akademischen Arbeitsgeräts? Sind es Daten, die die Plattform so über seine (zukünftig hochqualifizierten) Nutzer erheben und an Personalabteilungen verkaufen kann? Darüber lässt sich trefflich spekulieren. Weniger spekulativ dürfte aber die Annahme sein, dass sich Apple darüber weit mehr im Klaren ist, als die Universitäten.

iLearning: Platform-Politics an deutschen Universitäten

Man kann sich ja mit gutem Recht fragen, ob es ein für unsere AG relevantes Thema gibt, das mehr an deutschsprachigen Hochschulen diskutiert worden ist als E-Learning. Dieses Thema kreuzt mehr und mehr das Forschungsfeld der Platform- oder Software-Studies, wenn es darum geht, über welche Infrastruktur man Studierenden digitale Lernmaterialen zur Verfügung stellt. Solche Fragen erledigen sich in der Praxis oft ganz von allein und so ist es eher Regel als Ausnahme, dass Facebook, Dropbox oder GoogleDocs faktisch die wichtigeren E-Learning-Plattformen darstellen als Moodle, WebCT oder Blackboard.

Wie Leonhard Dobusch (FU Berlin) nun berichtet, verläuft diese Entwicklung allerdings nicht nur bottom-up, sondern deutsche Hochschulen treten vermehrt als Institutionen in Erscheinung, die ‚Platform-Politics‘ zugunsten proprietärer Anbieter betreiben: So zählt er nicht nur eine ganze Reihe von Universitäten auf, die ihre Lehrveranstaltungen über iTunes U zur Verfügung stellen, sondern zitiert auch ein Rundschreiben der FU Berlin an alle Fachbereiche. Darin würden die Lehrenden aufgefordert, die Aufzeichnungen ihrer Lehrveranstaltungen über iTunes zur Verfügung zu stellen. Insbesondere sollten sie aber „von der Nutzung anderer externer Internet-Plattformen“ zur Verbreitung dieses Materials absehen.

Aus medienwissenschaftlicher Sicht (oder eher: aus Sicht der Medienwissenschaft) stellt sich meines Erachtens die Frage, ob wir einen Beitrag zu der Debatte leisten können und wenn ja welchen. Wie auch immer die Antwort ausfällt: Als Seminar-Beispiel für Platform-Politics taugt der Fall allemal.