Wie man Datenkritik betreibt. Kleiner Workshopbericht zum Weiterschreiben

Mit dem ersten Workshop »Was ist Datenkritik?«, der in Zusammenarbeit mit der Siegener AG »Medien der Kooperation« am 26. und 27. Juli 2013 an der Universität Köln stattfand, hat die AG zeitnah und erfolgreich den aktuellen Diskurs um ›Big Data‹, das Soziale der ›Sozialen Medien‹ und auch die politisch brennenden Fragen im Kontext einer allgemeinen »liquid surveillance« (Baumann/Lyon 2012) aufgenommen. Zugleich ging es in dem von Marcus Burkhardt (Lüneburg), Sebastian Gießmann (Siegen) und Stefan Udelhofen (Köln) inhaltlich und organisatorisch vorbereiteten Workshop um die Konturen eines medienkulturwissenschaftlichen Umgangs mit analogen und vor allem digitalen Daten. Weiterlesen

Einleitung zum Workshop „Was ist Datenkritik?“ (Update)

Hier war der Livestream zu „Was ist Datenkritik?“ zu sehen. Wir haben die Einleitung von Marcus Burkhardt und Sebastian Gießmann mit einem minimalistischen technischen Setup gestreamt – danach ging es dann offline in medias res. Die AG Daten und Netzwerke ist nach wie vor gespannt auf Ihre Interventionen! Gerne hier in den Kommentaren oder auf Twitter mit dem Hashtag #AGDN. Wir freuen uns auf Reaktionen zu unserem ersten Workshop! Das Programm finden Sie hier.

Das Streamvideo beginnt bei Minute 1 … und die inhaltliche Einführung ab Minute 6:30.

Was ist Datenkritik? Workshop in Köln, 26./27. Juli 2013 (Update)

Daten, Daten, nichts als Daten? Diese Frage ist Symptom einer sich wandelnden Medienkultur in der scheinbar Nichts und Niemand der Verdatung entrinnen kann und in der alles Wissen in den Daten zu liegen scheint. Gerade deshalb bedarf es einer kritischen und differenzierten Auseinandersetzung mit Datenpraktiken.

Am 26. und 27. Juli 2013 findet daher der erste Workshop der AG Daten und Netzwerke der Gesellschaft für Medienwissenschaft zum Thema „Was ist Datenkritik?“ statt. Bis Ende Mai sind vielfältige und facettenreiche Themenvorschläge bei uns eingegangen. Mittlerweile ist das Programm komplett. Wir freuen uns auf ein breites Spektrum von Beiträgen, die von grundlegenden Auseinandersetzungen mit Daten und Kritik über das Verhältnis von Daten zu Algorithmen bis hin zu Open Data und Data Literacy reichen. Das aktuell vieldiskutierte Phänomen Big Data wird sich dabei wie ein roter Faden durch den Workshop ziehen und aus unterschiedlichen Perspektiven beleuchtet werden.

Was ist Datenkritik? Workshop in Köln, 26. und 27. Juli 2013

Da die Workshopbeiträge vorab unter den Teilnehmerinnen und Teilnehmern zirkuliert werden, bitten wir um eine formlose Anmeldung für den Workshop via Email an post@sebastiangiessmann.de und marcus.burkhardt@inkubator.leuphana.de.

Update 20.6.: Leider können Till Heilmann und Valentin Dander nicht teilnehmen. Wir freuen dafür sehr, dass Marian Steinbach als Open-Data-Experte Teil des Workshops sein wird!

Freitag, 26. Juli 2013
Universität Köln, Seminargebäude (Universitätsstraße 37), Raum S11

14:00

Entré, Vorstellung etc.

14:30

Sebastian Gießmann und Marcus Burkhardt: Einleitung

Datenkritik und Datenpraxis

15:00

Florian Sprenger: Zeit der Kritik

16:00

Yuk Hui: Data, Objects and Interobjectivity

17:00

Irina Kaldrack und Christian Köhler: Daten handeln. Zur Wissensordnung und Praxeologie des E-Commerce

18:00

Get together und Abendessen

Samstag, 27. Juli 2013
Universität Köln, Hauptgebäude (Albertus-Magnus-Platz), Alter Senatssaal

Die großen Versprechen großer Daten

10:30

Florian Püschel: Big Data und die Rückkehr des Positivismus. Zur Datengläubigkeit der Informationsgesellschaft

11:30

Markus Dirr: Big Data – Herstellung von Relevanz durch SocialMedia insbesondere durch SocialCuration und SocialCollaboration

12:30

Mittagessen

Algorithmen, Echtzeitanalysen und Data Literacy

14:00

Annika Richterich: Google Trends und Echtzeitanalysen. Zur Verwertbarkeit von Suchmaschinen-generierten Big Data

15:00

Johannes Paßmann: Datenkritik als praxeologische Kompositionskritik

16:00

Marian Steinbach: Offenes Köln

17:00

Zusammenfassung, Agenda, Ausklang

Ein Workshop der AG „Daten und Netzwerke“ in Zusammenarbeit mit der AG „Medien der Kooperation“ (Universität Siegen)

Große Daten, analytische Gesten und praktische Datenkritik

 Die Utrecht Data School hat am 25. April im Zuge der Big Data Week ein Symposium zum Umgang mit Big Data veranstaltet. In diesem Kontext fokussierte sich das Symposium sowohl auf akademische als auch wirtschaftliche Perspektiven auf Big Data und verdeutlichte dadurch die Unterschiede zwischen Datenkritik und Datenverwertung.

Die akademischen Beiträge von Bernhard Rieder (Universiteit van Amsterdam), Johannes Paßmann (Universität Siegen), Ellen Bijsterbosch  und Thomas Boeschoten (beide Universiteit Utrecht) lenkten ihre Aufmerksamkeit vor allem auf die analytischen Operationen und den Umgang mit Algorithmen, APIs und statistischen Analyseverfahren.

Bernhard Rieder fokussierte seinen Vortrag auf sogenannte analytische Gesten und die Frage, wie Big Data qualitative und quantitative Forschungsmethoden zusammenbringen. Ausgehend von Philip Agres Idee der „Grammars of action“ diskutierte er, wie digitale Medien eine Grammatik der Interaktion und Formalisierung von Datenerhebung schaffen, welche im Kontext von Big Data in neue Sinnzusammenhänge gebracht werden kann. Nicht nur die Datensätze und Referenzpopulationen werden grösser, argumentierte Rieder, Big Data Forschung trägt selbst zur Multiplizierung von Daten bei. Zentrale Analysetechniken dabei sind Statistik und Netzwerktheorie, deren epistemischen Grundannahmen spezifische Sinnzusammenhänge von Daten schaffen und daher als analytischen Gesten zu verstehen sind.

Wie sehr solche analytischen Gesten von der Technizität der Medien abhängen verdeutlichte der Vortrag von Ellen Bijsterbosch über Twitter als Gatekeeper. Während die Plattform täglich fast 600 Millionen Tweets speichert, haben Forschungsprojekte und Unternehmen nur sehr begrenzten freien Zugang über APIs, zum Beispiel zum Garden-Hose Sample (10% aller Tweets) oder zum ‚Spritzer’ (1%). Obwohl die Plattform betont, dass diese Auswahl auf zufälligen Stichproben basiert, verbleibt die der assoziierte Algorithmus als Blackbox und ist daher Subjekt von Kritik (boyd et al).

Der Vortrag von Johannes Paßmann entwickelte die Idee einer „praktischen Datenkritik“, die sich eben solchen analytischen Gesten zuwendet, wie Rieder sie vorher beschrieben hat und die nach einer Dokumentation und Reflektion von Analyseschritten im Umgang von Big Data fragt. Basierend auf seiner ethnografisch-digitalen Forschung zur „Favstar-Sphäre“ im deutschsprachigen Twitter nähert sich Paßmann dem Umgang mit Big Data mit der Metapher von Karte und Territorium. Um die Beziehung zwischen beiden nicht zu einer BlackBox werden zu lassen, fordert Paßmann eine verstärkte Explikation der Analyseschritte sowie eine situierte Nutzung von Algorithmen. Seine Antwort auf die Frage, wie man Algorithmen – wie zum Beispiel Twitter Accounts, die automatisch Deutschlands interaktions-stärkste Tweets berechnen – überhaupt für die eigene empirische Arbeit nutzen kann, rückt den Fokus zurück ins Feld: Wenn ein Algorithmus Relevanz für mediale Nutzungspraktiken hat, gewinnt er diese auch für methodologische Ansätze. Dieses Argument schließt an eine Idee in dem Aufsatz „Scraping the Social“ von Noortje Marres (Goldsmiths) und Esther Weltevrede (Universität von Amsterdam)  an.

In der Diskussion kristallisierten sich einige zentrale Herausforderungen für einen datenkritischen Umgang mit Big Data heraus: (1) Die zentrale Rolle von proprietären Algorithmen in der empirischen Forschung eröffnet Accountabilitäts-Probleme für ihre analytischen Gesten. Rieder schlägt in diesem Kontext vor, Algorithmen als mehr oder weniger glaubwürdige Informanten zu betrachten, während Paßmann einfordert, dass die Medienwissenschaft neue und spezifische Kriterien benötigt, um ihre Valenz oder Glaubwürdigkeit zu prüfen, um nicht mit „zwielichtigen Agenten“ zu arbeiten. Diese Kriterien können, so Paßmann, zum Beispiel durch ethnografische Dokumentation des Handelns mit Daten entwickelt werden. (2) Big Data verdeutlicht einmal mehr, wie dezentralisiert analytischen Kompetenzen in der Medienwissenschaft sind und wie problematisch eine zu diskrete Trennung von Erhebung, Ergebnissen und Analyse in der Forschung ist. (3) Daten, Methoden und Analyseverfahren im Kontext von Big Data überschneiden nicht nur disziplinäre Grenzen, viel mehr bedienen sich akademische Projekte kommerzieller Daten, Tools und Algorithmen und vice versa. Daten und Methoden kommen mit unterschiedlichen Valenzen für MediennutzerInnen, für die Forschung, für Plattformbetreiber sowie für Werbende. Die Rolle von medienwissenschaftlicher Datenkritik könnte daher sein, die Performativiät von analytischen Gesten zu verfolgen und die unterschiedlichen Wert- und Sinnzusammenhänge, in die Big Data geführt werden zu erfassen.