Was der Erklärbär zu Big Data sagt

Wenige Buzzwords sind so undefiniert wie die großen Datenmengen, die als Big Data daherkommen. Nun ja, Cloud Computing dürfte ein vergleichbarer Integrationsbegriff sein, der Marketingdiskurs, Messenkommunikation und alltägliche Computer- und Smartphonenutzung unter einen Hut bringt. Groß scheint an den großen Daten ihre Menge zu sein, die im Digitalen vor allem eine numerische ist, wenn auch die physische Speicherung nicht zu unterschätzen bleibt.

Nachdem bereits Trendkongresse zum Thema abgehalten werden, muss man sich wieder einmal fragen, ob die Medienkulturwissenschaft das Thema nicht verpasst. Die Landesanstalt für Medien Nordrhein-Westfalen hat jedenfalls ein verbraucherorientiertes Video produzieren lassen – gemacht von Mario Sixtus und Alexander Lehmann – in dem der Erklärbär mächtig steppt. Dazu gibt es auch eine Broschüre, verfasst von Steffan Heuer (PDF).

Auffälligerweise ist der englischsprachige Wikipedia-Eintrag zu Big Data deutlich informativer als sein deutsches Pendant. Das lese man dort vor Ort nach, gerade auch hinsichtlich der Akteure und Experten-/Firmenkulturen, die die Analyse großer Datenmengen entscheidend mit hervorbringen. Interessant ist die im Grunde genommen organisationssoziologische Annahme der Relationalität dessen, was ein großes Datenset ist:

What is considered „big data“ varies depending on the capabilities of the organization managing the set, and on the capabilities of the applications that are traditionally used to process and analyze the data set in its domain.

Interessant ist auch die Betonung der Zeitlichkeit als Kriterium für große Datenmengen („high volume/high velocity“). Der Kritikteil bringt die spannendsten Fragen, gerade hinsichtlich der Datengrundlage, die sich immer auf eine Vergangenheit, bestenfalls auf eine Gegenwart bezieht, wobei die Aussagen der interpretierten Daten bei Big Data meist zukünftige Operationen und Vorhersagen betreffen.

Warum blogge ich das? Mir scheint, dass die Medienkulturwissenschaft hierzu mehr sagen können müsste, sowohl in Sachen Definition wie hinsichtlich von Software und Rechenzentren. Und weil netzpolitik.org mich auf das LfM-Video aufmerksam gemacht hat.

Advertisements

5 Gedanken zu „Was der Erklärbär zu Big Data sagt

  1. Genau diesen relationalen Aspekt daran fand ich auch sehr interessant, den Manovich auch in „The Promises and Challenges of Big Social Data“ hervorhebt. Besonders hilfreich an Manovichs Text (frei abrufbar unter http://www.manovich.net/DOCS/Manovich_trending_paper.pdf ) finde ich seine “ Vier Einsprüche“ gegen Big-Data-Utopien:
    1. Zu den wirklichen Big Data haben nur „Big Social Media Companies“ Zugang
    2. Auch die Data in Big Data sind Ergebnisse eines (inszenzenierten, arbiträren, auf unterschiedliche Weisen von statten gehenden…) Repräsentationsprozesses und unterscheiden sich mithin nicht kategorisch von Erhebungsdaten.
    3. Interpretative Forschungsleistung wird durch Big Data nicht nach- sondern vorrangig
    4. Ihre Analyse verlangt eine unwahrscheinliche Kombination von Fähigkeiten.

  2. Ah, danke, den Text kannte ich noch nicht. Muss ich mir mal genau ansehen, auf den ersten Blick würde ich 1-4 genauso sehen.

  3. Ich finde, insbesondere 2. gilt es, aus medienkulturwissenschaftlicher Sicht auszudifferenzieren: Wie erzeugt sich der Eindruck, es handele sich nicht um Sublata (Erhobenes) sondern um Data (Gegebenheiten, daher weniger mit dem ‚Repräsentationsproblem‘ belastet)? Und unter welchen Bedingungen kann dieser Eindruck in der Tat Geltung beanspruchen?

    • Ja, das ist eine interessante Frage. Vermutlich braucht es keine Big Social Data, damit sich solch ein Eindruck herstellt. Auch nicht-computerbasierte Datenerhebung hat solche Evidenzeffekte hervorgerufen. Man kann das mit einer Pragmatik des Datenhandelns begründen. (Wenn man etwas Gegebenes benutzt, muss man Repräsentationseffekte und mitunter auch Codierungsprobleme außer acht lassen.) Aber das ist natürlich eine unbefriedigende, weil vergleichsweise naheliegende Begründung…

      Etwas detaillierter könnte man vermuten, dass die Übersetzungsprozesse von Daten in etwas, das man als Information bewerten und weitergeben kann, gerade bei Arbeit im digitalen Raum leicht vergessen werden und vielleicht sogar zur Seite gedrängt werden müssen. Big Data wäre so ein Fall, wo ab einem bestimmten Moment Werkzeuge zur Informationsvisualisierung und Suchtools à la Social Graph das Kommando übernehmen. Das Setting, wie überhaupt Datenbanktabellen mit welchen Felder angelegt werden und welche sozialen und kulturellen Grundannahmen dem zugrunde liegen, wird dann vergleichsweise unwichtig.

      Übrigens schreibt Michael Seemann gerade aus ganz anderer, datenenthusiastischer Perspektive über die „Gretchenfrage Big Data“: http://www.ctrl-verlust.net/grechenfrage-big-data/

      • Ja ich glaube auch, dass Pragmatik des Datenhandels und der damit einhergenhende Übersetzungs- und/oder Dekontextualisierungsprozess hier einen starken Anteil hat.
        Die oben angesprochene (behauptete) Differenz zwischen Data und Sublata erscheint mir aber für die Netzforschung doch extrem wichtig. Denn wenn ich es recht verstehe, basiert die gesamte Idee der „Digital Methods“ auf dieser Differenz.
        Der erste Satz von Rogers‘ Inaugural Speech (auch übersetzt in der vor- oder vorvorletzten ZfM, Original unter: http://www.govcom.org/publications/full_list/oratie_Rogers_2009_preprint.pdf) lautet: „Arguably, there is an ontological distinction between the natively digital and the digitized; that is, between the objects, content, devices and environments ‘born’ in the new medium, as opposed to those which have ‘migrated’ to it.“ Und weiter: „I propose that Internet research may be put to new uses, given an emphasis on natively digital methods as opposed to the digitized“.
        Das ist doch genau die Differenz: Data/Sublata, Natively Digital/Digitized und Manovich hat dafür meine ich auch ein Begriffspaar (ich glaube es ist in „What is Visualisation?“).

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s