The Paradise of Big Data

Published on December 7th, 2015


* * * * * * * * * * * *

In 2009 bleek dat we met zijn allen alleen dat jaar al net zoveel data produceren als in alle jaren daarvoor. In 2012 was de verwachting dat er tweeëneenhalf quintiljoen databytes gecreëerd zouden worden per dag. Maar wat betekent dit cijfer eigenlijk? Een byte staat ongeveer gelijk aan een letter en een pixel in een foto is ongeveer drie bytes. Volgens Wiktionary is een quintiljoen ‘een zeer groot getal’, een tien met 30 nullen. Ter vergelijking, deze tekst heeft 11.610 karakters en een gemiddelde uitgave van Metropolis M bestaat al gauw uit 225.000 karakters, exclusief afbeeldingen en advertenties. Dit is nog maar een fractie van een tien met dertig nullen. Tegelijkertijd laat het wel zien dat er al snel sprake is van grote getallen, maar dat het maar weinig zegt over wat die getallen betekenen. De productie van grote getallen, of massale volumes data, fascineert, zeker zolang die alleen maar blijkt te groeien.

This article was published in Metropolis M, Nr 6 Dec/Jan 2015/2016 ANTI.DATA.
Unfortunately, for now, it’s only in Dutch.

 

In 2009 bleek dat we met zijn allen alleen dat jaar al net zoveel data produceren als in alle jaren daarvoor. In 2012 was de verwachting dat er tweeënhalf quintiljoen databytes gecreëerd zouden worden per dag. Maar wat betekent dit cijfer eigenlijk? Een byte staat ongeveer gelijk aan een letter en een pixel in een foto is ongeveer drie bytes. Volgens Wiktionary is een quintiljoen ‘een zeer groot getal’, een tien met 30 nullen. Ter vergelijking, deze tekst heeft 11.610 karakters en een gemiddelde uitgave van Metropolis M bestaat al gauw uit 225.000 karakters, exclusief afbeeldingen en advertenties. Dit is nog maar een fractie van een tien met dertig nullen. Tegelijkertijd laat het wel zien dat er al snel sprake is van grote getallen, maar dat het maar weinig zegt over wat die getallen betekenen. De productie van grote getallen, of massale volumes data, fascineert, zeker zolang die alleen maar blijkt te groeien.

Constant Dulaart: High Retention, Slow Delivery, Web-Projekt, 20

Constant Dulaart, High Retention, Slow Delivery

Met zijn project High Retention, Slow Delivery (2014) brengt Constant Dullaart de waarde van cijfers op sociale media duidelijk naar voren. Het is bekend dat iedere like op een geplaatste post en het aantal vrienden dat je hebt, je populariteit weerspiegelen: hoe meer likes en vrienden, hoe meer aanzien je hebt. Met zijn project laat Dullaart zien hoe je van deze aandachtseconomie kunt profiteren. Via eBay en vergelijkbare verkoopsites kun je ‘machine gegenereerde volgers’ kopen om je eigen bekendheid, en daarmee aanzien, te vergroten. Dullaart kocht tweeënhalf miljoen van deze nepvolgers en verspreidde ze over verschillende actieve gebruikers uit de kunstwereld. Belangrijk detail is dat iedereen uiteindelijk uitkwam op honderdduizend volgers, waardoor onduidelijk werd wie het populairst was. Beginnende kunstenaars met slechts een paar volgers werden ineens even interessant als de wereldbekende kunstenaars. Kleine kunstenaarsinitiatieven konden zich qua aandacht ineens meten met grote kunstinstellingen. Met deze strategische ingreep ondermijnde Dullaart de status-race van sociale media platformen zoals Instagram, Twitter en Facebook.

Toch is de hoeveelheid data per se niet interessant, noch wie al die data produceren. Belangrijker is wat er met de data gebeurt. Als gevolg van de datadichtheid zijn er naast allerlei platforms waar data op geplaatst kunnen worden en geteld, in de afgelopen paar jaar ook allerhande apparaten, sensoren en algoritmes ontwikkeld die zelfstandig data traceren, vastleggen en doorgeven door middel van opnieuw gevisualiseerde of beschreven data. Volgens veel overheden, bedrijven en theoretici staan we aan het begin van een nieuw tijdperk waarin kennis op een fundamenteel andere manier verkregen zal worden.

Volgens deze denkwijze brengen big data nieuwe vragen naar voren die leiden tot nieuwe oplossingen en vormen van, wetenschapsbeoefening, bedrijfsvoering, economie en politieke bewustwording. Big data en alles wat daarmee samenhangt, is een belangrijk thema van onze tijd, maar tegelijkertijd roept het verwarring op: statistieken en processen blijken vaak onzichtbaar of onbegrijpelijk, en de gesprekken over big data zijn weinig eenduidig.

taxodus_03-1024x627

Femke Herregraven, Taxodus

Hoewel het creëren van data over de jaren niet wezenlijk is veranderd, is de toegang tot de huidige big data wel degelijk van een andere orde. Pas als je de regels van het spel kent openbaren de in elkaar verstrengelde datastructuren zich. Een goed voorbeeld van hoe complex dit in zijn werk gaat is het project Taxodus (2012-13) van Femke Herregraven. Taxodus is een spel dat reageert op het fenomeen van offshore handel. Met offshore-zakendoen benut je als bedrijf de mogelijkheden die worden geboden door landen waarvan de wetgeving niet-ingezetenen bepaalde voordelen toekent, bijvoorbeeld op het gebied van ondernemingsstructuren, bepaalde vertrouwelijkheden of lage belastingen. Door middel van openbare jaarverslagen, databases en wet- en regelgeving kwam Herregraven uiteindelijk achter de regels en zette die om naar een game: Taxodus is een reconstructie van deze wereld waarin iedereen spelenderwijs zo veel mogelijk belasting kan leren ontwijken. Net als in de werkelijkheid is er de mogelijkheid om het spel te sturen, alleen zijn de lijnen en verschillende constructies nu duidelijk zichtbaar.

Herregravens spel, dat al op diverse plekken in Nederland en België is geëxposeerd, laat zien hoe kunstenaars zich op het onderwerp hebben gestort. In het paradijs van big data zijn kunstenaars aan het verzamelen, analyseren en herinterpreteren, op een manier die veel weg heeft van de taken van een curator. Cureren komt in plaats van zelf maken als het tactisch antwoord op de eisen van de hedendaagse culturele hyperproductie. Waarbij het algoritme, volgens het Content Marketing Institute, gegevens samenbrengt, daar voegt het cureren een menselijke aspect toe aan de selectie.

Schermafbeelding 2016-04-08 om 13.11.41

Matthew Plummer Fernandez, Novice Art Blogger

Matthew Plummer Fernandez laat in zijn werk zien hoe algoritmes dwars door stapels data heen werken, en hoe slim maar ook onhandig veel van deze technieken nog functioneren. In Novice Art Blogger (2014), een titel die de suggestie wekt dat het werk over een beginnend kunstblogger gaat, gebruikt Matthew-Plummer een geautomatiseerde bot die beelden en metadata selecteert van kunstwerken uit online archieven van musea. In een poging om de kunstwerken te decoderen en de inhoud te identificeren, ontcijferen deep learning algoritmen (ontwikkeld door computerwetenschappers aan de universiteit van Toronto) de inhoud van het kunstwerk en genereren ze op basis daarvan een bijschrift bij de afbeelding. Aan de ene kant levert dit soms platte en onbegrijpelijke zinnen op, zoals de beschrijving van Charley Toorops Liggende Medusakop (1938): ‘I liken this to an old yellow lady’s slipper or then again a spaghetti squash. I was once shown a snorkel alike a silver bakery.’ Maar soms zitten er ook hele gevatte opmerkingen bij, zoals bij Alan Charltons 9 Part Painting (1983): ‘I liken this to a extraordinary prison or I reckon a radiator akin to a picket fence. It stirs up a memory of a clear, white worm fence.’ Of het geeft simpelweg een directe komische vertaling, zoals bij Rob Scholte’s Cul de Sac (1990): ‘A delicate hatchet or quite possibly a pole and a spotlight. Reminds me of a hard, darkslategray matchstick.’ Er worden veelal onbekende werken uit een collectie naar voren gebracht, waarnaar de bot het publiek op een nieuwe manier laat kijken.

De geautomatiseerde interpretaties verwijzen naar de explosie van open big data en hoe musea en amateurcultuurbloggers op platformen zoals Tumblr hier vervolgens mee omgaan. Daarnaast onderzoekt het project hoe neural network- en machine learning technologieën functioneren en hoe ze reageren op bijvoorbeeld abstracte kunst. Is dit een eerste stap naar het automatisch samenstellen van tentoonstellingen of het waarderen van kunst?

Het manipuleren en misbruiken van data is geen nieuw fenomeen. Het is vooral de schaal waarop data tegenwoordig worden ingezet die vragen oproept. Bijvoorbeeld, wat gebeurt er met het auteurschap van de maker van een werk dat in een database is terechtgekomen? En wat gebeurt er met de ‘nieuwe curatoren’ die zich massaal storten op het liken, selecteren en delen van data? Wat is de culturele, of beter financiële, waarde van digitale reproducties en data? En staat dit alles niet op gespannen voet met het museale streven naar openbaarheid en voor een ieder toegankelijke educatie?

Planthropy_wide11

Stephanie Rothenberg, Planthropy (exhibition The Lowry, Manchester)

Het spanningsveld tussen marketing, openbaarheid en macht is het onderwerp van het werk Planthropy (2015) van Stephanie Rothenberg. Met haar installatie reflecteert Rothenberg op kritische wijze op het toenemende vermarkten van microleningen. Een trend die met name via sociale platforms als Twitter zichtbaar wordt; een plek waar mensen laten weten dat ze kleine geldbedragen doneren aan goede doelen. Planthropy is een serie hangplanten die door kleine plastic buizen water krijgen zodra een Twitterbericht verschijnt op een van de kleine lcd-schermen die aan de plant verbonden zijn. De installatie verbeeldt de steriele ruimte van een laboratorium en de hectiek van een financiële beursvloer. Het leven van de planten is afhankelijk van de live berichten die verzonden worden naar aanleiding van de micro-leningen. Elke like brengt de ontvanger mogelijk dichter bij zijn doel en benadrukt de liefdadigheid van de gever. De nauwe relatie tussen economie en liefdadigheid wordt hiermee nadrukkelijk ter discussie gesteld. De installatie benadrukt het samenspel, of de paradox, tussen macht en onmacht, imago en onbekendheid, en technologie en economie.

Terwijl Rothenberg vooral de ambigue relatie tussen de verschillende online actoren naar voren haalt, maakt Jonas Lund op meer listige wijze gebruik van de open data die online beschikbaar zijn om zijn eigen kunstenaar- en auteurschap te verstevigen. Door verschillende algoritmes op de hoeveelheid data die online gepresenteerd wordt lost te laten en te verwerken, probeert hij achter de systematiek van verschillende kunstsystemen te komen. Zijn vraag is welke ingrediënten bepalend zijn voor het succes van een kunstenaar, een curator of een kunstwerk. Een van zijn eerste werken waarin hij gebruik maakt van de uitkomsten van een dergelijke big data-analyse is het project The Fear of Missing Out (2013). Het project bestaat uit een serie installaties die zijn gemaakt op basis van een algoritme dat belangrijke hedendaagse kunstenaars en hun werk analyseert en categoriseert. Daarmee genereert het instructies voor het maken van nieuwe werken. Naast het kritisch ondervragen van begrippen als authenticiteit, kunstenaarschap, talent en creativiteit, probeert Lund er voornamelijk achter te komen hoe de hedendaagse kunstwereld functioneert. De logica van big data-analyse leverde hem niet alleen een serie nieuwe kunstwerken op, maar ook een plek bij een gevestigde galerie en verschillende tentoonstellingen. Hoewel vaak beweert wordt dat dergelijke big dataverzamelingen vooral veel data opleveren en geen kennis, stelt Lund het tegenovergestelde: ‘I know more about the art world now – yes! And knowledge is power. If you operate within a system that has no obvious logic to it, then the more you know about it, the better you can operate within this system.’[1]

overview2-1024x656

Jonas Lund, The Fear of Missing Out, photo: Lotte Stekelenburg and Bob Goedewaagen (exhibition Mama, Rotterdam)

De paradox van open data is duidelijk: terwijl gegevens en interacties driftig verzameld worden is er nog geen plan om de metadata over dergelijke interacties vrij te geven. Zoals uit bovenstaande voorbeelden blijkt, aanvaart een aantal kunstenaars deze ontwikkelingen gretig. In plaats van te wachten op regelgeving, nemen ze het heft in eigen hand. De uitkomsten en methodes die kunstenaars hanteren variëren net zoals de data zelf. Geïnspireerd door de big-datahype variëren de projecten van meer efficiëntie, het promoten van inzichtelijkheid, transparantie en verantwoording tot het opzetten van nieuwe businessmodellen en netwerken. In plaats van te worden gestraft door een analytisch kader dat is ontworpen om meer geautomatiseerde content en meer publiek te leveren, laten deze kunstenaars zien dat er mogelijkheden zijn om ook strategisch in te grijpen in de culturele dataketen.

 

[1] Deze quote komt uit een interview dat Jonas Lund had met Tilman Baumgärtel voor Springering 2/15, Ballmer neben Kühlschrank.


* * * * * * * * * * * *

T O    T O P