Exploring Digital Culture
Article

10. Mijn Digitale Schaduw

Ooit ging het om je persoonsgegevens. Nu geven we iets veel waardevollers weg.

Tue 11 Nov 2014
Nienke Huitenga 

Ooit ging het om je persoonsgegevens. Je identiteit. Alterego’s gegoten in avatars, misleidende chat handles of heus frauduleus gefröbel om geld lost te peuteren via phishing. Slimme (en domme) bedrijven kunnen nu van nog iets lekkerders smullen. Nu geven we iets veel waardevollers weg via onze slimme apparaten: gedetailleerde info over identiteit én gedrag. Ditmaal vaak onwetend en onbewust, in grote hoeveelheden en voor noppes.

In de voorbereiding op een cursus Media Ethiek voor studenten van CMD Breda verdiep ik me in mijn ‘eigen’ big data. We lezen er veel over en moeten vaak begrijpen dat commerciële bedrijven er geld aan verdienen of dat overheden er (militair) strategische keuzes op baseren. Maar dat klinkt zo abstract. Is big data iets wat ik zelf ook kan aanraken? Wat moet ik er eigenlijk van vinden, behalve zorgen maken?

Om die reden heb ik twee jaar zoekgeschiedenis uit mijn Google Chrome browser gedoneerd aan de workshop Dirty Databases van SETUP Utrecht, onderdeel van het Sousveillance summer school programma dat van augustus tot september liep.
In tegenstelling tot surveillance is sousveillance bottum-up spionage die je zelf in gang zet. Of eigenhandige zelfregistratie, volgens Wikipedia. Mijn zoekgeschiedenis is daar een voorbeeld van. Een rijke verzameling zoekwoorden en websites. Maar vooral big genoeg om gedragspatronen, en dus een authentiek profiel uit op te maken.

Nu het zelfregistreren van ons gedrag zo casual en alledaags is geworden –denk ook aan stappentellers, thermostaat instellingen, fiets en hardloop apps et cetera– is sousveillance net als voor de burger, de consument en ook voor de media designer een realiteit om eens kritisch te bestuderen. SETUP vatte het zo samen:

Vergeet Big Brother, het zijn de Little Sisters die je in de gaten houden. In augustus verleggen we de discussie over privacy.

Ik wilde weten, als achteloze consument, wat vertelt mijn database nu eigenlijk? Ten behoeve van educatie (en vermaak) wilde ik mijn onwetendheid op ‘de snijtafel’ leggen.

And so I did.

De zwarte spiegel

Mijn mede workshopgenoten waren ook onwetend. Ze wisten niet dat de donateur van de dataset ook aanwezig was. De eerste les die ik leerde terwijl er vijftien leken data-analisten mijn zoekgeschiedenis doorzochten, is dat dit ook daadwerkelijk voelt alsof er iemand in je leven aan het browsen is. Dat voelt spannend, maar ook erg ongemakkelijk. Naakt. Even schoot een gedachte door mijn hoofd: ‘oh shit, misschien heb ik wel iets vreemds gegoogeld vorig jaar. Maar weet ik het niet meer wat.’ Snel probeerde ik porno als zoekwoord in de op maat gemaakte interface –door workshopleider Heinze Havinga– voor mijn dataset. Gelukkig niets.

Dus wat is mijn zoekgeschiedenis eigenlijk behalve een archief? Een echo, een spiegel van twee jaar online leven. Een /hoogst persoonlijk zoekpatroon. Toen AOL in 2006 per ongeluk 650,000 zoekprofielen lekte op het internet, hebben filmmakers Lernert en Sander een kort verhaal gemaakt van de gevoelige privé zoekdata van user #711391: een middelbare obese vrouw in de menopauze die haar seksleven wat wil oppeppen. Het stuk heet I Love Alaska en is online te bekijken.

Mijn verhaal zou worden getypeerd door Hollywood blondes en snackcorner Zuilen. Want met gemak, zo blijkt, viel de ongeoefende data-detective mijn intensieve zoektochten naar acterende blondines (voor een artikel) en mijn grote voorliefde voor de openingstijden van de snackcorner om de hoek op, waar ik mijn patatjes haal in de wijk op de luie zondagavond. Triomfantelijk riep de vinder ‘oh ze snackt wel vaak!’ Niets crimineels, of zorgelijks. Althans, als dit niet tegen me wordt gebruikt. Dan kan zelfs welk patatje ik bestel bij de patatzaak ineens interessant worden. Maar, kleine kanttekening: ik snack niet vaak, maar de database van zoekwoorden bevatte wel enige glitches waardoor sommige search entries wat vreemd gebundeld en in overdreven proporties aan de workshoppers werden getoond.

Ziehier, ik wil me meteen verdedigen. Voordat ik u meeneem in wat ik als naïeve internetgrootgebruiker verder heb geleerd uit de workshop, wil ik u meenemen in een paar herinneringen.

Terwijl ik mij verwonder over welke verhalen er over mijzelf in een database schuilen die ik nota bene zelf heb opgebouwd door klakkeloos te googelen, moet ik denken aan de film The Enemy of the State. Will Smith in de rol van een naïeve advocaat Robert Dean die door een corrupte politicus de schuld in de schoenen wordt geschoven van een smerige moord en non-stop in de gaten gehouden en opgejaagd wordt door de NSA. Robert wordt in de lift door een surveillance-expert gefouilleerd en haalt de een na de andere afluisterapparatuur uit zijn mobiele telefoon, schoen en pen tevoorschijn. In deze fictieve, maar toch realistische weergave van de wereld toonde regisseur Tony Scott dat de NSA nog enigszins haar best moest doen om mensen te bespioneren. De mobiele telefoon maakte het al een stuk makkelijker.

Dit was 1998. Toen zat ik in de brugklas en was ik de koning te rijk met mijn eerste mobiele telefoon. Maar de consequenties van zo’n apparaat? Daar ben ik me nu pas van bewust, nu we twintig stappen verder zijn met slimmere apparaten.

Hoewel de film Das Leben der Anderen nog steeds waardevolle lessen bevat over hoe een maatschappij omgaat met technologie in tijden van oorlog, is dit beeld, net als Enemy of the State, ondertussen romantiek: een man op zolder die voor de Oost-Duitse overheid in de jaren 1940 een sleutelfiguur dag in dag uit afluistert. Nee wij, consumenten en burgers, kopen nu vrijwillig onze eigen surveillance. En tot op zekere hoogte dient het ook ons gemak.

Maar dat is een narratief dat de producenten van deze apparaten ons maar al te graag laten geloven. Ondertussen doen filmmakers hun best ons de keerzijde van de werkelijkheid te tonen. Er zijn nu series in het genre science fiction die ons met de neus op de hedendaagse feiten drukken. We versmaden ze als entertainment, maar het zijn waardevolle lessen die je serieus mag nemen. En die lessen gaan niet over de verre toekomst. Maar de reeds ontwikkelende toekomst. Ergens tussen nu en morgen. Dus wil u in lekentaal beter begrijpen waar internet pessimist Evgeny Morozov tegen ageert –het fluffy utopisme dat het internet de mensheid zal redden/verbeteren/etc– dan kunt u naast zijn boeken The Net Delusion (2011), To Save Everything Click Here (2013) en zijn blog voor Slate.com ook gerust een paar weekenden binge watchen met Person of Interest van Jonathan Nolan en Black Mirror van Charlie Brooker. Beiden series zijn begonnen in 2011, en zijn redelijke pogingen ons wat te leren, via vermaak, over onze naïeve blik op technologie.

Nolan neemt de Batman-aanpak van zijn broer (Christopher) door artificial intelligence centraal te zetten in de serie als gadget om slachtoffers van overheidsrancune te redden. Actie en vlotte oneliners zijn bijgeleverd, maar het dystopische beeld van hoe alom aanwezige apparaten samen een groter systeem vormen voor surveillance en fraude is niet alleen vermakelijk maar ook treffend van wat nu werkelijkheid is. Brooker neemt een sociale invalshoek. Door kleinmenselijke conflicten uit te spelen in een hoog technische leefomgeving toont hij hoe onze interacties met elkaar subtiel evolueren naar vreemde onmenselijkheid. Bijvoorbeeld in een aflevering in het eerste seizoen krijgt een stel ruzie over de oude liefde van de vrouw. Dankzij de implantaten in het oog registreren ze alles van hun dagelijks leven. Zelfs hun baby heeft er een. Zo kunnen ze niet alleen de oppas controleren door de ‘babyfeed’ terug te kijken, ook haar geheimpjes worden dankzij het archief door haar man moment voor moment uitgeplozen. Doordat onze leven tot op de seconde doorzoekbaar zijn verliest het paar alle kans om de relatie te repareren door een simpel menselijke eigenschap: vergiffenis. Dat is in Brookers sociaal dystopische Black Mirror de consequentie van het comfort van life-logging.

Big Data

Ieder gereedschap heeft de potentie van goed en slecht. Hamer of big data, het hangt er vanaf hoe je het gebruikt. Data visionair Hans Rosling heeft met zijn pleidooi voor de wasmachine als beste uitvinding van de eeuw een sterk punt gemaakt voor de welvaart en groei in opleidingsniveau van een hele generatie. De technologie maakte ruimte voor meer aandacht voor kinderen, boeken voorlezen en eigen ontplooiing van vrouwen. Wat dat betreft lijkt technologie ook echt wat op te lossen.

Big Data blijkt ook super fijn spul om mee te ontwerpen. Jonathan Harris, mijn favoriete creative technologist en interactive artist heeft er prachtige verhalen van kunnen maken met zijn project We Feel Fine. Harris richtte een website in die stukken tekst met de opmaak “i feel” of “i am feeling” scraped uit openbare blogposts.

“We Feel Fine is an exploration of human emotion. It continually harvests sentences and displays them in an interactive Java applet, which runs in a web browser. Each dot represents a single person’s feeling.”

Waoooh, dat klinkt leuk. En zeker als Harris er mee aan de haal gaat. Dan wordt het betoverend mooi. Zijn interactieve visualisatie toont menselijk gedrag op zijn meest poëtisch. Bovendien geeft hij inzicht in hoe hij technologie inzet om zijn verhaal te vertellen. Aspirant internet kunstenaars en designers kunnen van hem leren.

Echter, om te snappen hoe het internet werkt en wat nu precies wringt in Facebooks verdienmodel is het handig om te begrijpen wat het verschil is tussen de data die Harris verzamelt en meta data. Het eerste is openbaar: je status update. Je tweet. Het tweede – meta data - is ‘onzichtbaar’ voor het surfend oog, maar wel aanwezig in de communicatie tussen e-mails en hangen ook aan je blogpost. Of tweet. Of een simpele tag over jouw adres in een database waar jij je niet van bewust bent. Over meta data kan je leren bewuster mee om te gaan. Je kan je smartphone bijvoorbeeld rooten en daardoor je anonimiteit terug claimen door reclames in apps te kunnen blokkeren.

En dit is waar de ethiek zijn kop opsteekt. Want dit soort mogelijkheden worden niet in de gebruiksaanwijzingen gegeven. Daarvoor moet je begeven op nerd gebied en ook echt wat weten over hoe de technologie werkt. Maar waar leren we dat? Want je wist waarschijnlijk ook niet dat die meta data, die onder andere ingezet wordt om je online surfgedrag te bestuderen, ook wordt gebruikt om drone aanvallen te plotten? Voormalig hoofd van de NSA en de CIA, Michael Hayden, gaf dit jaar zonder blikken of blozen toe dat de Amerikaanse overheid ‘will kill people based on metadata.” Lees hier en hier verder als je beter wil begrijpen hoe de NSA dit doet.

Nee meta data is niet alleen maar fuzzy en knuffelbaar.

De eerste spreker van de workshop Dirty Databases was Douwe Schmidt. Hij had hier een mooie term voor: je digitale schaduw. Een schaduw uitgetekend door meta data. Data die iets over data zegt. ‘En vaak verklapt deze meta data meer dan de data zelf’ vervolgde Douwe.

Met een visualisatie legde hij het uit: ‘Dear Mom’ is wat je denkt dat je e-mailt. Maar je IP-adres is een extra pakketje dat mee verstuurd wordt. Het is meta data van je e-mail.’ Je IP adres is als een telefoonnummer. “Elke computer die is aangesloten op het internet heeft een nummer waarmee deze zichtbaar is voor alle andere computers op het internet. Om het mogelijk te maken dat computers elkaar kunnen vinden en identificeren, hebben deze hun eigen nummer nodig.” (Wikipedia, IP-adres).

Dit is hoe het internet werkt. So far so good, geen beren op de weg hier. Want zonder dit systeem bestaat er geen internetverkeer. Douwe houdt voor Bits of Freedom een data dagboek bij waarin hij uitzoekt wat bedrijven en overheden nu eigenlijk nog meer weten over hem op basis van meta data die hij online achterlaat.

Een jaar lang gaat hij op zoek naar alle sporen die hij online heeft achtergelaten. Op zoek naar zijn digitale alter ego. Want behalve jezelf ben je ook een adres, geboortedatum, BSN-nummer, IP-adres, zoekopdrachten, bankafschriften, bonuskaart en nog tientallen andere persoonlijke kenmerken. (Data Dagboek, BOF.nl)

Dus hoe dit nu te begrijpen: als je graag hebt dat je post niet open wordt gemaakt door de postbode, zouden we het denk ik ook fijn vinden als onze digitale post discreet behandeld wordt. Echter, dat is niet altijd zo.

Douwe deelde een persoonlijk meta-data-drama. Hij wilde een auto huren maar werd dit geweigerd omdat hij ‘niet kredietwaardig’ zou zijn. Lang verhaal kort: zijn woonadres was geflagged in de database van een bedrijf die kredietwaardigheid checkt waar het autoverhuurbedrijf gebruik van maakt. Waarom was het geflagged? De vorige bewonder van zijn woonadres betaalde vaak zijn rekeningen niet. Dit had dus niet zoveel te maken met Douwe zelf, maar wel zijn persoonlijke data die ‘per ongeluk’ nog gekoppeld was aan het gedrag van de vorige bewoner. Douwe legt hier het hele verhaal uit. Meest opvallend uit zijn blog hierover vind ik dit citaat:

‘In Nederland is te weinig bewustzijn over de effecten van dit soort bedrijven op ons leven,’ meent Pierre. In andere landen is het normaal om eens per jaar bij dit soort databoeren je dossier op te vragen. De Duitse tak van Experian verwerkt jaarlijks meer dan 1 miljoen van dit soort aanvragen op een speciaal daarvoor opgerichte afdeling.’

En dit is voor mij precies de reden waarom ik mijn data set ter beschikking heb gesteld. Hoe makkelijk (of moeilijk) is het om een gedragsprofiel van mij te maken met mijn digitale schaduw? De Correspondent en Zeit Online hebben op basis van gedetailleerdere meta data vergelijkbare projecten gedaan.

Dus, even samengevat. Meta data kunnen je gedrag in kaart brengen. Simpelweg door veel verschillende informatiepunten te combineren tot een concreter beeld van je identiteit tot en met je weekindeling, je koopgedrag, reisgedrag etc. Je Facebookfeed is daar een vernuftige uitwerking van. De algoritmes die je tijdlijn vormgeven reageren op jouw gebruikersprofiel die steeds rijker en genuanceerder wordt naarmate je het intensiever gebruikt. Leer er meer over hier en hier.

Douwe wilde ons vooral ook op het hart drukken dat het belangrijk is om te weten dat de wetgeving in principe voorschrijft dat we onze data mogen opvragen. Hij heeft dat eens geprobeerd bij T-Mobile. ‘Ik mocht toen tien luttele dagen kiezen’. Het werd hem nota bene op a4’tjes gestuurd per post. Binnenkort dient hij een aanvraag in bij de rechtbank om een heel jaar te krijgen, want volgens de (Europese) wetgeving heeft hij daar recht op. Het betreft hier ook meta data gegenereerd door zijn smartphone die T-Mobile vangt via telefoonmasten, sim-kaart, abonnement etc.

In dit perspectief lijkt Google dan een soepele partij. Als je je zoekgeschiedenis bijhoudt dan kan je die vrij gemakkelijk terug vinden via history.google.com. Maar ja, is dit werkelijk alles wat ze verzamelen? Neem bijvoorbeeld een eenvoudig twitterbericht. Hoewel het minimalisme van de 140 tekens je het idee geeft dat hier toch niet veel ‘gevaarlijks’ of ‘persoonlijks’ aan zit behalve de inhoud van de boodschap toont deze visualisatie hoeveel info er meereist per tweet.

Goed, is dit nu reden om bezorgd te raken? Ja en nee. Het is belangrijk dat je het weet. Surf bewust zou het motto dan zijn. Er zijn er ook heel leuke, positieve toepassingen te bedenken met Twitter meta data. Bijvoorbeeld het project van Owen Mundy getiteld I Know Where Your Cat Lives om alle foto’s met de tag #cat (op social media) te mappen op Google Maps via publieke api’s (zie uitleg hier). Ook een interessante vondst is CatGrindr en dit verhaal van een developer die zijn kat (‘War Kitteh’ gedoopt) met tracking technologie uitrustte (in de halsband) om – ter vermaak – eens te checken wie van zijn buren hun wifi niet (of wel) goed beveiligd hadden. Citaat van de man zelf:

“He hopes it might make more users aware of privacy lessons those in the security community have long taken for granted. “Cats are more interesting to people than information security,” Bransfield says. “If people realize that a cat can pick up on their open Wi-Fi hotspot, maybe that’s a good thing.”

Wat hij hier blootlegt is ook aan de hand met de aankoop van Nest door Google. Deze thermostaat meet en registreert vanalles, via het wifi netwerk in je huis. Uiteraard om super slim op jouw leefpatroon af te stemmen. Da’s fijn en comfortabel. ook voor Google om nog preciezere marketing via je ip-adres jouw kant op te slingeren. Of dat vervelend is, vind ik een andere discussie. Wat ik kwalijker vind is dat het niet altijd transparant is wát ze verzamelen. Dat staat vaak niet in de handleiding. En hoe je je moet beveiligen, tegen hackers bijvoorbeeld. Zo’n Nest maakt dat inbrekers die een beetje handig zijn met wifi sniffers, zoals War Kitteh maar dan met de verkeerde intenties, precies weten wanneer je weg van huis bent.

Daarnaast, dankzij Edward Snowden is ondertussen bekend dat Google met enige regelmaat gevoelige persoonsgegevens –onder andere op te maken uit je meta data– aan de NSA doorsluist. En andersom, de Amerikaanse overheid luistert ook Google af, en ook de Nederlandse overheid. En die weer op haar beurt ook andere onwetende partijen.

En nu jij ook. Jij doet er zelf ook aan mee, vrijwillig informatie genereren over je privéleven voor andermans gewin. Door onwetend internetgebruik. En dat is wat ik onethisch vind. Bedrijven en overheden maken gebruik van je naïviteit. Zolang een consument niet daadwerkelijk en volledig kan begrijpen wat het apparaat in wezen is en doet…moet er niet degelijke voorlichting zijn?

Daarom is het Sousveillance programma van Setup ook zo waardevol. Om te leren wat je moet weten.

Wat weten ze over mij?

En zo liet ik tijdens Dirty Databases mijn zoekgeschiedenis doorploegen door een groep gretige data-detectives (in spe). De opdracht was om een aantal basisgegevens over mij terug te vinden (naam, adres, opleiding, werk, geslacht etc.) en natuurlijk juicy details. Opvallende search entries (zoals hobby’s, plekken die ik vaak bezoek, gekke zoekwoorden).

De meest opvallende interpretaties van de groep:

Ik heb op katten video’s gezocht = ik ben dus vrouw
Ik heb op babystoeltjes gezocht = ik heb dus kinderen
Ik zoek vaak op literatuur en scripties = ik ben student
Ik bezocht een datingsite in 2012 = ik ben misschien nog single

Wat ik hiervan heb geleerd:

Je identiteit is heel makkelijk te achterhalen via je zoekgeschiedenis. Google weet wie je bent. Zonder moeite. Daar hebben ze je IP-adres niet voor nodig. Maak je geen illusies, zelfs de ongeoefende dataverkenner wist mijn adres, mijn werk, mijn naam, mijn opleidingsniveau, mijn mobile devices heel precies terug te vinden.

Het interpreteren van data is tricky. Bovenstaande uitspraken waren niet alleen grof kort door de bocht, maar konden mij het leven ook echt zuur maken. Ze wisten niet dat ik aanwezig was. De data was zonder context aan de groep gegeven. Maar de kunde om een nauwgezette interpretatie te geven op basis van de data over een persoon die je niet kent….kattenfilmpjes, ya right. It takes skill.

Hadden ze meer tijd en meer ervaring, dan konden ze heel makkelijk het leven zuur maken.

Zoals Douwe al aangaf met zijn autohuur-drama kunnen data tot misinterpretaties leiden. Nu vind ik het niet heel problematisch dat ze me jonger schatten en tegelijkertijd single met kinderen. Maar geen van die drie klopt. Ik zoek veel op scripties/literatuur omdat ik docent ben. Die datingsite is me een raadsel en het babystoeltje was een cadeautje voor een vriendin.

Heb ik iets te verbergen?

Nee. Tot er een gemenerik president, koning of premier wordt. Ja dan maakt het wel wat uit. En dat is waar je je het meest zorgen over moet maken. Over die toekomst die je niet kan voorspellen, maar wel jouw digitale schaduw mee gemoeid is. Ik heb geen criminele hobby’s, geen gênante collectie foto’s of extreem rechtse ideeën. Maar ik heb wel recht om te weten waar en wie er met mijn data aan de haal gaat.

Zie het maar als recht op transparantie. Wat als het UWV, zorgverzekeringen en andere sociale vangnetten van dit soort big data gebruik gaan maken? Dan doe ik alle apparaten weg. Maar dat klinkt als een domme gebruiker die niet beter wist. Laten we ook maar zorgen dat er goede wetgeving komt.

Mara Vandorou Editorial: The Public Human Strategies of living in the transparent society
Carmin Karasic 1. Hacktivism in My Words Becoming a hacktivist through electronic civil disobedience
Stephanie de Smale 2. Tinkering with Life Strategies for 'literacy' in the age of biotechnology
Ben Borrow 3. The (in)convenient surveillance device The Mobile Phone as both Enabling Surveillance yet Empowering the Individual
Marina Turco 4. In the Shadow of the Matrix A strategic approach to the transparant society
Alexandra Woelfe 5. Surveillance of the state Connections to identity, autonomy and Foucault's notion of biopower
Dr David Barnard-Wills 6. Stanza An artist's engagement with surveillance, privacy, technology and control
Joeri Taelman 7. Biopolitics through the internet of bodies The act of looking back might sound appealing, but it might very well mean the disappearance of disappearance
Suze Krijnen 8. Waarom je online privacy kunt vergeten (Tenzij we als publiek onze verantwoordelijkheid nemen)
Hans de Zwart 9. Privacyrede 2014 Deze rede werd op 2 september 2014 uitgesproken voor SETUP en Studium Generale UU in de Senaatszaal van het Academiegebouw in Utrecht.