Webarchivering: digitale bronnen van ons post-truth tijdperk bewaren voor de toekomst

Een actuele trend op het web is die van de ‘post-truth’ of ‘post-waarheid’. Kort gezegd komt dit erop neer dat feiten als meningen en meningen als feiten worden gepresenteerd op onder meer het web.1 Hoe zijn de digitale bronnen van het post-truth tijdperk veilig te stellen voor de toekomst?

Door: Kees Teszelszky

Post-truth komt tot uiting in onder meer de verspreiding van nepnieuws en complottheorieën die worden ondersteund door ongefundeerde bronnen van het internet. De uitspraak van Donald Trump: ‘All I know is what’s on the internet’ is hiervan een goed voorbeeld.2 We leven in verwarrende tijden die ook in de toekomst niet gemakkelijk te doorgronden zullen zijn. De huidige en de toekomstige historici van onze periode proberen hun weg te vinden in het landschap van de post-truth in ons postwaarheidstijdperk. Al zijn de wetenschappers het nog niet eens over de precieze definitie van post-waarheid, ze vinden wel dat er snel iets bewaard moet worden dat als bron van deze tijd kan worden gebruikt. Ons post-truth tijdperk mag straks niet de geschiedenisboeken ingaan als de post-history periode, doordat er geen bronnen meer bewaard zijn.

Webarchivering in de KB

De Koninklijke Bibliotheek is in 2007 begonnen met een selectie van Nederlandse websites te archiveren om zo wetenschappers van de toekomst bronnen te bieden uit ons digitale tijdperk van en over de Nederlandse taal, cultuur en geschiedenis. Het doel was om een webcollectie op te bouwen van sites die representatief zijn voor actuele trends op het Nederlandse deel van het wereldwijde web.

Het belangrijkste criterium om een website te bewaren is de waarde als Nederlands cultureel erfgoed: het belang van het verzamelde digitale object voor de bestudering van de Nederlandse cultuur en actuele of voorbije trends in Nederland, nu en in de toekomst.3 Bij de selectie wordt rekening gehouden met andere instellingen die websites archiveren, zoals Beeld en Geluid en het Documentatiecentrum Nederlandse Politieke Partijen. Daarom verzamelt de KB geen sites van omroepen of politieke partijen.

Post-truth?

De Koninklijke Bibliotheek heeft zich tot nu toe vooral gericht op het verzamelen van digitale bronnen van het web met een zekere reputatie en zich terughoudend opgesteld wat betreft archivering van online nieuws of sites met aanstootgevende of leugenachtige inhoud. De KB stelt zich volgens haar beleidsplan ten doel om betrouwbare, gevalideerde informatie aan te bieden aan haar gebruikers.4 Nu informatie die aantoonbaar onwaar is een belangrijke bron van ons tijdperk zal worden, worden inspanningen gedaan om dat op te slaan. Hieronder zet ik uiteen hoe de KB een collectie van gevalideerde bronnen kan aanleggen die representatief zou kunnen zijn voor ons ‘postwaarheidtijdperk’.

Vluchtigheid

Het grootste probleem van de beschikbare historische bronnen van het post-truth tijdperk is dat online bronnen zeer vluchtig zijn. De gemiddelde website is maar negentig dagen online als deze niet wordt opgeslagen, terwijl nepnieuws uit de zeventiende eeuw nog in overvloed te vinden is in bibliotheken of archieven. Historici houden zich nog maar nauwelijks bezig met het vastleggen van bronnen van het web. Ook het historisch onderzoek naar actuele websites staat nog maar in de kinderschoenen of wordt meestal te laat begonnen: van maar weinig bronnen op het web zal binnen negentig dagen het grote historisch belang worden ingezien. Bovendien gaan sites met nepnieuws of andere onwaarheden waarschijnlijk nog sneller offline dan de gemiddelde website.

Kortom: als we nu niet iets doen om potentiële bronnen uit onze tijd duurzaam te bewaren, dan komt het toekomstig historisch onderzoek in een post-truth of beter gezegd een post-history periode terecht, omdat bronnen simpelweg verdwenen, niet meer betrouwbaar of niet duurzaam aanwezig in een openbare collectie zijn.

Onderzoeksvraag

De onderzoeksvraag voor een nieuw aan te leggen webcollectie ‘actuele websites’ luidt als volgt: Welke Nederlandse websites zijn representatief voor het post-waarheidstijdperk en geven een actueel beeld van de Nederlandse digitale cultuur die tot nu toe niet is vertegenwoordigd in de KB-webcollectie en op welke wijze staan deze sites met elkaar in verband?

Om te bepalen hoe groot de omvang en wat de inhoud van een webcollectie met een dergelijk thema zou zijn, is een verkennend onderzoek gedaan naar Nederlandse websites die aan de bovenstaande selectiecriteria voldoen op grond van een aantal recente publicaties van Nederlandse wetenschappers over actuele fenomenen uit het postwaarheidstijdperk. Het onderzoek is beperkt gebleven tot de URL’s en de linkstructuur waarmee de verschillende sites met elkaar verbonden zijn. De websites zelf en de inhoud van de sites zijn niet verder bestudeerd, maar worden ook nog niet bewaard door de KB, omdat eerst toestemming van de site-eigenaars dient te worden verkregen.

Pilot

Als pilot is een lijst van websites opgesteld op grond van een linkextractie van het recente proefschrift5 van Jelle van Buuren over complotdenkers en van een publicatie6 van Jaron Harambam en Stef Aupers over complottheorieën in Nederland. Deze sites worden gekenmerkt door auteurs die boos, kritisch en teleurgesteld zijn over de Nederlandse maatschappij en dat uiten door het publiceren van al dan niet extreme politieke, religieuze en maatschappijkritische of anti-wetenschappelijke denkbeelden. Veel publicaties komen voort uit onvrede vanwege de recente economische crisis, ervaringen met jeugdzorg, uitkeringsinstanties of de overheid in het algemeen, angst voor de islam, privacy, milieu, nieuwe technologische ontwikkelingen of een naderende Apocalyps. Volgens Jelle van Buuren zijn complotdenkers kanaries in de kolenmijn, omdat ze signaleren dat de geloofwaardigheid van het huidige bestel onder druk staat.

Linkanalyse

De voorlopige lijst is vervolgens gecontroleerd op relevantie en aangevuld door middel van automatische linkanalyse. Hierbij werden de interne verbanden (relaties tussen de sites en webpagina’s van de sites onderling) en de externe links (naar welke sites buiten de collectie werd gelinkt) onderzocht op basis van de webadressen van de lijst. De voorlopige lijst groeide zo tot ongeveer vijfhonderd websites. Hierbij moet worden aangetekend dat ook sites op de lijst zijn gekomen die nadrukkelijk niet post-truth zijn. Vanwege de vele verwijzingen van en naar deze sites horen deze toch in de webcollectie, omdat ze de digitale context van de andere sites vormen. Ter controle is een onderlinge linkanalyse uitgevoerd met de tool IssueCrawler7 van het Digital Methods Initiative (Mediastudies, UvA) (zie afbeelding).

Op grond van deze eerste selectie en analyse blijkt dat een groot deel van de verzamelde sites al offline is, maar desondanks nog wel aanwezig als hyperlink op sites die nog wel online zijn. In de linkwolk zijn verschillende clusters van sites te zien die overeenkomen wat betreft inhoud: (extreem-)links of rechts, maatschappijkritisch onafhankelijk en religieus. Desondanks linken veel sites door de clusters heen toch ook weer naar elkaar: of het nu linkse, rechtse, onafhankelijke of religieuze sites zijn.

Tot slot

Uit de linkanalyse van de pilotcollectie volgt dat de verzamelde sites een eigen werkelijkheid of waarheid vertegenwoordigen. De makers zetten zich sterk af tegen de in hun ogen ‘mainstream media’ en vigerende opvattingen in politiek, wetenschap, media en de gevestigde kerken. Desondanks laat de linkwolk zien dat al die verschillende sites toch ook iets gemeenschappelijks hebben: de meeste post-truth vertegenwoordigers verwijzen op hun websites naar elkaar om hun eigen gelijk te onderstrepen of om zich af te zetten tegen de ander. Zonder op de inhoud in te gaan lijkt het alsof in het postwaarheidstijdperk niet alleen de waarheid, maar ook de ‘onwaarheid’ in het midden lijkt te liggen. Linkanalyse is dus een bruikbaar hulpmiddel voor de collectiespecialisten van de Koninklijke Bibliotheek om een collectie van gevalideerde bronnen aan te leggen die representatief zijn voor ons postwaarheidtijdperk.

Noten

1 Adriaan van Veldhuizen, Post-truth en de ervaring van de waarheid, De Groene Amsterdammer, tinyurl.com/y74yx6pk.
2 Zie: www.youtube.com/watch?v=jp2ggZ7s4OI.
3 Zie: tinyurl.com/ya7vfgtj.
4 De kracht van het netwerk. Beleidsplan 2015-2018. Den Haag, 2014.
5 Jelle van Buuren (2 november 2016), Doelwit Den Haag?: complotconstructies en systeemhaat in Nederland 2000-2014 (Dissertatie. Institute of Security and Global Affairs, Governance and Global Affairs, Leiden).
6 Jaron Harambam & Stef Aupers (2015). Contesting Epistemic Authority: Conspiracy Theories on the Boundaries of Science. Public Understanding of Science, 24 (4), 466-480. doi: 10.1177/0963662514559891
7 Zie: www.issuecrawler.net.

Kees Teszelszky is onderzoeker webarchivering en webcollecties bij de Koninklijke Bibliotheek.

Deze bijdrage komt uit IP nr. 5 / 2017. Het gehele nummer kun je hier lezen.