Tof of sof: Linkrot

Jos Damen bekijkt nieuwe ontwikkelingen op informatiegebied en geeft daar een beargumenteerd verhaal bij. De lezer krijgt afwisselend een toffe ontwikkeling of een sof voorgeschoteld. Deze keer: linkrot oftewel gebroken links.

Door: Jos Damen

Iedereen kent het fenomeen linkrot: je klikt op een link in een tekstje op internet of in een oude e-mail en helaas: de internetlinks werken niet meer. Linkrot heeft verschillende namen, variërend van het wat vriendelijker gebroken link tot het harde dode link. Ze beschrijven allemaal hetzelfde verschijnsel: de informatie lijkt verdwenen. Ook vele bibliotheken en informatieve websites hebben zélf diverse dode links op hun eigen website staan. (Zelfs de website van onze eigen beroepsgroep heeft er last van.)

Groeiend probleem

Meer dan tien jaar geleden werd het probleem (en de gevolgen ervan) in alle ernst gesignaleerd (Eysenbach & Trudel, Journal of Medical Internet Research 2005), maar de rotting woekert voort. Een studie uit 2014 van de Harvard Law School (Zittrain et al, Legal Information Management 2014) liet zien dat 30-50 procent van de url’s in uitspraken van de US Supreme Court niet langer linkten naar de originele bron. Dan wordt het een serieuze zaak. Ook universiteiten moeten op hun tellen passen: lees ‘Reference Rot in the Repository’ van Massicotte & Botter uit 2017 (Information technology and libraries, 37: 1). Het aantal artikelen over linkrot is overstelpend – en ik geef uiteraard geen links.

Websites verdwijnen

De oorzaken zijn divers. Meestal bestaat de oorspronkelijke website niet meer. Sociale media zijn nogal wiebelig (archief van Hyves, iemand?). Soms zijn alleen gedeelten of pagina’s van een website verdwenen. Nieuwe domeinnamen zijn een veelvoorkomende oorzaak. Soms bestaat de inhoud van een website nog wel, maar is die achter een betaalmuur gebracht. Dat komt onder meer voor bij succesvolle tijdschriften, die bijvoorbeeld eerst open access waren. Pijnlijk is het als een website bewust verwijderd is door de eigenaar, al dan niet na een rechterlijk bevel.

Voorkomen is beter

Voor de eigen website kan elke beheerder een paar regels in acht nemen. Verander webpagina’s zo weinig mogelijk van naam. Zet oude pagina’s in een archief op de website, en laat een vaste verwijzing achter (http 301). Meld je website aan bij de Koninklijke Bibliotheek of een ander webarchief als archive.org. Voor wat betreft links naar andere websites: link niet te diep. En gebruik persistent identifiers, zoals handles, DOI’s en DAI’s.

Maar genezing is mogelijk

Het kwaad geschiedt toch. Elke website telt dode links. Neem de meest geraadpleegde pagina’s regelmatig onderhanden. Laat eens in de paar weken een programma over de website lopen dat de links checkt. Voor Drupal en WordPress bestaan plug-ins. Gebruik die programma’s met verstand: een pagina waarop netjes een tekst staat dat de pagina is opgeheven, telt als een correcte pagina, terwijl een zeer langzaam opbouwende pagina soms als een gebroken link wordt gezien. Het devies: de lijst handmatig controleren.

Webarchivarissen

Linkrot zorgt ervoor dat websites die kopieën maken van andere websites (en die daarmee als het ware ‘archiveren’) populair worden. Wikipedia zet semi-automatisch gebroken links door naar www.archive.org, met zijn fantastische WayBack Machine (pas op: slechts snapshots, en niet heel diep de website in). Koninklijke en nationale bibliotheken in Europa archiveren geselecteerde delen van het internet, en diensten als WebCite en archive.is zijn ook actief. TimeTravel van het Memento Project van Herbert Van de Sompel et al. is een handig hulpmiddel: timetravel.mementoweb.org. Maar dit artikeltje wordt helaas vervolgd.

Jos Damen is hoofd bibliotheek & ICT van het Afrika-Studiecentrum, Universiteit Leiden.

Deze bijdrage komt uit IP nr. 6 / 2017. Het gehele nummer kun je hier lezen.