Oplossing voor linkrot: altijd vindbaar met persistent identifiers

Niets kan meer misgaan. Gisteren waren de laatste ict-tests positief en in geval van nood liggen er back-upplannen klaar. Vandaag is de organisatieverandering een feit. De kroon op je werk na een periode van hard werken. Maar ineens staat de telefoon roodgloeiend; het regent klachten. Ook je e-mailbox explodeert: 404-file not found, 404-file not found. De links die organisaties hadden gemaakt naar je website blijken allemaal dood te lopen. 

Door: Maayke Rusken

Sinds jaar en dag zijn musea, bibliotheken en archieven meesters in het beheren van waardevolle fysieke stukken. De laatste decennia zijn zij ertoe overgegaan om hun collecties steeds verder te digitaliseren, zodat gebruikers over de hele wereld deze stukken via internet met één muisklik kunnen inzien en bewonderen. Fysiek en digitaal collectiebeheer vragen om verschillende oplossingen als het gaat om houdbaarheid en vindbaarheid van stukken. Bij het beheer van digitale collecties moet je zekerheden inbouwen die de vindbaarheid door eindgebruikers borgt in de veranderlijke wereld van het internet. De veranderingen in de digitale wereld volgen elkaar binnen één generatie al op. Hardware en software wijzigen snel en het internet zelf is nog geen drie decennia oud.

Ook de webadressen die instellingen gebruiken zijn nog heel veranderlijk. Voor degenen die naar de digitale collecties willen verwijzen, is dit bijzonder lastig: na verloop van tijd werken de links niet meer. Tot enkele jaren geleden was deze ‘linkrot’ weliswaar zeer vervelend, maar geen grootschalig probleem.

Effecten

De effecten van linkrot, niet-werkende links op internet, zijn door de komst van aggregatoren als Europeana en het beschikbaar stellen van open data in sneltreinvaart toegenomen. Op grote schaal wordt de metadata van digitale objecten verzameld en op andere websites hergebruikt. Het veranderen van het oorspronkelijke webadres betekent dat tienduizenden links op sites van partners en particulieren die verwijzen naar jouw collectie niet meer werken.

En dat lijkt op zijn zachtst gezegd onhandig. Maar dat niet alleen. Het vormt een reëel risico voor de reputatie en autoriteit van je organisatie. Bibliotheken, erfgoedinstellingen, musea en wetenschapsinstituten maken onderdeel uit van een grote, soms mondiale digitale infrastructuur. Er zijn vaak meerdere externe portals die gebruik maken van jouw data en verwijzen naar jouw bronnen. Elke verandering van een webadres vraagt dus om een grote update van alle verwijzingen naar de gegevens in deze portals, en dat gaat al snel om tienduizenden links.

Je zult ervoor moeten zorgen dat elke portal de verouderde informatie verwijdert en de beschikking krijgt over nieuwe, correcte verwijzingen naar je bronnen. Dat zal in veel gevallen lastig zijn, vaker zelfs onmogelijk. Het bezorgt de organisatie en anderen veel werk en extra kosten.

Oplossing

Voor dit probleem bestaat gelukkig een betrekkelijk eenvoudige, technische oplossing: het gebruik van permanente links. Deze worden ook wel persistent identifiers (PiD’s) genoemd. Het zijn unieke en permanente identificatienummers die gegarandeerd blijven werken, ook al verandert het webadres van een organisatie. Steeds meer bibliotheken, musea, erfgoedinstellingen en wetenschappelijke instituten passen permanente links toe. De Koninklijke Bibliotheek en het Nationaal Archief werken ermee, evenals het Rijksmuseum, Beeld en Geluid, Data Archiving and Networked Services (DANS) en universiteiten. De verifieerbaarheid van bronnen in wetenschappelijke publicaties vormt immers een noodzakelijke basis voor de betrouwbaarheid en kwaliteit van een onderzoek.

Hoe werkt het?

De persistent identifier is te vergelijken met het ISBN (Internationaal Standaard Boeknummer), het unieke identificatienummer dat aan elke boekuitgave wordt gegeven. Er zijn internationale afspraken gemaakt over hoe ISBN’s worden toegekend en door wie. Centraal wordt bijgehouden welk ISBN bij welk werk hoort.

Voor persistent identifiers werkt dit hetzelfde. Wanneer een object een persistent identifier krijgt, worden de permanente link en de gegevens over het object centraal geregistreerd. Dit geldt ook voor de locatie van het object. Zodra er een wijziging plaatsvindt in naam of locatie, wordt dit op centraal niveau bijgewerkt en wordt er een verwijzing naar de nieuwe locatie opgenomen. De persistent identifier verwijst zo altijd naar de meest recente locatie van het object.

Een standaard?

Er bestaan verschillende typen persistent identifiers. De drie meest gebruikte zijn: DOI (Digital Object Identifier) Handle en URN:NBN. Ze zorgen er alledrie voor dat een link op internet altijd vindbaar blijft. Maar als er zoveel verschillende persistent identifiers bestaan, kun je dan wel spreken van een standaard? Veel organisaties vragen zich af hoe toekomstvast ze zijn, zeker gezien de snelle ontwikkelingen van het internet.

In de praktijk blijken de verschillende typen al lange tijd in gebruik te zijn. De systemen URN, DOI en Handle zijn gebaseerd op technieken die al meer dan vijftien jaar oud zijn. In de snelle evolutie van het internet hebben zij hun duurzaamheid ruimschoots bewezen. De systemen worden steeds bekender en steeds meer gebruikt.

Het Handle-systeem bijvoorbeeld bestaat al sinds 1990 en wordt door meer dan 10.000 universiteiten, onderzoekscentra, bibliotheken en archieven in meer dan 75 landen gebruikt. Met DOI zijn al meer dan 100 miljoen objecten geregistreerd en URN:NBN wordt al 15 jaar toegepast door nationale bibliotheken en archieven. Ook de wetenschap maakt al vele jaren gebruik van persistent identifiers. DANS is al meer dan tien jaar betrokken bij de invoering van de verschillende systemen. Marnix van Berchum, hoofd datadiensten bij DANS, adviseert om de technische oplossingen te blijven volgen in combinatie met de toepassing ervan. ‘Kijk ook goed naar het doel dat je hebt en hoe je doelgroep de informatie op internet gebruikt en laat dat meewegen bij het type persistent identifier dat je kiest.’

Hoever zijn we in Nederland?

‘Organisaties hebben nog veel vragen en worstelen soms met de implementatie,’ aldus Gijsbert Kruithof, werkzaam bij het Nationaal Archief. Vanuit het Netwerk Digitaal Erfgoed (NDE) is dan ook een project gestart om het gebruik van persistent identifiers bij erfgoedinstellingen te stimuleren en te faciliteren (zie kader). Kruithof ondersteunt vanuit het NDE de nationale invoering van persistent identifiers. Hij benadrukt dat het gebruik ervan niet alleen een technische aangelegenheid betreft. ‘Voor een duurzame oplossing moet je ook in de processen van de organisatie nieuwe afspraken maken, bijvoorbeeld over het beheer en onderhoud van de collectie in combinatie met het collectiebeheersysteem.’

Iedere organisatie kan persistent identifiers invoeren, is de stellige overtuiging van Kruithof. ‘Belangrijk is dat je een blijvend uniek identificatiekenmerk toekent aan de objecten die je langdurig wilt bewaren. Op basis daarvan maak je vervolgens een permanente link. Dat kun je vrij eenvoudig regelen in je beheerproces door vanuit je collectiebeheersysteem automatisch persistent identifiers te laten registreren.’

Ook voor kleine organisaties

Klein beginnen is het devies, zegt Kruithof. ‘Informatieprofessionals vinden het werken met persistent identifiers veelal complex. Maar dat valt reuze mee. Ook kleinere organisaties kunnen gefaseerd op haalbare schaal starten zodat het project overzichtelijk blijft. In veel gevallen kan de impact worden beperkt doordat bestaande nummering kan worden hergebruikt en de registratie van de identifiers kan worden overgelaten aan het collectiebeheersysteem. Daarbij is het verstandig om vooraf te bedenken of je in een later stadium het aantal objecten dat je wilt voorzien van permanente links nog verder zou willen uitbreiden, of de toevoeging van nieuwe collecties in de toekomst bijvoorbeeld mogelijk wilt maken’.

Er is inmiddels landelijk ondersteuning beschikbaar en ook kennis en ervaring wordt zoveel mogelijk gebundeld. Deelnemers uit het NDE die ervaring hebben met persistent identifiers helpen beginnende collega-instellingen. Organisaties die ermee aan de slag willen, kunnen zich hierbij aansluiten. Ook heeft het project een (gratis) digitale tool ontwikkeld (zie www.ncdd.nl/pid) waarmee informatieprofessionals en ict’ers kunnen nagaan welke persistent identifier voor hun organisatie het meest geschikt is.

Verder is er een handleiding in aantocht. ‘Het ontbreekt instellingen nog vaak aan tijd en menskracht,’ denkt Walther Hasselo, projectleider digitalisering bij Erfgoed Leiden en Omstreken. ‘Wij werken daarom samen met andere NDE-deelnemers aan een handleiding, zodat je stap voor stap weet wat je moet doen. Ook streven we ernaar om de technische oplossing die wij kiezen, samen met de leverancier zo te ontwikkelen dat deze ook voor andere organisaties eenvoudig over te nemen is.’

Leveranciers aan boord

Ook de leveranciers van de grote collectiebeheersystemen zijn aan boord. Een belangrijke succesfactor is het realiseren van betaalbare standaardoplossingen, om kleine organisaties over de drempel te helpen. Het streven is dat al het digitaal erfgoed dat in Nederland via internet beschikbaar wordt gesteld van persistent identifiers is voorzien. Leveranciers van collectiebeheersystemen kunnen daar een belangrijke rol in spelen door in hun systemen een standaardfunctionaliteit in te bouwen waarmee persistent identifiers worden aangemaakt. Wilbert Helmus, coördinator van het NDE-werkpakket Bruikbaar, voorspelt dat de ontwikkeling daarmee ineens heel snel kan gaan. ‘Een tiental softwareleveranciers van collectiebeheersystemen in Nederland hebben zich recentelijk verenigd in één leveranciersknooppunt. Het knooppunt is een soort “coalition of the willing”. Het denkt en werkt vanuit de ict-markt mee met instellingen en overheid om die zaken aan te pakken die in de Nationale Strategie Digitaal Erfgoed zijn belegd.’ Een van de onderwerpen betreft het inbouwen van een persistent identifier-functionaliteit in de collectiebeheersystemen. Zo kan elke instelling bij een nieuwe softwarerelease van het eigen collectiebeheersysteem automatisch over permanente links beschikken, zonder daarvoor zelf technische handelingen uit te voeren.

Digitaal netwerk

Wat heeft ervoor gezorgd dat iedereen in beweging is gekomen? Is het de reputatieschade bij linkrot of de behoefte aan digitale duurzaamheid?

Wat een belangrijke rol speelt is de wens onder erfgoedinstellingen om alle erfgoedinformatie in een digitaal netwerk van met elkaar verbonden erfgoedinformatie beschikbaar te maken. Dit kan alleen als je ervoor zorgt dat je altijd werkt vanuit de oorspronkelijke, beherende bron en dat die digitaal altijd bereikbaar en universeel raadpleegbaar is. Collectiehoudende instellingen worden daarmee eigenlijk de belangrijkste bron van informatie.

Erfgoed Leiden en Omstreken (ELO) bijvoorbeeld heeft de handschoen opgepakt. Samen met partners als de Universiteitsbibliotheek Leiden, Museum De Lakenhal, Museum Boerhaave en Hoogheemraadschap van Rijnland werkt ELO aan de ontwikkeling van een platform waarop alle erfgoedinformatie van de stad Leiden centraal raadpleegbaar is. Historici hoeven dan niet meer bij elk instituut of organisatie apart te zoeken naar informatie, maar kunnen op één punt terecht. ‘Maar als je daarmee aan de slag gaat zonder dat je vanuit alle organisaties permanente links gebruikt, dan wordt het rijden in een auto zonder wielen,’ aldus Walther Hasselo, projectleider digitalisering bij ELO ‘Je links moeten altijd blijven werken. Dat kan alleen als je persistent identifiers gebruikt.’

Informatiemanager Enno Meijers vertelt hoe de Koninklijke Bibliotheek (KB) intensief werkt aan het duurzaam publiceren van titels en auteurs als linked data. ‘Als eerste stap in deze richting hebben we vorig jaar diverse thesauri, waaronder ruim anderhalf miljoen auteursnamen, als linked data gepubliceerd. Eind dit jaar volgen de titelbeschrijvingen van de Nederlandse Bibliografie. Door de informatie in deze vorm en voorzien van duurzame identifiers beschikbaar te stellen biedt de KB andere organisaties de mogelijkheid om deze data op een eenvoudige manier te koppelen.’

Zowel nationaal als internationaal neemt de wens toe om digitaal erfgoed integraal doorzoekbaar en vindbaar te maken. Dat is niet alleen handig en gebruikersvriendelijk voor alle digitale bezoekers van over de hele wereld, maar het biedt ook kansen op nieuwe en onverwachte verbindingen. Iemand uit Miami vindt al surfend en zoekend naar dat ene object in een bibliotheek opeens ook relevante links naar objecten van musea en archieven. Met persistent identifiers kunnen organisaties gezamenlijk de kansen van beter zichtbare en bruikbare collecties verzilveren.


Permanente links herkennen

Als je wilt verwijzen door middel van een permanente link, of als je wilt nagaan of de link die je op de website ziet een permanente link is, dan kun je dat eenvoudig controleren. De afbeelding van Het Joodse Bruidje die het Rijksmuseum op zijn site beschikbaar stelt, heeft als persistent identifier http://hdl.handle.net/10934/RM0001.COLLECT.5223. Als je hierop klikt, blijkt het huidige webadres https:// www.rijksmuseum.nl/nl/collectie/SK-C-216. Aan het vetgedrukte stukje kun je zien dat het een persistent identifier is. En dit garandeert dat het bekende schilderij van Rembrandt gevonden kan blijven worden, ook als het webadres in de toekomst verandert.


Alarmbellen

Alarmbellen moeten gaan rinkelen bij woorden als organisatieverandering, nieuwe naam, samenvoeging van collecties, centraal raadpleegbare registers, verbeterde of nieuwe website of linked data. Deze situaties hebben zonder persistent indentifiers vrijwel altijd linkrot tot gevolg.


Netwerk Digitaal Erfgoed (NDE)

Vanuit het Netwerk Digitaal Erfgoed (NDE) is het project Persistent Identifiers gestart om het gebruik van deze permanente links bij erfgoedinstellingen te stimuleren en te faciliteren. Het NDE richt zich op de ontwikkeling van een stelsel van landelijke voorzieningen en diensten voor het verbeteren van de zichtbaarheid, bruikbaarheid en houdbaarheid van digitaal erfgoed. Deelnemers aan het samenwerkingsverband zijn onder meer de Koninklijke Bibliotheek, het Nederlands Instituut voor Beeld en Geluid, de Rijksdienst voor het Cultureel Erfgoed, de Koninklijke Nederlandse Akademie van Wetenschappen, het Nationaal Archief en kenniscentrum DEN. De activiteiten van het NDE vallen uiteen in drie werkprogramma’s die in 2015 en 2016 worden uitgevoerd. Het project Persistent Identifiers maakt deel uit van het werkprogramma Digitaal Erfgoed Houdbaar, dat wordt gecoördineerd door de Nationale Coalitie Digitale Duurzaamheid (NCDD).

www.ncdd.nl


Maayke Rusken is communicatieadviseur NDE-project Persistent Identifiers.

Deze bijdrage komt uit IP nr. 4 / 2016. Het gehele nummer kun je hier lezen.