Gegevens van erfgoedinstellingen met elkaar verbinden: Erfgoed & Locatie

Databases van erfgoedinstellingen bieden een schat aan gegevens en historische informatie. Die rijkdom wordt zichtbaar wanneer je de gegevens met elkaar verbindt, zodat ze samen een groot verhaal vertellen. Het project Erfgoed & Locatie stelt erfgoedinstellingen in staat om hun gegevens uit te wisselen op basis van locatiegegevens en nieuwe diensten te ontwikkelen.

Door: Ralph Kits 

Bij erfgoed speelt de historische dimensie (tijd, plaats en gebeurtenis) een belangrijke rol. Vrijwel alle databases of diensten met digitaal cultureel erfgoed bevatten dan ook specifieke locatiegegevens. Helaas komen historische geografische termen vaak niet overeen met moderne geografische termen. Om gebruik te kunnen maken van deze geo-informatie is zowel harmonisatie van gegevens(vormen) als het gebruik van breed geaccepteerde (open) standaarden noodzakelijk. Dit is een belangrijke voorwaarde om aan elkaar gerelateerde gegevens ook daadwerkelijk aan elkaar te kunnen koppelen. Het project Erfgoed & Locatie wil een bijdrage leveren aan de standaardisatie bij erfgoedinstellingen en faciliteert hen om optimaal gebruik te maken van de mogelijkheden die dit oplevert. De primaire doelgroep van Erfgoed & Locatie (E&L) is dus de Nederlandse erfgoedsector: archieven, musea, bibliotheken en archeologische en bouwhistorische instellingen. De producten van E&L (zie verderop) kunnen de erfgoedinstellingen vervolgens zelf inzetten voor hun eigen doelgroepen.

Het project werd in 2009 geïnitieerd door de Stichting Archiefprogrammatuur (STAP). In 2012 heeft Digitaal Erfgoed Nederland (DEN) de uitvoering ervan op zich genomen, in samenwerking met de Rijksdienst voor het Cultureel Erfgoed (RCE), Stichting Bibliotheek.nl en Waag Society.

Infrastructuur & toolkits

De technische infrastructuur die door Erfgoed & Locatie wordt ontwikkeld vormt het hart van het project. Deze moet de te realiseren publieksdiensten mogelijk maken. E&L volgt ruwweg het drielagenmodel zoals dat vaak wordt gebruikt voor referentie-infrastructuren van de overheid: een onderste laag met databronnen en -opslag (collecties), een middenlaag met semantische onderdelen en diensten (de technische infrastructuur van E&L) en een bovenste laag van toepassingen (publieksdiensten zoals een webviewer). Binnen de looptijd van het project wordt onder andere een aantal toolkits voor de (publieke) toepassingen in de bovenste laag ontwikkeld. Instellingen kunnen deze toepassingen, samen met de creatieve industrie, vervolgens verder doorontwikkelen.

De toolkits stellen erfgoedinstellingen in staat zelf een kaartviewer of een mobiele tour te configureren. Door middel van de viewer kan de ontsloten data op diverse manieren worden bekeken en doorzocht. De bijbehorende toolkit maakt het mogelijk om de informatie te selecteren die in de viewer getoond wordt en de viewer te embedden binnen de eigen website.

Ook wordt een toolkit ontwikkeld waarmee instellingen een mobiele tour-app kunnen samenstellen, uiteraard op basis van locatie, maar ook aan de hand van een thema of periode. Een instelling kan dan bijvoorbeeld een stadswandeling aanbieden als app, waarmee de gebruiker op locatie informatie vindt.

Meedoen

Inmiddels leveren ruim 25 erfgoed- en archiefinstellingen een bijdrage aan E&L, waaronder Amsterdam Museum, DANS, Beeld en Geluid, Erfgoed Brabant, Nationaal Archief, Naturalis NBC en ProBiblio. Een zestal pilotteams met medewerkers van de deelnemende instellingen onderzoekt hoe de verschillende onderdelen van E&L moeten gaan werken. Zij leggen vast wat er gedaan moet worden om deze onderdelen werkend en bruikbaar te maken. Ook bekijken ze welke onderdelen (bijvoorbeeld softwarepakketten, code en standaarden) al bestaan en (eventueel in aangepaste vorm) hergebruikt kunnen worden. Vanaf 1 juli 2014 worden de resultaten van deze pilots uitgewerkt tot een pakket eindproducten dat E&L op 1 juli 2015, bij afronding van het project, zal opleveren. Erfgoedinstellingen die data aan E&L aanleveren dienen goed zicht te hebben op de samenstelling en indeling van de eigen data, zodat duidelijk is welke velden overeenkomen met de voor E&L noodzakelijke (meta)data(velden). Voor een succesvolle aanlevering kan het noodzakelijk blijken dat de erfgoedinstelling de data eerst zelf op orde brengt. Om te voorkomen dat álle digitale collectiedata moet worden aangepakt, stelt E&L voor om een relevante selectie bruikbaar te maken en aan te bieden. Die selectie is afhankelijk van de doelgroep en de wensen van de instelling.

(Laten) verrijken

De E&L-infrastructuur gebruikt een historische geo-coder om historische topografische aanduidingen in de aangeleverde bronnen te geo-coderen: het toeschrijven van geografische informatie (meestal coördinaten) op basis van andere geografische data, zoals straatnaam, plaatsnaam en postcode. Hierbij is semantiek een interessante uitdaging: in verschillende periodes en binnen verschillende disciplines kunnen uiteenlopende schrijfwijzen of termen gebruikt worden voor dezelfde geografische informatie of voor soortgelijke concepten. Denk bijvoorbeeld aan de vele mogelijke schrijfwijzen van een bepaalde straatnaam, door schrijffouten, verandering van schrijfwijze door de jaren heen, het wijzigen van een straatnaam of het geheel verdwijnen van een straat.

In de E&L-ontologie worden de per bron verschillende termen voor soortgelijke informatie en concepten onderling met elkaar verbonden. Hierdoor levert een zoekvraag toch een relevant, betekenisvol resultaat uit de geraadpleegde brongegevens op. Op deze manier kan een erfgoedinstelling zijn eigen data (laten) verrijken. De instelling definieert zelf welke informatie voor wie toegankelijk is en welke informatie ontsloten en/of verrijkt wordt via E&L.

Een mogelijkheid voor verrijking is bijvoorbeeld het crowdsourcen van het georefereren van kaartscans: het toewijzen van coördinaten aan een afbeelding, zo duidelijk wordt welk geografisch gebied deze dekt en de scan wat betreft oriëntatie geografisch correct gepositioneerd kan worden op de basislaag. Ook is het mogelijk een erfgoedobject te voorzien van geo-informatie door het aan een punt op een kaart te koppelen; geo-taggen. Andersom kan natuurlijk ook: een geografische locatie voorzien van nieuwe content zoals foto’s of verhalen, oftewel geo-annoteren. Hierdoor leveren de inspanningen van deelnemende instellingen naast een betere toegankelijkheid van de collectie ook de kans om waardevolle aanvullingen te krijgen vanuit een betrokken publiek.


WatWasWaar

Binnen het project Erfgoed & Locatie krijgt de website WatWasWaar, waar historische informatie over elke plek in Nederland te vinden is, een nieuwe vorm. Specifiek is de opdracht om de gedigitaliseerde collectie Historische Kadastrale Basiskaarten Nederland 1811-1832 online beschikbaar te houden.

Momenteel toont WatWasWaar.nl een ruime collectie van gedigitaliseerde kaarten. De vernieuwing ten opzichte van WatWasWaar zal met name in de techniek aan de achterkant plaatsvinden. Waar de site vanuit een gesloten systeem de scans van een vastgelegd aantal collecties toont, zal E&L gebruik maken van een actief systeem om collecties van een groeiend aantal deelnemende erfgoedinstellingen te benaderen, gebundeld te tonen en verrijkte (meta)data weer terug te leveren.


Ralph Kits is projectmedewerker Erfgoed & Locatie bij Digitaal Erfgoed Nederland.

Deze bijdrage komt uit IP nr. 4 / 2014. Het gehele nummer kun je hier lezen