Big data in de erfgoedsector: vernieuwende apps dankzij Open Cultuur Data

Open data, of big data, beginnen steeds meer vorm te krijgen in Nederland en daarbuiten. Overheden, bedrijven, non-profits zien langzaamaan het voordeel om hun data, die nog vaak ‘opgesloten’ zitten in interne systemen en webapplicaties, vrij te geven. Op deze manier krijgen ontwikkelaars en andere geïnteresseerden en belanghebbenden mogelijkheden hier nieuwe betekenis aan te geven. Ook de culturele sector haakt in met verschillende initiatieven voor open cultuurdata, waarvan inmiddels de eerste verrassende toepassingen zichtbaar worden.

Door: Pepijn Lemmens

Tot 31 december van dit jaar kunnen ontwikkelaars meedingen naar verschillende prijzen in de competitie Open Cultuurdata.1 De uitdaging van de competitie is toepassingen te maken die bijdragen aan het vergroten van het publieksbereik van cultuur (online, offline, onsite), waarmee publieksgroepen op nieuwe manieren bereikt en betrokken kunnen worden, en die datasets met elkaar verbinden. De beschikbare datasets zijn afkomstig van musea, archieven en erfgoedinstellingen die ervoor hebben gekozen hun ‘digitale deuren’ te openen voor externe ontwikkelaars.

Het netwerk Open Cultuur Data werd eind 2011 opgericht door het Innovators Netwerk Erfgoed (INE) en Hack de Overheid, een organisatie die zich sterk maakt voor meer open data bij overheden in Nederland. Het jonge netwerk maakte in korte tijd acht datasets vrij van onder meer het Rijksmuseum, het Nationaal Archief en het Nederlands Instituut voor Beeld en Geluid. Deze datasets mochten gebruikt worden in het kader van de door Waag Society georganiseerde competitie Apps voor Nederland, die met name gericht was op open overheidsdata. Uiteindelijk wonnen drie apps prijzen die met de culturele datasets waren gemaakt, waaronder Vistory, de algehele winnaar van Apps voor Nederland.2 Op basis van dit succes werd Open Cultuur Data in 2012 voortgezet met steun van Beelden voor de Toekomst en Creative Commons Nederland. Kennisland en het Nederlands Instituut voor Beeld en Geluid voeren het project uit.

Toepassingen

Uit de hackathons die Open Cultuur Data en Hack de Overheid organiseerden, blijkt dat vooral toepassingen met afbeeldingen die verschillende datasets combineren populair zijn. Zo creëerde ab-c media monumenten.info, een website en app die op basis van het monumentenregister van de Rijksdienst voor het Cultureel Erfgoed (RCE), Wikipedia, afbeeldingen van Wikimedia Commons, fotoverzamelsite Flickr en historische archieven en musea meer informatie geven over alle rijksmonumenten in Nederland.

Mobiele apps lijken zich het beste te lenen voor open cultuurdata-toepassingen. Succesverhaal van Open Cultuur Data is het eerder genoemde Vistory. Deze app maakt gebruik van de geolocatie van een mobiele telefoon en zoekt op basis daarvan naar filmfragmenten (afkomstig van de dataset Open Beelden van het Nederlands Instituut voor Beeld en Geluid) die in de buurt zijn opgenomen. Gebruikers van de app kunnen een frame van de video ‘bevriezen’ wanneer deze overeenkomt met het beeld dat zich op dat moment voor de camera van de telefoon bevindt en vervolgens een foto maken. De foto wordt opgeslagen in de app-backend met een geolocatie en de timestamp van de video. Gebruikers kunnen hun toen-en-nu-opnamen vervolgens delen via Facebook en Twitter. Vistory combineert daarmee open datasets met user generated content tot een game-achtige ervaring.

Vistory won tijdens de wedstrijd Apps voor Nederland begin 2012 uit een veld van 48 deelnemers de hoofdprijs. De jury over Vistory: ‘De app heeft een sterk educatief karakter, maar kan ook ingezet worden in bijvoorbeeld de toeristische sector. Daarnaast stimuleert Vistory participatie door gebruikers op te roepen zelf beelden toe te voegen en zo de dataset te verrijken.’ Games blijken sowieso aantrekkelijke toepassingen van open cultuurdata. Op basis van de dataset van het Rijksmuseum zijn twee quizzes ontwikkeld waarbij ofwel de juiste naam van het werk geraden moet worden, ofwel de maker van het werk. De Rijks-Quiz daagt iedereen uit zijn of haar kennis van de schilderkunst te testen door uit een lijst met vier opties de goede maker bij een werk te kiezen. De Rijksmuseum Quiz doet min of meer hetzelfde met de juiste titel van een werk.

Copyright

Een belangrijke beperking in het vrijgeven van culturele/erfgoeddata als open data door erfgoedinstellingen is de complexiteit van de rechten, met name het auteursrecht. Hoewel de nieuwe Europese richtlijnen ten aanzien van Public Sector Information (PSI) als het aan eurocommissaris Kroes ligt ook gaan gelden voor erfgoedinstellingen, is het auteursrecht op erfgoedcollecties nog een heikel punt.3

Om te zorgen dat data echt hergebruikt kunnen worden, is het een vereiste deze beschikbaar te stellen onder een open licentie, bijvoorbeeld een Creative Commons-licentie CC0 (Creative Commons Zero: data zijn vrij te gebruiken zonder noodzaak voor attributie of openstelling voor hergebruik), CCBY (Creative Commons, naamsvermelding: de data zijn vrij te gebruiken mits onder vermelding van de bron) en CCBYSA (Creative Commons, naamsvermelding, gelijkdelen, de data zijn vrij te gebruiken mits onder vermelding van de bron en het ‘dataproduct’ dat hieruit voortkomt wordt onder dezelfde CC-licentie vrijgegeven).

Voor erfgoed- en cultuurinstellingen is deze licentievereiste vaak een beperkende factor: veel collecties in het beheer van instellingen zijn geen eigendom van de instelling zelf. Zij kunnen dus niet bepalen onder welke licentie deze wordt geplaatst (overigens geldt dit meestal alleen voor de content, de feitelijke inhoud van de collectie, niet voor de metadata die instellingen zelf produceren). Vaak gelden er nog auteursrechten van de vervaardiger, archiefvormer en anderen. Om die reden bestaan de meeste ‘culturele datasets’ die op dit moment beschikbaar zijn, dan ook uit content waarvan de maker inmiddels meer dan zeventig jaar geleden is overleden, de termijn waarop het auteursrecht op een werk vervalt en dit toevalt aan het publieke domein. Voorbeelden zijn de datasets van het Rijksmuseum4 en het Amsterdam Museum.5

Het openstellen van datasets van recentere ‘content’ stuit vaak op bezwaren: los van de rechten van de oorspronkelijke maker, hebben cultuurinstellingen vaak ook te maken met de rechten van de maker van de afbeelding, het afgeleide werk. Een voorbeeld: Pierre Cuypers, architect van onder meer het Rijksmuseum, overleed op 3 maart 1921. Op basis van die datum zou het werk van Cuypers dus in het publieke domein vallen. Dat betekent echter niet dat alle afbeeldingen van het Rijksmuseum zomaar vrij te (her)gebruiken zijn: een foto van het gebouw kan gemaakt zijn ver na die datum, waarbij de fotograaf nog rechten kan doen gelden op zijn afbeelding. Omdat de meeste cultuur- en erfgoedinstellingen collecties met zowel origineel als afgeleid materiaal bezitten, is het ‘clearen’ van alle rechten op digitale archieven een tijdrovende en complexe taak. Vaak zijn er in het verleden wel overkoepelende afspraken gemaakt met makers en andere rechthebbenden over publicatie op bijvoorbeeld de website van een instelling, maar gelden die afspraken niet voor een relatief nieuwe uitingsvorm als open data.

Datasets

Ondanks de complexiteit rondom rechten en rechthebbenden, zijn er op het Open Cultuur Data-platform inmiddels negentien datasets beschikbaar.6 In veel gevallen betreft dit metadata van de archieven, maar ook geluidsfragmenten van het Nederlands Instituut voor Beeld en Geluid, de mode- en textielcollectie van het Fries Museum en historische kaarten van het Nationaal Archief.

Op basis van de eerste ervaringen met het inbrengen van data op hackathons heeft Open Cultuur Data een aantal conclusies getrokken over wat vanuit het perspectief van een hacker en ontwikkelaar interessant bevonden wordt.

De belangrijkste conclusie is dat (omvang)rijke content gewild is. Ontwikkelaars hebben vooral interesse voor zo veel mogelijk en zo interessant mogelijke content, en niet enkel metadata. Uiteindelijk spreekt het meer tot de verbeelding om iets te doen met de afbeeldingen uit collecties, zoals de Nachtwacht van het Rijksmuseum of de Zonnebloemen van het Van Gogh Museum, dan met alleen de metadata van deze stukken, zo blijkt.

Het EYE Film Instituut Nederland stelde voor de wedstrijd Apps voor Nederland metadata van hun collectie Nederlandse films onder CC0 beschikbaar. Deze data werden door niemand gebruikt. Het Rijksmuseum bracht naast metadata van zijn gehele collectie uiteindelijk ook een groot deel van de eigen content uit de collectie in. Aanvankelijk was het Rijksmuseum van plan om contentselecties te maken rond specifieke onderwerpen, maar uiteindelijk is ervoor gekozen om de selectie zo breed mogelijk te houden. Deze strategie leverde vlak na de afsluiting van de wedstrijd Apps voor Nederland (binnen een maand) al elf applicaties op.

Lizzy Jongma (Rijksmuseum): ‘We zijn kunstwerken gaan selecteren die auteursrechtelijk vrij zijn en waar we beeldmateriaal van hebben, vanuit de veronderstelling dat appbouwers altijd beeldmateriaal willen gebruiken. Deze veronderstelling blijkt juist. Zodoende zijn wij tot een selectie van ruim honderdduizend kunstwerken van vóór 1840 gekomen. We merken inderdaad dat de meeste appbouwers op zoek zijn naar de Rembrandts en werken uit de Gouden Eeuw. Dit hebben wij kunnen leveren. We vinden het wel spijtig dat wij onze modernere parels niet als open data beschikbaar hebben kunnen stellen en zodoende ook niet een ander beeld van het Rijksmuseum hebben kunnen bieden.’7

Voordelen voor de organisatie

De voordelen van het beschikbaar zijn van open datasets voor ontwikkelaars is evident, maar waarom zouden culturele organisaties hun data als open data ter beschikking stellen? Wat winnen zij er zelf mee? Daar blijken verschillende redenen voor te worden opgegeven.

Het stimuleren van hergebruik van data, het zo breed mogelijk ontsluiten en het verrijken van culturele data zijn voor culturele instellingen de drie hoofdargumenten om met open data aan de slag te gaan. Open data kunnen culturele instellingen helpen hun publieke functie als instelling beter te vervullen. Daarnaast neemt de toegang en het hergebruik toe en ontstaat er grotere samenwerking tussen instellingen. Goed voorbeeld hiervan is Maritiem Digitaal, een samenwerkingsverband van onder meer het Scheepvaartmuseum, het Maritiem Museum Rotterdam, maar ook het Visserijmuseum Zoutkamp. Gezamenlijk hebben zij hun datasets beschikbaar gemaakt. ‘Dit heeft voor een klein museum als Visserijmuseum Zoutkamp ook het voordeel dat ze nu in de media in één adem worden genoemd met het grote Rijksmuseum, omdat ook hun data nu open zijn,’ aldus Nikki Timmermans, projectleider Open Cultuur Data bij Kennisland.

Het beschikbaar hebben van open data via een API (Application Programming Interface) biedt ook voordelen voor de instelling zelf, omdat op die manier eenvoudiger nieuwe toepassingen kunnen worden ontwikkeld, gebruikmakend van zowel de data van de eigen instelling, als van die van collega’s.

Open data maken daarnaast toepassingen mogelijk waar culturele instellingen zelf niet aan zouden denken. Zo ontwikkelde ab-c media een app die de collectie van het Rijksmuseum met behulp van gezichtsdetectie doorzoekt. Dit biedt de mogelijkheid de Rijkscollectie op een meer ‘menselijke’ manier te doorzoeken.8

Door toepassing van open data wordt de waarde van de collectie dus vergroot. Hierbij moet evenwel eerder worden gedacht aan soft benefits, zoals hogere (online) bezoekersaantallen, contextualisering van collecties en objecten op externe platforms als Wikipedia en verrijking van metadata, dan aan de verhoging van financiële baten.

Meer mogelijkheden voor waardecreatie zitten volgens Nikki Timmermans, projectleider Open Cultuur Data, in het combineren van cultuurdata met andere datasets, zoals toeristische informatie. Zo verbindt de website Arts Holland9 de ‘uitgaansinformatie’ van het Nederlands Bureau voor Toerisme en Congressen en het Nederlands Uitbureau met data van culturele instellingen tot een toeristische cultuur-‘gids’. Door ook marketingprofielen te verbinden met cultuurdata, ontstaan nog meer toepassingen. ‘Denk aan samenwerking met een bedrijf als Booking.com. Hiermee zouden toeristen op maat gewezen kunnen worden op voor hen interessante cultuur in de buurt van hun verblijfplaats,’ aldus Timmermans.

Nu ook de grote Europese erfgoedportal Europeana10 heeft aangekondigd de eigen metadata als open data te gaan aanbieden, wordt de ‘snoeppot’ waaruit ontwikkelaars kunnen putten alleen maar groter. Gecombineerd met data van overheden, zorg, onderwijs en andere organisaties zal dit de komende jaren naar verwachting leiden tot vele nieuwe toepassingen van erfgoedinformatie.


Wat zijn open data?

Bij open data gaat het om een methode van informatie aanbieden via internet zodat deze herbruikbaar (interoperabel) zijn met verschillende systemen. Om partijen die open data publiceren, te stimuleren hun data in een zo herbruikbaar mogelijk formaat beschikbaar te stellen, heeft Tim Berners-Lee, bedenker van het World Wide Web, een vijfsterrenmodel voorgesteld.

Hierbij worden de volgende sterren toegekend:

* De data zijn beschikbaar op internet, in welk formaat dan ook.

** De data zijn online beschikbaar in een gestructureerd formaat, dat geschikt is voor automatisch hergebruik (zoals Excel in plaats van een plaatje van een tabel).

*** De data zijn online beschikbaar in een open bestandsformaat (zoals CSV in plaats van Excel).

**** Al het bovenstaande, en bovendien wordt gebruik gemaakt van de open standaarden Resource Description Framework (RDF) en SPARQL, zodat anderen makkelijk naar de data-objecten kunnen verwijzen.

***** Al het bovenstaande, en bovendien wordt er naar data van anderen verwezen voor meer context van de data.

Linked Open Data (LOD) is een communityproject dat staat onder toezicht van het World Wide Web Consortium (W3C). Linked Open Data (vijf sterren) is het essentiële onderdeel van het semantisch web.11


 Hackaton

Een hackathon, ook wel hack day of codefest genoemd, is een evenement waarbij softwareontwikkelaars en anderen die werkzaam zijn binnen de softwarewereld, zoals ontwerpers en interface designers, intensief samenwerken aan een softwaregerelateerd product. Een typische hackathon duurt één of meer dagen en heeft tot doel in korte tijd te komen tot werkende prototypen, zoals apps en websites.


Noten

  1. www.opencultuurdata/competitie.
  2. www.vistory.nl.
  3. Jos van Dijk, ‘Erfgoed te geef? Nieuwe Europese richtlijn vooor overheidsinformatie’, in InformatieProfessional nr. 9/2012.
  4. www.rijksmuseum.nl/api.
  5. www.amsterdammuseum.nl/open-data.
  6. www.opencultuurdata.nl/datasets.
  7. Creative Commons Nederland. Maarten Zeinstra en Nikki Timmermans: Open data: delen, verbinden en verrijken. www.opencultuurdata.nl/2012/07/open-cultuur-data-publiceert-drie-papers/
  8. weblab.ab-c.nl/rijksmuseum.
  9. www.artsholland.com.
  10. www.europeana.eu.
  11. nl.wikipedia.org/wiki/Open_data.

Pepijn Lemmens is webcoördinator bij het Nederlands Architectuurinstituut (NAi). Daarnaast houdt hij zich als freelancer bezig met het ontwikkelen van culturele websites en applicaties.

Deze bijdrage komt uit IP nr. 10 / 2012. Het gehele nummer kun je hier lezen