Eerste stappen naar open denken en werken: Rijksmuseum opent zijn data

In 2011 startte het Rijksmuseum in Amsterdam met de ontwikkeling van een API (Application Programming Interface), een platform waar ontwikkelaars de beschikbaar gestelde open data1 kunnen downloaden en hergebruiken. Wat begon als experiment is inmiddels uitgegroeid tot een van de grootste open data-kunstcollecties in de wereld. Inge Giesbers en Lizzy Jongma beschrijven de weg ernaartoe.

Door: Inge Giesbers en Lizzy Jongma

Afgelopen voorjaar heeft het Rijksmuseum na lange tijd weer zijn deuren geopend. In het gerenoveerde gebouw van architect Pierre Cuypers presenteert het museum op geheel eigen wijze ruim 8.000 objecten, vanaf de middeleeuwen tot en met de 20e eeuw. Ook digitaal staan de deuren nu wijd open. Sinds 2011 stelt het Rijksmuseum beelden van 125.000 werken uit zijn collectie via een Application Programming Interface (API) beschikbaar. Metadata en afbeeldingen van objecten kunnen in hoge resolutie, onder een CC0- licentie (zie verderop), door app-bouwers en techneuten gedownload worden en in zelf ontwikkelde apps en websites worden hergebruikt.2 Dit project begon als een experiment, maar is inmiddels uitgegroeid tot een van de grootste open data-kunstcollecties in de wereld.

Sinds 2012 richt het Rijksmuseum zich online op het grote publiek: een groot deel van de collectie wordt vrijelijk beschikbaar gemaakt in het onderdeel Rijksstudio van de website. Om op in te zoomen, te bewerken, te ‘liken’ én om te delen of downloaden. De afbeeldingen zijn in hoge resolutie beschikbaar, waardoor ze zelfs afgedrukt kunnen worden op canvasdoek of op een mok.

Lang gekoesterde wens

Het Rijksmuseum hecht grote waarde aan een open en breed gebruik van de collectie en aan uitwisseling van informatie. De collectie is ‘van iedereen, voor iedereen’. Het open data-traject was dan ook een lang gekoesterde wens. Het vergroot de toegankelijkheid van de collectie en maakt het makkelijker om samen te werken met andere instellingen.

Daarnaast blijkt dat derden de afbeeldingen uit de Rijksmuseumcollectie al veelvuldig gebruiken. Helaas vaak in slechte kwaliteit, zoals te zien is aan de talloze ‘vergeelde Melkmeisjes’ op internet. Door kwalitatief hoogwaardig beeldmateriaal open te stellen komt ook de correcte, kleurechte afbeelding beschikbaar voor hergebruik.

Aanleiding voor het open data-project was de vraag in 2011 om als museum deel te nemen aan de hackbattle ‘Apps voor Nederland’. In deze wedstrijd werden programmeurs en ontwikkelaars uitgedaagd om applicaties te bouwen met open data. De uitnodiging kwam vanuit het Open Cultuur Data-netwerk en de Hack de Overheid-community. Deze organisaties zetten zich in voor het vrijgeven van culturele en overheidsdata.

De voorbereidingstijd voor de wedstrijd bedroeg slechts acht weken. In die tijd is een technische infrastructuur ontwikkeld en zijn de objecten geselecteerd die geschikt zijn voor hergebruik.

Verrassende resultaten

Sinds de lancering van de API zijn er ruim dertig apps gebouwd en is de collectie zo’n zeshonderd keer gedownload. Niet alleen Helsinki is zelfs een horrorvideo ontwikkeld met twee prenten uit de collectie.

Ook voor hogescholen en universiteiten blijkt de API een interessante bron te zijn. Zo heeft het museum samengewerkt met de Hogeschool van Amsterdam, studierichting Mobile Interaction. Studenten hebben op basis van de open data interessante apps ontwikkeld, zoals een kunstenaarstwitterapp, een stadswandeling en een spelletjes-app om het wachten in een lange rij wat aangenamer te maken.

Bij de Universiteit van Amsterdam is de open data-set gebruikt voor een college over big data, maar ook voor een college over Thomas van Hees (diplomaat in de Gouden Eeuw): studenten hebben hun onderzoeksresultaten in eigen webtoepassingen gepresenteerd.

Voorafgaande stappen

Om open data te realiseren is de eerste stap uiteraard dat data (beeldmateriaal en metadata) vrijgegeven dienen te worden. Het openstellen van data bleek een flinke uitdaging. Naast de ontwikkeling van een geheel nieuwe techniek om de data toegankelijk te maken kreeg het Rijksmuseum ook te maken met auteursrechtelijke vragen. Er was nog weinig ervaring op dit gebied, aangezien het merendeel van de Rijksmuseum-collectie rechtenvrij is. Maar met de aanwinst van steeds meer 19e, 20ste- en 21ste-eeuwse objecten komt hier verandering in.

Voor de API was een selectie van rechtenvrije objecten nodig, omdat erfgoedinstellingen alleen data beschikbaar kunnen stellen waar zij zelf copyrighthouder over zijn of waar geen rechten meer op rusten. Helaas was dit selectiecriterium nog niet beschikbaar in het collectiemanagementsysteem (Adlib). De afdeling Collectie Informatie is daarom te rade gegaan bij collega-instellingen.

Op basis van deze gesprekken is vervolgens het tabblad ‘Rechten’ aan Adlib toegevoegd. Per object worden de geldende rechten (auteursrecht, maar soms ook portretrecht), de copyrightvermelding en de vervaldatum vastgelegd. Met een zoekactie op de vervaldatum wordt jaarlijks gekeken welke objecten er in het publieke domein vallen. Doorlevering van objectinformatie en digitaal beeld wordt geautomatiseerd geregeld op basis van gegevens in dit tabblad.

CC-licenties

De beschrijvingen in de open data-set zijn door het Rijksmuseum zelf opgesteld en worden vrijgegeven onder een CC0-licentie. Een CC0-licentie houdt in dat een persoon of instelling afstand doet van al zijn auteursrechten. Iedereen mag de data vrijelijk gebruiken en hergebruiken. Ook voor commerciële doelstellingen.

Het beeldmateriaal van objecten waar geen auteursrechten meer op rusten zijn vrijgegeven met een Publiek Domeinvermelding. Deze vermelding expliciteert dat er geen auteursrechtelijke beperkingen meer op een werk rusten, waardoor iedereen het werk vrijelijk mag gebruiken.

De CC0-licentie was geen automatische keuze binnen het Rijksmuseum. De open data-set werd in eerste instantie aangeboden onder een CC-by-licentie. Hierbij mogen de data vrijelijk hergebruikt worden, mits onder vermelding van het Rijksmuseum als bron. Het museum wil zijn data graag met iedereen delen, maar er was angst dat de beelden zonder enige bronvermelding overal terecht zouden komen. Deze vrees is terecht, want de meeste beelden uit de collectie van het Rijksmuseum zwerven zonder bronvermelding op internet.

Het Rijksmuseum hecht nog steeds grote waarde aan een vermelding waar het digitaal materiaal geproduceerd is en waar het originele werk te bezichtigen is. Het is echter onmogelijk om te controleren of alle afnemers van open data zich aan deze licentie houden. Daarnaast bleek dat ontwikkelaars juist graag het Rijksmuseum als bron willen vermelden. Ook zonder dat dit vastgelegd is in een licentie. Embedden van een bronvermelding in de afbeelding (via bijvoorbeeld IPTC, een standaard metadataformaat voor foto’s) lijkt een effectieve strategie om bronvermelding bij beeld te behouden.

Deze conclusies hebben geleid tot de overstap naar een CC0-licentie, in combinatie met een ‘fair-use’-beleid.3 Hierbij wordt ontwikkelaars gevraagd om een applicatie te ontwikkelen in lijn met de vervaardiger en om deze applicatie ook als open data beschikbaar te stellen.

Ervaringen

Het Rijksmuseum ging het traject in zonder duidelijke verwachtingen. Het museum is aangenaam verrast door het grote aantal aanmeldingen, reacties en applicaties. Ook internationaal blijkt er grote interesse te zijn, ondanks het feit dat de metadata alleen in het Nederlands beschikbaar zijn. Ongeveer de helft van alle aanvragen is in het Engels en medewerkers van het museum worden regelmatig op internationale congressen uitgenodigd. Voor het Rijksmuseum zijn met name de aanmeldingen van erfgoedportals (zoals Kennisnet en Artstor) interessant. Zo zijn er nieuwe samenwerkingen ontstaan met buitenlandse musea en Nederlandse instituten als Beeld en Geluid, Wikimedia NL en de Hogeschool van Amsterdam. Bovendien is er een aantal applicaties ontwikkeld die ook voor het Rijksmuseum nuttig zijn, zoals de eerdergenoemde Iconclass-browser.

Het openstellen van data was een enerverend traject binnen het Rijksmuseum. Vooraf werden er vragen gesteld over de omzet van de beeldverkoop: de angst bestond dat het beschikbaar stellen van hoge resolutie-jpeg’s de verkoop van beeldmateriaal voor publicaties en drukwerk zou stoppen. Het Rijksmuseum verkoopt zijn tiff’s voor ongeveer veertig euro per afbeelding.4
De lancering van de API is binnen het Rijksmuseum een eerste stap naar open denken en werken. Het heeft de weg vrijgemaakt voor nieuwe ideeën en ontwikkelingen rondom het beschikbaar stellen van de collectie, zoals nu al geïmplementeerd zijn in Rijksstudio en in educatieve programma’s waarin deelnemers objecten digitaal kunnen bewerken en 3D-printen. Het Rijksmuseum denkt inmiddels ook aan big data, linked open data en verdere ontwikkelingen op gebied van 3D.

Leerpunten

Naast de positieve feedback zijn er ook leerpunten voor het Rijksmuseum. Zo kan op dit moment alleen de gehele set van 111.000 objecten via de API aangeleverd worden. Maar gebruikers willen vaak gericht zoeken naar (een set van) objecten, zoals ‘De Nachtwacht’ of alleen objecten met tulpen.

Technisch leunt de API volledig op OAI en Dublin Core XML. Grote portalsites als ArtSTOR en Europeana kunnen de collectie zonder problemen harvesten, omdat zij goed bekend zijn met deze binnen de erfgoedwereld veel gebruikte harveststandaarden. Programmeurs en appbouwers zijn echter veelal onbekend met de museale standaarden voor metadatauitwisseling en hebben grote moeite met harvesting en om de metadata te ‘lezen’. Daarnaast blijkt Dublin Core een lastig xml-formaat te zijn voor museale informatie: er is een beperkt aantal velden beschikbaar, waardoor rijke museale informatie op moeizame wijze in vijftien velden opgeknipt wordt. Het Rijksmuseum wil op zijn nieuwe platform uitgebreidere formaten aanbieden als LIDO, CDWAlite en de volledige objectbeschrijving in ons eigen formaat.

Het Rijksmuseum heeft op 1 oktober een nieuw API-platform opgeleverd waar rechtstreeks in de collectie gezocht kan worden en waar verschillende sets en dataformaten uitgeleverd kunnen worden. Daarnaast komen de gegevens niet alleen in xml maar ook in JSON beschikbaar, dat als scriptingtaal beter bekend is bij programmeurs.

Noten

  1. Met data bedoelen wij de combinatie van metadata en het bijbehorend digitaal beeldmateriaal.
  2. Rijksmuseum API is een platform om gegevens (vanuit het collectiesysteem Adlib) en beeldmateriaal (vanuit de Beeldbank) open te stellen voor externen. Deze gegevens en afbeeldingen worden als ruw materiaal aangeboden in xml-formaat, zodat appbouwers en programmeurs hier zelf applicaties mee kunnen ontwikkelen.
  3. ‘Fair Use’-gebruiksvoorwaarden bestaan uiteraard niet als juridisch begrip. Wij hebben deze term zelf bedacht om aan te geven welke spelregels wij in acht genomen willen zien. Wij vinden dat de spelregels recht doen aan het museum, aan de objecten en aan de kunstenaars. Daarom hebben wij voor de term ‘Fair Use’ gekozen. Het aardige is dat andere musea dit begrip overnemen: het Getty Museum spreekt inmiddels ook over fair use (www.getty.edu/about/opencontent.html).
  4. Het Rijksmuseum stelt jpeg’s in hoge resolutie beschikbaar (300 dpi). Dit levert bestanden op van circa 5 MB. Het Rijksmuseum neemt al zijn objecten op in de hoogste resolutie en slaat deze beelden op in tiff-formaat. Deze bestanden zijn vaak vele gigabytes groot en er kan op ieder detail ingezoomd worden.

Inge Giesbers is informatiespecialist bij het Rijksmuseum.

Lizzy Jongma is databeheerder bij het Rijksmuseum.

Deze bijdrage komt uit IP nr. 8 / 2013. Het gehele nummer kun je hier lezen