Open source-software voor (erfgoed)instellingen: METS-viewer presenteert samengestelde, digitale objecten

Het Internationaal Instituut voor Sociale Geschiedenis (IISG) en Aletta E-Quality hebben de zogeheten METS-viewer ontwikkeld. Met deze open source-software kunnen (erfgoed)instellingen samengestelde, digitale objecten online presenteren. Jerry de Vries en Ivo Zandhuis beschrijven de totstandkoming ervan.

Door: Jerry de Vries en Ivo Zandhuis

Het Internationaal Instituut voor Sociale Geschiedenis (IISG) en Aletta E-Quality, kennisinstituut voor emancipatie en vrouwengeschiedenis, presenteerden op 5 juni het eindresultaat van het project Visual METS. In dit project is open source-software ontwikkeld waarmee (erfgoed)instellingen een gedigitaliseerde collectie op de eigen website kunnen presenteren. Bij het digitaliseren van een collectie maken veel erfgoedinstellingen scans van publicaties of archiefstukken. De scans hebben als zogenaamde ‘samengestelde objecten’ een onderling verband, waarvan het belangrijk is deze vast te leggen. Om de volgorde en groeperingen van de scans te kunnen opslaan en gebruiken, moet elke instelling een technische oplossing kiezen – zowel voor het registreren van de structuur als voor de presentatie op de website. Voorkeur gaat daarbij uit naar gestandaardiseerde technieken die instellingen de vrijheid geven zelf keuzes te maken die aansluiten bij de eigen informatiehuishouding.

Standaard kiezen

IISG en Aletta E-Quality stonden gelijktijdig voor de keuze de juiste standaard te bepalen, om deze uitdaging het hoofd te bieden. Voor het vastleggen van de benodigde structuur in de gescande archiefstukken of publicaties zou bij voorkeur worden gekozen voor de open, internationale xml-standaard Metadata Encoding Transmission Standard (METS). METS is een veelgebruikte standaard die erfgoedinstellingen vrijheid geeft bij het kiezen van software voor het presenteren van samengestelde objecten. Er was echter geen goede software om dergelijke METS-bestanden te interpreteren en zo een goede weergave te realiseren op een website. Beschikbare producten waren te gesloten om op een goede manier te kunnen worden ingepast in de informatiehuishouding van zowel IISG als Aletta E-Quality. Beide organisaties konden gescande archiefstukken en publicaties daardoor niet goed beschikbaar stellen.

Bijeenkomsten van een groep van enkele grote archiefdiensten en universiteitsbibliotheken die graag gebruik maakten van METS, maar de ideale software niet kon vinden, waren al enkele keren georganiseerd. Dat had helaas nog geen oplossing voor het genoemde probleem opgeleverd. IISG en Aletta E-Quality konden een voortrekkersrol gaan vervullen.

Visual METS-project

Een gezamenlijk project, mogelijk gemaakt door het subsidieprogramma Digitaliseren met Beleid van Agentschap NL, was een logisch gevolg. Het had als doel om gezamenlijk een open source (en daarmee zonder licentiekosten beschikbare) viewer te ontwikkelen. Of anders gezegd: software die als onderdeel van een website kan worden ingezet om de scans van een digitaliseringsproject in de juiste volgorde en groepering te kunnen bekijken. We noemden het beoogde resultaat een ‘METS-viewer’.

Het IISG nam de softwareontwikkeling voor zijn rekening, Aletta E-Quality richtte zich op de functionele specificaties en projectleiding. Het project volgde hierbij de ‘open-up’-methodologie: op basis van de functionele wensen is een definitieve lijst met functionele specificaties opgesteld. Hierdoor werd het project afgebakend en was het duidelijk wat het zou opleveren. Een klankbordgroep, bestaande uit vertegenwoordigers van de eerder genoemde archiefdiensten en universiteitsbibliotheken en IISG en Aletta E-Quality zelf, werd regelmatig geraadpleegd.

Wensen en randvoorwaarden

Bij de start van het project kwam de klankbordgroep bijeen voor een brainstormsessie. Tijdens deze goed bezochte bijeenkomst werden de functionele wensen opgesteld voor de te ontwikkelen viewer.

De samenhang tussen de beoogde software en de website van de instelling waarin deze moest functioneren, bleek een belangrijke randvoorwaarde van het eindproduct. Sommige websites, waaronder die van IISG en Aletta E-Quality zelf, hadden namelijk al een mogelijkheid om de groepering van scans te presenteren. Hierbij was alleen een viewer nodig voor het tonen van de scans in de juiste volgorde. Andere instellingen hadden echter ook behoefte aan het presenteren van de groeperingen.

Resultaat

De belangrijkste voorwaarde van het project was dat de te ontwikkelen software een webapplicatie zou worden; zij moest immers als onderdeel van een website kunnen worden ingezet. Deze eis heeft jongstleden het eindresultaat van het project Visual METS. In dit project is open source-software ontwikkeld waarmee (erfgoed)instellingen een gedigitaliseerde collectie op de eigen website kunnen presenteren.

Bij het digitaliseren van een collectie maken veel erfgoedinstellingen scans van publicaties of archiefstukken. De scans hebben als zogenaamde ‘samengestelde objecten’ een onderling verband, waarvan het belangrijk is deze vast te leggen. Om de volgorde en groeperingen van de scans te kunnen opslaan en gebruiken, moet elke instelling een technische oplossing kiezen – zowel voor het registreren van de structuur als voor de presentatie op de website. Voorkeur gaat daarbij uit naar gestandaardiseerde technieken die instellingen de vrijheid geven zelf keuzes te maken die aansluiten bij de eigen informatiehuishouding. Standaard kiezen IISG en Aletta E-Quality stonden gelijktijdig voor de keuze de juiste standaard te bepalen, om deze uitdaging het hoofd te bieden. Voor het vastleggen van de benodigde structuur in de gescande archief als consequentie dat ervoor gekozen is een client-serverconstructie toe te passen. De serverapplicatie is hierbij verantwoordelijk voor het verwerken van de METS-bestanden en de bijbehorende verzoeken van de client. Op deze manier fungeert de serverapplicatie als een webservice. De client bestaat uit een klein javascript dat de viewer presenteert in de browser van de gebruiker.

Behalve de technische scheiding tussen voorkant (presentatie op de website) en achterkant (verwerking van METSbestanden), is er ook onderscheid gemaakt tussen verschillende functies die bij het presenteren kunnen worden ingezet. We hebben daarom twee onderdelen gemaakt, die we ‘modules’ hebben genoemd.

De eerste module zorgt ervoor dat een serie scans wordt getoond in de vastgelegde volgorde. Een gebruiker kan hierbij bladeren door de objecten die in het METS-bestand beschreven staan. Bij het bestuderen van een scan is het onder meer mogelijk op de scan in te zoomen, de scan te roteren of, indien deze aanwezig is, een transcriptie te tonen.

screenprint METS-viewer module 1

De tweede module zorgt ervoor dat een object binnen zijn context bekeken kan worden. Deze context bestaat uit de groepering waar de scan onderdeel van uitmaakt. De context is meestal vastgelegd in een inventaris van een archief of de inhoudsopgave van een boek. Beide modules zijn volledig losgekoppeld van elkaar, waardoor een instelling ervoor kan kiezen om alleen module 1 in te zetten of in combinatie met module 2. Het kan namelijk voorkomen dat alleen behoefte is aan de presentatie van één tijdschrift of dat de presentatie van een inventarisnummer kan worden ingebouwd in de bestaande manier om archiefbeschrijvingen te publiceren.

screenprint METS-viewer module 2

Gebruik

METS is een open standaard, waarbij gebruikers de vrijheid hebben om keuzes te maken binnen de mogelijkheden die de standaard biedt. Om die reden zijn er vele vormen van METS-bestanden in omloop. Door het gebruik van xml is het echter een standaard waarmee op een eenvoudige manier de ene vorm kan worden geconverteerd naar een andere.

De modulaire opzet van de METS-viewer zorgt ervoor dat er eisen worden gesteld aan de aan te leveren METS-bestanden. Voor de werking van module 1 is er een METS-bestand nodig waarin de volgorde is opgeslagen van een groep scans, bijvoorbeeld de scans van één aflevering van een tijdschrift of één archiefdossier. We noemen deze ‘platte’ METS. Hij is ‘plat’ omdat de hiërarchie van de bestanden, zoals deze voortkomt uit groeperingen – denk bijvoorbeeld aan archiefdossiers uit een doos of de jaargang van een tijdschrift –, hierin niet is opgenomen. Hiervoor wordt een apart hiërarchisch METS-bestand gemaakt. Deze refereert voor elke groep naar het ‘platte’ METS-bestand. Het hiërarchische bestand wordt gebruikt bij het weergeven van de groepering van scans in module 2.

Deze opdeling in verschillende soorten METS-bestanden sluit goed aan bij de gekozen modulaire opzet. Bij omvangrijke archieven bestaat bovendien het risico dat een METS-bestand erg groot wordt, wanneer daarin zowel de volgorde als de hiërarchische structuur is gecodeerd. De omvang leidt tot moeilijkheden bij het op tijd kunnen verwerken van de informatie, wat ongewenste vertraging oplevert bij de presentatie op de website.

‘Platte’ METS-bestanden hebben nog een paar andere voordelen: er is geen afhankelijkheid van enig METS-profiel en in theorie kan elk METS-bestand aan de viewer aangeboden worden.

METS-bestanden maken

METS-bestanden zijn xml-bestanden en daarom technisch van aard. Het is voor een computerspecialist met enige kennis van zaken mogelijk met de hand xml-bestanden te maken. Dit is echter niet heel efficiënt en soms is de benodigde kennis ook niet voorhanden.

METS-bestanden kunnen ook gemaakt worden met behulp van specifieke software die door informatieprofessionals eenvoudiger kan worden bediend. Aanvullend op de viewer is in het project ook dergelijke software gemaakt.

Vrijheid

De introductie van zowel METS als de METS-viewer in een organisatie heeft een paar belangrijke voordelen. Ze hebben allemaal te maken met de keuzevrijheid voor verschillende onderdelen in de informatiehuishouding.

Allereerst kan er de onafhankelijkheid worden gerealiseerd van de plaats waar de scans zich bevinden, de plaats waar de METS-bestanden zijn opgeborgen en de plek waar de viewersoftware is geïnstalleerd. Er kunnen dus verschillende computers op verschillende locaties worden gekozen, als ze maar met elkaar in verbinding staan via internet. Om de software te kunnen testen, is bijvoorbeeld de software op een IISG-testserver gebruikt, terwijl de scans en METS-bestanden zich bevonden op www.aletta.nu.

Ook de mogelijkheid om module 1 (met volgorde presentatie) of module 2 (met presentatie van de groepering) onafhankelijk van elkaar te gebruiken, geeft de erfgoedinstelling de vrijheid om onderdelen naar eigen wens op haar website te integreren. Zowel bij IISG als bij Aletta E-Quality is op de website in eerste instantie gebruik gemaakt van module 1 voor de presentaties van gescand archiefmateriaal. De viewer functioneert daarbij binnen de presentatie van de archiefinventaris die er al was. De introductie van module 2 zal op een ander moment, waarschijnlijk bij de presentaties van tijdschriften, plaatsvinden.

Ten slotte: omdat METS een open standaard is, kunnen METS-bestanden door elke computerspecialist op elk computerplatform worden verwerkt. Mocht in de toekomst elders een betere viewer beschikbaar komen, dan is de overstap relatief eenvoudig.

Tot slot

Het project is op 31 januari afgerond en opgeleverd, en voor de zomer officieel gepresenteerd. De software is momenteel beschikbaar voor erfgoedinstellingen die de software willen inbouwen in hun website. Op www.github.com/iish/visualmets/ staat zowel de sourcecode als een compleet softwarepakketje (in de vorm van een zogenaamde ‘war-file’).

De METS-viewer is nog niet volwassen: we hopen dat we haar kunnen laten opgroeien, door gezamenlijk bij te dragen aan haar ontwikkeling. Instellingen kunnen dat doen door de viewer te gebruiken en fouten vast te stellen, onderzoekers en een breed publiek kunnen aangeven welke functies handig zijn en welke er ontbreken. Maar het belangrijkste is dat instellingen investeren in het doorvoeren van gewenste wijzigingen. Dit kan in overleg met de ontwikkelaars bij het IISG, maar kan ook zelfstandig worden opgepakt: de sourcecode is beschikbaar en iedereen kan daaraan (laten) bijdragen. En dankzij de modulaire opzet kan de gemeenschap van softwaregebruikers de viewer eenvoudig uitbreiden door extra functies en nieuwe modules toe te voegen.

Op dit moment implementeren Aletta E-Quality en het IISG de viewer in de eigen websites. We nodigen archiefdiensten en universiteitsbibliotheken uit de viewer binnenkort in te zetten om archiefcollecties en gedigitaliseerde publicaties op de eigen websites beschikbaar te stellen.

Jerry de Vries is werkzaam bij het Internationaal Instituut voor Sociale Geschiedenis als informatieanalist.

Ivo Zandhuis werkt als zelfstandig ICT-adviseur bij de digitale ontsluiting van culturele informatie en was namens Aletta E-Quality bij Visual METS betrokken.

Deze bijdrage komt uit IP nr. 9 / 2012. Het gehele nummer kun je hier lezen