Catchplus tools en diensten opgeleverd: nieuwe gereedschappen voor informatieprofessionals

Draaide CATCH (Continuous Access To Cultural Heritage) om onderzoeksprojecten, het vervolg erop, CATCHPlus, had een veel praktischer insteek: het bouwen en implementeren van werkende producten door en voor erfgoedinstellingen. Het resultaat is een reeks nieuwe gereedschappen voor informatieprofessionals die nu open source beschikbaar zijn.

Door: Patricia Alkhoven

Zoeken in ‘vervuilde’ databases? Handgeschreven indexen automatiseren? Uw eigen thesaurus combineren met andere thesauri? Op zoek naar hoe dat leuke liedje ook al weer klonk? Samenwerken aan beschrijvingen in een virtuele werkruimte? Persoonlijke suggesties krijgen bij het zoeken naar schilderijen?

Bovenstaande vragen zijn meestal niet direct te beantwoorden door de erfgoedprofessional. Digitalisering vraagt namelijk ook om nieuwe gereedschappen om collecties te doorzoeken. Iemand die bijvoorbeeld zoekt naar een gesproken fragment uit een radio-uitzending, zal in de meeste gevallen vele uren banden moeten afluisteren. Het vinden van alle fragmenten gesproken tekst van een bepaalde persoon in een bepaalde periode lijkt op het zoeken naar de spreekwoordelijke naald in een hooiberg. De software van CHORALPlus segmenteert en transcribeert de gesproken tekst waardoor zoeken in audiobestanden makkelijker wordt en snel tot relevante resultaten leidt. CHORALPlus is onderdeel van het recentelijk opgeleverde CATCHPlusproject dat diverse oplossingen biedt voor de dagelijkse beheerspraktijk van de erfgoedinformatieprofessional.

Bruikbare producten

CATCHPlus bouwde van 2009 tot en met 2012 voort op het lopende NWOonderzoeksprogramma ‘Continuous Access To Cultural Heritage’ (CATCH). Het project is uitgevoerd binnen een samenwerkingsverband van negen erfgoedinstellingen en twee kennisinstellingen. In CATCHPlus werden de prototypes en demo’s uit acht van de afgeronde deelprojecten van CATCH omgezet in bruikbare tools. Terwijl de CATCH-projecten echte onderzoeksprojecten waren waarbij onderzoekers als embedded researchers bij erfgoedinstellingen en bedrijven werden ondergebracht, ging het in CATCHplus om de valorisatie: het bouwen en implementeren van werkende producten door en voor erfgoedinstellingen. Software die in meerdere instellingen benut kan worden en die solide is.

Het project is financieel mogelijk gemaakt door het ministerie van Onderwijs, Cultuur en Wetenschap, het voormalige ministerie van Economische Zaken, Landbouw en Innovatie (PRIMA) (nu ministerie van Economische zaken) en NWO. Daarnaast hebben de betrokken erfgoedinstellingen, gelieerde kennisinstellingen en vaak de ingehuurde bedrijven ook een aanzienlijke extra eigen bijdrage geleverd.

Doordat grote erfgoedinstellingen, universiteiten en bedrijfsleven in CATCHPlus samenwerkten, is een nieuw knooppunt ontstaan tussen ict en erfgoed. Daarnaast bevorderen de producten de samenwerking en samenhang in de informatie-infrastructuur van de erfgoedsector.

Succesfactoren en valkuilen

Op dit moment zijn alle projectonderdelen opgeleverd – op een paar puntjes na die nog enige fine tuning vereisen – en zijn ze open source beschikbaar. Niet voor het eerst kan worden geconcludeerd dat een goede communicatie de rode draad is die alle projectonderdelen met elkaar verbindt: het is van groot belang voor de sfeer, betrokkenheid, bereidheid tot samenwerken en uiteindelijk het welslagen van het project. Daarnaast bleek een technische coördinator die alle onderdelen nauwlettend in het oog houdt, voortdurend bijstuurt en de verschillende onderdelen waar mogelijk met elkaar verbindt, cruciaal voor het succes van de eindproducten.

Het project begon met een rijk startkapitaal van halfproducten, proof of concepts, artikelen en dissertaties. De valorisatiestap – er werkende producten van maken – bleek soms lastiger. Want in de praktijk bleken de voorbereidende werkzaamheden voordat het bouwen zelf kon starten, bijna de helft van de projectperiode in beslag te nemen. Vaak waren er heel wat bijeenkomsten nodig om alle neuzen dezelfde kant op te krijgen, precieze functionele en technische beschrijvingen op te stellen of meer draagvlak te creëren voor het eindproduct.

Een valkuil blijft de kloof tussen wetenschappelijk onderzoek – onderzoekers willen graag de perfecte, ideale oplossing leveren – en een erfgoedinstelling. De laatste moet rekening houden met randvoorwaarden vaak al bepaald in de missie van de organisatie, bestaande technische infrastructuur, beschikbaar personeel, kennisniveau van personeel, budget, mogelijkheden voor de toekomst enzovoort.

Het valt onderzoekers maar ook technische ontwikkelaars soms niet mee om water bij de wijn te moeten doen en iets te bouwen dat daadwerkelijk kan worden geïmplementeerd in een bestaande omgeving. Wetenschappers zijn dan vaak alweer buiten beeld geraakt, want ze zijn met nieuwe projecten bezig.

Toegankelijkheid

De in CATCHPlus ontwikkelde software optimaliseert het zoeken en navigeren in cultureel-erfgoeddata. De eindproducten worden zowel ingezet binnen de erfgoedinstellingen zelf, als in de interactie met het publiek, dus zowel voor de frontals backoffice. Ze zijn bruikbaar voor de betrokken instellingen én andere collectiebeheerders. Tevens leidt het tot betere standaardisatie en interoperabiliteit tussen de collecties. Duidelijk is dat digitalisering het zoeken naar relevant materiaal enorm verbetert en dat de tools die dat mogelijk maken, een belangrijke rol spelen bij het oplossen van onderzoeksvragen die voorheen amper mogelijk waren.

Duurzame resultaten

Tijdens de projectfase was er geld en aandacht om het noodzakelijke te doen teneinde het project uit te voeren, zoals onderhoud, beheer en huur serverruimte. Moeilijker bleek het om van zoveel mogelijk producten ook het beheer en de doorontwikkeling na afloop van het project te kunnen garanderen.

Aan enkele tools en diensten wordt wel al een vervolg gegeven. Voor de Persistent Identifiers ondersteunt een groep van negen erfgoedpartners een tweejarige pilot samen met het Academisch Rekencentrum SARA. Hoe meer partijen er meedoen, hoe lager de kosten. In die periode kunnen de daadwerkelijke diensten en kosten worden getest. ‘Scratch4all as a webservice’ wordt verder in de markt gezet door Target Holding en er worden serieuze afnemers benaderd voor de handschriftherkenner. OpenSKOS wordt toegepast door een aantal bedrijven en erfgoedinstellingen, en wordt tien jaar gehost.

Om de valorisatie te realiseren, werd van de betrokken erfgoedinstellingen een businessplan gevraagd voor de door hen ontwikkelde ‘tool’ of dienst. Veel erfgoedinstellingen hadden er zichtbaar moeite mee het nieuwe product een plaats te geven binnen de organisatie en missie. Inzet vanaf het begin van het project op het hoogste niveau van de instelling biedt de beste garantie voor zowel ondersteuning en betrokkenheid van het management als voor succesvolle inbedding van het product in de bestaande organisatie.

Uit analyses van deze businessplannen en de markt blijkt dat de erfgoedsector staat voor een belangrijk vraagstuk. Digitalisering en toolontwikkeling bieden namelijk nog geen garantie voor duurzaam beheer, aanbod en doorontwikkeling van die tools. De betrokken partijen ontbreekt het vaak aan kennis en capaciteit om duurzame borging te realiseren. Andere erfgoedinstellingen en marktpartijen blijken niet op de hoogte van het bestaan en van de waarde van de tools.

Erfgoedmakelaar

Kennisland en DEN hebben daarom in nauwe samenwerking met het CATCHPlus Projectbureau een voorstel geschreven voor een erfgoedbrede oplossing voor de borging van de projectresultaten na afloop van het project: Businessplan op hoofdlijnen. De Erfgoed Makelaar. Hierin zouden gemeenschappelijke taken op basis van een nieuw, kostendekkend businessmodel kunnen worden samengebracht.

Het concept van een Erfgoedmakelaar is uniek in de erfgoedwereld: het loopt vooruit op de ondernemende erfgoeddirecteur die instellingsoverstijgend denkt.

Het idee heeft inmiddels ingang gevonden bij de Topsector Creatieve Industrie en is opgenomen in het werkplan van het innovatienetwerk CLICKNL Cultural Heritage. De verwachting is dat de makelaar een belangrijke bijdrage kan leveren aan het beschikbaar houden van de resultaten waarop nationaal en internationaal talloze spin-offs gebaseerd worden. Vermarkting en winst maken – of zelfs het product kostendekkend krijgen – blijkt in de erfgoedwereld een illusie: de vraag is te diffuus om er een commercieel businessmodel voor te ontwikkelen. In plaats van te focussen op winstgevendheid zal de toegevoegde waarde eerder gezocht moeten worden in spin-offs of nevenproducten die worden ontworpen op basis van de ontwikkelde technologie. Alle software is immers open source beschikbaar; dat was een van de voorwaarden voor het project.

De creatieve industrie blijkt ook zeer gevoelig en bereid te investeren. Zeker wanneer ze voor zichzelf kansen ziet om de eigen expertise te verbeteren. Het betreft het uitvoeren van veelal onbetaalde pilotprojecten waarmee ze inspiratie en ervaring opdoet – om daar bovenop nieuwe producten te bouwen waaruit ze haar business kan halen.

Door nauwe samenwerking tijdens het project zijn de erfgoedinstellingen zichtbaar naar elkaar toegegroeid. In deelprojecten is gewerkt aan software die geënt is op de praktijksituatie van de deelnemende erfgoedinstellingen. De tools zijn bij minimaal één collectie van een andere instelling succesvol getest. De bruikbaarheid van de producten uit CATCHPlus is getest door een onafhankelijke begeleidingscommissie. Deze commissie bestond uit vertegenwoordigers van uiteenlopende erfgoedinstellingen. Via site-visits heeft de begeleidingscommissie kennisgenomen van de deelprojecten, terwijl zij tevens op zich nam de kennis verder te verspreiden, feedback te geven en de eindproducten te evalueren. De site-visits hebben er onder andere toe geleid dat de ZieOok-applicatie samen met de User Profile Repository (UPR) niet alleen in het Amsterdam Museum maar ook in de Theaterencyclopedie van het voormalig Theater Instituut Nederland (TIN) is geïmplementeerd.

Nationale digitale infrastructuur

CATCHPlus toont het effect aan van de overheid op het creëren van een digitale infrastructuur voor innovatie en experiment. Nog mooier zou het zijn de toekomst van deze producten te kunnen garanderen in een infrastructuur waarin wordt voorzien in behoud en doorontwikkeling. De erfgoedsector vraagt erom en is bereid hierin te investeren, maar kan het niet alleen. De kennissector ondersteunt dit van harte en de creatieve sector staat te popelen er ook mee aan de slag te gaan, omdat ze korte- en langetermijnkansen ziet voor zichzelf.

Een les die we hebben geleerd is dat we innovatie het beste stimuleren wanneer erfgoedinstellingen onderling goede afspraken maken en gezamenlijk projecten doen die meer standaardisatie en nieuwe gezamenlijke producten beogen. Innovatie vindt dan ook plaats via kleine stappen, vanuit concrete vraagstellingen uit het veld, gesteund door de overheid. CATCHPlus was een van die stappen.


Deelprojecten van CATCHPlus

SCRATCH4All (Nationaal Archief)

Gedigitaliseerde gedrukte teksten zijn met optische tekenherkenning redelijk goed te doorzoeken, maar voor geschreven teksten is dat bijna onmogelijk. SCRATCH4All biedt een service voor geautomatiseerd herkennen van ingescande historische handschriften.

ChoralPlus (Stadsarchief Rotterdam)

Zoeken in digitale tekst is eenvoudig. Zoeken naar een fragment in een geluids- of videoopname is een stuk moeilijker. Volledige transcripties zijn meestal niet aanwezig en de metadata zijn beperkt. Automatische spraakherkenning maakt het doorzoeken van audiobestanden mogelijk.

WITCHCRAFTplus (Meertens Instituut)

Volksliedjes worden van generatie op generatie doorgegeven. Elke generatie verandert ongemerkt de melodie van deze liedjes, waardoor verschillende varianten van dezelfde liedjes ontstaan. Een speciale online melodieënzoekmachine kan deze variaties helpen opsporen.

MuSeUMPlus (Gemeentemuseum Den Haag)

Een complete database is een utopie. Altijd zijn er wel gegevens die in het verkeerde veld staan, inconsequent zijn of tekstuele of inhoudelijke onjuistheden bevatten. MuSeUMPlus maakt het mogelijk deze ‘vervuilde’ databases te doorzoeken en vervolgens de zoekresultaten te bewerken in een online werkomgeving.

UPR en ZieOok (Amsterdam Museum en Theater Instituut Nederland)

Een bezoeker die een schilderij van de Munttoren wel kan waarderen, heeft misschien ook interesse in andere stadsgezichten van Amsterdam. De applicatie ZieOok kan de bezoeker op basis van zijn persoonlijke profiel suggesties doen voor andere items uit de collectie.

Multiply (Beeld en Geluid)

Stukken uit erfgoedcollecties worden met behulp van trefwoorden beschreven. Als de computer archiefmateriaal automatisch kan indexeren, kan deze ook zelf suggesties doen voor relevante trefwoorden en de documentalist veel werk uit handen nemen.

STITCHPlus (Koninklijke Bibliotheek)

Bij het beschrijven maken erfgoedinstellingen vaak gebruik van meerdere thesauri. STITCHPlus verbindt deze thesauri, waardoor het doorzoeken zinvoller wordt.

DocChecker (Rijksdienst Cultureel Erfgoed)

Concepten uit thesauri van erfgoedinstellingen komen vaak ook al voor in gearchiveerde tekstdocumenten. Het koppelen van de juiste thesaurus-elementen aan deze documenten kost veel tijd. De Doc Checker kan een deel van deze taken overnemen.


Gemeenschappelijke erfgoeddiensten

Gecoördineerd door CATCHPlus Projectbureau

OpenSKOS: een online platform voor thesauri

Het ontwikkelen en beheren van thesauri om collecties mee te beschrijven, is tijdrovend werk. En als ze eenmaal bestaan, zijn ze meestal niet geschikt voor verschillende softwaretools en kosten kleine updates relatief veel technische aanpassingen. OpenSKOS lost deze problemen op.

Workspaces: samenwerken in een digitale werkomgeving In een webgebaseerde wereld waarin verschillende systemen en gebruikers samenwerken aan een taak, is vaak tijdelijke opslag van gegevens nodig. Workspaces biedt een digitale werkomgeving waarin verschillende partners deze werkzaamheden samen kunnen uitvoeren.

Annotation Repository: gestandaardiseerde annotaties online delen en hergebruiken Annotaties kunnen teksten zijn zoals aantekeningen, maar ook webpagina’s, foto’s of multimediale opnames. In dit project is gewerkt aan de uniformiteit van deze annotaties, zodat ze optimaal kunnen worden gebruikt in interne en externe samenwerkingsverbanden.

Persistent Identifiers: vertrouwen op unieke en blijvende identifiers In de archiefsystemen van erfgoedinstellingen wordt met unieke namen of nummers (identifiers) verwezen naar fysieke of digitale objecten uit de collectie. Maar hoe garandeer je dat deze identifiers werkelijk uniek en persistent zijn?


Verder lezen

  • Alle resultaten zijn voor iedereen beschikbaar via www.catchplus.nl. Onder ‘Aan de slag’ staat alle (achtergrond)informatie over de ontwikkelde producten, contactpersonen, inlogprocedures om de tools en diensten te gebruiken, en documentatie.
  • Ook is er een boekje verschenen met beschrijving van alle software: Digitale Innovatie voor het erfgoed (tevens in een Engelse versie beschikbaar). De publicatie is gratis te bestellen via projectbureau@catchplus.nl.

 

Patricia Alkhoven was projectmanager van CATCHPlus (2010-2012) bij Meertens Instituut. Zij is nu projectleider CLARIAH en coördinator van het innovatienetwerk CLICKNL Cultural Heritage.


Deze bijdrage komt uit IP nr. 1 / 2013. Het gehele nummer kun je hier lezen