Archipelproject: op weg naar een Vlaams Instituut voor Audiovisuele Archivering

Het nieuwe Vlaams Instituut voor Audiovisuele Archivering (VIAA) wacht nog op definitieve beslissingen van de overheid. Intussen laat het Archipelproject met een handboek en een demonstratieplatform zien wat er mogelijk is op het gebied van digitaal archiveren en delen van beeld en geluid.

Door: Jeroen Poppe, Sam Coppens en Olga Van Oost

In Vlaanderen wordt een grote diversiteit van actoren die actief zijn in de kunsten, het cultureel en wetenschappelijk erfgoed en het onderwijs- en onderzoeksveld, geconfronteerd met de technische en organisatorische uitdagingen van digitale langetermijnarchivering. In het Archipelproject is onderzocht hoe een netwerkgerichte aanpak kan bijdragen tot het opzetten van een digitale archiefinfrastructuur in Vlaanderen. Hiervoor zijn verschillende innovatieve technologische oplossingen onderzocht en getest. Het project had betrekking op zowel audio, video, foto’s, tekst, mixed media alsook complexere datasets uit de humane wetenschappen, met uitzondering van software. Dit alles in aanloop naar het Vlaams Instituut voor Audiovisuele Archivering (VIAA), dat waarschijnlijk gehuisvest wordt op de site van De Waalse Krook,1 samen met een bibliotheek en een centrum voor nieuwe media (zie het kader onderaan dit artikel).

 

architectuur demonstratieplatform VIAA

 

Met het digitaliseren van documenten zijn de meeste organisaties intussen wel vertrouwd. Maar wil men geluidsopnames of bewegend beeld digitaliseren, dan komt men in een andere wereld terecht. Een wereld die de meeste organisaties veel minder goed kennen. Archipel leverde verschillende hulpmiddelen op die de digitaliserende organisaties een heel eind op weg brengen. Dit zowel op technisch als op organisatorisch vlak. Om te beginnen is er een uitgebreid online handboek2 samengesteld. Dit handboek bevat informatie over zowel de organisatorische als de technische kant van het digitaliseren. Ook het voortraject, met voorbereidingen zoals het schoonmaken en restaureren van de dragers, komt aan bod. Auteursrechtelijke kwesties worden eveneens in dit handboek behandeld.

Naast het boek bracht Archipel een planningstool uit waarmee men een digitaliseringsproject kan voorbereiden en beheren. Dit is een sjabloon in het opensourceprogramma OpenProj en kan vrij worden bewerkt. Na het verzamelen van de informatie over dergelijke projecten ontwikkelde Archipel materiaal voor een driedaagse cursus. Deze cursus is in het voorjaar van 2011 gehouden.

Digitaal archiveren en ontsluiten

Het demonstratieplatform van Archipel richt zich op twee zaken: disseminatie van metadata zoals linked open data, al dan niet met aan die metadata gekoppelde digitale objecten, en de langdurige archivering van de digitale objecten alsook van hun metadata.

Maar wat is linked open data4 eigenlijk? Dit is een manier van metadata publicatie, waarbij de metadata ook worden aangeboden in een machineleesbare variant, die andere platformen/machine-agents gemakkelijk de data laat interpreteren. Tevens zijn de beschrijvingen hier ‘resource-based’, wat wil zeggen dat elke entiteit waarnaar wordt gerefereerd in de metadata, een aparte resource wordt. Dit laat ‘disambiguatie’ toe: een naam van een persoon is niet uniek, maar een resource die de persoon beschrijft wel. Alle gelinkte informatie kan op deze manier ook worden aangeboden aan de eindgebruikers als verwante informatie.

Een voorbeeld hiervan is een persoon. Deze kan in de metadata als een string worden meegegeven. In linked open data krijgt deze persoon een aparte resource en de string wordt dan de naam van die resource. Dit laat toe om de resource te linken met andere resources op het web die dezelfde persoon beschrijven, zoals een persoon uit Dbpedia.3 Dbpedia is een initiatief met als doel informatie uit Wikipedia als linked open data beschikbaar te maken.

Repository’s aan elkaar koppelen

Archipel is uitgegaan van een toekomst waarin verschillende organisaties elk een eigen repository hebben om hun content te bewaren en online te ontsluiten. De vraag was hoe men deze repositories aan elkaar kan koppelen. Dit is gebeurd via het OAI-PMH-protocol (Open Archives Initiative, Protocol for Metadata Harvesting),5 een uitwisselingsprotocol voor metadata. Dit laat het demonstratieplatform toe om de metadata uit de repositories te trekken, te mappen naar een gemeenschappelijk metadatamodel (Dublin Core), om te vormen naar linked open data en vervolgens op te slaan in een triplestore (opslagsystemen voor (meta) data die in RDF zijn uitgedrukt).

 

basisconcepten OAI-PMH

 

Het gebruik van een triplestore versnelt het uitvoeren van zoekopdrachten op heel grote hoeveelheden metadata. Een triplestore is een semantische databank die niet alleen trefwoorden bevat, maar ook de relatie tussen het trefwoord en het object beschrijft. Dat maakt het mogelijk om op een slimme manier te zoeken. Tevens ondersteunt zo’n triplestore het publiceren van zijn metadata als linked open data. Het achterliggende idee is om niet alleen zoekresultaten te leveren die de gebruiker vraagt, maar ook verwante informatie die voor de eindgebruiker interessant kan zijn.

SPARQL-Drupalintegratie

Boven op het demonstratieplatform bouwde Archipel verschillende websites. Deze websites hebben toegang tot alle geharveste en gelinkte metadata. De geharveste metadata zijn afkomstig van verschillende repositories die elk hun eigen metadatamodel gebruiken. Het platform heeft deze metadata gemapt naar Dublin Core, om alle verzamelde data uit de verschillende repositories als één geheel te kunnen doorzoeken en beheren. Dit heeft als voordeel dat de websites slechts één metadatamodel moeten ondersteunen (Dublin Core) om alle data te kunnen doorzoeken en raadplegen. De geharveste metadata zijn te bevragen via SPARQL, een semantische zoektaal.

SPARQL is door Archipel gekoppeld aan het contentmanagementsysteem Drupal. Dit laat toe om Drupal-views te genereren op basis van SPARQL-zoekopdrachten via de SPARQL-Viewsmodule. Deze SPARQL-Drupalintegratie was nog nooit eerder verwezenlijkt.

Websites op maat

De verschillende websites koppelden behalve het demonstratieplatform ook nog andere databanken die van nut konden zijn voor de website en zijn doelgroep. De metadata van deze andere databanken worden dus niet gekopieerd naar het demonstratieplatform, maar worden via een federated search geraadpleegd. Bij een zoekopdracht op een website wordt dus niet alleen de content doorzocht die op het platform zelf is opgeslagen, maar ook de content van andere repositories. Hierdoor kan elke website op maat, dat wil zeggen voor verschillende doelgroepen, gebouwd worden.

Een paar voorbeelden:

 

Er was ook een demosite over Vlaamse toneelgeschiedenis, gebouwd door het VTi (Vlaams Theater Instituut). Daarnaast werden twee toegangen gebouwd die niet toegankelijk zijn voor het publiek: één voor het hoger onderwijs en wetenschappelijk onderzoek en één voor leerobjecten voor het secundair onderwijs.

Preserveringsmetadata

Het demonstratieplatform is er niet alleen voor het raadplegen en verspreiden van audiovisueel materiaal. Men kan ook content aanbieden voor archivering. Hiertoe heeft het project OAIS6 gevolgd. Er wordt dus echt gearchiveerd met het oog op bewaring en raadpleging op zeer lange termijn.

Bijzondere aandacht verdient het gebruik van preserveringsmetadata. De bestaande PREMIS-standaard voor preserveringsmetadata is door Archipel en enkele buitenlandse partners ontwikkeld en geïmplementeerd als PREMIS OWL.7 Deze variant van PREMIS heeft preserveringsmetadata de wereld van de semantisch webtechnologie binnengebracht. Preserveringsmetadata houden alle informatie bij omtrent het aanpassen van de content voor langetermijnbewaring, bijvoorbeeld over migratiebewegingen. De Library of Congress zorgt voor een blijvende ondersteuning van PREMIS OWL.8

Archipel introduceerde voor het demonstratieplatform de opensourcesoftware Mediamosa.9 Met Mediamosa konden instellingen die dat tot nu toe nog niet hadden gedaan, hun content online ontsluiten en zo via OAI-PMH ook toegankelijk maken op het demonstratieplatform. Momenteel bestuderen verschillende erfgoedorganisaties de mogelijkheid om samen een digitaal archief met Mediamosa op te zetten. Mediamosa wordt dan verder uitgebouwd om buiten de verspreiding van de content ook de langdurige preservering ervan te ondersteunen. Wie zelf een e-depot wil opzetten kan terecht op website van Archipel, waar gedetailleerde technische informatie staat over de werking van het demonstratieplatform.

 

disseminatieworkflow en archiveringsworkflow in demonstratieplatform

Tot slot

Het Archipelproject bracht de verspreiding en bewaring van culturele digitale objecten op de voorgrond. Het project droeg bij tot een meer diepgaande kennis van onder andere digitaliseren en digitaal archiveren. De nieuwe kennis stroomde de sector binnen door publicaties, congressen, cursustrajecten, enzovoort. En met korte films sensibiliseerde Archipel zowel de sector, de beleidsmakers als het grote publiek voor de uitdagingen en mogelijkheden van een digitale cultuur.


Waar blijft het VIAA?

De Vlaamse regering verrichtte de voorbije jaren inspanningen om kennis en technologie op te bouwen rondom het digitaal archiveren. Eerst was er BOM-Vlaanderen (media & cultuur), daarna Archipel (cultuur) en zusterproject Vlaanderen in Beeld (media) en toen… werd het stil. De drie projecten zouden leiden tot een digitale archiefdienst (VIAA) voor audiovisuele content en later ook andere culturele content. De oprichting van een dergelijk instituut staat ook in het Vlaams regeerakkoord.

Toch blijft het wachten op een definitieve beslissing. Uiteraard zijn de economische crisis en de daarmee samenhangende besparingen een realiteit waar ook de Vlaamse regering niet omheen kan. Dit neemt niet weg dat Vlaanderen momenteel geen digitaal langetermijnarchief heeft waar men met culturele digitale objecten terecht kan. De regering lijkt ook enige terughoudendheid te vertonen wanneer de stap moet gezet worden van tijdelijke projecten naar structurele financiering.

Langetermijnbewaring is nochtans onmogelijk zonder deze structurele financiering. Hopelijk neemt de regering in de nabije toekomst een definitieve beslissing over de oprichting van het VIAA. De nood aan een dergelijk instituut is immers bijzonder groot.


Projectpartners

Archipel werd gesubsidieerd door het IWT. Het IWT is het Agentschap voor Innovatie door Wetenschappelijk en Technologie9 dat valt onder minister voor Wetenschapsbeleid, Ingrid Lieten. Het project werd bij IWT ingediend en vervolgens uitgevoerd door een consortium van twaalf organisaties. Een lijst met de projectpartners vindt u op de projectwebsite: http://www.archipelproject.be/over-archipel/partners.


Verder lezen

  • Het projectteam ondernam de voorbije twee jaar allerhande initiatieven om aan de nieuwe kennis en hulpmiddelen een bredere bekendheid te geven. Het meest in het oog springende initiatief betrof een reeks grappige korte films over de verschillende onderzoeksdomeinen van Archipel: www.youtube.com/user/faronetvideo.
  • Rapporten met meer gedetailleerde informatie over de onderzoeksresultaten van Archipel: www.archipelproject.be/documenten Ook zijn hier de presentaties van het Archipel-eindevenement en andere publieksevenementen te vinden.

Noten

  1. www.dewaalsekrook.be
  2. www.archipelproject.be/content/deliverable-16-handboekover-het-digitaliseren-en-archivereren-van-audiovisueleobjecten
  3. dbpedia.org/About
  4. www.w3.org/DesignIssues/LinkedData.html
  5. www.openarchives.org/OAI/openarchivesprotocol.html
  6. Open Archival Information System: hét theoretisch model voor een digitaal langetermijnarchief. Dit model werd ontwikkeld door de NASA en andere ruimtevaartorganisaties. public.ccsds.org/publications/archive/650x0b1.PDF
  7. www.archipelproject.be/content/premis-owl-en-premis-21-0
  8. www.loc.gov/standards/premis
  9. www.mediamosa.org

 

Jeroen Poppe was gedurende het Archipelproject werkzaam bij FARO als projectmedewerker. Hij was betrokken bij de meeste deelaspecten van het project, voornamelijk het onderdeel rondom digitaal archiveren en de projectcommunicatie.

Sam Coppens is onderzoeker bij IBBT-MultiMedialab, een onderzoeksgroep van de Universiteit Gent. Hij is specialist in digitaal archiveren en speelde een sleutelrol bij het ontwikkelen van het demonstratieplatform.

Olga Van Oost was verantwoordelijk voor de projectcommunicatie. Ze speelde tevens een belangrijke rol in het maatschappelijk strategisch onderzoek dat binnen Archipel plaatsvond. Ze is verbonden aan FARO en aan de Vrije Universiteit Brussel, onderzoeksgroep IBBT-SMIT.

 

Deze bijdrage komt uit IP nr. 5 / 2012. Het gehele nummer kun je hier lezen