Door: Irene Haslinger en Lotte Wilms
Het online platform Europeana brengt Europees gedigitaliseerd erfgoed samen en maakt dit voor iedereen toegankelijk via een gemakkelijke zoekmachine. Bibliotheken, archieven en musea kunnen bij Europeana hun digitale collecties beschikbaar stellen voor het bredere publiek door hun metadata te laten aggregeren. Deze metadata bevatten ook een link naar het originele object bij de instelling zelf, zodat de bezoeker daar kan aankloppen om het boek, schilderij, kaart of foto in groter formaat te bekijken. De Europese Commissie steunt Europeana door in het ICT Policy Support Programma subsidies uit te schrijven voor het aanleveren van nieuw materiaal of het werken met de al bestaande collectie.
Europeana bevat momenteel zo’n 26 miljoen objecten, waarvan 9,3 procent uit Nederland afkomstig is. Hiermee staat Nederland op de derde plaats in de top-15 van landen in Europeana. Kranten zijn nog nauwelijks te vinden in Europeana. Dit komt onder meer doordat er in de Europeana-portal alleen op metadata kan worden gezocht, terwijl de toegevoegde waarde van gedigitaliseerde kranten juist de full-text zoekmogelijkheden zijn. Helaas is het maken van full-text doorzoekbaarheid lastig voor kranten, en daarom hebben veel Europese bibliotheken zich nog niet aan deze taak gewaagd.
Het project Europeana Newspapers vindt dit een gemiste kans en heeft een oplossing bedacht. 18 Europese partners werken samen om meer dan 18 miljoen gedigitaliseerde krantenpagina’s uit vier eeuwen beschikbaar te stellen via Europeana. Eerst worden 10 miljoen krantenpagina’s verrijkt met Optical Character Recognition (OCR), artikelherkenning en/of Named Entity Recognition. Samen met de overige 8 miljoen, deels al verrijkte, gedigitaliseerde pagina’s wordt deze collectie vervolgens doorzoekbaar gemaakt bij een partner van Europeana, The European Library (TEL). Zij werken aan een portal speciaal voor deze kranten. De metadata van de kranten worden door TEL weer doorgeleverd aan de hoofdportal van Europeana, zodat ook daar een ingang is in het krantenmateriaal.
Het project loopt drie jaar, waarvan nu een jaar is verstreken. Begin 2015, als het project is afgerond, is er een uniek krantencorpus dat zicht biedt op de nieuwsgaring en verslaglegging in Europa, niet alleen in de verschillende kranten, maar ook in de verschillende landen.
Irene Haslinger is programmamanager Europese Projecten.
Lotte Wilms is projectleider Europese Projecten bij de Koninklijke Bibliotheek.
Deze bijdrage komt uit IP nr. 3 / 2013. Het gehele nummer kun je hier lezen