De Digitale Bibliotheek voor de Nederlandse Letteren (DBNL), een digitale collectie van teksten die behoren tot de Nederlandse letterkunde, taalkunde en cultuurgeschiedenis, bestaat twintig jaar. Karin Eggink vertelt over haar werk als bureauredacteur.
Door: de redactie
Hoe lang werk je voor de DBNL?
‘In totaal werk ik nu zes jaar voor de DBNL, in een leuk en klein team. Als bureauredacteur coördineer ik het proces van boek tot digitale, doorzoekbare tekst op de website. Daarbij hoort bijvoorbeeld ook het in de gaten houden van de kwaliteit van teksten en metadata, het onderhouden van onze databases en website en het versturen van de maandelijkse nieuwsbrief.’
Hoe groot is inmiddels de collectie?
‘Er zijn 15.000 titels full-text beschikbaar en daarnaast nog 15.500 titels als scan.’
De werken dienen heel nauwkeurig te zijn ten opzichte van het origineel. Hoe werkt dat? En worden de teksten overgetypt?
‘Onze leverancier maakt van het origineel een digitaal doorzoekbare tekst op basis van onze instructies. Dat ze alle teksten overtypen is een mythe! Ze gebruiken een combinatie van tekstherkenningssoftware en handmatige controles. Die tekst moet 99,995% correct zijn: er mag maximaal 1 fout in 20.000 aanslagen zitten.’
Jullie werken volledig digitaal, of toch niet?
‘Ha! Dat zou je inderdaad verwachten, maar voor een digitale bibliotheek gebruiken we nog best veel papier. Voor onze leverancier moeten we allerlei instructies toevoegen, zodat ze weten welke structuur en metadata ze moeten aanbrengen. Dat gaat nu nog het beste met pen en papier, maar we werken aan een digitale oplossing.’
Hoe komen de verrijkingen in het DBNL-corpus tot stand?
‘We signaleren verwijzingen in de teksten die we digitaliseren: auteurs, titels, plaatsnamen, datums, enzovoort. Die koppelen we aan informatie uit onze databases.’
Welke ontwikkelingen heeft de website in die twintig jaar doorgemaakt?
‘In de loop der jaren zijn allerlei functionaliteiten toegevoegd, zoals de Atlas en het Calendarium. Ook zijn we ebooks van onze teksten gaan aanbieden; inmiddels zijn dat er zo’n 5.000.’
Deze bijdrage komt uit IP nr. 1 / 2019. Het gehele nummer kun je hier lezen.