Crowdsourcing maakt zeventiende-eeuwse kranten op Delpher beter doorzoekbaar

Op Delpher is vanaf vandaag de transcriptie van 6000 Nederlandstalige kranten uit de zeventiende eeuw en een deel van de Tweede-Wereldoorlogskranten doorzoekbaar. Vrijwilligers hebben de afgelopen vijf jaar de krantenartikelen handmatig overgetikt en daarna het resultaat nog eens gecorrigeerd. Het crowdsourcingproject is uitgevoerd als samenwerking tussen de KB en het Meertens Instituut, onder leiding van senior onderzoeker Nicoline van der Sijs.

De zeventiende-eeuwse kranten stonden al geruime tijd op Delpher, maar waren tot nu toe niet tot nauwelijks doorzoekbaar. De computertechnologie waarmee de kranten automatisch waren gelezen, kon namelijk niet overweg met de oude schriften waarin de kranten waren gezet: het gotische schrift en later een Romeins schrift dat afwijkt van het moderne. Als gevolg hiervan werden de meeste woorden die gebruikers in de oude kranten zochten, niet gevonden. En áls een woord werd gevonden stond er meestal iets anders in het origineel.

Crowdsourcing
Mensen kunnen, anders dan de computer, wél overweg met de oude schriften en het archaïsche taalgebruik. Om de toegankelijkheid van de kranten te vergroten hebben de KB en het Meertens Instituut daarom vijf jaar geleden een crowdsourcingproject opgezet. Op het Meertens Instituut is een speciale applicatie gebouwd, die het de vrijwilligers mogelijk maakte om de tekst handmatig te transcriberen. Uiteindelijk hebben meer dan tweehonderd vrijwilligers zo’n 6000 kranten met maar liefst 18 miljoen woorden handmatig overgetikt.