Stadsarchief Amsterdam start project Crowd Leert Computer Lezen

Het Stadsarchief Amsterdam heeft de handschriftherkenningtechnologie van het platform Transkribus gekoppeld aan het crowdsourcingplatform VeleHanden. Dat geeft honderden mensen de mogelijkheid om in het project Crowd Leert Computer Lezen de computer te trainen én te corrigeren. Op die manier wil het Stadsarchief Amsterdam zijn historische, handgeschreven documenten doorzoekbaar gaan maken. Dat meldt het Stadsarchief op zijn site.

De technologie van Transkribus is in Europees verband ontwikkeld aan de Universiteit van Innsbrück. Volgens het Stadsarchief kan de computer de handgeschreven teksten van bijvoorbeeld de zeventiende-eeuwse notaris Hendrik Schaef nu al voor 94% foutloos lezen.

Als lesmateriaal voor de computer worden scans van documenten van het Archief van de Amsterdamse Notarissen gebruikt. Dat heeft de UNESCO-status als Memory of the World vanwege de world significance van de documenten. Het notarieel archief bevat oneindig veel onbekende details en kent een grote verscheidenheid aan teksten en verschillende handschriften. Over bekende en onbekende Amsterdammers en passanten, internationale handel, het leven op straat,  scheepvaart, slavernij, persoonlijk bezit en erfenissen. Het is voor de crowd interessant en tegelijk de beste optie om met deze enorme hoeveelheid verschillende data de computermodellen een boost te geven.

Een belangrijk deel van de 50 kilometer aan historische documenten die het Stadsarchief Amsterdam beheert is handgeschreven. Uiteindelijk wil het Stadsarchief bereiken dat iedereen kan ‘googelen’ op elk woord in oude handgeschreven documenten.

Beeld: Handschrift Notaris Hendrik Schaef, 1644 (foto: Stadsarchief Amsterdam)