KB stelt rechtenvrije collecties beschikbaar voor Nederlands AI-model

De KB stelt grote aantallen digitale teksten in haar collecties ter beschikking die moeten gaan bijdragen aan een ethisch verantwoord AI-taalmodel. Daarvoor heeft de nationale bibliotheek een overeenkomst getekend met GPT-NL, het samenwerkingsverband dat dit Nederlandse taalmodel ontwikkelt.

Het project GPT-NL vormt een belangrijke reactie op commerciële AI-modellen als ChatGPT en Gemini. GPT-NL ontwikkelt een ethisch verantwoord AI-taalmodel voor de Nederlandse taal en cultuur. Daarbij worden uitsluitend rechtmatig verkregen data gebruikt. De KB ondersteunt de ontwikkeling van GPT-NL, ‘juist omdat het project expliciet aandacht besteedt aan verantwoord datagebruik, eerlijke afspraken met auteursrechthebbenden en het zorgvuldig omgaan met cultureel erfgoed’. 

GPT-NL wordt momenteel getraind met alle rechtenvrije digitale teksten uit de KB-collecties en de data die andere partijen beschikbaar hebben gesteld. Dat zijn onder meer ICTRecht, Het Utrechts Archief en De Nederlandsche Bank. Eind 2025 moet een eerste versie van GPT-NL beschikbaar zijn.