TNO en de leden van NDP Nieuwsmedia (de dagbladen- en nieuwsmedia-uitgevers) slaan de handen ineen voor de verdere ontwikkeling van GPT-NL. Dat is het eerste grootschalige Nederlandse AI-taalmodel dat volledig wordt getraind op rechtmatig verkregen data. De leden van NDP Nieuwsmedia stellen een omvangrijk deel van het archief van nieuwsartikelen van meer dan 30 landelijke en regionale nieuwstitels beschikbaar om het taalmodel verder te trainen.
Verwachting is dat hiermee een verdubbeling komt van de hoeveelheid hoogwaardige Nederlandse data waarop het model wordt getraind. Ook persbureau ANP sluit zich aan bij het collectief. Het is wereldwijd de eerste keer dat nieuwsuitgevers op deze manier samenwerken met een organisatie die een AI-model ontwikkelt.
Vergoeding uitgevers
Daarmee ondersteunen Nederlandse nieuwsuitgevers de gezamenlijke ambitie van GPT-NL en de Nederlandse overheid om een taalmodel te realiseren dat een voorbeeld moet zijn van hoe om te gaan met nieuwsartikelen in AI-systemen. Daarbij zijn er strikte afspraken gemaakt die voorkomen dat de artikelen via technische weg uit het model kunnen worden gehaald. Als het model op de markt wordt gebracht zullen uitgevers een passende vergoeding ontvangen.
GPT-NL is een initiatief van non-profitorganisaties TNO, NFI en SURF en moet een verantwoord alternatief bieden voor internationale modellen, die ‘een kopie van het internet’ gebruiken als trainingsmateriaal. GPT-NL gaat volgens de initiatiefnemers zorgvuldig en ethisch te werk bij het verzamelen van auteursrechtelijk beschermde data. Degenen die met hun content bijdragen worden daarvoor beloond. Hiermee voldoet het aan de Europese wet- en regelgeving zoals de AI-Act. Het taalmodel wordt ontwikkeld voor specifieke taken: samenvatten, versimpelen en het extraheren van informatie uit tekst.
Precedent
Voorzitter van NDP Nieuwsmedia Rien van Beemen: ‘“’Internationale modellen van Big Tech zijn zonder toestemming en vergoeding massaal getraind met de artikelen van nieuwssites. De samenwerking tussen de leden van NDP Nieuwsmedia en TNO laat zien dat het ook anders kan. We scheppen met deze beweging een precedent waarmee we de positie van de journalistiek in Nederland op termijn verstevigen.’
Eerder stelde KB zijn rechtenvrije collecties al beschikbaar voor GPT-NL.