AI-modellen mogelijk illegaal getraind met beelden van Nederlandse makers

Het lijkt er sterk op dat de AI-modellen van OpenAI en Midjourney zonder toestemming zijn getraind met beelden van Nederlandse makers. Dat blijkt uit onderzoek van de NOS. Daarmee hebben de techbedrijven mogelijk inbreuk gemaakt op het auteursrecht.

Voor het onderzoek werd de AI-modellen gevraagd afbeeldingen te genereren in de stijl van verschillende bekende Nederlandse beeldmakers, onder wie Erwin Olaf, Eddy van Wessel en Dick Bruna. Daarbij kwamen telkens karakteristieke eigenschappen van bekende werken naar voren. Zo genereerden de AI-modellen afbeeldingen van vrouwen in een gele jurk, net zoals in een fotoserie van Erwin Olaf. In het geval van Eddy van Wessel leverde de zoekopdracht zwart-witafbeeldingen van oorlogsgebieden op, scènes waar de fotograaf om bekendstaat.

Opvallend is dat het maken van afbeeldingen in de stijl van bepaalde artiesten met DALL-E van OpenAI (het bedrijf achter ChatGPT) soms wordt geweigerd, omdat het in strijd zou zijn met de voorwaarden van het bedrijf. Door het opnieuw te proberen in een ander tabblad lukt het echter vaak alsnog, zo constateerde de NOS.

Data nabootsen

De NOS legde de resultaten voor aan vier experts op het gebied van AI: Evangelos Kanoulas en Efstratios Gavves van de Universiteit van Amsterdam, Olya Kudina van de TU Delft en Noelle Cicilia van Brush AI. Zij zeggen allen dat, hoewel het niet met honderd procent zekerheid te zeggen is, het er zeer sterk op lijkt dat de AI-modellen zijn getraind met de Nederlandse werken. ‘Het gaat hier om een heel generieke omschrijving’, zegt Kanoulas. ‘Toch zijn de AI-modellen in staat om alleen op basis van iemands naam een associatie te maken met bijvoorbeeld een gele jurk.’ Cicilia benadrukt dat een AI-model niet zelf creatief is. ‘Generatieve AI-modellen proberen slechts de data waarop ze zijn getraind zo goed mogelijk na te bootsen of te reproduceren.’

Schending auteursrecht

‘Als werken zijn beschermd, wordt een schending van het auteursrecht over het algemeen vrij snel aangenomen als iemand ermee aan de haal gaat’, zegt Mirjam Elferink, advocaat intellectueel eigendomsrecht bij Elferink & Kortier. Er is echter een uitzondering voor het verzamelen van openbare gegevens: ‘Deze geldt bijvoorbeeld voor wetenschappelijke instellingen, maar ook commerciële partijen kunnen hiervan gebruikmaken zolang rechthebbenden geen expliciet bezwaar hebben gemaakt: de zogeheten opt-out.’

Voor de werken van Dick Bruna en Eddy van Wessel is gebruikgemaakt van zo’n opt-out, waardoor mogelijk sprake is van een schending van het auteursrecht. Bij Erwin Olaf is dat niet het geval, zegt Shirley den Hartog, die nu zijn werk beheert: ‘We hebben voor zijn overlijden besproken dat het juist heel mooi zou zijn als mensen over de hele wereld met zijn werk bezig blijven.’

Onduidelijkheid

‘Het is goed om te weten dat de uitzondering op het auteursrecht in de wet is gekomen voordat deze AI-tools publiekelijk toegankelijk werden’, zegt Elferink. Dat leidt volgens haar nu tot onduidelijkheid over de toepassing ervan op het trainen van AI-modellen. ‘Het jammere is dat er in Nederland vooralsnog geen rechtszaken over dit onderwerp zijn geweest, waardoor de rechter zich nog niet over dit vraagstuk heeft kunnen uitspreken.’ In de Verenigde Staten lopen wel meerdere rechtszaken, maar zijn er nog geen uitspraken. (Zie ook een artikel hierover in het meimagazine van Informatieprofessional, IP #4-2024).

Opt-out

De Europese AI Act, die sinds deze maand van kracht is, lijkt aan te sluiten bij de opt-outsystematiek. Beeldmakers moeten aangeven dat ze hun opt-outrecht willen gebruiken, techbedrijven moeten vervolgens transparant zijn over hoe modellen zijn getraind en kunnen aantonen dat ze geen inbreuk maken op het auteursrecht.

Het probleem met opt-out is dat deze eigenlijk moet worden toegepast voordat AI getraind wordt met het werk, zegt Hanneke Holthuis, jurist bij Pictoright. ‘Eenmaal getraind is het voor een AI-systeem moeilijk om specifieke data te “ontleren”. Dit betekent dat werken die niet onder een opt-out zijn gepubliceerd voordat de AI werd getraind, mogelijk onomkeerbaar zijn gebruikt.’ Nederlandse beeldmakers kunnen op optoutnow.ai aangeven dat ze hun opt-outrecht willen gebruiken.

OpenAI wilde niet inhoudelijk reageren op het onderzoek, schrijft de NOS, maar verwees onder meer naar de mogelijkheid voor beeldmakers om bezwaar te maken. Midjourney heeft niet gereageerd op de vragen van de NOS.


Beeld boven: links een foto van Erwin Olaf, rechts door AI gegenereerd beeld in zijn stijl.