Belgisch AI-bedrijf bouwt taalmodel dat online haatspraak detecteert

AI-bedrijf Textgain bouwt de komende twaalf maanden aan CaLICO, een Large Language Model (LLM) dat haatspraak in alle officiële EU-talen herkent en verwerkt.

Textgain is een AI-spin-off van de Universiteit Antwerpen en won in juni een prijs bij de Large AI Grand Challenge, een competitie voor Europese AI-ontwikkelaars. Aan de competitie deden 94 bedrijven mee. Textgain won niet alleen 250.000 euro, maar ook zo’n 2 miljoen uur ontwikkeltijd op een Europese ‘supercomputer’. Daardoor kan het zijn nieuwe AI-modellen versneld trainen.

Toxische taal

CEO Guy De Pauw: ‘Grote taalmodellen, zeker de commerciële, weigeren om toxische taal te verwerken. Daardoor is het zo goed als onmogelijk om ze in te zetten om bijvoorbeeld haatspraak te verwerken. Wij bouwen nu een eigen taalmodel dat dit soort content wél kan verwerken, maar niet zelf produceert. Dit is uniek op de wereld.’

Het bedrijf zet zich in om maatschappelijke problemen in kaart te brengen met behulp van AI-technologie. ‘De Europese Unie heeft daarvoor strenge normen bepaald’, stelt De Pauw. ‘De technologie moet transparant, uitlegbaar en ethisch zijn.’