Doe mee met onderzoek naar lacunes in datasets

Binnen de geesteswetenschappen van de KNAW wil een consortium een onderzoeksagenda voor de toekomst (2025) formuleren, getiteld DESIDERIA (Dutch Extensible and Searchable Infrastructure for Digital Explorative Reading and Information Analysis). Een van de actiepunten betreft het onderzoeken welke lacunes er zijn in bestaande datasets.  Onderzoekers en collectiebeheerders wordt gevraagd een enquête in te vullen.

De agenda van DESIDERIA is gericht op onderzoek aan de hand van grote tekstcorpora en sluit aan bij huidige (inter)nationale projecten als CLARIN en CLARIAH. Zij bouwt voort op bestaande projecten door op drie cruciale punten naar vooruitgang in reeds aanwezige tekstuele digitale infrastructuren te streven. Het accent ligt hierbij op infrastructuren rond Nederlandstalig materiaal, materiaal dat zich voor een belangrijk deel in Nederland bevindt, en taalbeschrijvingen die door Nederlandse onderzoekers zijn gemaakt.
Een van de drie actiepunten betreft een onderzoek naar de lacunes in bestaande datasets die bias veroorzaken. Het betreft bias met betrekking tot de mogelijke representativiteit van de genereerde data, waardoor vernieuwend onderzoek kan worden belemmerd. Ook zal worden gekeken hoe die lacunes met behulp van crowdsourcing kunnen worden opgelost.
Voor dit actiepunt heeft de KNAW een enquête opgesteld. Onderzoekers en collectiebeheerders wordt gevraagd deze enquête in te vullen.