Vorige maand heeft Research Data Netherlands (RDNL) voor de zesde keer de Nederlandse Dataprijzen uitgereikt. Onder andere aan de 17e-eeuwse krantenset die door vrijwilligers is getranscribeerd binnen een samenwerkingsproject tussen het Instituut voor de Nederlandse Taal (INT), de Koninklijke Bibliotheek (KB) en het Meertens Instituut.
De dataset bestaat uit de oudste Nederlandstalige kranten, gepubliceerd tussen 1618 en 1700. Door de ouderdom van de tekst en de veelheid aan lettertypes konden deze kranten niet door de computer worden gelezen, maar ruim 200 vrijwilligers brachten uitkomst. Zij tikten de circa 120.000 artikelen over binnen een crowdsourcingsproject dat was opgezet door INT, KB en Meertens Instituut en dat onder leiding stond van Nicoline van der Sijs. Het resultaat is een betrouwbaar full-text doorzoekbaar onderzoekscorpus van circa 20 miljoen woorden, dat sinds mei op Delpher staat.
De drie partijen wonnen de Nederlandse Dataprijs in de categorie sociale en geesteswetenschappen; INT en KB willen het prijzenbedrag van 5000 euro gebruiken om de data via een vervolgproject nog verder te ontsluiten. Aan de vrijwilligers zal worden gevraagd alle Amsterdamse locaties (zoals straten, kroegen en markten) die genoemd worden in de zeventiende-eeuwse krantenartikelen, te identificeren en te koppelen aan een plattegrond van Amsterdam. Het resultaat zal een digitale kaart zijn waarop te lezen is wat waar gebeurde in zeventiende-eeuws Amsterdam en wat de toenmalige hotspots waren.
Projectleider Van der Sijs ziet de Nederlandse Dataprijs als ‘een geweldige erkenning van het maatschappelijk belang en de waarde van citizen science als bijdrage aan wetenschappelijk onderzoek’.
De andere winnende datasets in 2020 zijn:
- STORM (categorie exacte en technische wetenschappen) van Nadia Bloemendaal, Instituut voor Milieuvraagstukken, Vrije Universiteit Amsterdam, die ‘het prijzengeld zal gebruiken om een interactieve website te bouwen waar gebruikers het risico van een tropische cycloon voor elke plaats ter wereld kunnen visualiseren’.
- CoronaWatchNL (categorie medische en levenswetenschappen) van Jonathan de Bruin en CoronaWatchNL-community, Universiteit Utrecht. De Bruin zegt zich aangemoedigd te voelen ‘om aanbevelingen te doen voor het creëren van een FAIR-dataset in crisissituaties, die gecombineerd kunnen worden met de nieuwste inzichten uit research data management, open science en citizen science, zodat data op een FAIR, snelle en transparante manier gepubliceerd kunnen worden als de tijd dringt’.
De Nederlandse Dataprijs is een erkenning voor een onderzoeker of onderzoeksgroep die extra bijdragen levert aan de wetenschap door onderzoeksdata beschikbaar te stellen voor (aanvullend) onderzoek. Uit 44 inzendingen werden drie winnaars van de Nederlandse Dataprijs en drie winnaars van de Aanmoedigings gekozen. De eersten kregen uit de virtuele handen van juryvoorzitter prof. dr. Karel Luyben (rector magnificus emeritus en Nationaal Coördinator Open Science) een sculptuur en 5000 euro uitgereikt. De winnaars van de Aanmoedigingsprijs ontvingen 1000 euro om hun dataset (meer) toegankelijk te maken.
De winnaars van de Aanmoedigingsprijs 2020 zijn:
- Categorie sociale en geesteswetenschappen: MyMovez Project, het MyMovez Team, Radboud Universiteit Nijmegen.
- Categorie exacte en technische wetenschappen: The Orchid Flowers dataset, Diah H. Apriyanti, datamanagement & Biometrics Group, Faculteit EEMCS, Universiteit Twente.
- Categorie medische en levenswetenschappen: SPI-BIRDS, Marcel Visser en Antica Culina, NIOO-KNAW.