Open wetenschap: Informatieprofessionals pakken hun rol in open science

Nederland zet koers richting een open vorm van wetenschapsbeoefening, getuige onder andere de lancering van het Nationaal Plan Open Science (NPOS) afgelopen februari en het nieuwe regeerakkoord dat stelt dat open access en open science de norm worden in wetenschappelijk onderzoek. Open science heeft als doel om wetenschappelijke kennis op transparante wijze en voor een breed publiek te publiceren. Dat vergt een herijking van onderzoek doen, samenwerking tussen onderzoekers en de wijze waarop kennis wordt gedeeld en de wetenschap wordt georganiseerd. Informatieprofessionals kunnen hierbij een rol van betekenis spelen, zoals blijkt uit cases van de Universiteit Utrecht, Hogeschool van Arnhem en Nijmegen en KNMI. Maar eerst een korte toelichting op open science en het NPOS.

Door: Dafne Jansen en Leen Liefsoens

‘Dankzij informatie- en communicatietechnologie en globalisering ontstaan nieuwe kansen voor het uitwisselen van resultaten van wetenschappelijk onderzoek – publicaties, onderzoeksgegevens – en zelfs van methoden en praktijken van wetenschapsbeoefening.’ (Citaat uit NPOS)

Wetenschappelijk onderzoek wordt voor een groot deel gefinancierd met publiek geld – en zou dus ook voor het publiek toegankelijk moeten zijn. Hoe? Door het onderzoeksproces inzichtelijk te maken en de onderzoeksresultaten in de vorm van zowel data als publicaties vrij beschikbaar te stellen. Ook de kwaliteit van het onderzoek heeft baat bij meer openheid. Het is gemakkelijker om voort te bouwen op het werk van collega-wetenschappers, als je zoveel mogelijk weet over hun methoden en praktijken, en deze eventueel kunt reproduceren. Vrije beschikbaarheid van onderzoeksresultaten zorgt er tevens voor dat zowel mensen in het beroepsveld als ‘burgers’ gebruik kunnen maken van de nieuwste inzichten, én dat wetenschappers die over weinig financiële middelen beschikken ook toegang hebben tot diezelfde kennisrijkdom.

De voordelen zijn duidelijk, en globalisering en ICT kunnen het faciliteren… maar is open science ook de trend?

Voorlopers

Aan de ene kant zijn er voorbeelden van vakgebieden die al sinds de jaren tachtig van de vorige eeuw bezig zijn met open wetenschapsbeoefening. Denk aan een initiatief als de GenBank (gestart in 1982), een vrij toegankelijke database met genetische sequenties. Of neem ArXiv (gestart in 1991), een vrij toegankelijke ‘preprint server’ die gebruikt wordt om – in eerste instantie – de publicatie van onderzoeksresultaten in de natuurkunde te versnellen.

Aan de andere kant zijn er voorbeelden van moeizame onderhandelingen over de beschikbaarheid van wetenschappelijke artikelen tussen de Nederlandse universiteiten (verenigd in de Vereniging van Universiteiten, VSNU) en wetenschappelijke uitgeverijen als Elsevier en Oxford University Press. Uit deze onderhandelingen blijkt dat ‘open’ nog geen overtuigend verdienmodel is in de ogen van sommige spelers, of beter gezegd: dit model levert de uitgeverijen minder op.

Nationale regie

Meer regie op nationaal niveau kan het verschil maken. Al in 2013 breekt staatssecretaris Sander Dekker (OCW) via een kamerbrief een lans voor open access. Die lans is een nuttig wapen gebleken in de moeizame onderhandelingen tussen universiteiten en uitgevers, getuige de groeiende lijst met ‘deals’. Afgelopen februari vloeide het Nationaal Plan Open Science uit de pen van onder andere onderzoeksinstituten zoals NWO, KNAW en De Jonge Akademie, de universiteiten verenigd in de VSNU, de hogescholen verenigd in de VH en de universiteitsbibliotheken en Koninklijke Bibliotheek verenigd in het UKB. En als kers op de taart is er nu het nieuwe regeerakkoord waarin open access en open science benoemd worden als de norm in wetenschappelijk onderzoek.

Nationaal Plan Open Science

Open science is geen nieuw begrip, maar wordt als ‘parapluterm’ de afgelopen tien jaar wel steeds vaker gebruikt. Het omvat begrippen als open data (het eerder genoemde GenBank) en open access (ArXiv). Ook de doelen in het Nationaal Plan Open Science komen niet uit de lucht vallen. Het plan wil bestaande ambities, deels geformuleerd in Europees verband, bundelen. Denk daarbij aan ambities als ‘100% open access publiceren in 2020’ (streven van de EU-Raad van ministers eind mei 2016) en ‘onderzoeksdata optimaal geschikt maken voor hergebruik’.

Ook willen de initiatiefnemers iets toevoegen aan die ambities, namelijk door een onderzoek te starten naar de wijze waarop open science onderdeel gaat uitmaken van ‘het evaluatie- en waarderingsproces voor onderzoekers, onderzoeksgroepen en onderzoeksvoorstellen’. Ten slotte wil men ook een ‘clearinghouse’ inrichten dat alle benodigde informatie over alle terreinen van open science biedt voor het ondersteunen van onderzoekers.

Rollen voor informatieprofessionals

Wie door een informatieprofessional-bril naar de ambities uit het nationaal plan kijkt, ziet meerdere rollen die bij uitstek door informatieprofessionals kunnen worden vervuld. Sterker nog, sommige rollen wórden al vervuld. Denk bijvoorbeeld aan hun bijdrage aan de institutionele repositories. Daar waar sommige wetenschappelijke tijdschriften nog geen mogelijkheid bieden om direct volledig open access te publiceren, hebben veel instellingen een eigen ‘archief’ waarin vaak wel de auteursversie van een artikel geplaatst kan worden, zodat de informatie toch snel vrij toegankelijk kan worden gemaakt. Bij de meeste onderzoeksinstellingen ligt de verantwoordelijk voor zo’n repository bij de bibliotheek of mediatheek.

Er zijn ook relatief nieuwe rollen en functies, zoals de datalibrarian. Of neem de kennis van het evaluatieproces voor onderzoekers, waar bibliometrie (de kwantitatieve meting van wetenschappelijke output) een onderdeel van is. Ook dat behoort inmiddels tot het werkveld van de informatieprofessional.

Gouden tijden?

Breken er voor informatieprofessionals nu gouden tijden aan? Toen staatssecretaris Dekker in 2013 voor open access koos, richtte hij zich op een scenario waarin de ‘gouden route’ (publiceren in open access-tijdschriften) centraal stond en waarbij hij totaal voorbij leek te gaan aan de voordelen van de ‘groene route’ (publiceren in institutionele repositories). Kennis over de voor- en nadelen van beide routes was bij bibliotheken van onderzoeksinstellingen voorhanden, maar de dossierkennis van de staatssecretaris leek op zijn zachtst gezegd onvolledig, zoals bijvoorbeeld Frank Huysmans in zijn blogpost ‘Dekker en open access: intentie goed, uitwerking fout’ concludeerde (zie tinyurl.com/y9bqch8s). Om dit soort missers in de toekomst te voorkomen, zal de informatieprofessional onverminderd zijn best moeten doen om zijn kennis van informatie, óók in het wetenschappelijk domein, voor het voetlicht te brengen.

Ter inspiratie volgt hieronder een drietal best practices van informatieprofessionals die hun open science-rol met verve vervullen bij een hogeschool, een universiteit en een nationaal data- en kenniscentrum.

Dafne Jansen is redacteur van IP en projectmanager bij de Universiteit Utrecht. Leen Liefsoens is redacteur van IP en senior informatiespecialist bij de bibliotheek van de Haagse Hogeschool.


Wetenschappers adviseren over metadata

Otto Lange maakt deel uit van het Research Data Management-supportteam, een groep informatieprofessionals die onderzoekers van de Universiteit Utrecht assisteren en adviseren bij de beschrijving van dataverzamelingen. ‘Om het hergebruik van datasets te stimuleren, moeten ze zinvol beschreven worden. Als wetenschappelijk metadataspecialist help ik onderzoekers hierbij. Ik adviseer hen over beschikbare (metadata-)standaarden en over de wijze waarop deze kunnen worden gebruikt,’ aldus Lange.

Hij wordt in het RDM-supportteam vergezeld door twee bibliotheekmedewerkers, drie ICT-medewerkers en een security officer. Samen kunnen zij een breed scala aan diensten bieden; van advies bij het schrijven van een datamanagementplan tot ondersteuning bij de opslag van grote datasets en high performance computing (computers met extra grote rekenkracht).
Als metadataspecialist doet Lange meer dan alleen het adviseren over standaarden: hij helpt onderzoekers ook om over de grenzen van hun eigen onderzoek en hun eigen vakgebied heen te kijken. Dit doet hij onder meer door het belang uit te leggen van het gebruik van gestandaardiseerde terminologie (vocabulaires). ‘Een voorbeeld is aardwetenschappelijk onderzoek: om adequaat te kunnen handelen in het geval van grote natuurrampen als aardbevingen of tsunami’s moeten wetenschappers kennis hebben van de oorzaken van complexe processen die zich afspelen in de aardkorst. Hiervoor is het noodzakelijk om data uit veel verschillende onderzoeksvelden te combineren. Om die gegevens te kunnen koppelen moet de interpretatie van gehanteerde begrippen eenduidig zijn, dat wil zeggen: onderzoekers uit de verschillende disciplines dienen overeenkomstige terminologie te gebruiken voor overeenkomstige eigenschappen. Een belangrijke bijkomstigheid van uniformiteit en standaardisatie van terminologie is dat waardevolle onderzoeksdata beter (online) vindbaar wordt, wat vanzelfsprekend een belangrijke aanjager zal zijn voor het hergebruik van wetenschappelijke data.’


De routekaart

Dat er kracht schuilt in een multidisciplinair team, weet ook de Hogeschool van Arnhem en Nijmegen (HAN). Afgelopen voorjaar kreeg zij voor haar aanpak ‘On the roadmap Open Science’ een zogeheten HBOAward. Dit is een initiatief van SURF, de ICT-samenwerkingsorganisatie van het onderwijs en onderzoek in Nederland, om spraakmakende initiatieven op het gebied van open toegankelijk maken van praktijkgericht onderzoek in het zonnetje te zetten.
In de routekaart ‘On the roadmap Open Science’ (zie blog.han.nl) benoemt HAN de wegen die bewandeld worden om te komen tot een optimale kenniscirculatie en doorwerking van praktijkgericht onderzoek. Aan de basis van deze routekaart staan twee beleidsmedewerkers van de HAN, Nanske Wilholt en Maarten van Rooij, en extern adviseur Marina Noordegraaf van Verbeeldingskr8.
Met deze routekaart heeft de HAN een instrument in handen om het eigen kennisdisseminatie- en publicatiebeleid uit te voeren. Hierbij wordt een driesporenbeleid gevolgd: route 1 richt zich op de kennisinfrastructuur, route 2 gaat in op de processen die nodig zijn voor het ondersteunen van open kennisdisseminatie en route 3 geeft richting aan cultuurverandering.
De routekaart heeft een tweeledige functie. Zo dient zij als wandelkaart voor de werkgroep OSO (Open Science Ondersteuners), een brede geleding van HAN-onderzoeksondersteuners uit diverse disciplines (juridische zaken, communicatie, ICT, bibliotheek en O&O). Daarnaast wordt de routekaart gebruikt om de boer op te gaan bij onderzoekers, management en bestuur.
Er wordt met de routekaart een stevige visie op open science en de betekenis ervan voor een hbo-instelling neergezet. Zij biedt houvast voor de uitwerking van verschillende activiteiten die ‘sporen’ worden genoemd. Een aanstekelijk en stevig verhaal. Zo aanstekelijk dat ook lectoren de routekaart gebruiken om open science te promoten bij bijvoorbeeld lectorenplatforms.
Door verschillende lagen van de organisatie heen heeft de roadmap inmiddels een positieve verbindende functie gehad en veel in beweging gezet. Denk bijvoorbeeld aan de aanstelling van een coördinator kennisinfrastructuur (Willem Verstegen), het toewijzen van middelen binnen het strategisch investeringsplan en de start van een pilot met het onderzoeksregistratiesysteem Metis in samenwerking met de Radboud Universiteit.
Tijdens het uitwerken van de ‘sporen’, de fase waarin de HAN nu zit, blijft het vinden van draagvlak en het in stand houden ervan bij alle betrokkenen een grote uitdaging; hetzelfde geldt voor het afstemmen van het gezamenlijke beeld. Met iedereen in gesprek blijven is dan ook van cruciaal belang, benadrukken beleidsmedewerkers Wilholt en Van Rooij en coördinator Verstegen. Ze adviseren informatieprofessionals die binnen hun instelling ook open science op de kaart willen zetten om zo gauw mogelijk in contact te treden met alle betrokkenen. ‘Vraag eenieder om zijn eigen expertise in te brengen en benoem de mogelijke synergie. Leg beslist geen voorgeschreven en vastomlijnde projectstructuur op, dat is “killing”. En tot slot: begin pas over geld als iedereen overtuigd is van het “waarom”.’


Het innovatielab

Open science is niet alleen in het hoger onderwijs een hot topic. Zo heeft het KNMI, het nationale data- en kenniscentrum voor weer, klimaat en seismologie in Nederland, sinds 2016 een Datalab. Dit ‘lab’ wordt gerund door Jan Willem Noteboom en wetenschappelijk coördinator Raymond Sluiter. Saillant detail: in een eerdere functie was Sluiter verantwoordelijk voor het open data-beleid van het ministerie van Infrastructuur en Milieu – hij is dus zelf aanjager geweest voor wat nu de brandstof van het Datalab is.

Het Datalab maakt namelijk veelal gebruik van open data. Sluiter vertelt: ‘Het gaat niet alleen om traditionele data zoals satellietmetingen, maar ook om nieuwe bronnen zoals crowdsourced data. Gebruiken we data voor andere doelen dan waarvoor ze oorspronkelijk bedoeld zijn, dan spreken we van opportunistic data.’ Veel data vragen erom gecombineerd te worden met andere data, omdat ze verbanden bloot kunnen leggen die eerder verborgen bleven. ‘Een goed voorbeeld is de hoogte-informatie van het Kadaster, die voor ons waardevol is bij het analyseren van het lokale klimaat. Hoge gebouwen dicht op elkaar geven een hitte-eilandeffect dat een temperatuurverschil van enkele graden kan verklaren.’

Een ander mooi voorbeeld betreft de camerabeelden van Rijkswaterstaat, die bedoeld zijn om files te registreren. Sluiter: ‘Die camerabeelden kunnen wij gebruiken om mist waar te nemen, een zeer lokaal fenomeen dat met onze traditionele metingen lastig te registreren is.’ De camerabeelden, die vanwege privacy niet ‘open’ zijn, vormen een uitzondering op de regel, want ‘veel data komen uit Publieke Dienstverlening Op de Kaart (PDOK), en dan gaat het om geodata waar privacy geen rol speelt’.

Naast de vele sprekende voorbeelden waarin de potentie van open data wordt geïllustreerd, komen er in het Datalab ook diverse knelpunten naar voren. Zo is de richtlijn vanuit de overheid om publieke data ‘as is’ beschikbaar te maken, maar niet ieder dataformat is even bruikbaar. De data die het KNMI met metingen zelf genereert is voor een buitenstaander niet eenvoudig hanteerbaar, en voor conversie is geen budget. Bovendien is datacuratie sowieso duur. Noteboom licht toe: ‘We zijn bij het KNMI al sinds 2012 bezig met het introduceren van rollen zoals die van datasetmanager, om te zorgen dat de datasets die we publiceren niet zonder eigenaar rond gaan zwerven. Publieke data vragen meer kwaliteitscontrole, en ook betere beschrijvingen. Maar niemand heeft veel zin om te metadateren, een uiterst tijdrovende en nauwkeurige klus.’

Binnen de projecten van het Datalab worden niet alleen datasets gecombineerd, er wordt ook code gegenereerd om die nieuwe sets te analyseren of te reproduceren. Ook daarin worden stappen gezet: ‘Het beleid is dat code in eerste instantie gedeponeerd wordt in een private omgeving binnen GitHub,’ aldus Noteboom. ‘Waar mogelijk wordt de code op termijn ook open ter beschikking gesteld. Open data is slechts een onderdeel van de puzzel die open science is, open software is minstens zo belangrijk.’


Deze bijdrage komt uit IP nr. 8 / 2017. Het gehele nummer kun je hier lezen.