Peper 2 is live: zoeken en vinden met Eric Sieverts

De tweede aflevering van Peper, de podcast van IP en KNVI over de informatiehuishouding van je organisatie of bedrijf én die van jezelf, is live. Daarin komt de nestor van het informatievak aan het woord, Eric Sieverts, die met ingang van 2022 na ruim twintig jaar stopte als redacteur van IP, maar nog steeds volop bezig is als (mede)organisator van de VOGIN-IP-lezing.

Ruim twintig jaar was Eric Sieverts actief in de redactie van IP. Hij dacht mee over de inhoud, en schreef er regelmatig artikelen en columns voor, zeer gewaardeerd door de makers en lezers van het blad, dat intussen ook alweer 26 jaar bestaat. Begin 2022 stopte hij ermee, en intussen is hij alweer geruime tijd gepensioneerd, maar ook nog steeds actief als (mede)organisator van de VOGIN-IP-lezing. De laatste editie van het evenement is net geweest als dit blad op de deurmat valt. De tiende aflevering, tijd voor een feestje én voor een terugblik op zoeken en vinden volgens Sieverts, een thema van de VOGIN-IP-lezing en eveneens een belangrijke activiteit van de informatieprofessional.

Het evenement is destijds van de grond getild om mensen bij te spijkeren over de ontwikkelingen in nieuwe technologie en hoe zij handig kunnen zoeken in online informatiebronnen. ‘Dit is echter al eind jaren zeventig, begin jaren tachtig begonnen toen internet er nog niet was, maar al wel allerlei databestanden met informatie over publicaties van artikelen doorzoekbaar waren’, vertelt Sieverts tijdens de podcast. ‘Vanuit VOGIN (de Nederlandse Vereniging van Gebruikers van Online Informatiesystemen, nu Stichting VOGIN, red.) zijn toen cursussen ontwikkeld om mensen te leren omgaan met online informatie. Je had natuurlijk ook een bibliothecarissenvereniging, maar die werd door de mensen die met online bezig waren een beetje ouderwets gevonden, dus zijn ze voor zichzelf begonnen.’

Fysicus en informatieprofessional

Zelf startte Sieverts begin jaren tachtig als informatieprofessional. ‘Ik was fysicus en deed zelf onderzoek, en daarvoor zocht ik in die tijd in gedrukte indexen naar publicaties. Daarnaast kwamen artikelen ook vanzelf naar me toe doordat ik de mensen kende die in hetzelfde vakgebied bezig waren en zij geregeld preprintjes van hun publicaties naar mij stuurden. Allemaal nog gewoon op papier. Ik ben op een gegeven moment anderhalf jaar in de Verenigde Staten gaan werken als postdoc, en daar maakte ik kennis met online zoeken in databestanden met in mijn geval natuurkundepublicaties. Toen ik terug in Nederland niet direct een onderzoeksplan kon vinden, kwam er toevallig een advertentie voorbij voor een baan bij de universiteitsbibliotheek van de Universiteit Utrecht, waar ze iemand zochten die dat online zoeken voor betawetenschappers kon doen. Ik heb me daar een beetje in gebluft: “Ik heb er in Amerika naast gezeten, dus ik kan dat wel.” Sindsdien zit ik in het vak, dat ik ontzettend leuk vind, nog steeds, en ik ben er tot mijn pensioen en zelfs erna mee bezig gebleven.’

Knowledge graphs 

In de eerste jaren hielp Sieverts anderen met zoeken. ‘In de latere jaren, toen eenmaal de mensen zelf konden zoeken omdat het op een veel goedkopere en gebruikersvriendelijke manier werd aangeboden, ben ik voor mijn werk bij de UU meer de kant opgegaan van het aanbieden van zoeksystemen. Dus hoe maak je eigen zoeksystemen die handiger zijn voor de gebruiker dan wat standaard geleverd wordt.’

Wat heb je nodig om de informatie te kunnen vinden die je zoekt? ‘Als je wilt weten wat er over een bepaald onderwerp te vinden is, tik je een zoekterm(en) in waarvan jij denkt dat het een goede term is om dit onderwerp te omschrijven. Dan is het natuurlijk de vraag of het in het systeem ook met die term beschreven is. Dat was in het begin nog wel een probleem, maar intussen zijn er systemen die kunnen herkennen: bij dit woord hoort die officiële term waarmee de makers van de bestanden de artikelen hebben geïndexeerd. Dat is de laatste jaren nog weer sterk verbeterd doordat er knowledge graphs ontwikkeld zijn waarin veel meer relaties tussen begrippen op allerlei terreinen kunnen worden gelegd.’

Waarin ga ik zoeken?

Er wordt nog steeds gewerkt met thesauri die af en toe worden geüpdatet, maar het is de vraag of we die kant verder blijven opgaan, zegt Sieverts. ‘Want artificiële intelligentie maakt het voor moderne zoeksystemen steeds makkelijker om publicaties te vinden zonder van die officiële termen gebruik te maken, en ook zonder dat die publicaties al geïndexeerd met speciale termen ontsloten zijn.’

Belangrijker is nu meer de selectie: waarin ga ik zoeken, vervolgt hij. ‘Als je voor een database als Medline kiest, dan weet je: ik vind sowieso wetenschappelijke medische literatuur. En Google Scholar is weliswaar van Google, maar dit bedrijf stopt in Google Scholar alleen maar wetenschappelijke publicaties. Dat is dus al een voorkeuze, en je kunt vervolgens losgaan met zoektermen en inderdaad vinden wat je zoekt. Het is een beetje vloeken in de kerk, maar dan heb je die thesaurus eigenlijk niet meer nodig.

Google is niet meer gewoon een zoekmachine die domweg zoekt op het woord dat jij intikt; er zit AI en machine learning achter, waarmee op basis van jouw zoekverleden en op basis van de termen die je intoetst geprobeerd wordt te achterhalen wat je eigenlijk bedoelt. Wat je intentie is. User intent is waar steeds meer zoekmachines zoals Google, maar ook Bing en Yandex, zich op oprichten.’

Ontwikkelingen in het vak

Dit is een van de ontwikkelingen die Sieverts heeft zien langskomen, ook als item tijdens de VOGIN-IP-lezing, zo vertelt hij tijdens de podcast. ‘Verder zie je natuurlijk een andere manier van hoe mensen met informatie omgaan. Denk aan de sociale media die hun intrede deden, waarbij je zelf materiaal op internet kon zetten, en de zoeksystemen die daar gebruik van maakten. Daaruit bleek al snel dat niet alle informatie even betrouwbaar is. Nu zijn we voortdurend bezig met fenomenen als fakenews en factchecking, zeker met de oorlog in Oekraïne, maar acht jaar geleden was dit ook al aan de orde. We hebben daarom op een gegeven moment workshops factchecking in het VOGIN-IP-programma opgenomen, en lezingen over fakenews. Dat is eigenlijk een constante gebleven.

Verder hebben we sinds een aantal jaren veel contact met Bellingcat, die bezig zijn met een heel andere manier van informatie bovenhalen: niet alleen via internet, maar ook informatie uit meer obscure bronnen die niet echt geproduceerd is met het doel om beschikbaar te stellen, maar die je wel kunt gebruiken. Open source informatie dus – dat heeft Bellingcat helemaal op de kaart gezet, onder andere met het onderzoek naar de MH17-ramp.’ Hij noemt reverse image search, waarbij je niet op zoektermen maar op een plaatje zoekt. Dat beeld is dan elders in een of ander systeem te vinden, of althans iets wat daar visueel op lijkt. ‘Dat soort tools is veel beter geworden de laatste vijf, zes jaar. Er is ook steeds meer informatie digitaal aanwezig waarvan je niet meteen verwacht dat die er zal zijn. Mensen maken bijvoorbeeld in oorlogssituaties zelf foto’s en filmpjes met hun mobiele telefoon en stellen die beschikbaar.’

Zoektip

Heeft hij nog een persoonlijke zoektip om net even sneller tot goede resultaten te komen? Die heeft Sieverts wel: ‘Ik heb dit niet zelf bedacht, maar het is iets wat ook een zoekexpert als Henk van Ess altijd als tip meegeeft: denk niet vanuit je vraag, maar denk vanuit het verwachte antwoord. Dus formuleer je vraag zoals die in een antwoord op jouw vraag zou staan. In welke woorden en in welke volgorde van woorden zou die vraag gesteld zijn, want ook de volgorde waarin jij je zoekterm intikt, wordt door zoekmachines meegenomen bij het wegen van de ranking van de relevantie van je zoekresultaten.’

De hele podcast kun je hier beluisteren.

> In de volgende IP lees je een verslag van de VOGIN-IP-lezing 2022 van 11 mei; vogin-ip-lezing.net.


Informatiehuishouding op scherp

Hoe draag je als professional bij aan de informatiehuishouding en digitale transformatie van je organisatie of bedrijf? En hoe is het met je eigen informatiehuishouding gesteld? Je hoort het tijdens Peper, de podcast van vakblad IP en KNVI. Een-op-eengesprekken over werken en leven in de information society. Open, pittig, een beetje (zelf)kritisch en informatief. Elke maand een nieuwe aflevering.
Interviewer: Tom Dalderup.
Tip voor een interessant onderwerp en/of een kandidaat? Mail naar redactie@informatieprofessional.nl.


Deze bijdrage komt uit de papieren IP #4-2022. Het hele nummer kun je hieronder lezen of downloaden.