Actuele ontwikkelingen op het gebied van ‘zoeken en vinden’ kwamen op 3 maart jl. aan bod tijdens de VOGIN-IP-lezing 2016, een dag met lezingen en workshops in de Openbare Bibliotheek Amsterdam. Acht sprekers uit het brede informatieveld presenteerden hun bevindingen.
Door: Andrea Langendoen en Isabel Rapattone
Paul Gunstone
Zoeken in ‘pure rubbish’
Binnen iedere organisatie bevinden zich gigantische hoeveelheden kennis, vastgelegd in documenten, emails, contracten, notulen et cetera. Ongeveer tachtig procent van die kennis is, zegt Paul Gunstone – sales directeur bij Smart Logic – ongestructureerde informatie.
Die bevindt zich vaak op verschillende plekken binnen de onderneming, in verschillende formaten en in systemen die niet met elkaar communiceren.
Een groot deel daarvan is, zoals Paul Gunstone het noemt, ‘pure rubbish’: kennis waar eigenlijk niemand wat aan heeft. Maar dat weet je pas als je de documenten hebt gelezen. Tussen die rubbish bevindt zich echter ook heel veel kennis die juist heel belangrijk is of kan zijn voor de organisatie. Maar omdat hij niet goed vindbaar is wordt de content niet gebruikt. Dat is vaak zonde van de opgebouwde kennis, en soms zelfs schadelijk voor een organisatie.
Door het toepassen van semantische technologieën en informatiewetenschap – wat Gunstone content intelligence noemt – ontwerpt Smart Logic modellen waarmee deze kennis kan worden geïnterpreteerd, beschreven, geanalyseerd en gevisualiseerd. Zo worden al die bergen vergaarde kennis alsnog vindbaar en bruikbaar. Die ‘modellen’ van Smart Logic deden informatiespecialisten overigens wel erg sterk aan klassieke thesauri denken.
Peter Burger
Renaissance van fact checkers
Bijna iedere zichzelf respecterende krant heeft tegenwoordig een factcheckrubriek. We beleven, aldus docent en onderzoeker Peter Burger, een renaissance van factcheckers.
Waren het vroeger de journalisten zelf die hun informatie vooraf checkten, tegenwoordig worden de feiten vaak pas achteraf tegen de meetlat gehouden. ‘Dat lijkt ook wel nodig te zijn want wat is er een boel onwetendheid in die enorme oceaan van kennis die ons omringt,’ verzucht Burger. Burger ziet een aantal redenen voor die hernieuwde interesse en noodzaak voor het verifiëren van ‘feiten’. Ten eerste is het een reactie op de gemediatiseerde politiek, die zich steeds meer lijkt bezig te houden met the medium dan met the message (het is niet voor niets dat Tom-Jan Meeus in NRC onlangs schreef dat het eigenlijk nauwelijks meer de moeite loont om politici te interviewen: ze zeggen toch alleen wat hun persvoorlichters hen laten zeggen). Daarnaast is het pure noodzaak voor journalisten om nieuwe tools te ontwikkelen als tegenbeweging voor alles wat er in de social media als ‘bron’ voorbijkomt.
Maar hoewel ook de meeste journalisten de noodzaak zien van goed gebruik van bronnen (dus: check je bron, één bron is geen bron), gebeurt het toch vaak dat artikelen worden gepubliceerd terwijl ze nauwelijks gecheckt zijn. Burger heeft met zijn studenten van de opleiding Journalistiek en Nieuwe Media (Universiteit Leiden) onderzoek gedaan naar de oorzaken daarvoor. Journalisten gaven aan dat ze het vaak niet deden uit tijdgebrek, omdat de informatie van een vertrouwde bron kwam (controle ‘was dus niet nodig’), of omdat het toch maar om ‘zacht’ nieuws (amusement) ging. Daarnaast is het ook zo dat bij steeds meer redacties de eindredactie op stukken sowieso is komen te vervallen en blijken veel journalisten met maar heel basale zoekskills te werken.
De vraag is dus, aldus Burger, hoe we ervoor kunnen zorgen dat de informatie die we krijgen ook echt klopt? De overheid kan daar een rol in spelen door informatie, bijvoorbeeld rondom medische onderwerpen, op een begrijpelijke manier uit te leggen en beschikbaar te maken. Maar ook burgers zelf kunnen daar een rol in spelen: bijvoorbeeld door via social media als ‘burger-checker’ op te treden. Maar ook de informatieprofessional speelt daarbij een cruciale rol: die kan immers de juiste informatie ontsluiten, die kan ervoor zorgen dat mensen op alle niveaus mediawijzer worden, maar zeker ook door, als eindredacteur of documentalist 3.0, zich weer een plaats te bemachtigen binnen nieuwsredacties.
Peter van der Graaf
Duistere kant van SEO
Voor de meeste bedrijven is SEO (search engine optimalisation) een tamelijk onschuldige activiteit waarmee je door de juiste termen te gebruiken de beste zoekresultaten op Google krijgt. Maar Peter van der Graaf gaf een kijkje in de meer sinistere kanten van deze marketingtool.
‘Waarheidsvinding’ aldus Van der Graaf ‘is subjectief’. En iemand die goed zoekt is veel gemakkelijker te beïnvloeden dan iemand die het helemaal niets kan schelen omdat hij toch al vooringenomen is. Best dappere uitspraken voor een publiek van informatieprofessionals. Als ‘SEO-evangelist’ voor onder meer grote Amerikaanse lobby-instanties (van de National Rifle Association tot dierenrechtenclubs) is het zijn taak om de informatie en mensen zo te manipuleren dat de meest gunstige informatie bij Google boven komt drijven.
Bijvoorbeeld door ervoor te zorgen dat interviews met bepaalde experts door zo veel mogelijk mensen worden gedeeld. Natuurlijk is Google niet blij met deze manipulatie door inventieve marketeers. Als SEO-kenner weet Van der Graaf precies hoe Google zijn werk en dat van zijn collega’s probeert tegen te gaan. De manier waarop deze manipuleerders werken vertonen vaak bepaalde herkenbare patronen. Google probeert met machine learning technieken te ontwikkelen die die patronen herkennen, waardoor gemanipuleerde informatie kan worden gefilterd. Het gevaar daarbij is dat ook betrouwbare informatie (breaking news bijvoorbeeld) vergelijkbare patronen kan vertonen en dat is natuurlijk informatie die Google er juist niet uit wil filteren, aldus Van der Graaf.
Pieter Cobelens
Big data & veiligheid
Een generaal majoor buiten dienst met een indrukwekkende staat van dienst, onder andere in Irak en Uruzgan, en een zaal vol met informatieprofessionals. Twee totaal verschillende werelden en never the twain shall meet, zou je zeggen. Toch zit er echt wel een overlap tussen de twee werelden, zoals Pieter Cobelens in zijn keynote speech al snel duidelijk wist te maken.
Goed, ook hij zag bibliothecarissen aanvankelijk alleen als de obligatoire ‘suffe mensen die me altijd twee kwartjes boete gaven’, maar in de loop der jaren, bij een steeds uitgebreider en complexer wordende informatieomgeving, is hij de informatieprofessional steeds meer gaan zien als een belangrijke speler voor inlichtingdiensten.
De defensiewereld is de afgelopen jaren enorm veranderd. Waren het vroeger raketten die de grootste dreiging betekenden, nu zijn het hackers – en een mogelijke cyberoorlog lijkt niet onwaarschijnlijk in de toekomst
Voor de nationale en internationale veiligheid spelen big data een belangrijke rol (en tegelijkertijd een mogelijke bedreiging voor onze privacy). Hoe kunnen we de informatie die we in grote mate tot onze beschikking hebben inzetten om bijvoorbeeld terroristische aanvallen te voorkomen en de gevolgen te beperken? En hoe zorgen we ervoor dat we de kennis die we achteraf altijd al gehad blijken te hebben (kijk maar naar de informatie die nu is bovengekomen na de aanslagen in Parijs van afgelopen november) al vooraf tot onze beschikking hebben, zodat we zoveel mogelijk kunnen voorkomen?
Want wie wint de slag en de oorlog? Volgens Cobelens is dat de partij met de beste voorspellende vermogens. Die weer gebaseerd zijn op een juist gebruik en een juiste analyse van bronnen. En baseer je daarbij niet op ‘single source information’. Dat geldt in de defensiewereld, maar net zozeer in het bedrijfsleven, waar ‘door een rietje kijken’ nog altijd een belangrijke faalfactor is.
Andy Black
Invloed van mediaconsumptie op de samenleving
Het Midden-Oosten, opkomende markten, smartphones, social media, vrije communicatie en de Arabische lente – volgens Andy Black, die zich al ruim 25 jaar bezighoudt met digitale technologie en politiek, heeft het allemaal met elkaar te maken.
Black laat zien hoe jonge mensen sociale media gebruiken voor maatschappelijke activiteiten en met een smartphone in de hand in actie komen tegen politieke regimes. Sociale netwerken zoals Facebook en Twitter als middel voor politieke verandering. Dat de Arabische lente uiteindelijk grotendeels mislukte komt, aldus Black, omdat er een machtsvacuüm volgde op de revolutie waarin geen mogelijkheden waren om de maatschappij als geheel te veranderen, onder andere een gebrek aan goedkope en open technologieën. In reactie op de revolutie van onderaf trokken veel overheden de teugels juist weer strakker aan: sociale media werden afgesloten, ze wilden meer toegang tot data. Maar bijvoorbeeld ook via astroturfing, een vorm van propaganda waarbij de schijn wordt gewekt dat het burgerinitiatieven betreft.
Ondertussen blijft de digitale wereld razendsnel veranderen. Het gevolg daarvan is dat de media en de mediaconsumptie zelf ook veranderen en daarmee ook de wereld om ons heen. Overal zie je dezelfde beweging van top-down naar bottum-up: binnen organisaties, overheden, regeringen. Dat geldt ook voor de manier waarop bedrijven hun klanten benaderen, die gaat van merkgericht naar consumentgericht. Consumenten zijn nu ook zelf actief betrokken in de communicatie over merken en producten, en bedrijven passen daar hun marketingstrategieën en producten weer op aan.
Hanna Jochmann-Mannak
Kind vriendelijker zoeken
Er moet nog veel gebeuren om internet kindvriendelijker te maken, meent Hanna Jochmann-Mannak, specialist kind-computerinteractie bij de Amsterdamse startup WizeNoze.
Vaak zijn kinderen niet in staat om datgene wat ze vinden op internet cognitief te beoordelen. Daar komt bij dat de zoekmachines op kinderwebsites nog niet erg geavanceerd zijn; vaak is er veel geld in het design gestoken en niet in de gebruiksvriendelijkheid. ‘Het is alsof je een spelletje aan het spelen bent, terwijl het de bedoeling is dat je informatie vindt.’
Kinderen zien internet als een vraagantwoordmachine, blijkt uit onderzoek van Jochmann-Mannak: ze gebruiken soms hele zinnen om hun zoekvraag te formuleren. Ook twijfelen ze vaak over de te gebruiken zoektermen en spellen ze die nogal eens verkeerd. Het zou dus mooi zijn als zoekmachines spellingsuggesties geven, waarbij rekening wordt gehouden met het lees niveau en de gedachten van kinderen. Johmann-Mannak: ‘Als ze op paddestoelen zoeken, willen ze meestal geen kookboek vinden maar wel bijvoorbeeld een sprookjesverhaal.’
et is dus belangrijk dat een zoekmachine voor kinderen betrouwbare informatie biedt die aansluit bij de leeftijd van de kinderen en die ze helpt met het formuleren van hun zoekvraag. Dat kan bijvoorbeeld door een zoektechnologie te ontwikkelen speciaal gericht op kinderen. En door editing tools te ontwikkelen voor de makers van content, op basis van natural language processing en machine learning-technologie. Door de technologie slimmer in te zetten kunnen we allemaal helpen om van het internet een veilige plek te maken waar kinderen onbezorgd kunnen zoeken naar informatie, besluit Jochmann-Mannak.
Mart Evers
Social media monitoring
Met behulp van monitoringtools kunnen organisaties en bedrijven meer uit social media halen, liet Mart Evers, social business consultant bij Clockwork, met voorbeelden zien.
Zo kan bijvoorbeeld inzicht worden verkregen in trending topics (wat leeft er bij de klant?) en kunnen meningen en sentimenten worden gemonitord (voor bijvoorbeeld feedback op gebruikers). Ook kan er met behulp van de uitkomsten worden geanticipeerd op bepaalde zaken.
Een voorbeeld daarvan betrof een grote brand in Vlaardingen, eind 2015. Omwonenden maakten zich zorgen over asbest. Sommige mensen vroegen zich ook af of de scholen de volgende dag wel zouden opengaan. De communicatieadviseur van de Veiligheidsregio Rotterdam Rijnmond zag deze vragen langskomen op social media. Hij kon de antwoorden op die vragen vervolgens meteen meenemen in de woordvoering aan de pers.
Om te ontdekken welke tools hiervoor het meest geschikt zijn, presenteerde Evers een driestappenplan: 1. bepaal het doel van de monitoring, 2. bepaal de criteria/eisen waaraan de tool moet voldoen en 3. maak kennis met de verschillende tools en kies daaruit de beste.
Een rol voor de informatieprofessional ziet Evers vooral weggelegd bij het monitoren: nagaan wat er over je organisatie of bedrijf wordt gezegd op social media, daar inzichten uit halen en die informatie in rapportages samenvatten, om zo de organisatie te voeden. Ook een echte taak voor de informatieprofessional: het bepalen van de te gebruiken termen in de zoekqueries, om zo min mogelijk ruis in de zoekresultaten te krijgen.
Dat zoeken is nu nog heel erg tekstgericht, terwijl de content op social media steeds visueler wordt. De traditionele tools voor social mediamonitoring kunnen alleen zoeken op tekst, en als ze al plaatjes vinden zijn ze afhankelijk van de tekst die erbij wordt gebruikt of van de metadata. Maar er komen nu tools aan die een afbeelding kunnen ‘scannen’ en kunnen vaststellen wat erop te zien is. ‘Dit wordt de volgende stap in monitoring,’ aldus Evers.
Randolph Hock
Koester het oude, omarm het nieuwe
‘Join the evolution and enjoy the new; it can be a lot of fun,’ aldus Randolph Hock in zijn keynote speech. Volgens deze Amerikaanse zoekexpert kunnen en moeten we als informatieprofessionals profiteren van alle nieuwe technieken.
Door nieuwe technologieën zoals natural language processing verandert de aard van het zoeken drastisch, zegt Hock. Hij vindt dat we het oude zoals de booleaanse logica niet zomaar aan de kant moeten schuiven, maar moeten koesteren en integreren in nieuwe technieken. De zoekmachines waar het bij het zoeken op internet allemaal om gaat worden steeds geavanceerder.
Google doet het volgens hem allemaal net iets beter maar er is genoeg ruimte voor andere partijen. Bing bijvoorbeeld, Microsofts zoekmachine die over de financiële middelen beschikt om de concurrentie met Google aan te kunnen. En niet te vergeten Yahoo, die ook in de top-drie van zoekmachines staat.
Volgens Hock zorgt het semantische web, een doorontwikkeling van de techniek op internet, voor betere zoekresultaten voor de gebruiker. Hij noemt Googles Hummingbird en legt het begrip ‘semantisch zoeken’ uit. Daarbij wordt geprobeerd om de contextuele betekenis van termen in een query te begrijpen en verbanden te leggen door bijvoorbeeld naar de locatie van de gebruiker te kijken. Ook functies als gezichts- en spraakherkenning passen hier in. Complexe, over het internet verspreide kennis wordt zo meer toegankelijk gemaakt voor de gebruiker.
Hock sluit zijn lezing af met een advies voor informatieprofessionals: ‘Ga niet op de automatische piloot bij het zoeken maar vertrouw op jezelf en denk niet dat de zoekmachine altijd het juiste antwoord geeft.’
Deze bijdrage komt uit IP nr. 3 / 2016. Het gehele nummer kun je hier lezen.
Andrea Langendoen is redacteur IP en werkzaam bij de KB.
Isabel Rapattone verkent na een Master Culturele Informatiewetenschap aan de Universiteit van Amsterdam haar kansen als zelfstandig ondernemer binnen de erfgoedsector.