Terugblik VOGIN-IP-lezing 2014: zoeken in de toekomst

Actuele ontwikkelingen op het gebied van ‘zoeken en vinden’ kwamen op 20 maart jl. aan bod tijdens de VOGIN-IP-lezing 2014. In een afgeladen zaal – plus een extra zaaltje met scherm – in de Industrieele Groote Club te Amsterdam presenteerden vijf sprekers tijdens het middagprogramma hun bevindingen. Marydee Ojala reflecteerde op het verleden, het heden en de toekomst van het zoeken. Maarten de Rijke betoogde dat computers straks zelf kunnen onderzoeken wat de kwaliteit is van de formules die bepalen waarom een document voor een zoekmachine relevant is (de zogenaamde ‘rankers’). Antoine Isaac liet zien hoe het Europeana Data Model bestaande standaarden rond het semantisch web opnieuw gebruikt. De rol van Market Intelligence bij AkzoNobel en de implementatie van de Knowledge XChanger werden belicht door Robert Jan Alting von Geusau. En Arno Reuser sloot af met de belangrijke rol van bibliothecarissen om ‘leugens’ in de internationale inlichtingenwereld op te sporen.

Door: Alice Doek, Alice de Jong en Leen Liefsoens

Marydee Ojala: Waarde van het zoeken wordt minder belangrijk

Marydee Ojala, hoofdredacteur van het vakblad Online Searcher, trapte de VOGIN-IP-lezing af met haar keynote ‘Reflections on the reinvention of Research’. Ze stelde dat bibliothecarissen in het begin van het internettijdperk ‘tovenaars’ waren en grote hoeveelheden data konden vinden die niemand anders kon vinden. ‘Information professionals mastered data mining and big data, we just didn’t call it that.’

‘Information was in the cloud, we just didn’t call it that.’ Maar als we het nu over internet hebben, denken we eerder aan miljonairs van amper twintig dan aan bibliothecarissen…

Tegenwoordig zijn de verwachtingen sterk gestegen over wat op internet mogelijk is, en is permanent online zijn een gegeven: mensen voelen zich ontheemd als ze een dag geen e-mail kunnen checken. Verder is de eenvoud van Googles zoekbalk de norm voor alle zoekmachines geworden, en ook bij nieuwe ontwikkelingen is wat de ‘Great God Google’ (GGG) doet heel belangrijk. Nog een paar trends: iedere snipper papier wordt nu gedigitaliseerd en de trend is ‘sociaal’, waarbij diensten als LinkedIn, Facebook en Twitter naar elkaar toe groeien.

Er wordt meer dan ooit online gezocht, stelt Ojala, maar internetters zoeken vooral naar restaurants, reisinformatie en trivia, waardoor de waarde van het zoeken minder belangrijk wordt. Het is in feite een ‘trivialization of research’. Ojala vraagt zich af hoe informatieprofessionals de komende tijd met de ontwikkelingen zullen meegaan: wat zijn de kwesties waar het om draait, komt er nog innovatie uit onze sector? Mobiele apparaten nemen een grote vlucht en informatieprofessionals zouden zich moeten toeleggen op de ondersteuning van wetenschappelijk onderzoek, die nu nieuwe wegen aan het inslaan is. (AdJ)

Maarten de Rijke: Een blik onder de motorkap van zoekmachines

In zijn lezing ‘De Autonome Zoekmachine’ vertelde professor Maarten de Rijke, hoogleraar Informatieverwerking en Internet aan de Universiteit van Amsterdam, over de technologie onder de motorkap van zoekmachines. Hoe komen de ‘rankers’, oftewel de formules die bepalen waarom een document voor een zoekmachine relevant is, tot stand? Traditioneel spelen hierbij zaken een rol als een goede reputatie, een goede bron, de frequentie van het voorkomen van een term in een document en de lengte van een document. Maar hoe meet je de kwaliteit van de rankers? De Rijke liet zien hoe zijn team bezig is computers deze zaken zelf te laten onderzoeken.

Na een analyse van de inhoud en het bepalen van de structuur van de interactiedata van de gebruikers, leert men computers zelf complexe pagina’s samen te stellen, zodat die aan testgebruikers kunnen worden getoond. Hiermee worden queries verzameld die uiteindelijk bepalen welke documenten relevant zijn, zodat de ‘rankers’ beoordeeld kunnen worden.

Voor dit onderzoek worden machines gebruikt die zonder verdere inmenging combinaties kunnen wijzigen, zodat na enkele duizenden clicks van gebruikers duidelijk wordt welke zoekmachines (ergo welke rankers) de beste resultaten leveren. Uiteindelijk kunnen zoekvragen ook worden gebruikt om websites dynamisch (en trendgevoelig) in te richten. Een voorbeeld daarvan is de site ‘now playing on the planet’ (streamwatchr.com), die met dezelfde techniek, afhankelijk van de hoeveelheid tweets clipjes van bepaalde artiesten op de site toont. (AdJ)

Antoine Isaac: Making metadata work better

Antoine Isaac is wetenschappelijk coördinator bij Europeana, een erfgoedplatform van 2.300 Europese musea, archieven en bibliotheken waarin 300 miljoen objecten worden geaggregeerd en gedistribueerd. Het gaat om teksten, foto’s, video’s en geluid. Alles digitaal natuurlijk.

Isaac vertelde de bezoekers over nieuwe ontwikkelingen, met name het Europeana Data Model (EDM) dat bestaande standaarden rond het semantisch web opnieuw gebruikt. Waarom is zo’n nieuw model nodig? In de oude Europeana-situatie zijn er geen verbindingen tussen objecten (bijvoorbeeld een foto van een specifiek clavecimbel) en context entities (zoals de maker van het instrument en de plaats). Ook raken data over het object vermengd met de digitale inhoud in een en hetzelfde record. Dat leidt tot kwaliteitsproblemen.

In het nieuwe, meer granulair opgebouwde datamodel worden bestaande thesauri geharvest als linked open data, zoals bijvoorbeeld die van het MIMO: Musical Instrument Museums Online. De in MIMO opgeslagen vertalingen van de term clavecimbel worden volautomatisch gekoppeld aan het object. De toegekende geotags leiden naar een beschrijving van de plaats van oorsprong. Dit alles leidt tot betere zoekresultaten en tot informatievere annotaties bij de objecten.

Het model maakt op dit moment al gebruik van externe bronnen, zoals DBpedia en Geonames. Het staat open voor verdere verrijking, in nadrukkelijke samenwerking met de Europeana-deelnemers. Ook de koppeling met Getty-vocabularies staat op stapel.

Een bijkomend voordeel van het nieuwe EDM is dat het extensies mogelijk maakt, ofwel applicaties die gebaseerd zijn op de praktijken, wensen en behoeften van specifieke domeinen. Alle metadata van Europeana is open, zowel voor hergebruik als voor zoeken via een API. Europeana wil, zo zegt Antoine Isaac, zeker niet alleen maar een eindfabrikaat zijn, maar ook een distributiekanaal van metadata om daarmee andere sites en toepassingen te voeden. (AD)

Robert Jan Alting von Geusau: ‘informatie’-keuken van AkzoNobel

AkzoNobel, een internationale verfen coatingsonderneming met het hoofdkantoor in Amsterdam, heeft begin 2012 het product Knowledge XChanger™ van softwarebedrijf Comintelli in gebruik genomen. Het systeem aggregeert content uit verschillende bronnen, classificeert deze content met behulp van topic maps, analyseert trends en patronen in de content en levert tenslotte deze content aan geautoriseerde gebruikers via een gepersonaliseerde portal.

Al ging zijn lezing over de implementatie van Knowledge XChanger™, toch heeft Robert Jan Alting von Geusau niet één keer de naam in de mond genomen. Maar met allemaal informatiespecialisten als toehoorder blijft zoiets natuurlijk niet lang geheim. Alting von Geusau, projectmanager en business analist bij AkzoNobel, begon zijn verhaal met een introductie van AkzoNobel en waarom het Market Intelligence (MI)-proces binnen de onderneming moest worden aangepakt. Bij MI gaat het erom dat de juiste informatie bij de juiste personen in de onderneming terechtkomt ter ondersteuning van beslissingen op alle niveaus. En dat proces moet vooral op de meest efficiënte en kosteneffectieve manier plaatsvinden.

Een team van communicatieadviseurs, juristen en informatiemanagers ging aan de slag. Zij namen onder andere een kijkje bij het MI-proces van andere ondernemingen en hielden interviews met key users binnen het management, de marketing en de inkoop van AkzoNobel om hun informatiebehoeften in kaart te brengen.

Bij het binnenhalen van content is het moeilijk om ruisvrije nieuwsfeeds te realiseren, dus daar werden providers als LexisNexis, Proquest en Dow Jones zeker op getoetst.

Bij een multinational heb je te maken met verschillende doelgroepen die allemaal hun eigen cultuur hebben. Respecteer deze culturen en besteed aandacht aan het managen van verwachtingen, luidden de ‘Lessons Learned’ van het implementatieproces. De lezing eindigde met een live demo van de portal. Het uiterlijk deed denken aan dat van de persoonlijke startpagina-tool Netvibes. De gebruiksvriendelijkheid is volgens Alting von Geusau hoog. Middagvoorzitter Boyd Hendriks kondigde de lezing van Alting von Geusau aan als ‘vreemde eend in de bijt, maar daardoor juist een toevoeging’. In het zoekgeweld van de andere lezingen was dit kijkje in de ‘informatie’-keuken van AkzoNobel inderdaad een verfrissend tussendoortje, ook al ging het in essentie alleen over de implementatie van een softwarepakket. (LL)

Arno Reuser: Bibliothecarissen zijn de beste

Een lezing van Arno Reuser is een belevenis. Met vijfentwintig jaar ervaring in het inlichtingenwerk op defensiegebied is Reuser een ‘kanjer van de bovenste plank’, zoals hij in de aankondiging van zijn lezing werd betiteld. Hij bombardeerde het aanwezige publiek dan ook met frappante voorbeelden uit de internationale inlichtingenwereld. Maar ook de mondiale media bleef niet gespaard.

Ooit gehoord van ‘weasel-woorden’ of Quadronia? Die weasel-woorden bestaan echt. Ze klinken mooi of indrukwekkend, maar bij nadere beschouwing hebben ze weinig om het lijf. Voorbeelden zijn ‘tot 50% korting’ of ‘algemeen bekend’. CIA-achtige organisaties zijn volgens Reuser expert in het gebruik van dit soort woorden. Quadrionia is echter een verzinsel, maar als je je verhaal over dit fictieve land op de juiste manier brengt, zijn terroristen in staat om het vliegveld ervan op te blazen.

In de wereld van de journalistiek hebben kranten hun eigen creatieve manieren om het nieuws te brengen. Omdat Spits! al moest worden gedrukt voordat de verkiezingsuitslag van de laatste Amerikaanse presidentsverkiezingen bekend was, werd Obama op de voorpagina als winnaar aangeduid en op de achterkant als verliezer (zie tinyurl.com/mkcm5ml). Al is zo’n actie van Spits! geboren uit noodzaak, mensen nemen de inhoud voor waar aan. Vooral het feit dat dezelfde argumenten werden gebruikt waarom de kiezers voor rechts of voor links zouden hebben gekozen deed Reusers wenkbrauwen fronzen.

En dat de media het niet zo nauw nemen met de juistheid van de informatie die ze publiceren, blijkt uit de verzonnen namen van bemanningsleden van de in juli 2013 in San Francisco verongelukte Aziatische vlucht AA214: ‘Sum Ting Wong’, ‘Wi To Lo’, ‘Ho Lee Fuk’ en ‘Bang Ding Ow’.

Dit is maar een kleine greep uit de tal van, soms hilarische, voorbeelden die Reuser aanleverde. Hierdoor bleef er op het einde maar weinig tijd over voor de essentie van zijn boodschap: ‘Een goede analyse van inlichtingen, waardoor we bovenstaande leugens kunnen opsporen, kan niet worden gedaan zonder u, bibliothecarissen! Jullie zijn:

  • De beste in het onderscheiden van het goede en het kwade;
  • De beste in het selecteren van betrouwbare bronnen;
  • De beste in het valideren van open source informatie;
  • De beste in het matchen van de behoeften van de gebruikers met de wereldwijde aanbodzijde van informatie.’

En zo is het maar net. (LL)


Verder lezen

De presentaties van de workshops en lezingen zijn te vinden op vogin-ip-lezing.net/terugblik-slides-2014/


Deze bijdrage komt uit IP nr. 4 / 2014. Het gehele nummer kun je hier lezen