Column: Dingen of documenten

Door: Eric Sieverts

Al een tijdje laten zoekmachines zich erop voorstaan eigenlijk geen zoekmachine meer te zijn. Dat ze niet alleen zoeken, maar ook zelf beslissen welke informatie de gebruiker wil weten. Met Wolfram|Alpha was dat heel duidelijk. Maar ook Bing afficheerde zich bij zijn introductie als ‘decision engine’ in plaats van als zoekmachine. Overigens was dat niet erg terecht, want Bing leverde gewoon net zulke lijstjes resultaten als Google en alle andere zoekmachines. En nu is Google zelf dan ook zover met zijn Knowledge Graph, in Googles eigen Search Blog, ‘Inside Search’, aangeprezen met de kreet: ‘Things not strings’. Dat houdt in dat Google zich niet meer beperkt tot de domme reeksen letters in onze zoekvragen, maar weet heeft van een heleboel dingen of entiteiten, waartussen het relaties kent. En waarover het ook allerlei gegevens en feiten beschikbaar heeft, op grond waarvan dubbelzinnigheden ontrafeld kunnen worden.

Hoe komt Google eigenlijk aan al die gegevens? Op de discussielijst van Freebase, een grote open source semantische database, sprak Google al zijn dank uit aan alle mensen die geholpen hebben Freebase te vullen. En dat die wel blij mogen zijn dat hun werk dankzij Google veel ruimere verspreiding krijgt: ‘This is bringing a lot of the concepts about high-quality, structured data and entity disambiguation, that Freebase has refined, to a much wider audience.’ Behalve die Freebase-gegevens, aangevuld met Wikipedia en CIA World Factbook, beweert Google nog gebruik te maken van eigen gegevens, waardoor er meer dan 500 miljoen ‘dingen’ in die Knowledge Graph zouden zitten en meer dan 3,5 miljard feiten en relaties. En bovendien: ‘… it’s tuned based on what people search for, and what we find out on the web.’ Maar waarschijnlijk dan toch nog vooral voor de Engelstalige wereld.

Toch vraag ik me sterk af of alle soorten gebruikers hierop zitten te wachten. Wie alleen even een feitje wil opzoeken is er vast mee geholpen, maar had dat natuurlijk ook allang in de Wikipedia kunnen vinden. Het is echter de vraag of dit voor de echte informatieprofessional wel zo nuttig is. In veel gevallen wil die liever gewoon een lijstje documenten die hij zelf op waarde beoordeelt en waaruit hij zelf conclusies, voors en tegens, alternatieven en dergelijke destilleert. Of liever gezegd, dat hoort een goede informatieprofessional te willen. Zelf aan het stuur, en het niet aan Google overlaten. Is het dan helemaal mis? Nee, gelukkig blijft Google ook gewoon met lijstjes resultaten komen; documenten in plaats van dingen. En het is wel een volgende stap in de richting van het semantisch web. Ook al noemt Google dat zelf niet zo en vermijdt het zelfs – tot verdriet van sommige semantisch web enthousiasten – ook maar enig jargon uit die hoek te gebruiken bij het aanprijzen van deze nieuwe functionaliteit.

Deze bijdrage komt uit IP nr. 7&8 / 2012. Het gehele nummer kun je hier lezen