Dat zoeken we op: Wikipedia

Van de gegevens in Googles Knowledge Cards en ook in de andere directe antwoorden die je steeds vaker krijgt als je in Google zoekt, is een flink deel afkomstig uit Wikipedia. Anderzijds schijn je in de echte zoekresultaten minder vaak Wikipedia-pagina’s tegen te komen dan vroeger. Laten we daarom eens kijken hoe zoeken in Wikipedia zelf gaat.

Door: Eric Sieverts 

Rechtsboven elke pagina heeft Wikipedia een zoekvenster. Daarmee zoek je alleen in de taalversie waar je op dat moment in zit. Als je daar een zoekvraag begint in te tikken, verschijnt er meteen een dropdown-menuutje met de paginatitels die met de ingetikte letters beginnen. Als je daaruit iets kiest, maar ook als een helemaal zelf ingetikt woord een paginatitel blijkt te zijn, krijg je alleen die betreffende pagina of een ‘disambiguation’-pagina, in gevallen dat er meer pagina’s (lemma’s) zijn met dat woord in de titel. Resultaten waar je zoekterm(en) alleen maar in de tekst zelf voorkomen, krijg je dan niet te zien. Daarvoor moet je een echte zoekpagina oproepen, door – wat contra-intuïtief – op het oorspronkelijke vergrootglaasje te klikken zonder een zoekwoord in te tikken. Maar dan is er ook veel mogelijk.

Mooie zoekmogelijkheden

In de eerste plaats is er een flinke hoeveel zoeksyntax beschikbaar. Uitleg daarvan staat op een helppagina. Merkwaardigerwijs bevat die pagina in de Engelse versie een Wikipedia-kadertje dat meldt dat deze pagina ‘outdated’ is. Niettemin heb je er wel wat aan. Zeker meer dan in de Nederlandse versie waar zo’n helppagina helemaal ontbreekt.

De zoekmachine zoekt alleen op letters en cijfers, niet op andere (lees)tekens. Standaard wordt woordstemming toegepast. Met aanhalingstekens kun je toch exact zoeken. Verder volledig Booleaans (inclusief haakjes) en truncatie. Voor spellingsvarianten (bijvoorbeeld voor diacrieten) is er fuzzy zoeken – met ~ achter je zoekterm. Die ~ kun je ook voor een zoekvraag zetten, maar dat heeft een andere functie. Je krijgt dan altijd een resultatenlijst, ook als je zoekterm een paginatitel blijkt en je normaal alleen die ene pagina te zien zou krijgen.

Woorden uit je zoekvraag kun je ook specifiek in titels zoeken. Met prefixen kun je onder meer in allerlei speciale onderdelen van Wikipedia zoeken, zoals in de ‘talk’-pagina’s waarin over de inhoud van een lemma gediscussieerd wordt.

Daarnaast kent Wikipedia een geavanceerd zoekscherm, maar dat dient alleen om je zoekvraag vooraf te beperken tot bepaalde onderdelen van de site, hier ‘namespaces’ genoemd. Daarbij onder meer de net al genoemde talkpagina’s, de Mediawiki, categoriepagina’s en nog een heleboel meer. Maar dat is echt voer voor Wikipedianen.

Soms beter met Google

Voor zover we konden nagaan zijn alle Wikipedia-pagina’s ook met Google te vinden. In de Google-resultaten zie je vaak rich snippets. Die komen echter niet uit gestructureerde schema.org markup, maar worden door Google op eigen slimme wijze uit de tekst gegenereerd.

Nadeel van Wikipedia’s zoekfunctie is dat je altijd maar in één taalversie tegelijk kunt zoeken. Bij zoeken op taalonafhankelijke woorden zoals namen van personen, plaatsen, producten en dergelijke is dat nogal hinderlijk, omdat je dan vaak wilt weten wat er in verschillende talen over het onderwerp geschreven wordt. Dat is iets wat Google simpel oplost. Doordat de adressen van alle taalversies eindigen op wikipedia.org, levert een zoekactie zoekterm site:wikipedia.org automatisch resultaten in alle talen. Ook de verdere Google-syntax heb je dan tot je beschikking; Wikipedia’s eigen geavanceerde syntax natuurlijk juist weer niet. Het blijft dus een kwestie van afwegen wat in welk geval de voorkeur verdient.

URL www.wikipedia.org
Booleaans combineren   ja
Truncantie   ja
Speciale zoekvelden   ja
Advanced zoekscherm   ja
Parametrische filters   nee
Ook in Google   ja
Semantische markup  nee

 

Eric Sieverts is redacteur van IP en freelance docent en adviseur.

Deze bijdrage komt uit IP nr. 7 / 2015. Het gehele nummer kun je hier lezen

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *