Taxonomie en tooling – verbeter de vindbaarheid van je content

Door Joyce van Aalten

Als informatieprofessional is het veelal een van je taken om informatie en data toegankelijk en vindbaar te maken voor je organisatie en haar gebruikers. Een taxonomie (metadata, trefwoordenlijst, thesaurus of informatietaal) kan daarbij helpen, maar hoe beheer je die? Welke tools zijn er, en wanneer kun je welke tool het beste inzetten?

Ongeacht hoe je een taxonomie gaat gebruiken, heb je voor de opbouw en het beheer ervan iets van gereedschap (tooling) nodig om taxonomietermen en eventuele relaties tussen deze termen op te slaan. In de context van dit artikel versta ik onder tooling een bestand of systeem waarin je taxonomietermen, relaties tussen deze termen en eventuele andere attributen opslaat. In mijn werk als taxonomieconsultant werk ik met veel verschillende taxonomieën die onderling verschillen qua complexiteit en grootte. Ondanks deze verschillen is er altijd een vraag: wat is de beste optie om deze taxonomie op te slaan en te onderhouden? In dit artikel beschrijf ik niet alleen de verschillende soorten, maar ook welke tool voor welke situatie het meest geschikt is. 

Drie groepen taxonomietools

Taxonomietools kunnen worden onderverdeeld in drie groepen: spreadsheets, ingebouwde modules en speciale taxonomietools. Ze verschillen van elkaar op het gebied van specifieke taxonomiefunctionaliteiten, gebruiksgemak, integratie met andere systemen en kosten.

Hoewel spreadsheets van oorsprong geen taxonomietool zijn, worden ze wel vaak gebruikt om een taxonomie in te ontwikkelen en te beheren. Zeker een eerste opzet van een taxonomie start vaak in een spreadsheet. Groot voordeel is namelijk dat spreadsheets binnen elke organisatie voorhanden zijn. Daarnaast leent de aard van spreadsheets zich prima om te structureren. De hiërarchische structuur tussen taxonomietermen, maar ook synoniemen en notities, kunnen in kolommen en rijen worden vastgelegd. Bovendien hebben bijna alle taxonomiemodules en taxonomietools (waarover verderop meer) de mogelijkheid om een spreadsheet te importeren. Het is dan ook begrijpelijk dat veel organisaties een spreadsheet gebruiken om hun taxonomie in te beheren.

Tegelijk is een spreadsheet natuurlijk geen echte taxonomietool. Een van de nadelen is dat in een spreadsheet de relaties tussen taxonomietermen impliciet zijn. Kortom, dat de spreadsheet de semantische relatie tussen concepten niet echt begrijpt. Het belangrijkste nadeel van een spreadsheet is echter dat die erg foutgevoelig en arbeidsintensief is.

Systemen met module

Content, documenten en data kunnen worden opgeslagen en gestructureerd in een informatiesysteem, zoals een contentmanagementsysteem (CMS), documentmanagementsysteem (DMS), digital asset management (DAM)-systeem of bibliotheeksysteem. Om informatie in een dergelijk systeem te voorzien van taxonomietermen (taggen), hebben sommige van deze systemen een module waarin gecontroleerde trefwoordenlijsten/taxonomieën kunnen worden opgeslagen en onderhouden. Voorbeelden hiervan zijn de Managed Metadata Store van Microsoft 365/SharePoint en de Drupal Taxonomy Manager. Dergelijke modules maken het bijvoorbeeld mogelijk om hiërarchie tussen termen aan te brengen en synoniemen te definiëren. Het hangt echter van de specifieke module af hoe basaal of geavanceerd deze taxonomiefunctionaliteiten zijn. Sommige modules bieden bijvoorbeeld meertalige ondersteuning of de mogelijkheid om definities op te slaan bij taxonomietermen. Soms is het echter de vraag of deze modules taxonomiemodules mogen heten. Er bestaan er ook die niet veel meer zijn dan een spreadsheet in een mooie interface.

Zelden exportmogelijkheden

Bij een module is de taxonomie onderdeel van het contentsysteem, en daarmee is de taxonomie dan ook direct beschikbaar voor het taggen. Er hoeven geen technische koppelingen of andere inspanningen te worden geleverd om dit mogelijk te maken. Dat de module integraal onderdeel is van een contentsysteem, is echter meteen ook een belangrijk aandachtspunt: de taxonomie kan alleen worden gebruikt voor content die binnen het systeem is opgeslagen. Dat is ook waarvoor de modules zijn bedoeld. Wanneer je de taxonomie in andere systemen wilt gaan gebruiken, kan dit een grote uitdaging opleveren. Deze modules hebben zelden exportmogelijkheden en het aansluiten van de taxonomiemodule op andere systemen is bijna onmogelijk.

Centrale opslagplaats 

Taxonomiebeheertools, de derde groep van taxonomietools, zijn specifiek bedoeld voor het creëren en onderhouden van gecontroleerde vocabulaires, taxonomieën, thesauri en/of ontologieën. Het scala aan tools varieert van vrij eenvoudig tot zeer geavanceerd, maar allemaal bieden ze de algemeen benodigde taxonomiefunctionaliteiten, zoals het wederkerig maken van relaties tussen termen (een BT-NT-relatie), het niet toestaan van dubbelzinnige termen enhet voorkomen van verwijzingen die niet zijn toegestaan binnen de taxonomiebouw. De meer geavanceerde taxonomiebeheertools bieden daarnaast functionaliteiten voor bijvoorbeeld het definiëren van eigen relaties en attributen, waarmee enkele meer in de richting van een ontologiebeheertool gaan. Sommige taxonomiebeheertools zijn onderdeel van een bredere semantische suite, waarmee ook een semantische search engine tot de mogelijkheden behoort. 

Het achterliggende idee van een speciale taxonomietool is dat je een specifieke tool voor taxonomiebeheer hebt, en dat die tool met een of meerdere contentsystemen kan worden gekoppeld. Dit kan via export/importbestanden of via API-connectie/webservices. Het hebben van een centrale opslagplaats voor taxonomietermen maakt een speciale taxonomietool de beste optie als je een centrale, organisatiebrede taxonomie wilt.

Wel/geen afscheid van spreadsheet

Wanneer en hoe gebruik je nu de bovengenoemde taxonomietools? Wat spreadsheets betreft zijn sommige mensen van mening dat deze totaal ongeschikt zijn om een taxonomie in te beheren. Daar ben ik het niet helemaal mee eens. In bepaalde gevallen kun je prima met een spreadsheet uit de voeten, bijvoorbeeld als je net begint met het ontwikkelen van je taxonomie en/of als je taxonomie nog relatief klein is. En ook als je taxonomie vrij statisch is en niet vaak verandert, kan een spreadsheet een goede keuze zijn. Zeker als de verwachting is dat de taxonomie in de loop van de tijd niet heel omvangrijk zal worden. Verder is een andere tool soms simpelweg geen optie vanwege een beperkt budget of als het contentsysteem geen ingebouwde module heeft.

Wel een waarschuwing: weet wanneer het tijd is om afscheid te nemen van de taxonomiespreadsheet. Bijvoorbeeld wanneer de taxonomie begint te groeien, in zowel soorten relaties als in aantal termen, of wanneer de taxonomist zijn of haar werk niet meer goed kan doen en gefrustreerd raakt. Dan weet je dat het tijd is om naar een ingebouwde module of een speciale taxonomietool te kijken.

Module ‘als aanjager’

Ondanks het feit dat het bij ingebouwde modules soms ontbreekt aan (geavanceerde) taxonomiebeheerfunctionaliteiten, kunnen er situaties zijn waarin zo’n module een prima optie is. Dat is het geval als 1) de taxonomie in slechts één contentsysteem wordt gebruikt en 2) dat contentsysteem voldoet aan je behoeften ten aanzien van de taxonomiefunctionaliteiten. Ga dus na of de taxonomie binnen één contentsysteem zal worden gebruikt en de verwachting is dat deze situatie op korte termijn niet zal veranderen (dat wil zeggen: niet binnen twee jaar). Als dat niet zo is, bepaal je de gewenste taxonomiefunctionaliteiten, bijvoorbeeld ten aanzien van polyhiërarchie, meertaligheid of associatieve relaties. Vervolgens bekijk je of de ingebouwde module hieraan voldoet. 

Je kunt een ingebouwde module ook gebruiken als aanjager om een organisatie vertrouwd te laten worden met het gebruik en de voordelen van een taxonomie. In de loop der jaren heb ik voor verschillende klanten taxonomieën gemaakt in de Managed Metadata Store van SharePoint. Hierbij was ik niet alleen gefocust op het creëren van de taxonomie, maar heb ik het ook gebruikt als speeltuin om te laten zien hoe een taxonomie de vindbaarheid van content kan verbeteren. Bijvoorbeeld door de zoekmachine met de taxonomie te optimaliseren en gebruikers vertrouwd te laten worden met taggen. 

Discussie over termen/woorden

Natuurlijk is een taxonomiebeheertool de ideale oplossing als een spreadsheet of ingebouwde module niet (meer) voldoende is voor je behoeften aan taxonomie-onderhoudsfunctionaliteit, of als je taxonomie groeit in het aantal te onderhouden termen en/of relaties. Een taxonomie hoeft echter niet omvangrijk te zijn om een taxonomiebeheertool te kunnen gebruiken. Ook als je een gecentraliseerde, bedrijfsbrede taxonomie ambieert die the single point of truth is, zou ik een taxonomiebeheertool aanraden.

Onlangs heb ik voor een klant een relatief kleine taxonomie ontwikkeld. Binnen die organisatie was er veel discussie en onenigheid over welke termen/woorden ze moesten gebruiken voor hun onderwerpen en thema’s. Standaardisatie van terminologie was een hot topic op alle niveaus van de organisatie, van topmanagement tot content- en webanalysemanagers. De lijst met termen was niet enorm, maar ik raadde ze toch aan om een speciale taxonomietool aan te schaffen. Deze hebben we vervolgens voor alle medewerkers makkelijk toegankelijk en doorzoekbaar gemaakt. Omdat de taxonomie van de organisatie beschikbaar is in een echte tool, in plaats van in een spreadsheet, hebben we de taxonomie meer aanzien gegeven.

‘Connectiviteitsvriendelijkheid’ systemen

Als je de taxonomie aan meer dan één inhoudsopslagsysteem wilt koppelen, is een taxonomiebeheertool de beste optie. Het geeft je de mogelijkheid om de taxonomie op een centrale plek te onderhouden. Er is echter een belangrijke voorwaarde: je moet over voldoende technische vaardigheden beschikken (in huis of extern in te huren) om de tool aan te laten sluiten op andere systemen. Dat is geen sinecure, want je bent afhankelijk van de ‘connectiviteitsvriendelijkheid’ van die systemen.

Sommige mensen zouden zeggen dat een speciale taxonomietool de voorkeur heeft als het gaat om het bouwen en beheren van een taxonomie. Daar ben ik het niet noodzakelijk mee eens. Allereerst moeten we realistisch zijn: niet alle organisaties hebben het budget en/of de technische vaardigheden om zo’n tool aan te schaffen. Daarnaast is het niet per se nodig als een spreadsheet of ingebouwde module aan de behoeften voldoet. Een taxonomietool is geen vereiste om een succesvolle taxonomie te hebben. 

Weloverwogen beslissing

Net zoals elke organisatie of omgeving waarin een taxonomie wordt gebruikt anders is, zijn geen twee taxonomieën gelijk. Daarom is er niet een beste keuze voor een taxonomietool. Het hangt allemaal af van hoe je je taxonomie wilt inzetten, van de grootte en complexiteit ervan en van de contentsystemen waarvoor de taxonomie zal worden gebruikt.

In dit artikel heb ik beschreven welk type taxonomietool het beste bij welke situatie past, maar houd er rekening mee dat jouw beslissing mogelijk niet in overeenstemming is met de gedachten die ik heb opgeschreven. Het belangrijkste is dat jouw beslissing een weloverwogen beslissing is. Het is misschien verleidelijk om voor een eenvoudig te implementeren oplossing te gaan, of misschien denk je dat een taxonomie alleen succesvol kan zijn met een speciale taxonomietool. Geen van beide is een solide basis voor een duurzame beslissing. Je moet een duidelijke visie hebben op het kenmerk van de taxonomie, hoe deze zal worden benut, in welk contentsysteem (of systemen) deze zal ‘leven’ en hoe mensen binnen de organisatie daar waarschijnlijk op zullen reageren.

Onthoud: de taxonomietool is het technische aspect, maar het is de kwaliteit van de taxonomie zelf die zal bepalen of deze succesvol is of niet.


Wat is een taxonomie?

De begrippen metadata, trefwoordenlijst, taxonomie, thesaurus en informatietaal worden soms door elkaar gebruikt, waardoor er nog wel eens onduidelijkheid kan ontstaan. Hoewel ze verschillend zijn, hebben ze allemaal overeenkomstig dat ze de toegankelijkheid en daarmee de vindbaarheid van informatie kunnen verbeteren. Daartoe labelen we die informatie; we voegen kenmerken toe. Deze kenmerken zijn metadata en kunnen variëren van titel tot auteur tot aanmaakdatum. Een specifiek soort metadata zijn inhoudelijke metadata waarmee we willen vastleggen waar een document over gaat of wat het is. Als we dit doen volgens een gecontroleerde lijst met termen, spreken we van een informatietaal waar trefwoordenlijsten, taxonomie en thesaurus specifieke ‘verschijningsvormen’ van zijn.

Gecontroleerde lijst van concepten

Wat het echter verwarrend maakt, is dat het begrip taxonomie ook kan worden gebruikt voor het ordenen van informatie volgens een bepaalde systematiek (voor bijvoorbeeld een mappen- of navigatiestructuur). En om de verwarring nog groter te maken: in het Angelsaksische taalgebied wordt taxonomie als containerbegrip gebruikt voor alle informatietalen (en dus overkoepelend voor trefwoordenlijsten, taxonomieën en thesauri). Wie meer wil weten over de overeenkomsten en verschillen tussen deze begrippen kan terecht in het leerboek Maak het vindbaar: op schijven, sites en SharePoint.

In dit artikel gebruik ik taxonomie in de betekenis van ‘een gecontroleerde lijst van concepten in hun onderlinge relatie’ en daarmee als een verbastering van het Engelse taxonomy. Hoewel dit semantisch wellicht niet correct is, doe ik dit omdat er in de markt niet wordt gesproken van ‘informatietaalbeheertools’, maar van ‘taxonomy management tools’.


> Joyce van Aalten schreef mee aan het recent verschenen boek Taxonomies: Practical Approaches to Developing and Managing Vocabularies for Digital Information.

> Ze geeft een lezing op 16 maart 2023 tijdens de VOGIN-IP-lezing: Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar niks aan kan doen).


Joyce van Aalten is taxonomieconsultant, docent en auteur.

Deze bijdrage komt uit het digitale magazine IP #9-2022. Klik op de onderstaande button om het hele nummer te lezen.