Door: Eric Sieverts
Metadata zou best eens het woord van 2014 kunnen worden. Iedereen heeft het er ineens over. Vijf jaar geleden placht ik mijn IDM-studenten nog omstandig uit te leggen wat metadata waren. Alleen voorlijke automatiseerders gebruikten het woord toen al een tijdje. En een paar pretentieuze bibliothecarissen die metadata chiquer vonden klinken dan het oubollige titelbeschrijving. Daartoe geïnspireerd door Amerikaanse vakgenoten die in personeelsadvertenties al langer Metadata Librarians en Metadata Coordinators wierven.
Dat het woord ‘metadata’, behalve bij wat vakidioten, hier vrijwel onbekend was, blijkt ook wel uit het voorkomen ervan in de Nederlandse Krantenbank. In de periode tot en met 2013 kwam het maar tien keer voor in koppen van artikelen, waarvan zelfs maar drie keer in gewone kranten. De rest kwam uit vakbladen, zoals onze eigen IP, de VIP en InCT. Maar alleen al in de eerste drie maanden van dit jaar komen we het dertig keer tegen. Dankzij Edward Snowden en de afluisterpraktijken van de NSA heeft ineens iedereen het erover en iedereen denkt te weten wat metadata zijn. Zo meldde de Volkskrant onder meer: ‘Ook Plasterk wist al maanden over metadata’; ja, hij wel. En ook nog: ‘NSA verzamelt 6 miljard metadata per dag’.
Dat is nog wel van een andere orde dan de metadata waarover begin dit jaar op OpenGLAM bericht werd: ‘Nearly all German National Library metadata now available under CC0 license’. Het heeft brave bibliothecarissen waarschijnlijk meer dan een eeuw gekost om die tien miljoen metadata te verzamelen. Maar daartoe heeft dan wel iedereen vrije toegang. En dan nog een opmerkelijk verschil. Intussen hebben wij voor onze zoeksystemen meestal een voorkeur voor full-text zoeken, boven alleen metadata. Maar de NSA beweert voor hun analyses wel met alleen maar metadata toe te kunnen. Of zouden ze stiekem toch alles bewaren wat wij zeggen en schrijven om daarop datamining los te laten (zoals Google natuurlijk al lang doet)?
Uit historisch besef heb ik ook nog even gekeken in de gedigitaliseerde oude kranten van de KB (die nu in de nieuwe dienst Delpher zitten). Vijftien vindplaatsen voor ‘metadata’! Maar veertien daarvan, uit de jaren 1894-1934, blijken voort te komen uit de meest onwaarschijnlijke OCR-fouten. In werkelijkheid bleek daar matador, metselaar of margarinefabriek te staan. Alleen in een overzicht van radio- en tv-programma’s in het Limburgs Dagblad kwam echt het woord metadata voor. Op zondag 2 februari 1975 zond de Belgische tv een tien minuten durend filmpje uit dat kortweg Metadata heette. Dat maakt wel heel nieuwsgierig naar wat onze Belgische buren daar bijna veertig jaar geleden al over te melden hadden.
Nog even iets recenters. In mijn bookmarks zat ook nog een bijna twee jaar oude blogpost met de titel: ‘Metadata isn’t what it used to be’. Dat ging toen nog over catalogiseren, maar buiten die context klinkt deze verzuchting nu wel heel actueel.
Eric Sieverts is redacteur van InformatieProfessional en freelance docent en adviseur.
Deze bijdrage komt uit IP nr. 4 / 2014. Het gehele nummer kun je hier lezen