KB neemt Nederlandstalige Wikipedia op in archief

De KB heeft de tekst van de Nederlandstalige Wikipedia opgenomen in het archief. Het gaat hierbij om de tekst bij ongeveer 2,2 miljoen artikelen. Ook wordt een door de Wiki- gemeenschap zelf aangewezen selectie ‘topartikelen’ integraal gearchiveerd.

De KB heeft als bibliotheek de taak om het erfgoed van Nederland te bewaren voor de toekomst. Wikipedia is hiervoor een interessante bron, aldus de KB. ‘De verandering van artikelen door de jaren heen weerspiegelt veranderingen in kennis, maar ook in het denken van de samenleving.’

Wiki onder druk

Daarnaast geeft de site een goede indruk van de informatie die er is over bijna alle mogelijke onderwerpen. Voor taalkundigen is Wikipedia volgens de KB ook een onmisbare bron. ‘Maar in deze tijden van polarisatie, desinformatie en chatbots komt Wikipedia onder druk te staan. Reden te meer voor de KB om de informatie op de Nederlandstalige Wikipedia veilig te stellen voor de generaties na ons.’

Johan Cruijff en hommels

Het is voor de KB niet mogelijk de Nederlandstalige Wikipedia helemaal op te nemen. Door de enorme omvang, de structuur van de wiki en de gigantische hoeveelheden beeldmateriaal kan dat niet. Er is daarom besloten om alleen de teksten en wijzigingen zonder verdere opmaak op te nemen. Dat deel is alleen al ruim 50 GB groot.  Daarnaast zijn 378 ‘etalageartikelen’ wel helemaal opgenomen, inclusief foto’s en filmpjes. Dit zijn artikelen die voldoen aan bepaalde standaarden, die vaak erg uitgebreid zijn en die door de Wiki-gemeenschap worden gewaardeerd. Voorbeelden hiervan zijn de artikelen over Johan Cruijff en hommels.

Door deze twee strategieën blijft een representatief beeld van de Nederlandstalige Wikipedia bewaard, verwacht de KB. Alle teksten en wijzigingen worden een keer per jaar opnieuw binnengehaald via de databasedump. Ook worden de etalageartikelen elk jaar opnieuw toegevoegd.