KB neemt Nederlandstalige Wikipedia op in archief

De KB heeft de tekst van de Nederlandstalige Wikipedia opgenomen in het archief. Het gaat hierbij om de tekst bij ongeveer 2,2 miljoen artikelen. Ook wordt een door de Wiki- gemeenschap zelf aangewezen selectie ‘topartikelen’ integraal gearchiveerd.

De KB heeft als bibliotheek de taak om het erfgoed van Nederland te bewaren voor de toekomst. Wikipedia is hiervoor een interessante bron, aldus de KB. ‘De verandering van artikelen door de jaren heen weerspiegelt veranderingen in kennis, maar ook in het denken van de samenleving.’

Daarnaast geeft de site een goede indruk van de informatie die er is over bijna alle mogelijke onderwerpen. Voor taalkundigen is Wikipedia volgens de KB ook een onmisbare bron. ‘Maar in deze tijden van polarisatie, desinformatie en chatbots komt Wikipedia onder druk te staan. Reden te meer voor de KB om de informatie op de Nederlandstalige Wikipedia veilig te stellen voor de generaties na ons.’

Johan Cruijff en hommels

Het is voor de KB niet mogelijk de Nederlandstalige Wikipedia helemaal op te nemen. Door de enorme omvang, de structuur van de wiki en de gigantische hoeveelheden beeldmateriaal kan dat niet. Er is daarom besloten om alleen de teksten en wijzigingen zonder verdere opmaak op te nemen. Dat deel is alleen al ruim 50GB groot. 

Daarnaast zijn 378 ‘etalage-artikelen’ wel helemaal opgenomen, inclusief foto’s en filmpjes. Dit zijn artikelen die voldoen aan bepaalde standaarden, vaak erg uitgebreid zijn, en gewaardeerd worden door de Wiki-gemeenschap. Hier vind je bijvoorbeeld de artikelen over Johan Cruijff en hommels.

Door deze twee strategieën blijft een representatief beeld van de Nederlandstalige Wikipedia bewaard, verwacht de KB. Alle teksten en wijzigingen worden een keer per jaar opnieuw binnengehaald via de databasedump. Ook worden de etalage-artikelen elk jaar opnieuw toegevoegd.