Steeds meer data van het Oekraïense internet gearchiveerd

Terwijl de oorlog in Oekraïne heviger wordt, werken steeds meer vrijwilligers van over de hele wereld aan het archiveren van digitale content die het risico loopt te worden vernietigd of gemanipuleerd. Het Internet Archive ondersteunt verschillende inspanningen, waaronder Saving Ukrainian Cultural Heritage Online (SUCHO) dat begin maart werd gelanceerd.

Al eerder deze maand meldde de IP-site dat ‘archivarissen en data hoarders de online geschiedenis van Oekraïne aan het documenteren zijn’. Deze activiteiten zijn inmiddels geïntensiveerd. Meer dan 1200 vrijwilligers hebben namens SUCHO tot nu toe 10 terabytes aan data opgeslagen, waaronder 14.000 geüploade items (afbeeldingen en pdf’s), en delen van 2300 websites vastgelegd. Dit omvat materiaal van onder andere Oekraïense musea, bibliotheekwebsites, digitale tentoonstellingen en openaccesspublicaties, zo is te lezen in een blog van het Internet Archive.

‘Als we aan internet denken, denken we dat de data er altijd zullen zijn, maar al deze data staan ​​op fysieke servers die kunnen worden vernietigd, net als gebouwen en monumenten’, zegt Quinn Dombrowski, technologiespecialist aan de Stanford University en medeoprichter van SUCHO. De vrijwilligers van deze organisatie worden online en via Slack gecoördineerd en gebruiken verschillende webarchiveringstools, waaronder de Wayback Machine, om websites, openaccesstijdschriften, muziek en ander digitaal materiaal vast te leggen. Een deel van de informatie wordt opgeslagen bij het Internet Archive, waar het kan worden ontsloten met behulp van opensourcesoftware.

Digitale archieven en bibliotheken

Een grote inspanning wordt geleverd door het Archive Team, een los collectief van archivarissen, activisten en programmeurs die een verscheidenheid aan online materiaal vastleggen en opslaan in het Internet Archive. Archive Team is bezig met drie grote projecten om het Oekraïense internet te archiveren. Het eerste is een ongerichte crawl op URL’s die eindigen op .ua, die zich over de hele breedte van het Oekraïense web uitstrekt in de hoop snel een grote verscheidenheid aan materialen te verzamelen. Het tweede project selecteert specifieke sites om in hun geheel te archiveren, waaronder webpagina’s van de overheid, educatieve sites, en sites van instellingen met digitale archieven en digitale bibliotheken. Het derde project richt zich op de journalistiek waarbij wordt vertrouwd op Oekraïense ‘news aggregators’ om tientallen miljoenen Oekraïense artikelen te verzamelen, waardoor een uitgebreid, real-time verslag wordt gemaakt van hoe de invasie zich ontvouwt.