Verenigingen

Bijdrage KVAN

De tsunami te lijf

Op YouTube is een fragment te vinden van een interview uit 1999 van de BBC met David Bowie. Dat gaat natuurlijk over muziek, meer specifiek over de veranderingen die Bowie ervaart in de interactie tussen muzikant en publiek. In het verlengde daarvan (vanaf ongeveer 3:30 minuten) spreekt hij over het internet en de immense veranderingen die dat ons zal gaan brengen, zowel in positieve als in negatieve zin. 

De BBC-interviewer reageert verbaasd. Internet, dat is toch niet meer dan een ‘vehicle’, een medium om informatie van A naar B te brengen? Nou nee, zegt Bowie, dat ziet hij toch echt heel anders. Hij spreekt over spannende kansen en beangstigende effecten, waarvan we (in 1999) nog maar ‘the top of the iceberg’ hebben gezien. Een opmerkelijk profetische blik, want destijds was het internet nog maar een paar jaar breder bekend en beschikbaar, en moest het nog aan zijn enorme opmars beginnen.

‘In control’ komen en blijven

Ondertussen weten we hoezeer de beschikbaarheid van het world wide web, en de digitalisering in bredere zin, onze wereld ingrijpend en structureel heeft veranderd en nog steeds verandert. Als informatie- en archiefsector plukken we daar de vruchten van. Tegelijkertijd stelt het ons voor enorme uitdagingen om ‘in control’ te komen én te blijven vandie enorme hoeveelheid data en informatieobjecten (de nieuwe Archiefwet 2021 spreekt nog steeds over ‘documenten’ …) die we alleen al als overheden produceren. En om al die data te beheren, duurzaam toegankelijk te maken en te houden – deels voor de eeuwigheid.

Informatie op sociale media

Om te bepalen welke overheidsinformatie blijvend moet worden bewaard, en dus door archiefinstellingen op termijn actief aan de burger beschikbaar moet kunnen worden gesteld, hebben we keurige selectielijsten. Daarnaast, vooral in het particuliere domein, zijn er nog veel meer digitale uitingen, archieven en platforms die het verdienen om duurzaam beschikbaar en toegankelijk te blijven. Of het BBC-interview met David Bowie daarbij hoort, is een vraag die mag worden gesteld. Een eenvoudige vraag met een complex antwoord. Want hoe selecteren we de tsunami aan informatie die wordt gegenereerd op sociale media, websites en platforms en in online nieuwsbrieven, van zowel overheden als particuliere organisaties?

Niet terugschrikken, maar doen

Dan hebben we het nog niet over de technische hobbels die sommige platforms opwerpen bij het archiveren van deze informatie. Toch moeten we daar niet van terugschrikken, maar ons er juist maximaal voor inzetten. Want als we de generaties na ons de gelegenheid willen bieden om ‘onze tijd’ te leren kennen en onderzoeken, zijn al deze bronnen onmisbaar.

Dit was voorlopig de laatste column van KVAN in IP. Je kunt de ontwikkelingen in de archiefsector volgen op kvan.nl.


Bijdrage KNVI

Softwarearchief

Op 10 december 2022 staat de teller op 13.301.978.706 ingecheckte en beheerde source files. Een onwaarschijnlijk getal dat ieder dag weer groeit. We hebben het hier over Software Heritage, een non-profitorganisatie die zich ten doel stelt om unieke software te archiveren. 

Wat zo mooi is aan hun opdracht is dat iedereen zijn stukjes code kan delen, en er ook naar kan verwijzen voor hergebruik. Om met Harold (Hal) Abelson te spreken: ‘Programma’s moeten worden geschreven zodat mensen ze kunnen lezen, en ze moeten alleen incidenteel worden geschreven voor machines om uit te voeren.’ In het archief van Software Heritage zitten ook virussen. Net als bij een medisch lab of een willekeurige bibliotheek zit er van alles tussen. Er is alleen geen fysieke plek waar je rustig tussen de rijen met ‘codes op de plank’ kunt lopen.

Geschiedenis vastleggen

Deze geschiedenis vastleggen is essentieel, zeker omdat omgevingen met een profit-karakter soms ophouden te bestaan. Veel software wordt in open omgevingen gedeeld, en in de listings kun je zien welke developer de status van superstar heeft bereikt onder zijn vakgenoten. Het gebeurt echter nogal eens dat het commerciële bedrijf dat de softwaredatabase onderhoudt ermee stopt. Denk in dit geval aan Google Code en Gitorius.org, maar ook aan het verwijderen van codes door Bitbucket en GitLab. Al die codes bijeen – het brengt je op de vraag hoeveel er nog bij zullen komen, zeker nu machine learning en AI zichzelf aanleren codes te genereren en zij zich kunnen ontwikkelen tot betere versies van zichzelf.

The Library of Babel

Dit doet een beetje denken aan wat Jorge Louis Borges beschreef in zijn boek uit 1941, The Library of Babel: een oneindig universum met daarin een oneindige bibliotheek met alle boeken die ooit geschreven zijn en ooit geschreven zullen worden, in alle talen die er zijn. Met 25 karakters (22 letters, een spatie, komma en punt) zou dat theoretisch moeten kunnen, hoewel heel veel boeken totaal onleesbaar zullen zijn.

Een werkende versie hiervan zien? Jonathan Basile heeft het voor zowel teksten als foto’s uitgewerkt.

Alles bestaat al

Het is interessant om te bedenken dat in theorie alles al bestaat, ook al is het er nog niet. Als we dat zouden omarmen, scheelt dat heel veel type- en klikwerk. En het zou ook veel tijd schelen voor mijn vrienden die nu via sociale media, met de hulp van eenvoudige AI, geinige mock-ups laten maken van hun gezicht. Voila doet het in een handomdraai. De foto’s beloven ze na 48 uur weg te gooien, maar dat doen ze natuurlijk niet met je persoonlijk identificeerbare informatie, zoals je activiteit online. Die delen ze met externe partners en adverteerders. Hoe zou het zijn als je weet dat je dit allemaal niet meer hoeft te doen? Die foto’s waren er namelijk toch al, in de Bibliotheek van Babel. Net als deze column overigens. 

Wouter Bronsgeest, duovoorzitter van de KNVI.


Deze bijdrage komt uit het digitale magazine IP #9-2022. Klik op de onderstaande button om het hele nummer te lezen.