Interview met founding father van het internet archive: Brewster Kahle: ‘Als informatie niet online staat, is het net alsof het niet bestaat’

Brewster Kahle, oprichter van het Internet Archive, zal op het komend KNVI congres via Skype spreken over contextualisering van (bibliotheek-)data en competenties van medewerkers. Bij wijze van opwarmertje beantwoordde hij via e-mail alvast een paar vragen van InformatieProfessional

Door: Frank Huysmans

Wie wel eens een verloren gewaande website heeft teruggevonden met de Wayback Machine, heeft dat aan Brewster Kahle te danken. Deze internetpionier verwierf faam en kapitaal met het webanalyticsbedrijf Alexa, dat hij oprichtte in 1996 en in 1999 aan Amazon verkocht. Tegelijk met Alexa richtte hij het Internet Archive (archive.org) op, dat hij met zijn verworven fortuin ondersteunt.

De missie van het Internet Archive is even simpel als ambitieus en onbescheiden: ‘universal access to all knowledge’. Aanvankelijk was het archief bedoeld om born-digital informatie voor het nageslacht te bewaren. Inmiddels wordt er van alles gedigitaliseerd en ontsloten: boeken, audio, video. En Kahle is bezig van elk fysiek boek dat ooit is gepubliceerd er één in een container te stoppen om te bewaren (actuele stand: ruim een half miljoen titels). Een interview met deze door idealen gedreven visionair die zich niet snel laat ontmoedigen door praktische belemmeringen. Zelfs niet door het auteursrecht en de Amerikaanse geheime dienst.

Al vanaf midden jaren tachtig bent u actief als digitale bibliothecaris. Uw levensopdracht lijkt te zijn ‘alle informatie ter wereld organiseren en universeel toegankelijk en bruikbaar maken’. Alleen is dat al de missie van Google. Waarin verschilt uw werk van wat Google doet?

Google heeft ongelooflijk handige diensten ontwikkeld. Ik gebruik ze voortdurend. Ik heb geprobeerd een bibliotheek te creëren die voor iedereen toegankelijk is, om zoveel mogelijk nieuwe Googles te helpen ontstaan. En om onderzoekers in staat te stellen met nieuwe ideeën en diensten te komen. Laat honderd Googles bloeien.’

Het Internet Archive is een non-profitorganisatie waar veel mensen en organisaties van afhankelijk zijn voor onderzoeks- en andere doelen. Het wordt financieel ondersteund door zowel overheidsinstellingen als particuliere fondsen. Maakt u zich wel eens zorgen dat ergens in de toekomst het Archive zoals het nu is niet meer in de lucht kan worden gehouden? Is er letterlijk en figuurlijk een back-upplan?

‘Ondersteuning en duurzaamheid houden ons continu bezig. Met mijn eigen bijdragen kan ik het licht laten branden en de data veilig laten bewaren, maar om de collecties te doen groeien en vrij toegankelijk te maken, is de medewerking van honderden andere organisaties nodig. We zijn op zoek naar financiële bijdragen voor onze inspanningen, maar ook naar externe partijen om het werk van anderen te ondersteunen.’

‘De data worden veiliggesteld door het maken van kopieën. Er is een gedeeltelijke kopie in de bibliotheek van Alexandrië in Egypte en in Amsterdam in de European Memory Foundation.’1

In het digitale domein weerhoudt het auteursrecht bibliotheken ervan om informatie voor hun gebruikers online te zetten. Sommige bibliothecarissen zeggen dat de twintigste eeuw de ‘dark age’ van het web is. Vindt u een auteursrechthervorming noodzakelijk?

‘Als informatie niet online staat, is het net alsof het helemaal niet bestaat. Veel mensen vrezen dat werken uit de twintigste eeuw niet online gezet kunnen worden vanwege auteursrechtelijke belemmeringen. Maar we hebben gemerkt dat we op dit vlak toch veel kunnen doen: gewoon de boel online zetten en als iemand bezwaar maakt, haal je sommige dingen weer weg.’

‘Het Internet Archive leent twintigste-eeuwse boeken als ebook uit. We lenen Amerikaanse tv-nieuwsprogramma’s uit. We streamen oude videobanden die op dvd niet meer te krijgen zijn.2 We moeten onze kinderen het beste in handen geven dat we kunnen bieden. Dat materiaal moeten we vlug en met een dosis lef digitaliseren en formatteren voor de apparaten die zij nu gebruiken. We kunnen een vergoeding betalen voor wat nog steeds vindbaar is, maar dat moet ons er niet van weerhouden om de 99 procent te ontsluiten waarover iedereen het eens is dat die algemeen beschikbaar moet zijn.’

Er zijn al veel data, informatie en kennis in het publieke domein. Ook zijn er ‘open’-bewegingen – open software, open data, open access – die ernaar streven om nog meer informatie open te krijgen. Bibliothecarissen hebben echter heel lang gewerkt met auteursrechtelijk beschermde informatie. Velen van hen zijn sceptisch over de ‘open’-beweging, mede omdat dit hun rol als publieke aanbieders van auteursrechtelijk beschermde content kan ondergraven. Moet elke bibliothecaris en archivaris naar deze ‘openheid’ streven of is het ook prima om de ‘gesloten’ route te bewandelen?

‘De bibliothecaris heeft als taak het be­waren en ontsluiten van informatie – dit zou onze finest hour moeten zijn omdat de technologie ons in staat stelt om zoveel meer te doen dan dat. Maar veel bibliothecarissen grijpen die kans niet, ze voelen zich niet bekwaam genoeg. Degenen die het wel doen, krijgen promotie en stijgen in aanzien.’

‘Het wordt tijd dat bibliothecarissen beseffen waarom ze voor dit beroep hebben gekozen. En het wordt tijd om de technologie te benutten om niet alleen mensen in het gebouw, maar de hele wereld via internet van dienst te zijn. We moeten materialen aanschaffen en uitlenen. En als ze niet meer in de handel zijn, moeten we ze open beschikbaar maken. Universele toegang tot alle kennis is dé kans van onze generatie. En we kunnen dat waarmaken.’

Het Internet Archive werkt met een heleboel partners samen, van wie de meeste grote fysieke collecties bezitten. Leidt dat wel eens tot spanningen om als digitale bibliotheek samen te werken met fysieke bibliotheken en archieven?

‘Eigenlijk niet. Aangemoedigd door het Google Books Project zeggen de honderden bibliotheken waarmee we samenwerken nu: als iemand een boek uit onze collectie kan digitaliseren, zullen we – behoudens het auteursrecht dat erop rust – geen beperkingen opleggen aan het gebruik. Dat is verbazend en fantastisch. Voor 10 dollarcent per pagina, of dertig dollar per boek, kunnen we alles digitaliseren. Dat houdt in dat we voor ongeveer 160 miljoen dollar digitale versies van de grote bibliotheken kunnen maken. Deze openheid bij de bibliotheken is fantastisch. Ook dat ze samen elk jaar vijf miljoen dollar kunnen vinden voor de digitalisering. We moeten deze klus klaren zolang de deur openstaat. Bibliotheken staan ervoor open en wachten op ons. Laten we dus die 160 miljoen bij elkaar zien te krijgen.’

Veel bibliothecarissen en archivarissen kregen hun beroepsopleiding in een tijd dat internet nog in de kinderschoenen stond, er nog geen world wide web was en geen sociale media. Welke ‘nieuwe’ vaardigheden moeten informatieprofessionals volgens u hebben in het digitale tijdperk?

‘Moderne bibliothecarissen moeten weten hoe ze scripts kunnen schrijven in computertalen als Python en PHP. Zo kunnen ze hun collecties doorzoeken zonder dat ze daarvoor een interface hoeven te gebruiken die door iemand anders is gemaakt. We moeten zelf online diensten kunnen ontwikkelen, niet alleen maar andermans online diensten gebruiken. Alleen zo zullen we onze gebruikers de rijkdom van onze collecties kunnen tonen. Zo moeilijk is het niet. En je krijgt er ongelooflijk veel voor terug.’

Sinds Edward Snowden de klok heeft geluid over hoe de Amerikaanse National Security Agency en andere geheime diensten de digitale levens van burgers monitoren, is er veel informatie naar buiten gekomen die tot grote bezorgdheid heeft geleid op vele terreinen: politiek, economisch, juridisch en sociaal. U heeft zelf een national security-letter ontvangen met een vraag om informatie over een gebruiker en – omdat u er niet over mocht praten – heeft u een groot persoonlijk risico genomen om de overheid voor de rechter te dagen. Gelukkig heeft de overheid het informatieverzoek weer ingetrokken en kon u vertellen dat dit was gebeurd.3 Hebben deze affaire en de onthullingen van Snowden in het algemeen u bezorgd gemaakt of bibliotheken en archieven nog wel kunnen functioneren zoals in het verleden? Dat wil zeggen: als instituties die het publiek belang dienen op de manieren die zij zelf noodzakelijk vinden?

‘De onthullingen over overheidstoezicht zijn schokkend en deprimerend. De Amerikaanse overheid tast onze veiligheid aan door de veiligheidssystemen van het internet te verzwakken. Het goede nieuws is dat de hele wereld dit nu weet en we onze technologieën en organisaties erop kunnen aanpassen. Afhankelijk zijn van commerciële clouddiensten moet nu worden beschouwd als riskant voor zowel organisaties als hun gebruikers. Politici en overheidsdienaren hebben er aantoonbaar over gelogen tegen het publiek en tegen elkaar. Dat maakt het lastig hun toekomstige beweringen te vertrouwen.’

‘Ik voel me gesteund doordat dit alles de noodzaak aantoont van het bestaan van onafhankelijke non-profitorganisaties. Die hoeven niet zo snel door de knieën te gaan als grote bedrijven voor oekazes van de overheid. Ik ben er nu ook zekerder van dat open source-software die op je eigen computer draait, een niveau van veiligheid biedt die commerciële producten niet zullen kunnen bieden. En ik ben er ook zekerder van dat sterke cryptografie gebruikt kan worden om communicatie en transacties te beveiligen op systemen als Bitcoin. Nu we weten dat het internet is verzwakt, moeten we het repareren. We weten wat we moeten doen en dat moeten we nu gewoon doen.’

Noten

  1. www.bibalex.org/isis/frontend/archive/archive_web.aspx; internetmemory.org/en/.
  2. openlibrary.org/borrow; archive.org/details/tv; archive.org/details/ephemeralvhs.
  3. www.newyorker.com/online/blogs/elements/what-its-like-to-get-a-national-security-letter.

Met dank aan Jeroen de Boer en Edwin Mijnsbergen.

Frank Huysmans is redacteur van InformatieProfessional.

Deze bijdrage komt uit IP nr. 8 / 2013. Het gehele nummer kun je hier lezen