Door: Eric Sieverts
Ineens stond het diepe web weer in de belangstelling. Merkwaardig genoeg kwam dat door de AIVD. In een rapport over het gevaar van Jihadisten werd gesuggereerd dat hun gekonkel zich op het diepe web afspeelde. En de AIVD moest natuurlijk even uitleggen wat dat was:
“Het zichtbare deel van het internet, ook wel oppervlakteweb genoemd, is dat deel van het internet dat wel terugvindbaar en doorzoekbaar is. Wetenschappers schatten in dat het onzichtbare web 550 keer groter is dan het zichtbare web. Dit wil zeggen dat het onzichtbare web meer dan 99,8% van het totale web uitmaakt en dat dus minder dan 0,2% van het web tot het zichtbare deel behoort.”
Harde cijfers uit een onverdachte bron zou je denken. In de praktijk viel dat anders uit. NRC Next’s factcheckingafdeling wierp zich onmiddellijk al op deze bewering. Terecht, want dat cijfer 550 was gebaseerd op een onderzoek van BrightPlanet uit 2000. Destijds was dat in dit blad in de www.wie.wat.waarrubriek ook al aan de orde geweest. Behalve NRC’s harde conclusie ‘onwaar’ is daar nog wel meer over te zeggen.
Elders in dit nummer vindt u mijn schatting dat de omvang van dat zogenaamde oppervlakteweb sinds 2000 met minstens een factor 1000 is toegenomen. De AIVD heeft dus óf niet doorgehad dat het web de laatste twaalf jaar gegroeid is, óf ze denkt dat dat diepe web – al die databases van NASA, meteo’s, LexisNexis en dergelijke – ook wel met diezelfde factor gegroeid zal zijn. Zou dat echt? Bovendien weten onze speurneuzen kennelijk evenmin dat zoekmachines intussen succesvolle pogingen ondernemen om dat diepe web ook te indexeren, al dan niet in samenwerking met eigenaren van die databases. Vermoedelijk is dat diepe web sindsdien dus ook nog aanzienlijk minder diep geworden.
Maar het belangrijkste bezwaar is misschien wel dat helemaal niet duidelijk is wat met die factor 550 eigenlijk wordt bedoeld. Overigens kleefde dat bezwaar natuurlijk al aan dat oorspronkelijke onderzoek van BrightPlanet uit 2000. Wat probeerden ze te meten? In welke eenheden is gemeten? Meet je items? En wat zijn dan items? De middagtemperatuur op 23 april 1934 op Ameland uit een KNMI-database, is dat een item dat net zo hard meetelt als een pdf-document van een omvangrijk AIVD-rapport (voorzover dat niet geheim is)? En tellen al die steeds veranderende dynamisch gegenereerde oppervlaktewebpagina’s elk apart mee? Of meet je mega/giga/exabytes, waardoor dat dikke pdf-document juist weer onevenredig veel meer credit krijgt dan die temperatuur op Ameland?
Kortom, het was onzin allemaal. En ik blijf met een akelig gevoel achter. Als een uitspraak van de AIVD over iets waarvan ik verstand denk te hebben, zo onzinnig blijkt, hoe betrouwbaar zijn dan hun (ook nog geheimgehouden) uitspraken over al die andere onderwerpen. Hun onderzoeken gaan kennelijk niet erg diep.
Deze bijdrage komt uit IP nr. 5 / 2012. Het gehele nummer kun je hier lezen