Geef het volk brood en peilingen en het zal gehoorzamen. Tijdens de recente verkiezingsstrijd probeerden maar liefst vier opiniepeilers de stemming onder het volk te registreren. Met op het laatst meermaals per dag een nieuwe tussenstand die natuurlijk maar een paar zeteltjes afweek van de vorige. Alles ruim binnen de betrouwbaarheidsmarges, dus zonder betekenis. Maar geen journalist of opiniepeiler wil het verwijt krijgen het begin van een trend verzwegen te hebben uit respect voor de statistische theorie. Dus voor de zekerheid toch maar even groot mee uitpakken.
Statistische betrouwbaarheid is één ding. Discutabele steekproeftrekking is veel erger. Ten minste een deel van de peilers nam het helemaal niet zo nauw met hun steekproeven. Neem Maurice de Hond, die zich door Matthijs van Nieuwkerk liet verleiden tot het dagelijks (!) analyseren van de stemmingswijzigingen in het land. Zijn steekproeven trekt De Hond uit een panel van mensen die zich ooit voor deelname hebben aangemeld. Gedwee peilvee. In het tijdperk van bel-me-niet-registers kan dat niet anders dan een zeer merkwaardige potpourri zijn van vereenzaamde bijstandsmoeders, gesjeesde makelaars, GeenStijl-reaguurders en blanke sociologen op leeftijd die zich uitgeven voor Marokkaanse hangjongeren om te zien of hun identiteit überhaupt wordt gecontroleerd (quod non). Terecht twitterde een Amsterdamse politicoloog dat Maurice de Hond weer een peiling had gepubliceerd die representatief was voor mensen die graag willen meewerken aan een peiling van Maurice de Hond. De media zaten niet echt met dat drijfzand onder hun nieuwsfeiten. Een goed verhaal moet je immers niet kapot rechercheren.
Onlangs meldde OCLC zich met een onderzoek onder bibliothecarissen in vier landen, waaronder het onze. Fraai vormgegeven pdf’s met in het oog springende resultaten. Zo blijken vakbladen nog altijd de belangrijkste informatiebron en doet de meerderheid professioneel niets met blogs en Twitter. Kan best zo zijn, maar wie even verder keek, zag dat het in Nederland om 152 respondenten ging (en in het ruim vijf keer zo bevolkingsrijke Duitsland 143). Beetje weinig, maar mits goed geselecteerd kun je zelfs dan een redelijk beeld schetsen. Een blik op de samenstelling van de onderzoeksgroep leerde anders. Een meerderheid werkte in universiteitsbibliotheken, terwijl de gezamenlijke openbare bibliotheken toch veruit de grootste werkgever zijn. In de kleine lettertjes onderaan stond dat de resultaten betrekking hadden op ‘152 deelnemende bibliotheekmedewerkers’. Representatief dus voor wie per mail was uitgenodigd (wie? hoeveel?) én de moeite nam om de enquête in te vullen. Ook dit blad wijdde een spread aan de gammele percentages, niet beseffend dat het met een De Hondje bezig was.
Nu er op conferenties steeds meer aandacht komt voor big data en data librarianship – met name universitaire bibliotheken kunnen zich als betrouwbare beheerders en ontsluiters van onderzoeksbestanden opwerpen – moet er in onze opleidingen meer aandacht komen voor data literacy. Als deze fopspeen van OCLC daar achteraf aan heeft bijgedragen, heeft het onderzoek toch nog zin gehad.
Frank Huysmans is bijzonder hoogleraar bibliotheekwetenschap aan de Universiteit van Amsterdam en zelfstandig onderzoeker en adviseur bij WareKennis.n.
Deze bijdrage komt uit IP nr. 11 / 2012. Het gehele nummer kun je hier lezen