Google Books: hoe verder na 25 miljoen gedigitaliseerde boeken?

Sinds de start van Google Books in 2004 zijn er meer dan 25 miljoen boeken gedigitaliseerd. Tijd voor een tussenstand. Hoe staat het boekenproject er nu voor? Heeft Google pijnpunten als copyright en zeggenschap weten op te lossen? En welke rol spelen de Nederlandse en Vlaamse bibliotheken?

Door: Jos Damen 

Veel mensen hebben een dubbele houding ten opzichte van Google. Meer dan de helft van de mensheid gebruikt dagelijks producten van deze multinational. Het is een van de sterkste merken ter wereld: slim, snel en overal aanwezig. De inkomsten komen uit reclames, vooral via AdWords, wat weer zorgt voor gerichte plaatsing bij gepresenteerde zoekresultaten. Toch haten sommigen Google, vanwege de monopoliepositie en omdat men in Google Big Brother ziet: iemand die alles in de gaten houdt en het niet zo nauw neemt met privacy-aspecten – en met het auteursrecht van anderen.

Het lijkt wel of dat veel minder opgaat voor Google Books; het kan juist op grote waardering rekenen. Google Books lijkt een altruïstisch project, maar is dat ook zo?

Laatste ontwikkelingen

Een van de pijnpunten in de opzet van Google Books is het auteursrecht. Copyright is in veel landen verschillend en interpretaties van de auteurswet en de jurisprudentie maken het open gebruik van boeken ingewikkeld. Daar komt bij dat bibliotheken in de onderhandelingen met Google Inc. met zeer verschillende contracten te maken kregen: soms nam Google ‘alle’ boeken mee en kreeg de bibliotheek alleen de out-of-copyright scans terug, soms was dat weer volledig anders. In het begin waren die contracten geheim (Google Confidential), inmiddels staan ze gewoon online.1 Contracten verschilden vroeger ook, vooral voor wat betreft zeggenschap en auteursrecht. Sommige van de eerste samenwerkende bibliotheken kregen later zelfs spijt.2

Copyright

Het Authors Guild in de Verenigde Staten lag als vertegenwoordiger van de schrijvers langdurig met Google in de clinch over copyright. De laatste uitspraak in een lange reeks van rechtszaken vond plaats in hoger beroep in oktober 2015. Kort samengevat komt die uitspraak erop neer dat Google de auteurswet niet overtreedt en door mag gaan met scannen en beschikbaar stellen, op grond van het ‘fair use’-principe.3

Plannen versus realiteit

Toen Google Books in 2004 startte, waren de plannen helder. Alle boeken ter wereld zouden door Google gescand worden. De boeken waar geen auteursrecht meer op rustte zouden in zijn geheel open beschikbaar gesteld worden, en voor de rest waren drie vormen mogelijk: Limited Preview (waarbij de lezer een deel van het boek ziet), Snippet View (waarbij de lezer alleen snippertjes tekst te zien krijgt) en No Preview Available (waarbij niets zichtbaar is). Google verwachtte binnen enkele decennia alle boeken in een digitale versie beschikbaar te hebben. Dat viel wat tegen. Leonid Taycher, tot 2013 software engineer bij Google, schatte in 2010 in dat er 130 miljoen boeken op aarde waren. (Ter vergelijking: WorldCat geeft anno 2016 360 miljoen titelbeschrijvingen4 weer – maar daar zitten veel dubbelen tussen.) Eind 2015 had Google volgens de New York Times meer dan 25 miljoen boeken gescand. Dat is nog altijd een aanzienlijk aantal: bijna 20 procent van alle boeken op aarde – volgens Googles schatting dan.

Een teer punt is de nadruk op Engelstalige boeken. Google heeft zijn best gedaan door Duitse, Franse, Spaanse en Japanse bibliotheken in het proces te betrekken, maar de enorme over aanwezigheid van Engelstalige literatuur is evident.

Bibliotheken en uitgevers

Voor wat betreft Nederlandse en Belgische partners hebben de Koninklijke Bibliotheek in Den Haag en de Gentse Universiteitsbibliotheek samengewerkt met Google. De KB liet 235.000 boeken scannen en stelde die beschikbaar via Delpher.5 De Amsterdamse UB haakte aan en bracht zo’n 100.000 boeken in. Gent maakte 250.000 boeken voor Google open en stelde die beschikbaar op de eigen website. Ook ‘doneerde’ men de metadata van 100.000 digitale boeken aan Europeana.6

In toenemende mate hebben uitgevers ontdekt dat Google Books zich goed leent als advertentiemedium. Ze stellen vaak digitale versies van nieuwe en oudere boeken beschikbaar voor Limited Preview, waarmee die teksten als ‘teasers’ fungeren voor mogelijke aankoop van het (e)book. Tanende belangstelling Het lijkt erop dat de belangstelling van Google voor haar eigen boekenproject aan het afnemen is. Dat is onder meer te zien aan de positionering van Google Books, dat onderdeel lijkt te worden van Google Play. Deze houding komt natuurlijk deels door de lastige rechtszaken over copyright, maar ook omdat de digitalisering van grote collecties sneller gaat dan die van kleinere bibliotheken – en omdat het aantal unieke boeken bij elke nieuwe bibliotheek kleiner wordt. (Overigens heeft men de zaken technisch gezien zo geperfectioneerd, dat één persoon per uur 6.000 pagina’s kan digitaliseren. Dus dat compenseert weer.)

Doelen

Wat ook meespeelt, is dat de doelen van Google deels al bereikt zijn. Google Books was bedoeld als prachtig en cultureel waardevol uithangbord, maar voor de initiatiefnemer veel belangrijker was de hulp die dat enorme corpus van miljarden boekpagina’s bood bij het beter maken van diensten als Googles zoekmachine, Googles Ngram-viewer7 en Google Translate. Verder zag Google uiteraard de zakelijke kant van het project in: als ebooks over een aantal jaren het belangrijkste verkoopmiddel van informatie worden, moet je daar ervaring mee hebben. Door Google Books kreeg Google Inc. directe toegang tot de verkoopafdelingen van uitgeverijen.

Positief

Is dit een cynische kijk op Google Books? Dat valt wel mee. Hoewel ik persoonlijk erg kritisch ben op de commerciële aspecten van Google Books, blijf ik het als een fantastisch uitgewerkt idee zien. Dat idee had alleen door bibliotheken uitgedacht en opgepakt moeten worden. In zekere zin is de Digital Public Library of America,8 ontwikkeld door Robert Darnton en collega’s, daar inmiddels de logische pendant van. De DPLA ging open in 2013 en telt nu 11,5 miljoen teksten – de DPLA zou er zonder Google Books niet geweest zijn. Ook prachtig is de vertaalsoftware die Google op basis van Google Books heeft ontwikkeld. En vergeet niet de zeer geavanceerde OCR-techniek, bijvoorbeeld geschikt voor het Thais.9

Zelf gebruik ik Google Books dagelijks: soms op zoek naar specifieke informatie, een andere keer om een referentie te checken en ook wel om te kijken of ik een boek echt wil kopen.

Het belangrijkste aspect van Google Books wordt soms over het hoofd gezien: open en beschikbare informatie voor iedereen. In de westerse wereld is dat vrij gewoon, maar in het zuiden is het corpus van Google Books een prachtige manier om kennis te vergaren, bijvoorbeeld in landen waar informatievrijheid tekortschiet en bibliotheken letterlijk en figuurlijk ver weg zijn.

Ideeën voor bibliotheken

Wat brengt de toekomst voor Google Books? Mijn verwachting is dat Google Books in de komende vijf jaar rustig uitgebreid wordt, maar dat de dienst langzaam aan een wat commerciëler aspect zal krijgen en ook zal gaan fungeren als verkoopportaal voor ebooks. Wat kunnen Nederlandse en Vlaamse bibliotheken met Google Books doen? Hier liggen verschillende mogelijkheden:

  1. Streef naar samenwerking met echte open access-partners (DOAB, Wikisource, archive.org) en bouw Europeana (of een vergelijkbare website) uit tot een echt open platform met Europese open access-publicaties.
  2. Gebruik de in bibliotheekland aanwezige kennis van metadata (met OCLC?) om met iets beters te komen dan wat Google Books en archive.org nu presteren.10
  3. Gebruik Google Books (en andere grote digitale boekaanbieders als archive.org en de DPLA) als toegepaste bron om je gebruikers te laten profiteren van al die gedigitaliseerde weelde.

Noten

  1. Zie: tinyurl.com/jhfjffh.
  2. Peter Brantley (California): ‘Can we say it was a mistake? For it was a mistake’. Zie: tinyurl.com/hk2ju2r.
  3. Lisa Peet in Library Journal: tinyurl.com/hkjrt7u.
  4. Zie: https://www.oclc.org/worldcat/catalog.en.html.
  5. Zie: tinyurl.com/jhfjffh.
  6. Zie: http://lib.ugent.be/en/info/open.
  7. Zie: https://books.google.com/ngrams.
  8. Zie: http://dp.la.
  9. Zie: https://play.google.com/store/apps/details?id=nectec.img.thaiocr.
  10. Stephan Heyman: Google Books, a Complex and Controversial Experiment. New York Times, 29 Oct. 2015, tinyurl.com/zbgspx.

Jos Damen is hoofd bibliotheek & ICT van het Afrika-Studiecentrum, Leiden.

Deze bijdrage komt uit IP nr. 1 / 2016. Het gehele nummer kun je hier lezen.