in: Bibliotheekblad, jrg. 10 (2006) nr. 6/7

Sinds 1996 is Google een onmisbaar instrument geworden voor iedereen die zich op het internet begeeft. Miljarden webpagina’s met informatie zijn door deze succesvolle zoekmachine op effectieve wijze toegankelijk gemaakt. Ook informatiespecialisten voeren hun dagelijkse al@dinwerkzaamheden veelal uit met behulp van Google.

Google laat het niet bij het indexeren en toegankelijk maken van webpagina’s alleen. Het bedrijf heeft zich als doel gesteld “alle informatie wereldwijd toegankelijk en bruikbaar te maken”. Daarom ontsluit Google ook het wereldnieuws (Google News), het Usenet archief (Discussions), online winkels (Froogle), afbeeldingen (Images), video (Video), wetenschappelijke publicaties (Scholar) en e-mail (Gmail).

Voor de ontwikkelaars van Google is zelfs daarmee het doel nog niet bereikt, want krap 9 jaar na de oprichting van Google, komt het bedrijf met een dienst die het aantal geïndexeerde bronnen met een veelvoud zal doen vergroten: “Google Books, zoeken in en naar het gedrukte woord in boeken”.

Wat is Google Books? Wat is de filosofie erachter en wat is er op dit moment in Google Books te vinden? Hoe kijken betrokkenen in de bibliotheek-, boekhandels- en uitgeverswereld aan tegen Google’s expansiedrift?

In dit artikel volgt een beschrijving van deze dienst, evenals die van Google’s concurrenten Yahoo! en Microsoft. Ook zij werken aan vergelijkbare projecten.

In 2004 bracht Google haar plannen over het digitaliseren van boeken naar buiten, toen nog onder de naam Google Print.

Eind 2005 wijzigde Google deze naam in Google Books dat bestaat uit twee onderdelen:

  • het uitgeversprogramma (Partner program)
  • het bibliotheekprogramma (Library project)

google-books-standGoogle Partner program: hoe werkt het?
Grote en kleine uitgevers, maar ook auteurs, kunnen hun boeken naar Google sturen. Zij bepalen welke werken zij willen laten digitaliseren evenals het aantal pagina’s per boek. Die boeken kunnen worden aangeleverd als hard copies, maar ook als PDF bestand wanneer dat al voorhanden is.
Google scant of converteert deze boeken, van kaft tot kaft of delen hieruit, volgens overeengekomen afspraken en indexeert tenslotte de inhoud. De boeken zijn via books.google.com of books.google.nl toegankelijk. De kosten hiervan neemt Google voor haar rekening. De uitgever ontvangt een digitaal exemplaar voor eigen gebruik

Wat staat er op het scherm?

Wat de zoeker te zien krijgt, is dus vooraf bepaald door de uitgever die zijn werken beschikbaar heeft gesteld. Vrij te bekijken zijn in elk geval de voor- en achterkant van het boek, de informatie over copyright, de inhoudsopgave en de alfabetische index.
Vanuit elke pagina kan in beperkte mate gebladerd worden. Ook bestaat de mogelijkheid om binnen het boek naar een woord te zoeken, om vervolgens vanaf de pagina waarop dat woord voorkomt,  enkele pagina’s verder te bladeren.

Het boek is beveiligd en kan alleen via het computerscherm bekeken worden. Het is niet mogelijk een pagina te printen of het boek te downloaden. Ook de rechtermuisknop functie is onbruikbaar gemaakt. Daarnaast is op elke pagina de tekst ‘Copyrighted Material’ opgenomen. De enige manier om tekst op papier te krijgen is door van elke bladzijde een schermafdruk te maken.

Het voordeel voor de uitgever om werken via Google Books beschikbaar te stellen, is de directe link naar de kooppagina bij de uitgever zelf. Ook wordt verwezen naar Amazon.com (en andere internetwinkels). Voor wie binnen de Nederlandse Google Books zoekt, komt via links bij AKO, Bruna en Proxis.

hand-scanned-in-google-books-largeGoogle Library project: hoe werkt het?

Vanaf eind 2005 is het mogelijk via Google Books te zoeken in de collecties van een vijftal grote bibliotheken; de universiteitsbibliotheken van Stanford, Michigan, Harvard en Oxford en de New York Public Library. Met elke bibliotheek heeft Google een overeenkomst gesloten, die inhoudt dat de bibliotheek zelf bepaalt welke boeken zij laat digitaliseren.
Voor deze bibliotheken sluit deze stap naadloos aan op hun visie over digitale bibliotheek.

Ook in het Google Library project worden de kosten volledig betaald door Google. Hieronder vallen het transport naar de scanapparatuur, de personele kosten en de geautomatiseerde verwerking.

Wat staat er op het scherm?

Binnen het  Library project maakt Google onderscheid tussen twee categorieën boeken:

  1. boeken waarvan het auteursrecht nog niet verlopen is of waarvan de rechthebbenden (auteurs, uitgevers, maar ook de leverende bibliotheken) niet willen dat het boek wordt getoond
  2. boeken waarvan het auteursrecht verlopen is of waarop geen auteursrecht rust en daarmee tot het ‘Publieke domein’ behoren.

Van de eerste categorie (de boeken met copyright) toont Google Books twee of drie tekstfragmenten, genaamd ‘Snippets’. Van een boek in het publieke domein is elke bladzijde leesbaar.

Link naar de bibliotheken

In de FAQ van het Library project wordt vermeld dat elk bibliotheekboek een verwijzing krijgt naar de dichtstbijzijnde bibliotheek. Via Worldcat, de internationale catalogus applicatie van OCLC, kan direct worden bekeken in welke collectie het boek zich bevindt en zelfs of het beschikbaar is. Het ligt voor de hand dat ook Nederland op termijn hierop aansluit, waarmee ook Nederlandse bibliotheken toegankelijk worden via Google Books.

google-book-searchOpt-in, Opt-out

Vanaf het moment dat de gedigitaliseerde boeken van het Library project vindbaar zijn voor het publiek, voeren twee grote organisaties een rechtzaak tegen Google.

De brancheorganisatie Association of American Publishers (met leden als Penguin, McGraw-Hill en Pearson Education), vindt dat Google het auteursrecht schendt. Ook vindt de Association het ongehoord dat Google vooraf niet om toestemming heeft gevraagd, maar direct met het scannen van bibliotheekcollecties gestart is.

The Authors Guild vindt het eveneens onverteerbaar dat via Google Books het nog bestaande auteursrecht van haar leden bevochten moet worden. Ook wanneer er sprake is van tekstfragmenten, de snippets. Toen het Amerikaanse schrijversgilde in september 2005 de stap naar de rechter maakte, reageerde Google met een tijdelijke scanstop tot 1 november 2005. Tot die datum konden schrijvers en uitgevers in de gelegenheid gesteld bij Google kenbaar te maken dat hun boeken niet gescanned mogen worden. Het principe van opt-out; als je bezwaar hebt, meld je dan. Inmiddels heeft Google het scannen weer opgestart en de aanklagers spreken van een uiterst arrogante houding van Google.

Vanuit Nederland zijn vooralsnog geen bezwaren geuit. De uitgevers Brill, Elsevier en Kluwer leveren boeken en laten titels of delen hiervan scannen. De directeur van de Koninklijke Bibliotheek, Wim van Drimmelen, sprak in de NRC van 12 december 2005 met enthousiasme over het Google project. Hij maakt wel een bezorgde kanttekening: ,,Ik vind het geweldig dat dit gebeurt. Het is prachtig dat er geld voor grootschalige digitalisering beschikbaar komt uit de private sector. Maar er is ook een keerzijde. De kleine taal- en cultuurgebieden, waaronder Nederland, zullen achterin de rij staan”.

Google stelt zich op het standpunt dat het zoveel mogelijk informatie toegankelijk wil maken en daar horen boeken ook bij. Sidney Mock, marketing director van Google Benelux, stelt dat Google zich volledig houdt aan de voorwaarden die bibliotheken stellen. Auteurs die bezwaar hebben tegen opname van hun werk, kunnen zich melden bij Google. Het bedrijf is van mening dat zij met de ‘snippets’ het auteursrecht niet schendt. Google hanteert hierbij het ‘fair use’ principe.

Het Google Partner program valt buiten deze rechtzaken, omdat hier sprake is van opt-in. Wil je als uitgever bij Google Books worden opgenomen, dan kun je je melden.

Concurrentie

Het digitaliseren van boeken is echter geen nieuw verschijnsel. Sinds geruime tijd bestaan op dit terrein diverse activiteiten of projecten. Ook de grote concurrenten van Google zetten in op digitalisering van het gedrukte woord. Een aantal voorbeelden.

Project Gutenberg

Sinds 1971 werkt het Gutenberg project aan het digitaliseren van boeken. Dit wordt volledig uitgevoerd door vrijwilligers. Alle boeken zijn rechtenvrij en vallen in het zogeheten publieke domein. Alle grote werken uit de wereldliteratuur én boeken van onbekende auteurs zijn op vele manieren doorzoek- en vindbaar. Op dit moment zijn er 17.000 e-books gratis te downloaden.

Amazon.com

De service ‘Search inside’ is vergelijkbaar met het Google Partner program, echter met het verschil dat Amazon de boeken direct verkoopt. Boeken die door Amazon zijn gescanned zijn herkenbaar aan het ‘Search inside’ logo.

Yahoo!

Sinds oktober 2005 is Yahoo! deelnemer aan de recentelijk opgericht Open Content Alliance (OCA), waarin onder meer The Internet Archive, Hewlett Packard en – verrassend, want concurrent – Microsoft MSN zitting hebben. De OCA richt zich uitsluitend op het digitaliseren van titels in het publieke domein én op  boeken waarvoor auteurs hun toestemming hebben verleend. Scans worden beschikbaar gesteld in het gangbare PDF format. Deze worden op termijn indexeerbaar voor alle zoekmachines, dus ook voor Google! Enkele leveranciers van boeken zijn o.a. The Internet Archive, de universiteiten van Toronto en California, The UK National Archives en O’Reilly media.

Microsoft

Ook Microsoft is gestart met het digitaliseren van een bibliotheekcollectie. Via deelname aan de Open Content Alliance digitaliseert MSN Book Search 100.000 boeken van de British Library. In de loop van 2006 worden de eerste resultaten zichtbaar via de MSN zoekmachine, waarbij mogelijk de MicrosoftReader technologie toegepast wordt om boeken leesbaar te maken.

google-book-search-2Zoektips

Google Books is nog volop in de test- en groeifase en kan het beste via het geavanceerde zoekscherm doorzocht worden.

  • Zoek bijvoorbeeld eens naar de exacte woordcombinatie  “digital photography” en klik op het boek dat u wilt bekijken. Via de inhoudsopgave zoekt u naar een hoofdstuk. Via ‘Zoeken in dit boek’ typt u de titel van het hoofdstuk en het paginanummer. Vervolgens kunt u vanaf dat hoofdstuk voor- en achteruit bladeren
  • Zoek eens op uitgever en kijk welke titels er zijn opgenomen. Bijvoorbeeld inpublisher:lonely planet of inpublisher:elsevier
  • Om alleen boeken uit het publieke domein te vinden moet op de geavanceerd zoekscherm de optie ‘complete books only’ worden aangevinkt. Dit kan nog niet op de Nederlandse site!
  • Zoek eens met een beperking op datum, bijvoorbeeld boeken met het woord ‘nederland’ met de publicatiedatum tussen 1800 en 1875
  • Met een Google account of met een Gmailadres zijn er van boeken in het Partner program enkele pagina’s meer te zien. Het aantal pagina’s varieert per boek.

Google Books is uiteindelijk in ieders voordeel! (Sidney Mock, Google)

“Laat ik beginnen te vertellen, dat het Google’s missie is om alle informatie ter wereld te organiseren, of dat nu online staat of offline”, aldus Sidney Mock, marketing director van Google Benelux, in een telefonisch onderhoud. “Dat kunnen films en videobeelden zijn, maar ook boeken. Dat wij nu in een aantal rechtzaken verwikkeld zijn, heeft voor een deel te maken met onduidelijke communicatie van onze kant. Wij zien in onze programma’s alleen maar voordelen. De uitgever kan via ons betere verkoopresultaten behalen door de link we naar hem aanbrengen, maar ook naar online boekhandels die hun boeken verkopen. Schrijvers kunnen via ons een groter publiek bereiken. Bibliotheken kunnen, door de samenwerking die we hebben gesloten met OCLC, hun collecties beter zichtbaar maken. En de gebruikers voor wie we het doen, die hebben er het meeste profijt van. Alle werken in het publieke domein zijn gratis online te lezen.”

Over de Nederlandse bibliotheken: “Google heeft voor het Library project nog niet direct de Nederlandse bibliotheken op het oog, maar het ligt wel voor de hand dat er met bijvoorbeeld de Koninklijke Bibliotheek iets moois kan ontstaan”. Nog een tip voor betere vindbaarheid: “Google wil graag online informatie bij bibliotheken indexeren. Als databases [zoals de al@din Kennisbank, red.] worden opengesteld, kunnen wij ons werk doen. En verder willen we graag met de openbare bibliotheken praten hoe wij kunnen helpen om hun informatie breder toegankelijk te maken. Want met  Google Books willen we ook een hoger doel bereiken, namelijk de democratisering van informatie”.

Dat lijkt me een aanbod dat niet afgeslaan mag worden!

Google Books als katalysator van de digitale bibliotheek? / door Marina Noordegraaf

Goed nieuws: Negen van de tien Nederlanders denkt dat het boek altijd zal blijven bestaan!1) Dus we kunnen gewoon op onze lauweren rusten? Nee, niets is minder waar. Maar, báng voor Google Books zijn de spelers in boekenland allerminst. “Tot nu toe heeft elke nieuwe ontwikkeling op audio en ICT-gebied geleid tot meer aandacht voor het lezen van boeken”, aldus Henk Kraima, directeur van de Stichting Collectieve Propaganda van het Nederlandse Boek (CPNB).

Willem Huberts, directeur van openbare bibliotheek Nijmegen (sinds 1 januari 2006 Bibliotheek Gelderland Zuid), vindt het een prima idee dat boeken op het internet beschikbaar komen: “Dat gebeurt ook al, bijvoorbeeld bij De Digitale Bibliotheek voor de Nederlandse Letteren en het project Laurens Jz. Coster waarbij klassieke rechtenvrije  Nederlandstalige literaire teksten in een elektronische versie worden uitgebracht”. Huberts noemt dit een prima aanvulling op het materiaal dat de bibliotheken bezitten. Maar ook een elektronische versie van een roman van bijvoorbeeld Jan de Hartog ziet hij niet als bedreiging. “Het bijt elkaar niet. Je gaat toch geen 320 html-pagina’s op je PC bekijken, danwel printen?”.

Dat is ook de mening van Gosse Kerkhof, directeur van openbare bibliotheek Purmerend. Hij gelooft dat de meeste mensen nog steeds de voorkeur geven aan het opvragen van het echte medium.  “Nadat ze dan de eerste selectie
hebben gemaakt op het internet”, voegt hij toe.

Edwin Mijnsbergen, informatiespecialist bij de Zeeuwse Bibliotheek, onderstreept de grootheid van Google Books door het minpunt van oude stoffige werken in bibliotheekkluizen te benadrukken: “Fantastisch dat oude werken worden bewaard en dat onderzoekers en liefhebbers de mogelijkheid hebben om deze werken in te zien. Maar ze liggen wel in de kluis en zijn zeer kwetsbaar. Dan kun je toch alleen maar blij worden van het gegeven dat je ze op gutenberg.org full-text,
inclusief afbeeldingen, terug kunt vinden?”. Mijnsbergen gaat nog verder: “Google biedt met dit project een nooit gedroomde etalage voor het product dat we als bibliotheken zo graag aan de man willen brengen: het boek!”
Friso Visser, manager van bibliotheek.nl, is dezelfde mening toegedaan: Google Books levert meer aandacht op voor boeken en dat is voor bibliotheken nooit nadelig. “Als er dan titels gevonden worden ligt er – als bibliotheken dat goed regelen –  een grote kans! Publicitair zouden bibliotheken veel meer gebruik moeten en kunnen maken van het feit dat Google hiermee op pad is”, denkt Visser.

EdwinKansen
Mijnsbergen vindt dat Google-topman Eric Schmidt 2) de bezwaren tegen het project goed pareert. Als uitgevers boeken willen verwijderen kan dat. Boeken uit het publieke domein zijn slechts zeer beperkt in te zien. 60% van de geïndexeerde
boeken zijn niet meer in druk en worden ook niet meer herdrukt. Ze zijn vaak maar op een paar plaatsen wereldwijd toegankelijk. “Voor de boeken die nog wel in druk zijn en/of deel uitmaken van het publieke domein gaat het dus om het
‘ontdekkingsaspect’. En dat heeft zijn waarde op websites als Amazon al lang bewezen. Het zet mensen juist aan de boeken aan te schaffen of te lenen”, aldus Mijnsbergen.

Biedt Google Books dan alleen maar kansen voor de openbare bibliotheek? Volgens de vijf geïnterviewden wel. Zelfs de vraagtekens die aan het project kleven, leveren uitdagingen en kansen op:-

Bergen zoekresultaten.
Zoeken en vinden zijn twee verschillende dingen. Informatievaardigheden worden steeds belangrijker. “De taak van de bibliotheek ligt evenzeer in het coachen van het publiek via cursussen en bewustwording om zo informatievaardiger te
worden”, verwoordt Kerkhof het aangaan van deze uitdaging.

kerkhofBetrouwbaarheid
Google biedt veel informatie, maar is die informatie ook betrouwbaar en onafhankelijk? Met boekdigitalisering zijn aanzienlijke kosten gemoeid. Die kosten moeten weer worden terugverdiend. Google is beursgenoteerd en er is een
link naar uitgeverijen.  Kerkhof is bang dat Google resultaten naar boven haalt en dat andere resultaten – die ook beschikbaar zijn – onder water blijven. Dat men bijvoorbeeld de Engelstalige vertaling neemt, terwijl het oorspronkelijke boek in het Nederlands is. Kerkhof denkt dat de gemiddelde consument niet zo kritisch is.
Ook hier liggen kansen voor de openbare bibliotheek:

  1. opvoeden tot informatievaardige burgers en
  2. (nog) beter profileren als onafhankelijke informatiemakelaar

Compleetheid
Visser denkt dat Google Books niet gemakkelijk een volledig of redelijk compleet en actueel aanbod zal kunnen realiseren. Een kans voor de gezamenlijke bibliotheken.

Monopoliepositie
Er zijn zorgen om een mogelijke monopoliepositie van Google. Europa is als reactie op Google Books haar eigen ‘European Digital Library’ project gestart 3). Mijnsbergen weet niet of dit het goede antwoord is:  “Waken voor monopolieposities is een goede zaak maar ‘if u can’t beat’em, join’em, is dat soms ook”. Hij kan zich helemaal vinden in de woorden van Rüdiger Wischenbart 4) die stelt: “The answer to a wheel that has suddenly picked up speed cannot be, however, to reinvent it just by giving it a European hub. The better response would be to get a hand on the steering”.

Kans van slagen?
Google Books ligt in de VS onder vuur. Visser denkt dat de kans op een Europees succes voor Google Books erg klein wordt als de rechtszaken voor Google nadelig uitpakken.  Maar hoe je het ook wendt of keert, het opzoeken van informatie via zoekmachines is gemeengoed geworden en kan niet meer worden teruggedraaid. “Zo kunnen we de discussie over Google Books niet zomaar afdoen als iets dat zal mislukken maar moeten we kijken naar de mogelijkheden en de rol die bibliotheken er bij kunnen of moeten spelen”, aldus Visser.

Google en Picarta
If you can’t beat them, join them! Via WorldCat, de internationale catalogus applicatie van OCLC, kunnen gebruikers direct opzoeken of het via Google Books gezochte boek zich in een collectie bevindt en of het uitleenbaar is. Moeten de gezamenlijke openbare bibliotheken ook aansturen op een koppeling tussen Google Books en Picarta?Huberts ziet het wel zitten: “We moeten gebruik maken van iedere technologische mogelijkheid om de collectie onder de aandacht van het publiek te brengen”.

Visser voelt er ook wel voor en denkt dat er bij aansluiting van Picarta bij Google Books een goede ontsluiting te realiseren zou zijn. Wel heeft hij een paar vraagtekens. Ga je geen verwachtingen wekken die niet kunnen worden
waargemaakt? Want schijnbaar bezit van bibliotheken suggereert leenbaarheid. Hoe zit het met afgeschreven titels die niet zijn verwijderd? Beschikbaarheidgegevens die niet kloppen? En de technische randvoorwaarden? “We moeten wel in de gaten houden dat de mogelijke problemen die we opgelost hebben door de koppeling Landelijk Lenen (zoek&boek) 5) en WSF13, niet toch nog de kop op steken”.

oudtMarieke Oudt, bibliothecaris van openbare bibliotheek Beuningen, staat in de dagelijkse praktijk nog niet onder invloed van Google en consorten. Zij vindt Google Books wel interessant en leuk om zo eens doorheen te neuzen, maar meer als een vorm van kennismaken en nieuwsgierigheid. “Met de paar vragen die ik er op heb losgelaten is het nog geen bedreiging maar ook nog amper een aanvulling voor de bibliotheek. Dat gaat ver voorbij aan de Beuningse behoeftes als ik dat zo mag stellen”, aldus Oudt. Ze ziet wel iets in een link tussen Google en Picarta. Maar dan alleen als veel (of alle) Nederlandse bibliotheken hun catalogi laten koppelen. Hoe groter de kans op resultaat, des te meer mensen maken er gebruik van. “Maar kom je regelmatig niet uit waar je wilt komen, dan zal men snel een andere weg van zoeken inslaan”, meent Oudt.

Alle hands aan dek
Er lijkt een tegenstelling te bestaan tussen lokale en landelijke behoeften. “Tot nu toe houden bibliotheken er nog te veel hun eigen toko op na”, aldus Huberts. “Dat is ook onvermijdelijk. De centrale branchevisie is algemeen geformuleerd, maar hoe je die invult bepaal je samen met de wethouder en de eigen gemeenteraad”. Eén lid van de huidige Nijmeegse gemeenteraad drukte Huberts op het hart: ik wil de geur van boeken altijd blijven ruiken. Zelfs vergrijzing in de raad blijkt zo een drempel voor de digitale bibliotheek.
Hoe kunnen de (lokale) openbare bibliotheken hun krachten zodanig bundelen dat ze ‘a hand on the steering‘ krijgen?
Kerkhof ziet wel wat in de openbare bibliotheek, los van de lokale overheid. De gemeentelijke kaders zijn nu vaak nog te bepalend. Daarnaast moeten lokale bibliotheken volgens hem bereid zijn om de complete autonomie op te geven en te
investeren in landelijke en provinciale netwerken, waarbij je compromissen sluit om ergens te komen.
Visser zoekt het buiten de muren van de openbare bibliotheek: Alléén krijgt een bibliotheek het niet voor elkaar om een dienst of product te ontwikkelen en in de lucht te houden. Hij geeft schoolbieb.nl (virtuele mediatheek) als voorbeeld. Dit project kost ongeveer 1,5 miljoen Euro op jaarbasis. “Doordat alle partijen een stukje bekostigen (in natura dan wel netto) wordt het behapbaar”, aldus Visser. “Op die manier denken is lastig omdat een lokale bibliotheek lokale financiering krijgt en eerst duidelijk moet maken dat een aandeel wordt gekocht in een groter geheel en dat daarmee een dienstverlening
naar de lokale klant wordt neergezet die anders niet realiseerbaar is”, verwoordt Visser de omslag die gemaakt moet gaan worden.

frisoDe tijd is rijp!
Friso Visser ziet de functie van de fysieke bibliotheek veranderen. Er is meer aandacht voor ontmoeting en sociale cohesie, voorlichting, culturele activiteiten enzovoort. Belangrijke waarden als betrouwbaar, onafhankelijk en laagdrempelig worden nog altijd hoog gewaardeerd door het publiek. “Alles wat via Google kan is leuk, maar het heeft ook zo zijn problemen. Dit levert een kans op om de digitale bibliotheek goed te positioneren. In die niche krijgt de bibliotheek, heel natuurlijk, een eigen rol die ook nadrukkelijker moet worden gezocht en geclaimd”, aldus Visser. “De tijd is er rijp voor!”, concludeert hij.

Bronnen:

1) Persbericht van 14 november 2005, Stichting Collectieve Propaganda van het Nederlandse Boek (CPNB):
2) http://googleblog.blogspot.com/2005/10/point-of-google-print.html
3) Zoek via Google naar digital librarysite:europa.eu
4) http://www.signandsight.com/features/174.html
5) http://sitegenerator.bibliotheek.nl/landelijklenen/home/