| Inhoudsopgave |
|---|
| Google Books : een mijlpaal in de geschiedenis van het boek? |
| Pagina 2 |
| Alle pagina's |
in: Bibliotheekblad, jrg. 10 (2006) nr. 6/7
Sinds 1996 is Google een onmisbaar instrument geworden voor iedereen die zich op het internet begeeft. Miljarden webpagina’s met informatie zijn door deze succesvolle zoekmachine op effectieve wijze toegankelijk gemaakt. Ook informatiespecialisten voeren hun dagelijkse al@dinwerkzaamheden veelal uit met behulp van Google.
Google laat het niet bij het indexeren en toegankelijk maken van webpagina’s alleen. Het bedrijf heeft zich als doel gesteld “alle informatie wereldwijd toegankelijk en bruikbaar te maken”. Daarom ontsluit Google ook het wereldnieuws (Google News), het Usenet archief (Discussions), online winkels (Froogle), afbeeldingen (Images), video (Video), wetenschappelijke publicaties (Scholar) en e-mail (Gmail).
Voor de ontwikkelaars van Google is zelfs daarmee het doel nog niet bereikt, want krap 9 jaar na de oprichting van Google, komt het bedrijf met een dienst die het aantal geïndexeerde bronnen met een veelvoud zal doen vergroten: “Google Books, zoeken in en naar het gedrukte woord in boeken”.
Wat is Google Books? Wat is de filosofie erachter en wat is er op dit moment in Google Books te vinden? Hoe kijken betrokkenen in de bibliotheek-, boekhandels- en uitgeverswereld aan tegen Google’s expansiedrift?
In dit artikel volgt een beschrijving van deze dienst, evenals die van Google’s concurrenten Yahoo! en Microsoft. Ook zij werken aan vergelijkbare projecten.
In 2004 bracht Google haar plannen over het digitaliseren van boeken naar buiten, toen nog onder de naam Google Print.
Eind 2005 wijzigde Google deze naam in Google Books dat bestaat uit twee onderdelen:
- het uitgeversprogramma (Partner program)
- het bibliotheekprogramma (Library project)
Google Partner program: hoe werkt het?
Grote en kleine uitgevers, maar ook auteurs, kunnen hun boeken naar Google sturen. Zij bepalen welke werken zij willen laten digitaliseren evenals het aantal pagina’s per boek. Die boeken kunnen worden aangeleverd als hard copies, maar ook als PDF bestand wanneer dat al voorhanden is.
Google scant of converteert deze boeken, van kaft tot kaft of delen hieruit, volgens overeengekomen afspraken en indexeert tenslotte de inhoud. De boeken zijn via books.google.com of books.google.nl toegankelijk. De kosten hiervan neemt Google voor haar rekening. De uitgever ontvangt een digitaal exemplaar voor eigen gebruik
Wat staat er op het scherm?
Wat de zoeker te zien krijgt, is dus vooraf bepaald door de uitgever die zijn werken beschikbaar heeft gesteld. Vrij te bekijken zijn in elk geval de voor- en achterkant van het boek, de informatie over copyright, de inhoudsopgave en de alfabetische index.
Vanuit elke pagina kan in beperkte mate gebladerd worden. Ook bestaat de mogelijkheid om binnen het boek naar een woord te zoeken, om vervolgens vanaf de pagina waarop dat woord voorkomt, enkele pagina’s verder te bladeren.
Het boek is beveiligd en kan alleen via het computerscherm bekeken worden. Het is niet mogelijk een pagina te printen of het boek te downloaden. Ook de rechtermuisknop functie is onbruikbaar gemaakt. Daarnaast is op elke pagina de tekst ‘Copyrighted Material’ opgenomen. De enige manier om tekst op papier te krijgen is door van elke bladzijde een schermafdruk te maken.
Het voordeel voor de uitgever om werken via Google Books beschikbaar te stellen, is de directe link naar de kooppagina bij de uitgever zelf. Ook wordt verwezen naar Amazon.com (en andere internetwinkels). Voor wie binnen de Nederlandse Google Books zoekt, komt via links bij AKO, Bruna en Proxis.
Google Library project: hoe werkt het?
Vanaf eind 2005 is het mogelijk via Google Books te zoeken in de collecties van een vijftal grote bibliotheken; de universiteitsbibliotheken van Stanford, Michigan, Harvard en Oxford en de New York Public Library. Met elke bibliotheek heeft Google een overeenkomst gesloten, die inhoudt dat de bibliotheek zelf bepaalt welke boeken zij laat digitaliseren.
Voor deze bibliotheken sluit deze stap naadloos aan op hun visie over digitale bibliotheek.
Ook in het Google Library project worden de kosten volledig betaald door Google. Hieronder vallen het transport naar de scanapparatuur, de personele kosten en de geautomatiseerde verwerking.
Wat staat er op het scherm?
Binnen het Library project maakt Google onderscheid tussen twee categorieën boeken:
- boeken waarvan het auteursrecht nog niet verlopen is of waarvan de rechthebbenden (auteurs, uitgevers, maar ook de leverende bibliotheken) niet willen dat het boek wordt getoond
- boeken waarvan het auteursrecht verlopen is of waarop geen auteursrecht rust en daarmee tot het ‘Publieke domein’ behoren.
Van de eerste categorie (de boeken met copyright) toont Google Books twee of drie tekstfragmenten, genaamd ‘Snippets’. Van een boek in het publieke domein is elke bladzijde leesbaar.
Link naar de bibliotheken
In de FAQ van het Library project wordt vermeld dat elk bibliotheekboek een verwijzing krijgt naar de dichtstbijzijnde bibliotheek. Via Worldcat, de internationale catalogus applicatie van OCLC, kan direct worden bekeken in welke collectie het boek zich bevindt en zelfs of het beschikbaar is. Het ligt voor de hand dat ook Nederland op termijn hierop aansluit, waarmee ook Nederlandse bibliotheken toegankelijk worden via Google Books.
Opt-in, Opt-out
Vanaf het moment dat de gedigitaliseerde boeken van het Library project vindbaar zijn voor het publiek, voeren twee grote organisaties een rechtzaak tegen Google.
De brancheorganisatie Association of American Publishers (met leden als Penguin, McGraw-Hill en Pearson Education), vindt dat Google het auteursrecht schendt. Ook vindt de Association het ongehoord dat Google vooraf niet om toestemming heeft gevraagd, maar direct met het scannen van bibliotheekcollecties gestart is.
The Authors Guild vindt het eveneens onverteerbaar dat via Google Books het nog bestaande auteursrecht van haar leden bevochten moet worden. Ook wanneer er sprake is van tekstfragmenten, de snippets. Toen het Amerikaanse schrijversgilde in september 2005 de stap naar de rechter maakte, reageerde Google met een tijdelijke scanstop tot 1 november 2005. Tot die datum konden schrijvers en uitgevers in de gelegenheid gesteld bij Google kenbaar te maken dat hun boeken niet gescanned mogen worden. Het principe van opt-out; als je bezwaar hebt, meld je dan. Inmiddels heeft Google het scannen weer opgestart en de aanklagers spreken van een uiterst arrogante houding van Google.
Vanuit Nederland zijn vooralsnog geen bezwaren geuit. De uitgevers Brill, Elsevier en Kluwer leveren boeken en laten titels of delen hiervan scannen. De directeur van de Koninklijke Bibliotheek, Wim van Drimmelen, sprak in de NRC van 12 december 2005 met enthousiasme over het Google project. Hij maakt wel een bezorgde kanttekening: ,,Ik vind het geweldig dat dit gebeurt. Het is prachtig dat er geld voor grootschalige digitalisering beschikbaar komt uit de private sector. Maar er is ook een keerzijde. De kleine taal- en cultuurgebieden, waaronder Nederland, zullen achterin de rij staan”.
Google stelt zich op het standpunt dat het zoveel mogelijk informatie toegankelijk wil maken en daar horen boeken ook bij. Sidney Mock, marketing director van Google Benelux, stelt dat Google zich volledig houdt aan de voorwaarden die bibliotheken stellen. Auteurs die bezwaar hebben tegen opname van hun werk, kunnen zich melden bij Google. Het bedrijf is van mening dat zij met de ‘snippets’ het auteursrecht niet schendt. Google hanteert hierbij het ‘fair use’ principe.
Het Google Partner program valt buiten deze rechtzaken, omdat hier sprake is van opt-in. Wil je als uitgever bij Google Books worden opgenomen, dan kun je je melden.
Concurrentie
Het digitaliseren van boeken is echter geen nieuw verschijnsel. Sinds geruime tijd bestaan op dit terrein diverse activiteiten of projecten. Ook de grote concurrenten van Google zetten in op digitalisering van het gedrukte woord. Een aantal voorbeelden.
Project Gutenberg
Sinds 1971 werkt het Gutenberg project aan het digitaliseren van boeken. Dit wordt volledig uitgevoerd door vrijwilligers. Alle boeken zijn rechtenvrij en vallen in het zogeheten publieke domein. Alle grote werken uit de wereldliteratuur én boeken van onbekende auteurs zijn op vele manieren doorzoek- en vindbaar. Op dit moment zijn er 17.000 e-books gratis te downloaden.
Amazon.com
De service ‘Search inside’ is vergelijkbaar met het Google Partner program, echter met het verschil dat Amazon de boeken direct verkoopt. Boeken die door Amazon zijn gescanned zijn herkenbaar aan het ‘Search inside’ logo.
Yahoo!
Sinds oktober 2005 is Yahoo! deelnemer aan de recentelijk opgericht Open Content Alliance (OCA), waarin onder meer The Internet Archive, Hewlett Packard en – verrassend, want concurrent – Microsoft MSN zitting hebben. De OCA richt zich uitsluitend op het digitaliseren van titels in het publieke domein én op boeken waarvoor auteurs hun toestemming hebben verleend. Scans worden beschikbaar gesteld in het gangbare PDF format. Deze worden op termijn indexeerbaar voor alle zoekmachines, dus ook voor Google! Enkele leveranciers van boeken zijn o.a. The Internet Archive, de universiteiten van Toronto en California, The UK National Archives en O’Reilly media.
Microsoft
Ook Microsoft is gestart met het digitaliseren van een bibliotheekcollectie. Via deelname aan de Open Content Alliance digitaliseert MSN Book Search 100.000 boeken van de British Library. In de loop van 2006 worden de eerste resultaten zichtbaar via de MSN zoekmachine, waarbij mogelijk de MicrosoftReader technologie toegepast wordt om boeken leesbaar te maken.
Zoektips
Google Books is nog volop in de test- en groeifase en kan het beste via het geavanceerde zoekscherm doorzocht worden.
- Zoek bijvoorbeeld eens naar de exacte woordcombinatie “digital photography” en klik op het boek dat u wilt bekijken. Via de inhoudsopgave zoekt u naar een hoofdstuk. Via ‘Zoeken in dit boek’ typt u de titel van het hoofdstuk en het paginanummer. Vervolgens kunt u vanaf dat hoofdstuk voor- en achteruit bladeren
- Zoek eens op uitgever en kijk welke titels er zijn opgenomen. Bijvoorbeeld inpublisher:lonely planet of inpublisher:elsevier
- Om alleen boeken uit het publieke domein te vinden moet op de geavanceerd zoekscherm de optie ‘complete books only’ worden aangevinkt. Dit kan nog niet op de Nederlandse site!
- Zoek eens met een beperking op datum, bijvoorbeeld boeken met het woord ‘nederland’ met de publicatiedatum tussen 1800 en 1875
- Met een Google account of met een Gmailadres zijn er van boeken in het Partner program enkele pagina’s meer te zien. Het aantal pagina’s varieert per boek.
Google Books is uiteindelijk in ieders voordeel! (Sidney Mock, Google)
“Laat ik beginnen te vertellen, dat het Google’s missie is om alle informatie ter wereld te organiseren, of dat nu online staat of offline”, aldus Sidney Mock, marketing director van Google Benelux, in een telefonisch onderhoud. “Dat kunnen films en videobeelden zijn, maar ook boeken. Dat wij nu in een aantal rechtzaken verwikkeld zijn, heeft voor een deel te maken met onduidelijke communicatie van onze kant. Wij zien in onze programma’s alleen maar voordelen. De uitgever kan via ons betere verkoopresultaten behalen door de link we naar hem aanbrengen, maar ook naar online boekhandels die hun boeken verkopen. Schrijvers kunnen via ons een groter publiek bereiken. Bibliotheken kunnen, door de samenwerking die we hebben gesloten met OCLC, hun collecties beter zichtbaar maken. En de gebruikers voor wie we het doen, die hebben er het meeste profijt van. Alle werken in het publieke domein zijn gratis online te lezen.”
Over de Nederlandse bibliotheken: “Google heeft voor het Library project nog niet direct de Nederlandse bibliotheken op het oog, maar het ligt wel voor de hand dat er met bijvoorbeeld de Koninklijke Bibliotheek iets moois kan ontstaan”. Nog een tip voor betere vindbaarheid: “Google wil graag online informatie bij bibliotheken indexeren. Als databases [zoals de al@din Kennisbank, red.] worden opengesteld, kunnen wij ons werk doen. En verder willen we graag met de openbare bibliotheken praten hoe wij kunnen helpen om hun informatie breder toegankelijk te maken. Want met Google Books willen we ook een hoger doel bereiken, namelijk de democratisering van informatie”.
Dat lijkt me een aanbod dat niet afgeslaan mag worden!
