JA slide show

The Big Hub; databases geordend

Afdrukken
in: Bibliotheekblad jrg. 4 (2000) nr. 3

Misschien staat u er nooit bij stil, maar elke pagina die u op het World Wide Web bekijkt (de voorkant) kent ook een achterkant; de zogenaamde HTML opmaak (HyperText Markup Language). Elke tekst, elke visuele tekstopmaak, elke afbeelding en elke hyperlink ziet er op het scherm uit zoals het eruit ziet, doordat er codering is aangebracht door de maker van de website. Wie die achterkant eens wil bekijken klikt in Microsoft Internet Explorer op Beeld > Bron, Netscape gebruikers klikken op Beeld > Paginabron. Zoekmachines zijn in staat om de tekst die zich tussen de programmeercodes bevindt, te indexeren en vervolgens voor ons doorzoekbaar te maken. Volgens een onderzoek uit februari 1999, had Northern Light, de grootste zoekmachine van dat moment, slechts een dekkingspercentage van 16% van de 800 miljoen indexeerbare webpagina's. Indexeerbaar zijn het type pagina's die gemaakt zijn met pure HTML, zoals hierboven beschreven. Het is een misvatting te geloven dat met zoekmachines alle informatie op het WWW gevonden kan worden.

Steeds meer websites worden tegenwoordig niet meer gemaakt volgens de traditionele HTML opmaak, maar met behulp van een achterliggende database. Dat wat wij op het scherm zien, wordt op commando voor de gebruiker gemaakt. Informatie wordt uit verschillende gegevensbestanden gehaald en "on-the-fly" tot een pagina samengesteld. Om te bekijken hoe een dergelijk pagina eruit ziet moet u eens de bron bekijken van De Volkskrant. Niets van wat op het scherm zichtbaar is, staat in de bron. Het gevolg hiervan is dat pagina's die uit een database worden gegenereerd, nooit door een zoekmachine kunnen worden geïndexeerd. Dus nog een probleem voor de zoekmachine.

Websites die vanuit een database worden opgebouwd zijn vrij eenvoudig te herkennen aan de lange internetadressen, die bestaan uit cijfers en symbolen zoals http://www.fishbase.org/Eschmeyer/EschPiscesSummary.cfm?vcas_spc=52876. Sites waar men kan zoeken in een bibliotheek- of boekhandelcatalogus, maar ook sites die zich presenteren als encyclopedie of database (The Internet Movie Database) worden "on-the-fly" aan u getoond.

Een lange inleiding waaruit het volgende af te leiden;

  • Zoekmachines indexeren alleen pagina's die volgens de HTML standaard zijn gemaakt en die eindigen met .htm of .html
  • Zoekmachines kunnen sites die uit een database worden gebouwd niet indexeren

Om nu de sites te vinden en te doorzoeken vanaf één plaats, is TheBigHub (De Grote Knoop) een prachtige bron. Hier zijn ruim 1500 websites bijeengebracht, per onderwerp gerangschikt, die zijn opgebouwd rond hun eigen database. Andijvie kun je kopen bij de supermarkt, maar betere andijvie is te kopen bij de groenteboer. Vergelijk in dit verband een gewone zoekmachine met een supermarkt en THB met de groenteboer

Vanaf THB (was voorheen overigens Isleuth.com) kan rechtstreeks een zoekopdracht worden uitgevoerd, maar voor een nauwkeuriger resultaat is het beter om THB te gebruiken als een verwijspunt. De zoekvensters van THB bieden namelijk slechts een beperkt aantal zoekopties. Vraagje. Welke Nederlandstalige speelfilms zijn er uitgekomen in 1999? Volg in THB Entertainment > Movies and Films > Internet Movie Database. Op die site aangekomen kiezen voor More Searches > Extended Searches en de taal Dutch en het jaar 1999 invullen. En voila, er komt een lijst met 58 titels uitgerold. Met een gewone zoekmachine zou dit niet lukken.

Andere vraag. Wat berichten kranten over de hele wereld over het laatste nieuws rond Kosovo? Ga naar News > Newsindex en tik in kosovo en de berichtgeving hierover uit enkele honderden kranten verschijnt in beeld.

Het gemak van TheBigHub is, dat de belangrijkste online bronnen bij elkaar zijn gebracht die op hun site een zoekfunctie hebben. Overigens betreft het alleen Engelstalige websites, dus reken niet op Nederlandse databases.

Met name wanneer het zoeken met een zoekmachine geen of slechte resultaten oplevert is het zoeken via TheBighub een alternatief of zelfs een eerste startpunt.

 

© Rob Coers, Coers Internet Trainingen

Het is niet toegestaan om materiaal op deze site te verkopen of te kopiëren zonder toestemming vooraf. Ook commercieel gebruik, gebruik van het logo of het publiceren van enig materiaal op de website van Coers Internet Trainingen, is zonder toestemming vooraf niet toegestaan.

 

Plaats reactie

Beveiligingscode
Vernieuwen

Mijn LinkedIn profiel

Via Twitter

  • @riavanbrederode goed ja. Nu op zoek naar lokale twitterers om te followen en zoekalerts uitzetten. Succs @boekparel
  • Volg mij op Twitter

Reacties

Wat lees ik?


You are here: Home Publicaties Alle artikelen