Google Sitemap

En weer een nieuwtje afkomstig uit de Googleplex: de Google Sitemap. Het principe is simpel: webmasters stellen een plattegrondje van hun site op met XML-taal en Google gebruikt dat om nieuwe pagina’s te ontdekken. Eigenlijk een omgekeerde versie van de robots.txt-standaard: een sitemap vertelt Google waar die wél moet komen; in het bestand robots.txt staan juist de verboden hoekjes van een site. De Google Sitemap is vooral bedoeld om webpagina’s te ontsluiten die niet via statische hyperlinks zijn te bereiken.

Google presenteert de Sitemap vooral als service voor webmasters, maar het lijkt erop dat het vooral Google zelf is die er baat bij heeft. Google hoeft immers nog maar één bestand per website op te halen om te kijken wat de nieuwe pagina’s zijn. En niet onbelangrijk: aan de hand van dit XML-bestand ziet Google meteen of er ook pagina’s verdwenen zijn. Anders zou Google bij elk bezoek de hele site opnieuw moeten doorspitten. Bij grote websites kan dit Google dus heel wat werk besparen.

Verschillende webloggers, zoals Google Blogoscoped, vragen zich af waarom Google niet gewoon RSS-feeds gebruikt om nieuwe pagina’s op het spoor te komen. Een sitemap en een feed zijn echter twee verschillende dingen: een feed geeft alleen de nieuwste pagina’s, een sitemap álle pagina’s van een site. Met een sitemap zie je dus ook welke pagina’s verdwenen zijn, bij een feed niet. Een sitemap gelijkstellen aan een feed is in bibliotheektermen net zoiets als een catalogus gelijkstellen aan een aanwinstenlijst.

Tot zover het technische perspectief. Vanuit de gebruiker zijn de gevolgen misschien nog zelfs veel interessanter. De Google Sitemap heeft namelijk veel weg van een eerste poging van Google om het diepe web te doorgronden, het deel van internet dat achter archiefdeuren en in lokale databanken zit verscholen. Webmasters die hun dynamische internetcontent toegankelijk willen maken voor de buitenwereld, hoeven slechts één inhoudsopgave in XML te maken en Google doet de rest.

Overigens ligt bij de Google Sitemap ook het gevaar van cloaking op de loer. Met zo’n sitemap is het gemakkelijker dan ooit om Google een nepsite voor te schotelen die alleen maar uit handige trefwoorden bestaat.

Update 17/6
Een handige site om XML-sitemaps te genereren: www.sitemapspal.com.

Lees ook:

Reageer


naam*

e-mail (wordt niet gepubliceerd)*

website

reactie*

verstuur

© Copyright Wessel Zweers - Designed by Pexeto - Photography: Alexandre Duret-Lutz