Google Analytics en error 404-pagina’s
Op deze plaats mopper ik vaak over Google, maar het zoeksysteem heeft ook twee formidabele kanten. De eerste is natuurlijk Google Adsense, waarmee ik een aardig deel van mijn inkomsten verdien (ja, zo schijnheilig ben ik ook wel weer). De tweede is Google Analytics, het hulpmiddel om het bezoek aan websites te analyseren.
Google Analytics is een walhalla voor wie een website beheert en van cijfers houdt. Vroeger vonden we Nedstat al heel mooi en informatief, maar zonder te overdrijven kun je rustig stellen dat Google Analytics honderd keer meer informatie biedt: welke pagina’s en paginaclusters worden het meest bezocht, hoe komen bezoekers binnen, hoe lang blijven ze op de site, welke pagina’s bezoeken ze daarbij, wat zijn de belangrijkste afhaakpagina’s, en nog véél meer informatie. En dit alles over elke gewenste periode. De resultaten worden getoond in tabellen (te downloaden als Excel-spreadsheet), staaf- en taartdiagrammen. Kortom: Google Analytics is een Efteling voor wiskundigen.
Bijna wekelijks neem ik wel even de tijd om de Google Analytics-grafiekjes te bekijken. En vrijwel altijd stuit ik wel op een verrassend nieuw inzicht in een van mijn websites. Een voorbeeld betreft mijn wandelsite Tweevoeter.nl. In november 2005 was ik om technische redenen genoodzaakt om alle pagina-adressen van deze site te voorzien van de extensie .php. Binnen enkele weken had Google alle nieuwe adressen verwerkt.
Operatie geslaagd? Helaas, een paar honderd andere websites bleven linken naar verouderde pagina’s. De belangrijkste mailde ik met het verzoek hun link aan te passen, maar daar werd maar mondjesmaat gehoor aan gegeven. Drie maanden later gaf Google Analytics aan dat nog steeds 20 procent van alle bezoekers op een niet-bestaande pagina terechtkwam. Dat is veel.
Volgende ingreep: een error 404-pagina. Voor wie deze term niet kent: een error 404 is de fout die je krijgt als je een niet-bestaand adres intikt, bijvoorbeeld van een pagina die inmiddels verhuisd is. Door de error 404 op te maken in de vormgeving van je site, inclusief alle navigatiemenu’s, kunnen bezoekers vanuit de niet-bestaande pagina doorklikken naar andere delen van je site en op zoek gaan naar de gewenste informatie.
Operatie alsnog geslaagd? Helaas. Einde 2006, een jaar na de adreswijzigingsoperatie, viel me bij mijn wekelijkse rondje Google Analytics iets op. De gemiddelde klikdiepte (het aantal bezochte pagina’s per bezoeker) voor de hele site lag op 2,8. Dat is niet veel. Toen ik vervolgens de relatie legde tussen ingangspagina en klikdiepte, dan bleek de error 404-pagina met afstand onderaan te staan met een gemiddelde klikdiepte van slechts 1,2. Omgerekend: minimaal 80 procent van de bezoekers die een niet-bestaande Tweevoeter-pagina bezochten, besloot direct af te haken; hooguit 20 procent (en waarschijnlijk nog een stuk minder) deed nog een poging de informatie elders op de site te vinden.
Conclusie: zelfs een opgemaakte error 404-pagina met een nette foutmelding is voor de meeste bezoekers een afknapper. Om de klikdiepte wat op te schroeven zit er maar één ding op: alle 404-errors wegwerken, zodat bezoekers alleen op pagina’s terechtkomen met relevante inhoud. Om dat voor elkaar te krijgen heb ik eerst in beeld moeten krijgen welke niet-bestaande pagina’s het meest werden opgevraagd. Ik heb daarop een scriptje gemaakt dat mij een e-mail stuurde zodra iemand een 404-error kreeg. De eerste dag kreeg ik zo’n 1500 e-mails. De belangrijkste niet-bestaande pagina’s heb ik daaruit gevist. Voor elke pagina heb ik een zogeheten ‘redirect’ aan mijn .htaccess-bestand toegevoegd, bijvoorbeeld:
RedirectMatch permanent ^/drenthe/$ http://www.tweevoeter.nl/drenthe.php
Deze regel betekent dat elke bezoeker van het adres www.tweevoeter.nl/drenthe/ automatisch wordt doorgeschakeld naar het nieuwe adres www.tweevoeter.nl/drenthe.php. Zo heb ik elke niet-bestaande pagina gekoppeld aan het nieuwe adres. Met snel resultaaat: binnen een dag was het aantal mailtjes gezakt tot nog maar een paar honderd. En een week later nog maar 50. Je vraagt je misschien af: waarom heb je deze redirects niet meteen in 2005 ingebouwd? Dat had een praktische reden: de site draaide toen nog op een Windows-server in een shared hosting-omgeving. Nu staat de site op een eigen virtuele Linux-server en dan heb je veel meer mogelijkheden om de webserver te beïnvloeden.
Inmiddels bevat mijn .htaccess-bestand een stuk of 500 redirects. Dat is erg veel en het zal ook de webserver iets vertragen, maar 404-errors komen vrijwel niet meer voor. En het belangrijkste: volgens Google Analytics is de klikdiepte gestegen tot 3,3, dus een verhoging van 0,5. Dit verschil lijkt weinig indrukwekkend, maar het betekent wel dat je met hetzelfde aantal bezoekers bijna 20 procent meer pageviews genereert en de advertentie-inkomsten navenant stijgen. En dat met hooguit een halve dag werk. Was elke halve werkdag maar zo lucratief…
Overigens ben ik nog steeds niet van de 404-errors verlost, ik krijg nog altijd zo’n 20 tot 30 mailtjes per dag. Maar dit heeft andere oorzaken. Aan de adressen te zien zijn dit meestal geen verdwaalde bezoekers, maar pogingen van hackers om uit te zoeken welke toepassingen op mijn site zijn geïnstalleerd. Verder zijn er ook wel eens bezoekers van vlees en bloed die behoorlijk wat af blijken te knoeien op je site. Maar dat is weer een verhaal apart…
Computer!Totaal-dvd over Google
De nieuwe dvd van Computer!Totaal (nummer 17) is gewijd aan nieuwe mogelijkheden op het web. Op deze dvd mocht ik iets vertellen over de macht van Google en het optimaliseren van websites voor zoekmachines. Verder tips van internetondernemers en ontwikkelaars van webwinkels voor het opstarten van een succesvolle internetonderneming. Diverse experts geven hun visie op ontwikkelingen van online communities.
Kijkgedrag bij zoekmachines
Ik ga nog even door met het bashen becommentariëren van internetmarketeers. De Nederlandse koeienjongens berichten:
De Vos & Jansen Marktonderzoek heeft in samenwerking met Search Engine Mediabureau Checkit eyetracking onderzoek gedaan naar hoe men bij zoekmachines kijkt als men met verschillende intenties het web opgaat.
Goed, kom maar op met de resultaten.
Het blijkt dat kopers meer zoekresultaten bekijken en meer gericht zijn op merken dan informatie zoekers.
Daar gaan we al. Wie de vergelijking maakt met de offline wereld, ziet direct in dat dit een open deur is.
Dat komen enkele conclusies met betrekking tot zoekgedrag:
1. Consumenten kijken gemiddeld 1,1 seconde naar één zoekresultaat.
2. 98% bekijkt de niet gesponsorde zoekresultaten.
3. 96% bekijkt de bovenste (drie) gesponsorde zoekresultaten.
4. 31% bekijkt de rechtse gesponsorde zoekresultaten.
5. Kopers kijken langer (gemiddeld 11,4 sec.) en naar meer resultaten (gemiddeld 10) en focussen op vertrouwde merknamen.
6. Kijkers kijken korter (gemiddeld 9,4 sec.) en naar minder resultaten (gemiddelden letten meer op inhoud dan op merkbekendheid.
OK, dit is zeker interessant. Duidelijk is dat tekstadvertenties boven de zoekresultaten ruim drie keer zo vaak gezien worden als aan de rechterkant. Een belangrijke vraag voor adverteerders is dan wel of de klikpercentages zich net zo verhouden, maar waarom is dat dan weer niet onderzocht?
Dan nog wat conclusies met betrekking tot zoekmachinemarketing:
1. Zorg dat u met uw website op een hoge positie komt te staan. Hierdoor wordt uw resultaat opgemerkt en daarnaast wordt de inhoud van het zoekresultaat als relevant en actueel ervaren.
2. Probeer een hoge positie te behalen binnen de natuurlijke zoekresultaten, want die worden het beste en langste bekeken door consumenten. Kopers nemen overigens ook de moeite om naar de onderste resultaten op de eerste pagina te kijken.
3. Gebruik de volgende elementen: bekende, betrouwbare merk,- en websitenamen, beschrijving van interessante websitefuncties, aanwezigheid van prijsindicaties, het herhalen van de zoekterm en aanwezigheid van indicaties van de omvang van het aanbod op een website. Dit zijn voor consumenten redenen om door te klikken.
4. Gebruik geen hoofdletters, schreeuwende teksten en uitroeptekens, want dit wordt als irritant ervaren.
5. Zorg dat de boodschap binnen een seconde te begrijpen is.
Ik ben sprakeloos. Tien jaar geleden gaf usability-goeroe Jakob Nielsen precies dezelfde adviezen in zijn tweewekelijkse columns. Anno 2007 moeten we dus concluderen dat de zoekmachinemarketing even ver is als de usability-wereld tien jaar geleden. Overigens heb je helemaal geen usability-deskundige (en ook geen internetmarketeer) nodig om dit soort voor de hand liggende conclusies zelf te bedenken.
En het wordt nog erger:
Het Tijdschrift voor Marketing, waarin dit onderzoek werd gepubliceerd zegt “[…]als de uitvoering van dit onderzoek één ding aantoont, dan is het wel dat zoekmachinemarketing snel volwassen wordt.”
Volwassen worden door tien jaar oude conclusies in een nieuw jasje te hijsen?
Waar kan ik een maagd offeren, vraagt de webmaster
Langzaamaan begint ook de computerjournalistiek wat kritischer te worden jegens Google. Jozef Schildermans schrijft een kritische column over Google op Diskidee.be. De sterkste passage gaat over de gebrekkige communicatie tussen Google en webmasters:
Google heeft een geautomatiseerd systeem waar websitebeheerders de status van hun website in de index kunnen nagaan en eventuele problemen kunnen signaleren. Dat systeem zegt echter meestal dat er geen probleem is met de getroffen site. De beheerder kan een formulier invullen met een beschrijving van het probleem, maar Google zal daar zelden of nooit op antwoorden.
Ook via e-mail of via telefoon is Google niet bereikbaar. De Google-nieuwsgroepen voor webmasters lijken tegenwoordig meer op een zelfhulpgroep voor bijgelovigen, waar allerlei theorieën worden verkondigd waarom deze of gene site uit de index is verdwenen, zonder dat ooit een echte verklaring wordt gevonden.
Als de problemen te flagrant zijn, lost ‘iemand’ van Google ze op, maar dit gebeurt meestal zonder uitleg waarom het misging. ‘Dit doet me denken aan een oude Star Trek episode,’ schrijft iemand in de Google nieuwsgroep voor webmasters, ‘waar de onwetende inboorlingen niet begrijpen waarom goede dingen verschijnen, maar gewoon knielen voor hun god, hem bedanken en een of twee maagden offeren om hem blijvend gunstig te stemmen.’
Lees ook even de rest van de hilarische vergelijking met Star Trek:
So I’ve jammed a bone in my nose, put on my grass skirt, and just need to know where the mighty Goog El is so I can go sacrifice a virgin and keep it happy. Any guidance on exactly where to perform the ritual is welcome. Until guidance arrives, we will continue to beat our drums, spin and dance and hope for the best.
Maar een beetje jammer is dat de rest van de column weinig hout snijdt. Neem bijvoorbeeld:
Search Engine Optimalisation of SEO – optimalisatietechnieken waarmee websites hopen hoger te scoren in zoekopdrachten – heeft meer en meer perverse bijwerkingen. Zo krijgen journalisten van Angelsaksische kranten zoals The New York Times of The Guardian tegenwoordig les over hoe ze hun koppen ‘Google-vriendelijk’ kunnen maken. Gedaan met leuke woordspelingen of poëtische ontboezemingen, nee een krantenkop moet vandaag zoveel mogelijk relevante steekwoorden bevatten die hoog scoren in Google. Geen ‘Goodbye Lenin, Sputnik and Mog’ (namen van kippen die eraan moeten omwille van de vogelgriep), maar wel ‘Poultry turned to pulp as workers switch sites’ (het allitereert tenminste nog).
En de verklaring:
Dat is natuurlijk niet de schuld van Google, eerder een indicatie van de domheid van zoekrobotten en zoekalgoritmes die nog altijd zeer slecht zijn in het interpreteren van natuurlijke taal.
Zoekalgoritmes hebben inderdaad hun onvolkomenheden, maar het is veel te gemakkelijk om de techniek de schuld te geven. Vijf jaar geleden waren de algoritmes van Google immers nog veel beperkter, maar toen kregen journalisten nog geen instructies hoe ze Google-vriendelijke moesten maken. Er is dus iets anders aan de hand.
Ik zou zeggen: de werkelijke oorzaak is de domheid van de hele internetwereld. Jarenlang hebben we (inclusief het journaille) Google opgehemeld en ons nooit kritisch afgevraagd hoe goed dit zoeksysteem nu werkelijk is in vergelijking met zijn concurrenten. Elke scheet die Google liet, was gelijk nieuws. En nu vragen we ons af hoe het toch komt dat iedereen wanhopig probeert om beter vindbaar te worden in Google? Is dat gek? We hebben dat toch zelf over ons afgeroepen?
Overigens is er niets mis met een Google-vriendelijke kop. Woordspelingen in nieuwskoppen zijn leuk in kranten en tijdschriften, maar op internet helemaal passé. Dat komt niet door Google, maar door het surfgedrag van internetgebruikers. Die lezen geen hele stukken meer om te beoordelen of ze die wel of niet interessant vinden. Ze kijken alleen naar de kop en besluiten in een fractie van een seconde of ze wel of niet het hele bericht willen lezen. Dat journalisten daarop inspelen, kun je toch niet ‘pervers’ noemen?
Google wil beter contact met webmasters, maar alleen de bonafide
Is uw site geheel of gedeeltelijk uit de Google-index verdwenen? Google wil de dienst Google Sitemaps gebruiken om beheerders van websites hiervan op de hoogte te stellen. Dat schrijft Google-medewerker Matt Cutts op zijn weblog.
De laatste maanden heeft Google al een test uitgevoerd waarbij sommige webmasters per e-mail een bericht kregen, maar lang niet iedere webmaster is goed per e-mail te bereiken. Google Sitemaps lijkt een beter instrument.
Opmerkelijk genoeg betoogt Cutts dat niet iedere webmaster bericht moet krijgen als Google zijn site verwijdert wegens spampraktijken. Hij maakt onderscheid tussen de bonafide webmaster die maar nét over de schreef gaat, en de malafide webmaster die er een potje maakt en duizenden neppagina’s maakt. De bonafide webmaster zou wel bericht moeten krijgen, inclusief de mogelijkheid om een verzoek in te dienen tot herindexering. De malafide webmaster zou alleen stilletjes uit de index moeten worden gegooid.
Google Banned Tool
Weer een zinloos snufje, groot geworden in de Google-hysterie: de Google Banned Tool. Tik uw site en deze tool geeft aan of die wel of niet voorkomt op de zwarte lijst van Google.
Maar daar is een veel eenvoudiger methode voor: zoek in Google met site:www.uwsite.nl en u ziet direct hoeveel (en welke) pagina’s zijn geïndexeerd.
Google Sitemap
En weer een nieuwtje afkomstig uit de Googleplex: de Google Sitemap. Het principe is simpel: webmasters stellen een plattegrondje van hun site op met XML-taal en Google gebruikt dat om nieuwe pagina’s te ontdekken. Eigenlijk een omgekeerde versie van de robots.txt-standaard: een sitemap vertelt Google waar die wél moet komen; in het bestand robots.txt staan juist de verboden hoekjes van een site. De Google Sitemap is vooral bedoeld om webpagina’s te ontsluiten die niet via statische hyperlinks zijn te bereiken.
Google presenteert de Sitemap vooral als service voor webmasters, maar het lijkt erop dat het vooral Google zelf is die er baat bij heeft. Google hoeft immers nog maar één bestand per website op te halen om te kijken wat de nieuwe pagina’s zijn. En niet onbelangrijk: aan de hand van dit XML-bestand ziet Google meteen of er ook pagina’s verdwenen zijn. Anders zou Google bij elk bezoek de hele site opnieuw moeten doorspitten. Bij grote websites kan dit Google dus heel wat werk besparen.
Verschillende webloggers, zoals Google Blogoscoped, vragen zich af waarom Google niet gewoon RSS-feeds gebruikt om nieuwe pagina’s op het spoor te komen. Een sitemap en een feed zijn echter twee verschillende dingen: een feed geeft alleen de nieuwste pagina’s, een sitemap álle pagina’s van een site. Met een sitemap zie je dus ook welke pagina’s verdwenen zijn, bij een feed niet. Een sitemap gelijkstellen aan een feed is in bibliotheektermen net zoiets als een catalogus gelijkstellen aan een aanwinstenlijst.
Tot zover het technische perspectief. Vanuit de gebruiker zijn de gevolgen misschien nog zelfs veel interessanter. De Google Sitemap heeft namelijk veel weg van een eerste poging van Google om het diepe web te doorgronden, het deel van internet dat achter archiefdeuren en in lokale databanken zit verscholen. Webmasters die hun dynamische internetcontent toegankelijk willen maken voor de buitenwereld, hoeven slechts één inhoudsopgave in XML te maken en Google doet de rest.
Overigens ligt bij de Google Sitemap ook het gevaar van cloaking op de loer. Met zo’n sitemap is het gemakkelijker dan ooit om Google een nepsite voor te schotelen die alleen maar uit handige trefwoorden bestaat.
Update 17/6
Een handige site om XML-sitemaps te genereren: www.sitemapspal.com.
Britney naakt: koppen schrijven voor zoekmachines
Posted by laterna on maart 12, 2007 · Leave a Comment
In de VS gebeurt het al jaren, maar ook in Nederland leren redacties zoekmachinevriendelijke koppen te schrijven. Het vakblad InformatieProfessional noemt Nu.nl als voorbeeld:
Uit eigen ervaring kan ik beamen dat zoekmachinevriendelijke koppen inderdaad heel goed werken. Maar wat ik me hierbij afvraag: wat voor soort bezoekers levert dat op? Zijn dat bezoekers die via Google zo’n treffer aanklikken, snel even kijken wat voor pagina dit is en dan even snel weer wegklikken? Of zijn dat bezoekers die na het lezen van deze column over Britney doorklikken naar andere artikelen op Nu.nl? Met andere woorden: in hoeverre dragen zoekmachines bij aan een vaste bezoekerskring en de branding van je merk? Dit is helemaal niet zo moeilijk uit te zoeken: gratis diensten als Google Analytics leggen ook de relatie tussen herkomst en klikdiepte van bezoekers.
En zouden Google-vriendelijke koppen zich ook tegen je kunnen keren? Stel dat een bezoeker constateert: dat Nu.nl kom ik elke keer in de zoekresultaten tegen, maar ik vind er nooit wat ik werkelijk zoek. In dat geval bouwt Nu.nl een slecht imago op: je hebt er nooit wat aan, dus niet meer aanklikken als je deze site bij een volgende Google-zoekactie tegenkomt. Ik heb dat zelf bij een site als Kelkoo. Kom ik steeds weer tegen als ik naar bepaalde producten zoek, maar omdat ik er nooit vind wat ik zoek, sla ik die site steevast over bij het doornemen van zoekresultaten. Scheelt weer een treffer die ik niet hoef te bekijken.
Nog een kanttekening: hoog scoren in Google is mooi, maar betekent dat automatisch ook dat meer bezoekers doorklikken naar jouw site? In hoeverre speelt de omschrijving bij een link (in Google de zwarte tekst eronder) daarbij een rol? Kun je bij een bepaalde Google-zoekactie op de derde plaats staan en dankzij een goede omschrijving in je webpagina’s (META NAME=”description” CONTENT=”vul zelf maar in”) toch vaker aangeklikt worden dan de nummer 1?
Filed under Commentaar · Tagged with Google, journalistiek, media, SEO, zoeken