Een online nieuwsarchief beter vindbaar maken in Google

Je hebt honderden oude nieuwsberichten op je site. Keurig chronologisch gesorteerd en opgehakt in groepjes van tien. Toch worden de oude berichten slecht gevonden. Hoe komt dat? Een vaak voorkomend SEO-probleem. De waarschijnlijke oorzaak: het pagineren van nieuwsoverzichten is slecht voor Google. Gelukkig zijn er goede alternatieven.

lees verder»

Google Custom Search

De afgelopen weken heb ik tijdens verloren uurtjes wat gespeeld met Google Custom Search. Daarvoor was een concrete aanleiding: de website van een van mijn opdrachtgevers had al jarenlang geen goed zoeksysteem. Ooit gebruikte ik de gratis dienst Atomz.com, maar de gratis versie indexeerde niet meer dan maximaal 500 pagina’s. Bovendien waren de mogelijkheden tot het aanpassen van de layout beperkt.

Dan maar een zoekscript downloaden en op je eigen server installeren? Ik had er verschillende uitgeprobeerd, maar het indexeren van tienduizenden pagina’s vormt een flinke belasting van je processor en het opslaan van die index kost bovendien veel diskruimte. Ook de interfaces vond ik niet handig in elkaar zitten.

Dus besluit ik toch maar eens Google Custom Search te proberen. Dat scheelt diskruimte en ach, Google bezoekt mijn site toch al, dus vormt deze dienst in feite geen extra belasting. Om kort te gaan: de lokale zoeker van Google draait inmiddels tot volle tevredenheid. Niet alleen fijn voor de bezoekers, maar vooral voor mezelf als beheerder – ik kom pagina’s en berichten tegen die ik al lang vergeten was en ook ben ik veel beter in staat bezoekers gericht door te verwijzen naar bepaalde hoekjes van de site. Mooi is ook dat je de Google-zoekmogelijkheid tot op zekere hoogte in je eigen layout kunt gieten, alleen lettertype en -grootte zijn niet te beïnvloeden. En Google houdt niet op bij 500 pagina’s, de grens van Atomz.

Google Custom Search draait ook zelfstandig, dus niet gekoppeld aan een eigen site. Je kunt een verzameling websites opgeven die Google voor je doorzoekt. En als je geen waslijst van honderden websites wilt opgeven, heeft Google een heel simpel alternatief: als je een webpagina kunt vinden waar al je favoriete websites worden gelinkt, dan kun je tegen Google zeggen dat je alle websites op die ene pagina wilt doorzoeken en Google zoekt het allemaal uit.

Een voorbeeldje is dit zoeksysteem voor Nederlands nieuws. Deze zoeker was in één minuut gemaakt, namelijk door simpelweg kranten.startpagina.nl en kranten.startkabel.nl als linklijsten op te geven. Deze twee pagina’s bevatten zo’n beetje alle Nederlandse nieuwssites. Het resultaat: een zoeksysteem voor oude nieuwsberichten. In feite een soort Google News, maar dan eentje die niet alleen de laatste 30 dagen doorzoekt. Zoek bijvoorbeeld op wilders koran en je ziet wat deze politicus de afgelopen jaren allemaal over de Koran heeft geroepen – voor zover de media dat hebben opgetekend.

Nog een voorbeeld is een zoeksysteem voor natuur en milieu, eveneens gevoed met een aantal startpagina’s. Is dat handig? Ja, dat is handig, want als je met de ‘gewone’ Google op bos zoekt, krijg je veel ruis: de Boeddhistische Omroep Stichting (BOS), Wouter Bos, een internetbedrijf, een incassobureau en Stef Bos. Maar de gespecialiseerde natuurzoeker toont veel betere resultaten, alleen Wouter Bos en het Bos en Lommerplein horen er niet thuis. Een aardig alternatief dus als je kinderen een spreekbeurt aan het voorbereiden zijn en je hen wat doelgerichter wilt laten zoeken, zonder het ze gelijk weer ál te gemakkelijk te maken.

Britney naakt: koppen schrijven voor zoekmachines

In de VS gebeurt het al jaren, maar ook in Nederland leren redacties zoekmachinevriendelijke koppen te schrijven. Het vakblad InformatieProfessional noemt Nu.nl als voorbeeld:

Uit een onlangs gehouden experiment op Nu.nl blijkt dat trefwoorden in koppen goed werken. Nu.nl-columnist Nico Dijkshoorn heeft als test een column geschreven over Britney Spears en Steve Irwin met als kop ‘Britney naakt en Steve Irwin dood’. Dit artikel staat vol met relevante woorden over de twee beroemdheden. Als je nu op Google zoekt op ‘Britney naakt’, staat het artikel op de derde plaats. Verhagen: ‘Het wekt geen verbazing dat de column erg goed gelezen is.’

Uit eigen ervaring kan ik beamen dat zoekmachinevriendelijke koppen inderdaad heel goed werken. Maar wat ik me hierbij afvraag: wat voor soort bezoekers levert dat op? Zijn dat bezoekers die via Google zo’n treffer aanklikken, snel even kijken wat voor pagina dit is en dan even snel weer wegklikken? Of zijn dat bezoekers die na het lezen van deze column over Britney doorklikken naar andere artikelen op Nu.nl? Met andere woorden: in hoeverre dragen zoekmachines bij aan een vaste bezoekerskring en de branding van je merk? Dit is helemaal niet zo moeilijk uit te zoeken: gratis diensten als Google Analytics leggen ook de relatie tussen herkomst en klikdiepte van bezoekers.

En zouden Google-vriendelijke koppen zich ook tegen je kunnen keren? Stel dat een bezoeker constateert: dat Nu.nl kom ik elke keer in de zoekresultaten tegen, maar ik vind er nooit wat ik werkelijk zoek. In dat geval bouwt Nu.nl een slecht imago op: je hebt er nooit wat aan, dus niet meer aanklikken als je deze site bij een volgende Google-zoekactie tegenkomt. Ik heb dat zelf bij een site als Kelkoo. Kom ik steeds weer tegen als ik naar bepaalde producten zoek, maar omdat ik er nooit vind wat ik zoek, sla ik die site steevast over bij het doornemen van zoekresultaten. Scheelt weer een treffer die ik niet hoef te bekijken.

Nog een kanttekening: hoog scoren in Google is mooi, maar betekent dat automatisch ook dat meer bezoekers doorklikken naar jouw site? In hoeverre speelt de omschrijving bij een link (in Google de zwarte tekst eronder) daarbij een rol? Kun je bij een bepaalde Google-zoekactie op de derde plaats staan en dankzij een goede omschrijving in je webpagina’s (META NAME=”description” CONTENT=”vul zelf maar in”) toch vaker aangeklikt worden dan de nummer 1?

Google: voor al uw medische diagnoses

Ook artsen googelen wel eens, zo blijkt uit een onderzoekje van een Nieuw-Zeelandse studente:

Canterbury District Health Board (CDHB) staff were most likely to consult experts and colleagues, followed by textbooks, internet search engines and library resources. Google was the most popular electronic resource.

Griffin said this did not mean it was the most highly rated.

“Staff most commonly judged information to be authoritative if it was published in a reliable journal, suggesting that while staff frequently use Google, they are cautious about the reliability of information found this way,” she said.

Ook aardig is de volgende toevoeging:

Nursing and allied health staff were more likely than doctors to choose Google as the most valuable resource.

Met andere woorden: hoe lager je medische status, hoe groter de kans dat je Google gebruikt.

Maar dan de vraag: is dit nu wel of niet nieuws? Dat hangt ervan af. Gaat het hier om zoeken in wetenschappelijke publicaties via Google Scholar? Dat is niet bijzonder, want steeds meer wetenschappelijke literatuur wordt via webinterfaces ontsloten. Het grootste en bekendste voorbeeld is LexisNexis, dat overigens nog veel meer onderwerpen dekt dan wetenschap.

Of doorzoeken ze het algemene web met de standaard Google-interface? Dat zou pas echt nieuws zijn, want dat zou erop kunnen duiden dat de medische wereld zich langzaam vervreemdt van al zijn hoogwaardige wetenschappelijke bronnen. Dat zal de kwaliteit van de gezondheidszorg niet ten goede komen.

Web 2.0-zoeksystemen

“At the very least, stop using just Google!”

Aldus Simon Lande, directeur van Magus Research in Londen, gisteren tijdens zijn verhandeling over web 2.0-zoekmachines op de IP-lezing in Amsterdam.
Welke web 2.0-zoeksystemen zijn de moeite van het proberen waard? Zonder nadere toelichting volgen hier de volgens Lande belangrijkste kanshebbers:

Zoekmachinetest

Dat Google niet zaligmakend is, bewijst de nieuwe site ZoekmachineTest.nl. Geef een zoekopdracht en de site toont vier kolommen, ieder met de resultaten van één zoekmachine: Google, Ilse, MSN en Yahoo. Kies de kolom met de beste zoekresultaten en pas daarna wordt verklapt welke kolom bij welke zoekmachine hoort.
gPoque probeerde 25 uiteenlopende zoekacties, van ‘fietsen’ via ‘zoekmachines’ tot aan ‘aardbeving java’. Onze ranglijst:

  1. Yahoo (7x)
  2. Ilse (6x)
  3. Google en MSN (5x)

En in twee gevallen konden we geen duidelijk beste aanwijzen.
Opvallend was dat bij actuele kwesties, bijvoorbeeld de aardbeving op Java, Google duidelijk de beste bronnen geeft. Maar bij alle overige onderwerpen scoorden Yahoo en Ilse ietsje beter in deze minitest, terwijl ook MSN niet moet worden onderschat.
Al met al lijkt Google niet meer met afstand de beste – maar dat wisten de echte zoekmachinekenners al lang.

Wildcards in Google

In Google zoeken met wildcards? Jarenlang dacht ik dat dat niet mogelijk was, maar ik heb me vergist. Vakreferent Wouter Gerritsma deed de volgende ontdekking: zoek op “nederland wordt * wereldkampioen” en je komt bij de treffers tegen:

Nederland wordt geen wereldkampioen

Nederland wordt in Roemenië wereldkampioen

Nederland wordt normaal gesproken geen wereldkampioen

Argentinië wint met drie één van Nederland en wordt daarmee wereldkampioen

En dat is ontzettend handig, want zo kun je veel beter naar personen zoeken. Weet je niet zeker of het Pieter van Hoeven, Pieter van de Hoeven, Pieter van der Hoeven of Pieter Johannes Jacobus van der Hoeven is? Zoek op “pieter * hoeven” en het komt allemaal goed.
De vraag is of je met wildcards ook kunt trunceren. Dat blijkt niet te werken. De zoekactie wereldkampioen* levert maar twee treffers op, veel en veel te weinig.

Google, de magische antwoordmachine

Basisschoolleerlingen maken gretig gebruik van zoekmachines op internet, maar hun zoekgedrag laat te wensen over. Dat concluderen Ulrike Koot en Mirjam Hoveijn, studenten onderwijskunde aan de Universiteit van Utrecht, in hun scriptie Kritisch omgaan met informatie op internet.
Uit hun onderzoek blijkt dat leerlingen hun vragen in Google tikken alsof het een magische antwoordmachine is. Gevonden antwoorden worden vaak klakkeloos overgenomen, tenminste als de site er gelikt uitziet en de teksten niet te lang of te moeilijk zijn.

De zoekmachine Google is bij deze leerlingen veruit favoriet, omdat de zoekresultaten van Google meestal veel informatie geven. De leerlingen maken geen gebruik van andere zoekmachines. De zoekmachine van Kennisnet wordt bijvoorbeeld niet gebruikt. Sommige leerlingen lijken te verwachten dat er bij gebruik van Google een letterlijk antwoord komt op de vraag die zij intypen, alsof Google na een druk op de knop het antwoord tevoorschijn tovert. Google lijkt voor de leerlingen een soort antwoordmachine. Vandaar dat zij als zoekterm vaak een correct geformuleerde ‘vraagzin’ invoeren. Als de zin niet helemaal lekker loopt dan veranderden ze deze in een taalkundig juiste zin. Lidwoorden en leestekens laten ze daarbij staan.

De onderzochte leerlingen zoeken eigenlijk zonder bewuste strategie. Het is een aaneenschakeling van gissen en missen – trial and error. Er zit weinig systematiek in hun handelingen. Wellicht beschikken deze leerlingen niet over het scala aan vaardigheden dat nodig is om efficiënt met zoekmachines om te gaan.

En wat doen ze met de gevonden informatie?

Wat is voor leerlingen een reden om informatie te vertouwen? Informatie die overeenkomt met eigen kennis wordt meteen aangenomen en niet verder gecontroleerd. Ook de bron van de informatie is voor een aantal leerlingen een belangrijke reden om de informatie te vertrouwen. Toch controleren leerlingen de bronvermelding niet. Als er meerdere sites zijn met dezelfde informatie is dat een reden om gevonden informatie te geloven.

» lees verder: Kennislink

Op zoek naar een vergeten schilder

Kun je het met Google niet vinden? Probeer dan eens Google Answers.

Seth Godin schrijft op zijn weblog hoe hij dankzij Google Answers een amateurschilder terugvond waarvan hij vijftien jaar geleden een schilderij had gekocht. Het kunstwerk was kapot gevallen, waarna hij op zoek ging naar de maker om een nieuw werk te maken.

Via Google kwam Godin niet verder, maar uiteindelijk leverde Google Answers wel resultaat. De schilder bleek in Israël te wonen, ondertussen een andere naam te hebben en niet meer te schilderen. Toch was die bereid opnieuw aan de slag te gaan. Tot grote vreugde van Godin: hij vindt de nieuwe versie nóg mooier dan het origineel.

» Google Answers

Nieuwe site voor egosurfers

Tikt u wel eens uw eigen naam in als u met Google zoekt? En komt u allemaal persoonlijke gegevens over uzelf tegen?

Het nieuwe bedrijf Zoom Information heeft de persoonsgegevens van zo’n 25 miljoen internetgebruikers verzameld en vastgelegd in profielen, zo bericht Wired. Alle gebruikers hebben toegang tot deze profielen en ze kunnen hun gegevens zelfs gratis aanpassen.

Let wel: hiermee verandert u niet de bronnen waaruit de gegevens afkomstig zijn. Zoom Information gokt erop dat zijn miljoenen profielen heel hoog zullen scoren in Google – in ieder geval dan de oorspronkelijke bronnen – zodat andere internetters uw correcte Zoom Information-profiel eerder zullen tegenkomen dan andere foutieve of verouderde bronnen.

www.zoominfo.com

© Copyright Wessel Zweers - Designed by Pexeto - Photography: Alexandre Duret-Lutz