Over het aantal geïndexeerde pagina’s

Een terrein waar ik niet veel over lees, is het aantal geïndexeerde pagina’s van een site. Toch is dit in mijn ogen op SEO-gebied een belangrijke factor in je SEO-campagne. Ik wil drie redenen noemen waarom het aantal geïndexeerde pagina’s relevant is voor je zoekmachine-positionering.

  • Allereerst staan op elke pagina die extra geïndexeerd wordt waarschijnlijk unieke keywords die leuk kunnen zijn voor je long tail. Zeker als je site qua content redelijk divers is, is dit een belangrijk punt.
  • Ulco meldde in een eerder artikel al dat je d.m.v. veel content, bepaalde keywords flink kan laten scoren. Ik merk dit zelf op www.sudokutips.nl. De URL’s van de puzzels zijn /sudoku-spelen/puzzel-$id en hoe meer puzzels er geïndexeerd raken, hoe hoger ik sta op ‘sudoku spelen’.
  • Ten derde biedt een grotere site je meer mogelijkheden om van verschillende pagina’s te linken naar je hoofdpagina’s. Gezien het PageRank-algoritme betekent dit dat je hoofdpagina’s beter scoren. Dit is waarschijnlijk ook de reden dat blogs op Netters vaak beter scoren dan artikelen. Op elke pagina staat een lijstje met de laatste blog-items terwijl artikelen vaak in één blog worden aangekondigd en verder maar op een enkele pagina een link bevatten.

Hoe moet ik pagina’s laten indexeren?

Hieronder noem ik een groot aantal mogelijke manieren om je aantal geïndexeerde pagina’s te vergroten. Ik zeg er meteen bij dat ik met lang niet alle methoden testervaring heb, maar ik beargumenteer wel mijn vermoedens. Het staat je dus zeker vrij om dingen aan te vechten of juist verder uit te diepen.

Opmerking:
Ik ga er van uit dat je bezig bent met een normale site en niet één of andere site die enkel door scrapers en RSS-feeds gevuld wordt. In dat geval gaan veel van onderstaande voorstellen ook op, maar wellicht wil je dan nog wat agressievere tactieken uitvoeren. Dat is ook zeker leuk, maar voor vandaag gaan we simpelweg uit van de bestaande content en maken we geen gebruik van de str_replace() functie ;-)

Backlinks/deeplinks

Hoe meer backlinks je krijgt, hoe dieper Google je site indexeert. Met ‘dieper’ bedoel ik dat Google verder op zoek zal gaan naar dieperliggende pagina’s, de zgn. deeplinks. Daarnaast is het zeer de moeite waard om backlinks te krijgen naar dieperliggende pagina’s in je site zodat Google daar kan beginnen met crawlen en indexeren. Ik had betreffende het punt van het aantal backlinks ook kunnen zeggen dat je een zo hoog mogelijke PageRank nodig hebt, omdat de PageRank in feite een gewogen gemiddelde van je aantal en de kwaliteit van de backlinks is.

Unieke content

Google bekijkt per pagina of deze interessant is. Hierbij wordt niet alleen naar de tekst gekeken, maar ook naar de URL en de titel. Een aantal mogelijke redenen waarom Google wellicht een pagina niet zal indexeren zijn bijvoorbeeld:

  • “Dit is al de twintigste pagina met ‘Bedrijfsnaam B.V.’ als paginatitel”.
  • “Hé, de content van deze pagina kwam ik ‘hier’ ook al tegen.”
  • “Huh? Dit is al de veertigste URL die begint met ‘index.php?id=3&sessionID=’.”

Je dient dus de pagina’s interessant te maken voor Google. Dit doe je niet alleen door er een aantal backlinks heen te sturen, maar ook door de content, de URL en de titel van de pagina uniek te laten zijn.

Goede sitestructuur

Wat we bij Netters doen, is in veel blogpostings linken naar andere blogs en artikelen en soms naar user-profielen. Op die manier gaat de spider flink random door je site heen en dat betekent dat de spider steeds andere pagina’s tegen komt bij het spideren. In de praktijk blijven er veel van die gevonden pagina’s in de index hangen.

Je sitestructuur zal in de regel een piramidevorm moeten hebben. De bezoeker komt binnen op de homepage en komt dan terecht op de hoofdsecties van je site (bijvoorbeeld artikelen, blog, forum). Vanuit de hoofdsecties komt je bezoeker terecht op de categorieën (bijvoorbeeld HTML, PHP, SEO). Vanaf dat niveau komt de bezoeker uiteindelijk terecht op de items (zoals individuele forumberichten).

Een zeer goed voorbeeld van een slechte sitestructuur is www.itjobboard.nl. Deze site plaatst vele vacatures per week, maar ze zijn slechts via een zoekmachine bereikbaar. Probeer maar eens – zonder het formulier te submitten – bij de vacatures uit te komen en je zult snappen dat Google even veel moeite heeft als jij om deze relevante content te vinden.

Sitemap

Een sitemap (ik doel hierbij niet op een XML Sitemap) kan de indexatie van je website versnellen, omdat je daar links kan plaatsen naar alle relevante (hoofd)items van je site. Als een sitemap op elke pagina gelinkt wordt door de link bijvoorbeeld vast in de footer te zetten, is elke hoofdsectie van je site binnen twee kliks vanaf elke pagina te bereiken.

Subdomeinen

Zoekmachines schijnen in de praktijk een voorliefde voor subdomeinen te hebben. Elk subdomein wordt namelijk gezien als een aparte site. In de praktijk is het makkelijk om op 10 subdomeinen 1.000 pagina’s per subdomein geïndexeerd te krijgen, dan 10.000 pagina’s op 1 domein. Voorwaarde is dan wel dat je redelijk wat heen en weer linkt, want de subdomeinen hebben dan wel eigen backlinks nodig.

Google producten (Search, Sitemap)

Wat een typisch fabeltje zou kunnen zijn, is dat het gebruik van Google diensten op je eigen site (zoals Google Search of Google Sitemaps) de indexatie van je site bevordert. Uiteraard is de Google Sitemap bedoelt om de spider aan te wijzen waar de pagina’s zich bevinden, maar ik vermoed dat een goede sitestructuur het gebruik van Sitemaps in principe overbodig maakt. Sterker nog, David Naylor geeft goede argumenten om maar helemaal geen Google Sitemap te gebruiken.

Dat het gebruik van Google Search het aantal geïndexeerde pagina’s zal vergroten is iets wat ik niet geloof. De enige reden dat het punt hier staat is om het keihard te ontkrachten ;-)

Opmerking:
Dit artikel is in eerder stadium gelezen en van commentaar voorzien door Joost, waarvoor hartelijke dank!