Logfile analyse versus page tagging

In het kort zijn er twee soorten webstatistieken software. In een eerder artikel noemde ik de twee soorten al:

  1. Aan de ene kant heb je dus de web server logfile analyse. Dit is, zoals de naam al zegt, een methode waarbij de statistieken gehaald worden uit de logfiles van een server. Bekend voorbeeld hiervan zijn Webalizer en AWStats.
  2. Aan de andere kant heb je methodes die page tagging gebruiken. In dit geval worden de statistieken verkregen via het plaatsen van een klein stukje Javascript of een klein plaatje op elke pagina. Het bekendste voorbeeld hiervan is Google Analytics, hoewel Ulco een grotere fan is van het commerciële Stuffed Tracker.

Opmerking:
In dit artikel worden termen gebruikt die worden uitgelegd in dit artikel.

Logfile analyse

Alle transacties van een server worden opgeslagen in een logfile. Op bijvoorbeeld een Apache webserver zijn twee soorten log files. access.log bevat informatie over de toegang die verleend is, terwijl error.log allerlei foutmeldingen bij houdt. Een logfile regel van Netters ziet er bijvoorbeeld als volgt uit (waarbij ik de regel over meerdere regels verdeeld heb vanwege de leesbaarheid):

87.67.XX.XX
[27/Aug/2007:16:44:41 +0200]
"GET /blog/feed HTTP/1.1" 200 15214
"-" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; InfoPath.2; MSOffice 12)"

Aan deze regel kunnen ze dit zien:

  1. De bezoeker heeft als IP-adres 87.67.XX.XX (onherkenbaar gemaakt door mij)
  2. De request was op 27 augustus 2007 om 16:44 uur
  3. Het betrof een normale request van /blog/feed
  4. De response code was 200, wat betekent dat de boel keurig is afgeleverd
  5. Er zijn 15.214 bytes verstuurd als response op de request
  6. De request is gedaan d.m.v. Internet Explorer 7.0 op een Windows NT 5.1 platform

Aan de hand van deze log files is ook te zien hoeveel pagina’s een IP-adres heeft opgevraagd. Het probleem is echter dat het tegenwoordig d.m.v. proxies en dynamische IP’s niet meer mogelijk is om unieke IP-adressen te zien als unieke bezoekers. Ook dient een log file analyser een lijst van IP-adressen van zoekmachine bots te hebben, zodat deze uit de totalen kunnen worden gefilterd.

Page Tagging

Page tagging werkt doordat een plaatje of (meestal) een stukje Javascript op elke pagina van de site geplaatst wordt. Deze Javascript code (of plaatje) verwijst naar een script waarop de statistieken worden bepaald. In geval van Google Analytics wordt het script op een externe server gehost. Doordat er Javascript gebruikt wordt, kan er ook informatie over bijvoorbeeld de resolutie van de gebruiker opgeslagen worden. Ook wordt er vaak een cookie gebruikt zodat een visit gevolgd kan worden.

Logfile analyse vs. page tagging

De vraag is uiteraard welke vorm van statistiekensoftware beter is. In het algemeen kunnen we zeggen dat page tagging nieuwer is en dus beter inspeelt op technologieën als AJAX en caching.

Welke methode moet ik gebruiken?

In de volgende gevallen moet je logfile analyse gebruiken:

  • Als je wilt weten hoeveel responsecodes van elke soort je hebt.
  • Als een groot deel van je bezoekers Javascript heeft uitstaan is page tagging niet betrouwbaar.
  • Als je wilt weten hoe bots van zoekmachines je site bekijken en doorzoeken.

Dit zijn zaken die page tagging niet of niet goed kan oplossen. In de meeste andere gevallen biedt page tagging vaak meer informatie dan logfile analyse en is page tagging dus te preferen. Uiteraard is het combineren van beide methoden het beste, maar ook het meeste werk om in de gaten te houden.