In het kort zijn er twee soorten webstatistieken software. In een eerder artikel noemde ik de twee soorten al:
Opmerking:
In dit artikel worden termen gebruikt die worden uitgelegd in dit artikel.
Alle transacties van een server worden opgeslagen in een logfile. Op bijvoorbeeld een Apache webserver zijn twee soorten log files. access.log bevat informatie over de toegang die verleend is, terwijl error.log allerlei foutmeldingen bij houdt. Een logfile regel van Netters ziet er bijvoorbeeld als volgt uit (waarbij ik de regel over meerdere regels verdeeld heb vanwege de leesbaarheid):
87.67.XX.XX
[27/Aug/2007:16:44:41 +0200]
"GET /blog/feed HTTP/1.1" 200 15214
"-" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; InfoPath.2; MSOffice 12)"
Aan deze regel kunnen ze dit zien:
/blog/feedAan de hand van deze log files is ook te zien hoeveel pagina’s een IP-adres heeft opgevraagd. Het probleem is echter dat het tegenwoordig d.m.v. proxies en dynamische IP’s niet meer mogelijk is om unieke IP-adressen te zien als unieke bezoekers. Ook dient een log file analyser een lijst van IP-adressen van zoekmachine bots te hebben, zodat deze uit de totalen kunnen worden gefilterd.
Page tagging werkt doordat een plaatje of (meestal) een stukje Javascript op elke pagina van de site geplaatst wordt. Deze Javascript code (of plaatje) verwijst naar een script waarop de statistieken worden bepaald. In geval van Google Analytics wordt het script op een externe server gehost. Doordat er Javascript gebruikt wordt, kan er ook informatie over bijvoorbeeld de resolutie van de gebruiker opgeslagen worden. Ook wordt er vaak een cookie gebruikt zodat een visit gevolgd kan worden.
De vraag is uiteraard welke vorm van statistiekensoftware beter is. In het algemeen kunnen we zeggen dat page tagging nieuwer is en dus beter inspeelt op technologieën als AJAX en caching.
In de volgende gevallen moet je logfile analyse gebruiken:
Dit zijn zaken die page tagging niet of niet goed kan oplossen. In de meeste andere gevallen biedt page tagging vaak meer informatie dan logfile analyse en is page tagging dus te preferen. Uiteraard is het combineren van beide methoden het beste, maar ook het meeste werk om in de gaten te houden.