De wiskunde van de PageRank

Door Erik-Jan op 31 oktober 2007

Trefwoorden: .

Vanmorgen sprak ik met Roy over een site met een PageRank van 6. Twee andere sites met een PageRank van 5 zouden naar deze site geredirect worden met een 301. Wat zou dat met de PageRank doen? Nu kunnen we die vraag pas beantwoorden als we twee zaken heel helder hebben:

  1. De PageRank zoals wij die zien is slechts een zichtbare weergave van de werkelijke PageRank. De PageRank die wij zien is een schaal van 0 tot en met 10, maar de werkelijke PageRank zou in theorie elk getal kunnen zijn, zelfs negatief.
  2. De PageRank loopt volgens een logaritmische schaalmet als basis ongeveer 5. Die 5 is geschat, maar wordt door de meeste mensen die er verstand van hebben ondersteund.

Stel dat een werkelijke PageRank-score van 0 tot 5 een zichtbare PageRank van 0 oplevert. Als de schaal van de logaritmische verdeling dan 5 is, zou een werkelijke PageRank waarde van 6 tot en met 25 een zichtbare PageRank van 1 opleveren. Om het rijtje af te maken even een paar getallen op een rijtje:

  1. Werkelijke PageRank van 0 tot 5 => Zichtbare PageRank van 0
  2. Werkelijke PageRank van 6 tot 25 => Zichtbare PageRank van 1
  3. Werkelijke PageRank van 26 tot 125 => Zichtbare PageRank van 2
  4. Werkelijke PageRank van 126 tot 625 => Zichtbare PageRank van 3
  5. Werkelijke PageRank van 626 tot 3.125 => Zichtbare PageRank van 4
  6. Werkelijke PageRank van 3.126 tot 15.625 => Zichtbare PageRank van 5
  7. Werkelijke PageRank van 15.626 tot 78.125 => Zichtbare PageRank van 6
  8. Werkelijke PageRank van 78.126 tot 390.625 => Zichtbare PageRank van 7
  9. Werkelijke PageRank van 390.626 tot 1.953.125 => Zichtbare PageRank van 8
  10. Werkelijke PageRank van 1.953.126 tot 9.765.625 => Zichtbare PageRank van 9
  11. Werkelijke PageRank groter dan 9.765.625 => Zichtbare PageRank van 10

Als we dus van twee PR5 sites alle links 301′en naar een PR6 site, is het dus maar zeer de vraag of we een PR7 halen (zelfs al zijn alle links uniek). Immers, de PR6 site heeft in verwachting een werkelijke PageRank van (15.626 + 78.125)/2 = 46.875,5 en met de waarde van 2 PR5 sites erbij redt je het niet om dan voorbij de 78.125 te komen.

Ook zien we dat het niet zo moeilijk is een PageRank 3 te halen. Om echter een PageRank 5 te halen moet je al een mooie verzameling backlinks hebben. Netters heeft er ongeveer 4.500 waarvan meerdere PR6 en 1 PR7 backlink.


Je kunt een reactie, achterlaten of een trackback van uw eigen site.

12 Reacties op “De wiskunde van de PageRank”

  1. Eduard Blacquière

    Het blijft altijd gissen naar de werkelijke PageRank, maar dit vereenvoudigde rekenvoorbeeld maakt inderdaad goed de werking van de logaritmische schaal inzichtelijk.

    Reageer
  2. MacSeth

    Werkelijke PageRank van 26 tot 125 => Zichtbare PageRank van 2
    Werkelijke PageRank van 126 tot 600 => Zichtbare PageRank van 3

    Volgens mij zit hier een fout in Erik-Jan: De 600 zou volgens mij 625 moeten zijn.

    Voor de rest kan ik je redenatie niet helemaal volgen wat betreft de moeilijkheid om een PR van 5 te halen. Dit is niet heel lastig… je hebt slechts 1 of 2 links nodig van een site met een PR van 6 (met zelf weinig andere backlinks) om al tot een PR van 5 te komen.

    Reageer
  3. Erik-Jan

    Werkelijke PageRank van 26 tot 125 => Zichtbare PageRank van 2
    Werkelijke PageRank van 126 tot 600 => Zichtbare PageRank van 3

    Volgens mij zit hier een fout in Erik-Jan: De 600 zou volgens mij 625 moeten zijn.

    Klopt, rekenfout, ik pas het zo even aan.

    Voor de rest kan ik je redenatie niet helemaal volgen wat betreft de moeilijkheid om een PR van 5 te halen. Dit is niet heel lastig… je hebt slechts 1 of 2 links nodig van een site met een PR van 6 (met zelf weinig andere backlinks) om al tot een PR van 5 te komen.

    En hoe vaak denk je dat een commerciële site zo’n link krijgt? Juist – Nooit :)

    Reageer
  4. MacSeth

    Partnerships Erik-Jan… partnerships :)

    Reageer
  5. Erik-Jan

    Nope, dat werkt zo niet. Stel je krijgt een link van de homepage van Netters. Op die pagina staan ongeveer 100 links dus de PageRank waarde die jouw ene backlink mee krijgt is slechts één honderdste van de waarde die de pagina kan doorgeven. Dan kun je weliswaar de enige externe link zijn, maar dat zegt dus niks, omdat er enorm veel interne links zijn.

    Ik heb nog iet vaak een pagina gezien waar slechts een handjevol links op staan (zeg eens minder dan 5).

    Reageer
  6. MacSeth

    Strikt genomen heb je gelijk ware het niet dat het PR-algoritme in de loop der tijd verder is doorontwikkeld.

    Ik denk dat ze ook kijken naar relevantie van de anchortekst en hoeveel dat te maken heeft met de “target” van de link.

    Volgens mij worden links die bijvoorbeeld een artikel staan zwaarder meegewogen dan links die in menu’s staan of in de template gebakken zijn.

    Ik kan het mis hebben dus schiet maar raak :P

    Reageer
  7. Erik-Jan

    @Seth: Het PageRank algoritme zelf is nooit echt veranderd (voor zo ver ik weet). De PR is nog steeds een indicatie van je linkpopulairiteit. Of deze links gerelateerd zijn of niet, maakt voor de PR geen klap uit. Daarom is de PR ook niet zoveel waard.

    De factoren die jij noemt (positie links en relevantie van de anchor tekst) spelen 100% zeker weten mee in de positie van je rankings, maar niet voor de PageRank.

    Reageer
  8. DennisWijnberg

    Toch heb ik met een commerciele site een PR van 5. Daarbij komen binnenkort nog een PR6 en een PR7 link, ik ben benieuwd wat dat voor m’n PR kan doen.

    Het is niet onmogelijk dus om die op een commerciele site een PR5 of misschien zelfs PR6 te halen maar lastig is het wel.

    Reageer
  9. Erik-Jan

    Nee, natuurlijk is het niet onmogelijk. KLM.nl heeft 6 en Elsevier.nl zelfs 8. Ik weet zeker dat de meeste sites van de leden hier ook een hoge PR hebben, ook al is de site commercieel.

    Reageer
  10. Landeweerd

    Denk dat dit artikel goed de werking van de logaritmische schaal weergeeft. Het is alleen wat minder onduidelijk hoe tot de scores gekomen wordt, maar dit is ook niet uit te leggen in 1 pagina.

    Reageer
  11. MacSeth

    Je telt 2 antwoorden bij elkaar op en deelt ze erna door 2… dit klopt volgens mij niet…

    Volgens het PR-algoritme zou een 301 de PR 1 op 1 moeten doorsturen ( er zijn namelijk geen uitgaande links) waardoor je dus een ordinaire optelsom krijgt (met daarbij wellicht nog een damping-factor of iets dergelijks.)

    Bij een visuele PR van 5 waarbij de “werkelijke” PR van allebei de sites op zijn max zijn (15.625) is het dus best mogelijk om een (visuele) PR van 6 te krijgen.

    Reageer

Reageer!