A hagyományos keresőoptimalizálás kulcsfogalma a PageRank volt. Elméletben a PageRank egy szám, ami megmutatja, hogy egy adott weblap mennyire fontos az interneten. A Google az internetet egyedülállóan demokratikus közösségnek fogta fel. Méghozzá úgy, hogy minden link egy szavazatot jelentett. Azonban nem minden szavazat volt egyenértékű. A fontosabb oldalak szavazatai többet értek, mint a kevésbé fontos oldalaké. Nagyon leegyszerűsítve: Egy oldal akkor volt fontos, ha sok fontos oldal mutatott rá. Mi azért beszélünk múlt időben róla, mert egyre kevesebbet és kevesebbet számított egy oldal helyezésének eldöntésében, adott keresőkulcsszóra. 2009-re Google algoritmusában a PageRank szerepe elhanyagolhatóan kicsi, a többi keresőmotor pedig soha nem is használta ezt az algoritmust.

Ahhoz, hogy megértsd, miért nem számít a PageRank, először bemutatjuk, hogy nagyon leegyszerűsítve hogyan működik a Google. Az oldalakat a keresőrobotok begyűjtik, majd az indexelő elemzi a megtalált oldalakat, és a könyvek tárgymutatójához hasonló listát készít belőlük. (Az egyszerűség kedvéért figyelmen kívül hagyjuk, hogy a Google esetében nem csak egy indexről beszélhetünk.) A keresés tulajdonképpen azt jelenti, hogy a felhasználó által beírt szavakat a keresőmotor feldolgozza és elvégzi magát a keresést az indexelt oldalak között. Mielőtt választ adna, a találatokat sorrendbe rakja. Régen a PageRank az egyik legfontosabb szempont volt itt. De hogyan számolja ki a Google a PageRanket?

A PageRank, mint statisztikai modell

Először is, a közhiedelemmel ellentétben a PageRank nem azonos a Google Toolbar vagy más eszközök által mutatott 0-10-ig terjedő természetes számmal. A Google Toolbar ugyanis a PageRanknek a 0–10 intervallumra logaritmikusan átskálázott és kerekített értékét mutatja. Ez utóbbit a Toolbar nélkül is megtudhatjuk, ha a böngésző címsorába beírjuk a következő Javascript kódot:
javascript:location.href='http:\/\/www.google.com\/search?client=navclient-auto&ch=6-1484155081&features=Rank&q=info:'+escape(location.href);

Pontosabb megfogalmazásban egy informatikai algoritmus, ami az oldalunkra mutató linkek alapján egy jól meghatározott statisztikai egyenletből számol ki egy értéket a honlapunknak. Erről részletesebben olvashatsz Brin és Page eredeti publikációjában.

Mivel minden oldal PageRank-je befolyásolja a többi oldal PageRank-jét ezért az egész web link struktúrájának a féltérkepézésére van szükség. Ez így nagyon bonyolult feladatnak tűnik, de a PageRank algoritmussal ez egyszerűen megoldható. Az algoritmus egy egyszerű statisztika egyenlettel elhanyagolható hibahatárral kiszámolja az oldalak rangját. A leegyszerűsített, rekurzív képlet a következő:

PageRank(A) = (1 - d)/N + d * ∑(PageRank(t)/C(t))
Ahol:
N – a weben található összes oldal száma
PageRank(A) – az A oldal PageRank értéke
d – egy speciális tényező, egy skálázó faktor (damping factor), mely értéke 0 és 1 között van
M(A) – azok az oldalak amelyeken található hivatkozás az A oldalra
PR(t) – az A oldalra hivatkozó t oldalak PageRank-je
C(t) – a t oldalról kimenő linkek száma.

Ha eltekintünk (1 – d)/N és N-től, akkor az egyenletet úgy értelmezhetjük, mint: Az A oldal az első olyan oldaltól, amelyről mutat rá link, PageRank(t)/C(t)-nyi szavazatot kap, az illető oldal egyenletesen elosztja a saját fontosságát a linkjei között. Ha t-ből egyetlen link megy ki, akkor A megkapja a teljes PageRank(t) értéket. Ugyanezt alkalmazzuk az összes többi olyan oldalra, ahonnan van link A-ra, végül ezeket összeadjuk. A d faktor miatt egy oldal nem a teljes fontosságát osztja szét az általa linkelt oldalak között, hanem csak annak 85%-át.

A PageRank szemléltetése macskával

Képzeljük el, hogy a érintőképernyős számítógép elé ültetünk egy macskát, aki képes felfedezni a linkeket egy weblapon, viszont nem tudja sem elolvasni, sem megérteni azok szövegét. Így tehát amint elér egy új weblapra, véletlenszerűen, egyenletes eloszlás szerint kiválaszt egy linket az oldalról és rákattint erre. A PageRank nem más, mint a válasz arra a kérdésre, hogy: „Mi a valószínűsége annak, hogy a macska odatalál az oldalunkra?” Ezt persze annak idején úgy fogalmazták meg, hogy „a sztochasztikus szörföző bolyongást végez a hiperlinkek alkotta irányított gráfon”.

A macskák azonban nem szeretnek zsákutcába jutni. Így ezt elkerülendő a PageRank modellt kiegészítették egy biztosítékkal az olyan oldalak ellen, amiből nem vezet kifelé link. Ez a biztosíték pedig az, hogy a cica minden lépésben 1-d valószínűséggel elunja magát, és egyenletes eloszlás szerint, véletlenszerűen választott weblapra ugrik. Mindennek az a következménye, hogy a macska előbb-utóbb visszajut a kiindulási lapra, illetve egy pár óra után az érintőképernyő nagyon össze lesz karmolva.

Miért halott a PageRank?

Az általános, már-már közhelyszerű vélemény az, hogy a blogok és a szociális hálók okozták a PageRanket istenítő SEO hanyatlását és halálát. Ez csak részben igaz, nagyon sok tényező játszott közre. Fontos megjegyezni, hogy régen a toolbar által mutatott PageRankre afféle célként tekintettek. A PageRank mutatta, hogy mi népszerű és mi nem. A SEO munka afféle számszerűsíthető eredménye volt, éppen ezért a legfontosabb SEO tevékenységgé vált a linképítés. A linkeladások, linkfarmok és a linkpiramisok, és egyéb link többszöröző megoldások nyilvánvalóvá tették, hogy elég sebezhető a rendszer. De még csak nem is ez a legnagyobb probléma. A legnagyobb probléma ugyanis szemiotikai természetű. Ha egy internethasználó rákeres valamire, akkor nem azt az oldalt szeretné megtalálni, amire multik milliókat költöttek SEO címen, és nagyon sok linkkel rendelkezik, hanem azt, amelyik releváns és aktuális információt tartalmaz. Nagyon sok keresés eredményeként azt tapasztalhatjuk, hogy alacsonyabb PageRankü siteok megelőznek magasabb PageRankkel rendelkezőket. Noha látszólag mindkettő elfogadható lenne. Persze itt lehetne érvelni azzal, hogy a valódi PageRank sokkal gyorsabban változik, mint a Toolbar átlag három havi frissítései, de tapasztalataink szerint ez nem mérvadó. Azt kell megérteni, hogy a PageRank egy a több, mint 200 faktorból, ami a sorrendet meghatározza, és tapasztalataink szerint fontossága egyre csökken. Ez logikus is, hiszen ami az internet hajnalán nagyon fontos volt, az mára, a gyökeresen megváltozott körülmények halott.