En mi opinión, el meollo del asunto Sandbox es éste:

Tradicionalmente, la posición de una web en Google para un resultado concreto dependía de dos factores principales:

1) Factores basados en las técnicas tradicionales de recuperación de la información (I.F., information retrieval), es decir, concordancia de texto entre la búsqueda y el texto indexable en la propia web (factores on the page) o asociado (anchor text), ponderado de acuerdo a algotimos de ordenación de resultados (mayor peso en títulos y anchors, contigüedad, etc.).

2) El famoso PageRank.

Básicamente, eso era todo. Añádele unos cuantos filtros (detección de duplicados y tal), algo de geolocalización, alguna zarandaja más, y ya tienes un buscador. Grosso modo, ante una búsqueda, Google calculaba:

Puntuación I.R. x PageRank = Posición

La influencia del PageRank en este cálculo dependerá de la escala en la que esté expresado, de manera que puede tener más o menos peso.

Como ya sabemos, los factores on the page son fácilmente manipulables, y el éxito de Google se debió a introducir otros factores menos manipulables. Menos manipulables, pero manipulables al fin y al cabo, y a finales de 2003 ya eran de dominio público las técnicas para hacerlo. Intercambios de enlaces, compra de PageRank, guestbook spam, y otras técnicas, funcionaban a las mil maravillas. Empezaba a ser difícil encontrar sectores que no estuvieran siendo manipulados por SEOs.

Google introdujo por primera vez en la Googledance Florida (noviembre de 2003) otro elemento en la ecuación que alteró de forma significativa los resultados para algunas búsquedas.

Este elemento nuevo debe actuar como contrapeso de los ya conocidos y manipulados, y servir como un indicador de la confianza que Google puede asignarle como posible fuente de resultados. De ahora en adelante lo llamaré MysteryRank.

Así pues, el nuevo Google calcula:

Puntuación I.R. x PageRank x MysteryRank = Posición

Pero de esta manera sólo hemos trasladado el misterio del Sandbox al no menos misterioso MysteryRank, aunque hemos explicado cómo puede interactuar con los elementos ya conocidos de los algoritmos de Google. Entonces, ¿qué es lo que mide el tal MysteryRank?



« (Anterior) De esto y aquello
Rel=nofollow y la Wikipedia (Posterior) »

Deja una respuesta