Antes de ponerse a leer la nueva patente de Google para comprobar si encontramos en ella la explicación al Sandbox, uno haría bien en plantearse las razones por las que, en un sistema de ordenación de resultados, las webs nuevas aparacen mayoritariamente mal posicionadas. Como diría Aceves, hay dos líneas de investigación (bueno, en realidad alguna más):

  1. Mala leche: Es algo deliberado; pretenden desanimar a aquellos que crean webs con la intención de que Google sea su principal proveedor de tráfico gratuito.
  2. Actualizaciones espaciadas: Sea lo que sea lo que mide el MysteryRank (recordemos que llamo así al ingrediente secreto del nuevo Google para ocultar el hecho de que no sé qué coño es), las actualizaciones, como antaño sucedía con el PageRank, se realizan periódicamente, y como cuesta tanto calcularlo, se hacen de peras a uvas.
  3. Datos escasos: Sea lo que sea lo que mide el MysteryRank, es algo que las webs nuevas tardan bastante en reunir (incluso aquellas webs que eventualmente están destinadas a ocupar buenas posiciones según el nuevo Google).
  4. Datos temporales: Sea lo que sea lo que mide el MysteryRank, es algo relacionado con lo temporal, por lo que su propia naturaleza hace que las webs nuevas no vayan a tener nada para ser medido hasta después de pasado un tiempo.

A juzgar por el propio título de la patente, la cuarta posibilidad parece la más probable, ¿no?

La oficina de patentes de EEUU ha desvelado una nueva patente de Google solicitada a finales de 2003 que puede o no estar relacionada con el Sandbox.

En todo caso arroja una nueva luz sobre las tan traídas y llevadas ’señales de calidad’ que yo englobaba en la parte de la ecuación ‘MysteryRank’ y que muchas personas, quizá erróneamente, atribuíamos a obtener muchos enlaces desde fuentes distintas y no relacionadas (ni por IP, ni por cross-linking, etc).

La patente presenta una gran variedad de posibles indicadores según los que juzgar un sitio, y a la vez es deliberadamente vaga al señalar qué peso tiene cada factor en el resultado final; de hecho, es prácticamente seguro que en estos momentos Google es incapaz de reunir datos para valorar algunos de los aspectos que contempla en la patente, como los bookmarks.

Es por ello que antes de examinar más de cerca la patente, acabaré de resumir los puntos que me quedaban pendientes sobre el Sandbox, para tener una idea más clara de cuáles de los elementos de la patente que podrían ser responsables.

Resumiendo:

  • Los sitios nuevos tardan en obtener buenas posiciones; cuando lo hacen, parece responder a una actualizacón general.
  • El factor común a casi todos los sitios que salían del Sandbox (por lo menos hasta la última actualización, donde esto pareció cambiar) era una gran cantidad de backlinks.
  • No todos los sitios nuevos salen del Sandbox, a pesar de lograr también un buen número de enlaces.
  • También hay sitios viejos, con buenas posiciones, que entran en el Sandbox.
  • Parece haber distintos grados de ‘ensandboxamiento’.
  • El sanbox es query-dependent, es decir, no afecta a todas las búsquedas por igual, o mejor dicho, no afecta a todas las búsquedas en el mismo grado. Es como si las búsquedas tuvieran asociadas un ‘MysteryRank’ propio contra el que se compara el ‘MysteryRank’ de las webs, alterando en consecuencia el orden de resultados.
  • El sandbox parece ser parte de un proceso de ordenación de resultados en 2 fases, de ahí que durante algunos períodos se pudiera ‘desactivar’ el Sandbox añadiendo parámetros a las búsquedas; probablemente, estos parámetros desactivaban el cálculo del ‘MysteryRank’ para la búsqueda, no para las webs.
  • El MysteryRank parecía aplicarse a las webs en conjunto, no a las páginas concretas, de modo que se veía a páginas poco importantes de grandes webs ocupar posiciones por encima de las páginas principales de webs menos importantes pero más ‘consagradas’ a esa búsqueda.

Requeterresumiendo:

  • Relacionado con los enlaces.
  • Aplicación a toda una web.
  • Dependiente de la búsqueda.
  • Cálculo en 2 fases.

Haciendo gala de un cuestionable sentido de la oportunidad, Guia buscadores blog se pasa a Wordpress.

Que conste que si he estado un mes sin postear nada no ha sido por pereza, ni por falta de ganas.

Simplemente, tenía que demostrar por qué el nombre de este blog es Blog errático.