Cuando Google lanzó hace un par de años el link canonical, dijeron que sería una pista para saber qué página debería aparecer en los resultados en caso de contenidos duplicados en una misma web, pero no aseguraron al 100% que funcionaría, así que hace poco hice una prueba para comprobar qué pasa con los enlaces que apuntan a una página que tiene el link canonical.

[Para refrescar memorias, el link canonical sirve para señalar, entre varias páginas iguales o prácticamente iguales de una misma web, cuál de ellas debe ser considerada la página "original" para Google y otros buscadores, y por tanto la que aparecerá en los resultados, y tiene esta forma: <link rel="canonical" href="http://www.guia-bucadores.com" />
, es decir si yo tuviera variantes de la página principal (por ejemplo una versión para imprimir) pondría esa etiqueta en la cabecera de la página variante para señalar cuál es la original que debe tenerse en cuenta en la indexación.]

Planteamiento

Para mi experimento de andar por casa, en una de las webs que gestiono puse un enlace a una página interior, llamémosla A. Luego dupliqué esa página y la colgué como página B. La página A tiene un link canonical que señala que la página canónica es la B, que no está enlazada desde ningún otro sitio:

Resultados

Tras varios días, comprobé que la página indexada era la página B, es decir, la que no tenía ningún enlace convencional apuntándola y la que había señalado como página canónica. No sólo eso, sino que aparece en los resultados para una palabra clave que usé exclusivamente como anchor text del enlace que apuntaba de la home a la página A.

Otros buscadores

Bing aún no ha indexado las páginas. Yahoo (el motor de Yahoo, no los que usan Bing) ha indexado también la página B, pero no aparece para el anchor text que apunta a la página A.

Conclusión

La etiqueta link=canonical funciona en Google como se anunció, y permite aprovechar el “link juice” de los enlaces que apuntan a las versiones no canónicas.

Actualización 3/2/2011

Yahoo ya devuelve también la página B para el anchor con el que enlazábamos la página A desde la home. Bing, por el contrario, ha indexado la página A.


(Asok se dedica al SEO porque ha perdido su alma.)

Hoy haciendo algunas búsquedas me he encontrado esto:

y

Nótese los dos resultados sangrados, y que la fuente del título es más pequeña. Parece ser que lo devuelve cuando detecta que intentamos usar Google para hacer una búsqueda interna en una web sin usar “site:”, en este caso buscar “Barcelona” dentro de Wikipedia y “Arenys de Mar” dentro de Enalquiler. Otra muestra de la preocupación de Google por entender el significado de las queries.

Hoy he visto en las SERPs de Google un caso que me ha llamado la atención porque nunca había visto, o nunca me había dado cuenta, que Google actuara de esta forma:

- Una web cuyas páginas tienen todas el mismo título (el nombre de la empresa)
- Sin embargo, sí tiene un H1 personalizado en cada página
- En las SERPs,  el título del enlace a estas páginas es el texto del H1 en lugar de la etiqueta title. Esto es independiente de la búsqueda que se haga (puede verse con un simple site:)

Como digo, había visto que el texto de un enlace (de DMOZ por ejemplo) reemplazara al title en las SERPs (si no recuerdo mal, dependiendo de la palabra clave que buscaras); o si una página no tenía title que las primeras palabras del texto de la página fueran usadas en su lugar, pero es la primera vez que lo veo con un H1. Es significativo porque el título sí está presente, pero al ser usado el mismo en toda la web (cosa que Google detecta, por ejemplo, en un informe del Webmaster Tools), Google se da cuenta de que es semánticamente poco significativo y busca una alternativa.

Seguro que cada vez que Google anuncia que entra en un nuevo mercado, cientos de personas sufren insomnio esa noche, preguntándose si se convertirá en el category killer de ese sector y ellos tendrán que buscarse otra cosa.

El caso es que lo hace tan a menudo que si te dedicas a esto de Internet, no puedes dejar de sentirte como en Los Diez Negritos. ¿Será tu sector el siguiente en caer?

Primero Google fue a por la publicidad de palabra clave
y yo no dije nada porque no trabajaba para Overture.
Luego fue a por la búsqueda de productos
y yo no dije nada porque no trabajaba para Ciao, Dooyoo o Kelkoo.
Luego fue a por los anuncios locales
y yo no dije nada porque no trabajaba para Páginas Amarillas.
Luego fue a por el correo electrónico
y yo no dije nada porque no trabajaba para Hotmail.
Luego fue a por mapas
y yo no dije nada porque no trabajaba para Mapquest.
Luego fue a por la voz sobre IP
y yo no dije nada porque no trabajaba para Skype.
Luego fue a por la lectura de RSS
y yo no dije nada porque no trabajaba para Bloglines.
Luego fue a por la ofimática
y yo no dije nada porque no trabajaba para Office.
Luego fue a por los navegadores
y yo no dije nada porque no trabajaba para Explorer, Firefox u Opera.
Algún día vendrán a por mi sector
y no tendré más remedio que jorobarme.

Recientemente, la oficina de patentes ha otorgado a Google dos patentes que presentó hace tiempo (en el 2003) relacionadas con los cambios e el buscador según país/lengua:

System and method for providing preferred country biasing of search results
System and method for providing preferred language ordering of search results

Aunque desde el 2003 han pasado un montón de cosas que pueden afectar a la geolocalización de usuarios y resultados (a través de la mayor información de que dispone Google gracias a Analytics, Webmaster Tools, los datos que puede obtener como registrador de dominios, historial de búsqueda, etc.) he releído las patentes para refrescar la memoria, y estos son los elementos que utiliza para determinar la orientación geográfica de una web:

  • TLD (.es, .fr, etc)
  • La dirección de la compañía registradora (por lo que entiendo, no tu dirección que aparece en el WHOIS, sino la dirección de la compañía a través de la que has registrado el dominio)
  • Localización de la IP del servidor (puedes comprobar en qué páis está alojado tu dominio usando, por ejemplo, esta herramienta)
  • El anchor text de los enlaces que apuntan a tu web, o el texto que los rodea
  • El país de las webs que te enlazan
  • El país de los usuarios que visitan tu web, con datos recogidos por la barra de Google

Estas son las posibilidades que ofrecen las patentes, en la práctica no creo que se hayan aplicados todas.

Por supuesto, hoy en día, lo más fácil es registrar tu geolocalización en las Webmaster Tools. Sin embargo, aunque esto funciona perfectamente para señalar que la web es española, y por tanto aparece cuando escogemos “páginas de España” al hacer una búsqueda, no parace tener ningún efecto en cuanto a obtener un ‘boost’ en los resultados de Google España; es decir, si aparecías en el resultado nº 15, señalar por este medio que tu web es española no hará que aparezca antes, sólo que también aparezca cuando escoges “páginas de España”.

¿Son imaginaciones mías, o ahora Google trata los frames del 100% (los típicos en los que muestras la totalidad de la página B pero en la barra de direcciones aun aparece la direccion A) como redirecciones 301 o similares?

Webmaster querido.

Deseo intercambiar acoplamientos por usted. ¿Si usted conviene puede usted por favor enviarme un correo del confirmationa? Gracias mucho

con dónde buscas si un dominio está registrado o no.

nice cognitive dissonance right there

¿Un nuevo formato de anuncio de texto de AdSense? No, un anuncio gráfico usado para poner texto en lugar de dibujos. Me descubro ante el ingenio del anunciante. Aunque con un .swf el texto quedaría más claro.