Explicación

Peter Norvig, uno de los ingenieros más destacados de Google, ha colgado en su web un corrector de ortografía desarrollado con unas pocas líneas de Python; probablemente, el de Google (y el de Yahoo, y el de MSN, etc) se basa en los mismos principios.

a extremos indecentes, pero yo creía que el filtro anti-porno servía para otras cosas:

Buscamos ‘idealista’ en Google con el filtro safesearch desactivado o normal:



Y ahora con safesearch en modo estricto:



Y esto para una búsqueda ‘navegacional’, el tipo de búsqueda que nunca, nunca debería fallar.

Por lo demás, ¿soy el único que últimamente ve cosas raras, webs que desaparecen de las SERPs de un día para otro y reaparecen un par de semanas más tarde, o resultados distintos si buscas con Internet Explorer o Firefox pero con la misma configuración, o…?

Hace unos meses, Google potenció la geolocalización por idioma de sus resultados. Es decir, si buscas una palabra X en google.es, las páginas en español y/o con enlaces desde páginas en español reciben un empujón en los resultados. Esto crea situaciones como ésta:

En fin, este ejemplo es anecdótico, pero para ciertas búsquedas complejas (por ejemplo, buscando ejemplos de javascript) me suelen aparecer en español casi todas las webs de la primera página, y no los ’sospechosos habituales’ que uno espera encontrar al buscar trozos de código; con lo cual cada vez más a menudo tengo que darle al enlace de ‘Google.com in English’, hasta el punto de que intento mantener un navegador configurado para google.es y otro pata google.com.

Eso sí, desde el punto de vista del posicionamiento, miel sobre hojuelas: ahora es más factible rankear en google.es para términos en inglés muy competidos, cosa que es prácticamente imposible en google.com.

Al parecer, no somos sólo los SEOs los que vivimos obsesionados con las estadísticas:

¿Habéis oído hablar del posicionamiento en buscadores aplicado a la gestión de la reputación?

Mecadona sí ha oído hablar de ello.

En la página principal de guiabuscadores.com he elaborado una lista de otros buscadores basados en Google Custom Search Engine. Si has desarrollado uno y quieres que lo añada, envíame un e-mail.

Incluye su URL, qué número y tipo de fuentes recoge, criterios de selección, etc. Sería de especial importancia que cada buscador basado en CSE mantuviera en una URL determinada la lista de fuentes que recoge (yo estoy en ello).

En la implementación que he hecho en www.guiabuscadores.com he encontrado el problema de que según qué navegador usara, los resultados no se circunscribían a las webs que había especificado.

Aquí se explica la razón: GCS sólo está implementado en inglés, así que cuando por idioma del navegador, cookie, o lo que sea, Google fuerza la versión local de los resultados, la personalización se va a hacer puñetas.

Hasta que se internacionalice GCS, se puede añadir esto la código del buscador:

<input type=hidden name=hl value=”en”>

Tiene el problema de que los mensajes de Google aparecerán en inglés, y los resultados también mostrarán cierto prejuicio a favor de las páginas en inglés.

Cuando en el post anterior decía que “Respecto al uso webmasteroso, no creo que a nadie se le haya pasado por alto la utilidad que tiene este servicio”, no me refería a la facilidad con que los webmasters podremos implementar un buscador que cubra varias webs, ni a la posibilidad de ganar dinero con AdSense.

Una de las opciones de Google Custom Search Engine deja que aparezcan todas las webs, igual que en la búsqueda general, pero las que tú señalas aparecen antes.

Al fin veré una versión de Google en la que, busque lo que busque, todas mis webs aparecerán en primera posición.

La próxima vez que una de mis webs se pegue un batacazo, ya sé qué a qué terapia recurriré.

Hoy (o ayer, según se mire) Google ha anunciado un producto que podría significar una herramienta de primer orden para la profesión bibliotecaria: Custom Search Engine ( http://www.google.com/coop/cse/overview ). Básicamente, cualquier persona puede personalizar un buscador definiendo una lista tan larga como quiera de webs en las que se restringirá la búsqueda.

Por ejemplo, he implementado una versión en http://www.guiabuscadores.com que sólo devuelve resultados de páginas oficiales (gobierno central y de las autonomías, ministerios, diputaciones, algunos ayuntamientos…).

Parece que el sistema aún tiene algunos problemas. Por ejemplo:

  • He probado a usarlo con Internet Explorer en dos ordenadores distintos, y me devuelve resultados genéricos, no personalizados; en cambio, con Firefox funciona correctamente
  • De momento sólo está en inglés

Sin embargo, es una herramienta potencialmente muy interesante porque permite añadir a un buscador genérico un filtro desde cualquier óptica que deseemos: autoridad de las fuentes, oficialidad de las fuentes (como he hecho en guiabuscadores.com), idoneidad de las fuentes para cierto grupo de usuarios… Por ejemplo, para un público principiante en el mundo de los buscadores, se podría construir un buscador que sólo devuelva webs contrastadas y evitar los problemas que suele tener este tipo de usuarios con páginas que descargan malware o instalan de forma más o menos subrepticia toolbars adicionales en el navegador.

También se pueden etiquetar las webs o las páginas que incluyamos con información adicional; por ejemplo, aplicando a ciertas URLs la etiqueta ‘estadística’ o ‘noticias’ o ‘aplicaciones’ o cualquier otra etiqueta que definamos; estas etiquetas aparecen en la búsqueda y permiten restringir aún más los resultados al seleccionarlas.

Además, el sistema puede ser colaborativo, y el buscador resultante puede alojarse en Google o puede incorporarse a una web externa, con lo que, de la misma manera que hay, pongamos por ejemplo, bibliografías recomendadas para bibliotecas públicas, sería posible desarrollar colaborativamente un buscador de webs recomendadas para bibliotecas públicas.

Aún estoy explorando el sistema, por ejemplo para comprobar el número máximo de webs que pueden agregarse a un solo buscador, o para determinar cómo selecciona los resultados, ya que para algunas consultas muy simples se devuelven menos resultados que para consultas más específicas (probablemente lo que hace es recuperar los primeros X -¿1.000?- resultados del buscador genérico y contrastarlos con la lista personalizada de webs, dejando sólo las coincidencias), pero la primera impresión es magnífica.

Ya existían algunos buscadores que hacían cosas similares, pero la implementación de Google parece mejor y, sobre todo, permite ofrecer un producto nuevo a través de un sistema que por su amplia aceptación no requiere de ningún proceso adicional de aprendizaje.

[Vía JenSense.]

[Este post está reciclado de un mensaje que he enviado a Iwetel, una lista de distribución del campo de la biblioteconomía y la documentación, de ahí las referencias al uso bibliotecario. Respecto al uso webmasteroso, no creo que a nadie se le haya pasado por alto la utilidad que tiene este servicio, ¿verdad?]