19 noviembre 2007

Que hace una busqueda como tu en un site como este

Muchas veces mis alumnos me preguntan si la hermeneutica telúrica...ehmm no, creo que no era eso.



Hablando con mi Chiquitina de las visitas que llegan aqui buscando cualquier cosa (un saludo desde aqui a la visita de Barcelona de las 9:47 que buscaba "me necesitas en ese muro" famosa frase del coronel Jessep) surgio la cuestion de cómo llega la gente a entradas mias en las que puede que mencione de refilon las palabras clave de busqueda, quedando mi resultado por encima de paginas con un tratamiento mas extenso de esas materias (tales como "yeguas folladas", de las que en este blog no se trata tema alguno).
Comencemos por el comienzo. Un buscador es un sistema que muestra una serie de paginas web que coinciden con un criterio de busqueda (query) introducido por el usuario.

Esto se puede conseguir de dos maneras:
- O bien mediante una base de datos de toda la vida con las paginas introducidas a mano, bien por personas de carne y hueso o mediante meta tags(etiquetas dentro del codigo html de la pagina que especifican las palabras mas relevantes de la pagina).
-O bien utilizando robots, que son programillas que se configuran para leer paginas web y organizarlas segun la aparicion de las palabras clave.
La diferencia sustancial entre un metodo y otro es que con tags no se muestra una pagina si la palabra clave no esta definida en el tag, mientras que con robots, aparezca donde aparezca la palabra, se mostrara la pagina.

Google guardia copias de las paginas en su cache para un acceso mas rapido durante la busqueda y sus robots estan constantemente refrescando la base de datos en busca de nuevas versiones de las paginas. Una vez que se hace la busqueda y se tienen los resultados, el buscador los organiza en base a un criterio denominado PageRank, que consiste en situar mas arriba los resultados con mayor puntuacion.
El criterio para asignar dicha puntuacion (algoritmo) se resume de la siguiente manera:
GoogScore = (Uso de palabras clave en los contenidos * 0.3) + (Relevancia del dominio * 0.25) + (Calidad de los links entrantes * 0.25) + (Comportamiento de los usuarios * 0.1) + (Calidad del contenido * 0.1) + (Puntuación manual) - (Penalidades)

Uso de palabras clave en los contenidos:

* En el título
* En los Headers
* En el texto
* En links internos apuntando a la página
* En el dominio o en la URL

Relevancia del dominio:

* Historia de registro de dominio
* Tiempo de vida del dominio
* Fuerza de los links apuntando a ese dominio
* Vecindario del dominio basado en links entrantes y salientes
* Patrón de uso a lo largo de la vida de un dominio
* Tipo de dominio (.gov, .edu, etc)

Calidad de los links entrantes:

* Tiempo de existencia los links
* Calidad de los dominios que linkean
* Calidad de los documentos que linkean
* Texto que se usa para linkear (anchor text)
* Texto alt que se usa en los links entrantes
* PageRank de los links
* Tema de los sitios que mandan links

Comportamiento de los usuarios

* CTR histórico del documento en los resultados de búsqueda
* Tiempo que los usuarios pasan en la página hasta que hacen otra búsqueda
* Búsquedas del dominio
* Todo tipo de datos de comportamiento de los usuarios venidos de su Toolbar, Analytics, alianzas, etc.

Calidad del contenido:

* Calificación puesta a mano por analistas que potencialmente trabajarían para Google
* Sentido del contenido (procesamiento del lenguaje natural)
* Metadata (tipo de contenido)
* Aumentos manuales en los resultados (ej: wikipedia)

Penalidades (restan)

* Sandbox
* Sobre optimización
* Técnicas conocidas como Black Hat
* Penalizaciones manuales
de 86400.
en cristiano esto viene a significar que para calcular la popularidad de una pagina (y por tanto ponerla mas arriba o abajo en la lista de resultados, no solo se tiene en cuenta la aparicion de las palabras claves, sino tambien, cuantas veces aparece, donde (en titulos, enlaces, pies de fotos), quien enlaza la pagina y muchas cosas mas. Por eso al estar mi blog alojado en blogger, que ya de por si es un sitio popular, tengo mas posibilidades de aparecer arriba que una pagina alojada por sus propios medios.

  • La Frase de Hoy: Dadme un puñado de hombres que me sigan al Infierno y lo tomaremos. Teniente Raszak.
  • Para el que No lo Sepa:El Teniente Raszak es un personaje de la novela "Tropas del Espacio" de R.A Heinlein a quien se le acusa de fascista y militarista por quienes no han entendido la novela. La version cinematografica es una vergüenza.

No hay comentarios: