martes, 9 de mayo de 2017

Mejoras recientes a la calidad de la Búsqueda





Publicado por Ben Gomes, VP de Ingeniería, Búsqueda de Google

Siempre es posible mejorar la Búsqueda. Lo sabíamos cuando comenzamos a trabajar en la Búsqueda en 1999 y sigue siendo cierto hoy. En ese entonces, el Internet se expandía a un ritmo increíble. Tuvimos que dar sentido a esta explosión de información, organizarla y presentarla de manera que la gente pudiera encontrar lo que buscaba, directamente en la página de resultados de Google. El trabajo en ese entonces era alrededor de PageRank, el algoritmo base utilizado para medir la importancia de las páginas web, lo que a su vez permite ordenarlas en los resultados. Además de tratar de organizar la información, nuestros algoritmos siempre han tenido que lidiar con individuos o sistemas que buscan "burlar" nuestros sistemas para aparecer más arriba en los resultados de búsqueda – usando "granjas de contenido" de baja calidad, texto oculto y otras prácticas engañosas. Hemos abordado estos problemas y otros a lo largo de los años, actualizando regularmente nuestros algoritmos e introduciendo otras funcionalidades que impiden que las personas jueguen con el sistema.

Hoy, en un mundo donde decenas de miles de páginas están apareciendo en línea cada minuto de cada día, existen nuevas formas en que la gente trata de engañar al sistema. Uno de los problemas de más alto perfil es el fenómeno de las "noticias falsas", donde el contenido en la web ha contribuido a la difusión de información descaradamente engañosa, de baja calidad, ofensiva o completamente falsa. Si bien este problema es diferente de los del pasado, nuestro objetivo sigue siendo el mismo: proporcionar a la gente acceso a información relevante de las fuentes más confiables disponibles. Y aunque no siempre lo hagamos bien, estamos teniendo buenos avances hacia la solución del problema. Pero para lograr cambios importantes a largo plazo, se requieren más cambios estructurales en la Búsqueda.

Con ese esfuerzo a largo plazo en mente, hoy estamos dando el siguiente paso para seguir trayendo a la superficie más contenido web de alta calidad. Esto incluye mejoras en la clasificación de resultados de búsqueda, formas más simples para que las personas proporcionen retroalimentación directa y una mayor transparencia en torno a cómo funciona la Búsqueda.

Clasificación de los resultados de búsqueda


Nuestros algoritmos ayudan a identificar fuentes confiables de entre cientos de miles de millones de páginas en nuestro índice. Sin embargo, es muy evidente que un pequeño conjunto de consultas en nuestro tráfico diario (alrededor del 0.25 por ciento), han mostrado contenido ofensivo o claramente engañoso, que no es lo que la gente busca. Para ayudar a prevenir la propagación de dicho contenido en este subconjunto de consultas, mejoramos nuestros métodos de evaluación e hicimos actualizaciones algorítmicas para traer a la superficie más contenido informado.

  • Nuevas directrices de calidad en la Búsqueda: Desarrollar cambios en la Búsqueda implica un proceso de experimentación. Como parte de ese proceso, contamos con evaluadores, personas reales que analizan la calidad de los resultados de búsqueda de Google y nos dan su opinión sobre nuestros experimentos. Estas evaluaciones no determinan el posicionamiento de páginas individuales, sino que se usan para ayudarnos a recopilar datos sobre la calidad de nuestros resultados e identificar áreas en las que debemos mejorar. El mes pasado actualizamos nuestras directrices generales de calidad para proporcionar ejemplos más detallados de páginas web de baja calidad para que los evaluadores puedan señalarlas adecuadamente, lo que puede incluir información engañosa, resultados ofensivos e inesperados, fraudes y teorías de conspiración sin sustento. Estas directrices comenzarán a ayudar a nuestros algoritmos a degradar el contenido de baja calidad y nos ayudarán a hacer mejoras adicionales a lo largo del tiempo.
  • Cambios en la clasificación: Combinamos cientos de señales para determinar los resultados que mostramos para una consulta en particular, desde la actualidad del contenido hasta el número de veces que las consultas aparecen en la página. Hemos ajustado nuestras señales para ayudar a traer a la superficie más páginas autorizadas y degradar el contenido de baja calidad, para que sea menos probable que sucedan cuestiones similares a lo que vimos en diciembre con el caso de los resultados de negación del Holocausto.

Herramientas para la retroalimentación directa

Cuando visitas Google, nuestro objetivo es que tengas una experiencia veloz con funciones como autocompletar, lo que ayuda a predecir las búsquedas mientras escribes para obtener rápidamente la información que necesitas, y los fragmentos destacados, que te muestran de manera resaltada la información relevante para lo que estás buscando en la parte superior de los resultados de búsqueda. El contenido que aparece en estas funcionalidades se genera algorítmicamente y es un reflejo de lo que la gente está buscando y lo que está disponible en la web. Esto a veces puede conducir a resultados inesperados, imprecisos u ofensivos. A partir de hoy, estamos haciendo que sea mucho más fácil que la gente etiquete directamente el contenido que aparece tanto en las predicciones de autocompletar como en los fragmentos destacados. Estos nuevos mecanismos de retroalimentación incluyen categorías claramente etiquetadas para que puedas informarnos directamente si encuentras contenido delicado o inútil. Planeamos usar esta retroalimentación para ayudar a mejorar nuestros algoritmos.

Nuevo enlace de retroalimentación para autocompletar

Enlace de retroalimentación actualizado para fragmentos destacados



Mayor transparencia acerca de nuestros productos

En los últimos meses, nos han hecho preguntas difíciles sobre por qué estuvieron apareciendo predicciones ofensivas o impactantes en autocompletar. Con base en esto, evaluamos dónde podemos mejorar nuestras políticas de contenido para actualizarlas de manera correspondiente. Ahora publicamos estas políticas en el Centro de ayuda para que cualquier persona pueda saber más sobre autocompletar, así como de nuestro acercamiento a la eliminación de predicciones.

Para aquellos que buscan profundizar un poco más, recientemente actualizamos nuestro sitio sobre cómo funciona la Búsqueda para proporcionar más información a los usuarios y propietarios de sitios web sobre la tecnología detrás de la Búsqueda. El sitio incluye una descripción de cómo los sistemas de clasificación de Google ordenan cientos de miles de millones de páginas para mostrar los resultados, así como una visión general de nuestro proceso de pruebas de usuario.

Se hacen billones de búsquedas en Google cada año. De hecho, el 15 por ciento de las búsquedas que vemos cada día son nuevas, lo que significa que siempre tenemos nuevo trabajo para presentar a las personas las mejores respuestas a sus preguntas a partir de una amplia variedad de fuentes legítimas. Si bien nuestros resultados de búsqueda nunca serán perfectos, estamos tan comprometidos como siempre a conservar su confianza y asegurar que nuestros productos continúen siendo útiles para todos.




No hay comentarios.:

Publicar un comentario