Los buscadores de Google, Yahoo y Microsoft se han puesto de acuerdo para dar soporte a una nueva etiqueta HTML que permite controlar el contenido duplicado de la siguiente forma: cuando tenemos varias URL que muestran al mismo contenido, se le puede especificar a los buscadores cual de todas ellas es la principal, añadiendo el nuevo tag canonical a todas las páginas que consideremos duplicadas.

Por ejemplo, si tuviesemos las siguientes URL todas con el mismo contenido:

1. https://www.josebaumbelina.com/posicionamiento-en-google.html
2. https://www.josebaumbelina.com/posicionamiento-en-google.html?sid=24d536g6673
3. https://www.josebaumbelina.com/posicionamiento_en_google_html

Para indicar a los buscador que la buena es la 1, en el header habría que añadir lo siguiente:

<link rel=”canonical” href=”https://www.josebaumbelina.com/posicionamiento-en-google.html” />

Si Google encuentra contenido duplicado en tu web site, su propio algoritmo decide que URL es la principal sobre el resto y de alguna forma elimina las duplicadas. Esto puede funcionar bien o mal según el caso, pero con la nueva etiqueta ahora somos nosotros los que tenemos el control sobre ello y quienes decidimos cual debe ser considerada como principal.

Un ejemplo de uso real se puede ver en en el código fuente de la página de Nelvana en Wikia donde para la URL http://starwars.wikia.com/wiki/Nelvana_Limited se indica que la URL canónica es http://starwars.wikia.com/wiki/Nelvana.

Más información:

FAQ en el blog para webmasters de Google.

Presentación de Matt Cutts Canonical Link Element.

Video de Matt Cutts: