Alle volte una pagina web può essere raggiunta usando più di un URL. Si apre con questa semplice e chiarissima frase il post del blog ufficiale di Google per i Webmaster (Google Webmaster Central Blog) con cui i Googlers affrontano il tema del rel canonical, offrendo sia una definizione di questo tag sia spiegando i motivi per cui è fondamentale suggerire correttamente URL canonici.

Come appare il tag rel canonical

Cos’è il tag Rel canonical?

Quando parliamo di URL canonici facciamo riferimento a un attributo specifico che si inserisce manualmente nel codice HTML di una pagina per specificarne una caratteristica di priorità. La riga rel=canonical è un attributo del tag link che comunica ai motori di ricerca quale è l’URL più rappresentativo per l’indicizzazione di un sito tra i vari disponibili. In pratica, si imposta un unico URL come versione canonica e si comunica ai crawler di eseguire la scansione su questo, mentre tutti gli altri URL simili vengono considerati URL duplicati e sottoposti a scansione con minore frequenza.

Cosa vuol dire canonico e canonicalizzazione

Si chiama dunque canonicalizzazione il processo di selezione della pagina e degli URL ritenuti prioritari per un particolare sito, che viene eseguito per risolvere gli eventuali problemi di ridondanza, ovvero la duplicazione dei contenuti su URL differenti. Il termine deriva dal latino canone (poi adottato anche in italiano), che significa sostanzialmente regola o criterio da adottare, e dunque canonico significa che è conforme a questo principio.

La duplicazione delle pagine

In diverse occasioni abbiamo affermato che i contenuti duplicati possono danneggiare il posizionamento di un sito Web sui motori di ricerca, causando il noto effetto della cannibalizzazione delle keyword o, ancor più nello specifico, la cannibalizzazione degli URL: in pratica, il sito offre informazioni ambigue al crawler, incapace di comprendere quale sia la pagina principale da sottoporre a scansione ed eventualmente posizionare. Inoltre, se la presenza di contenuti duplicati su Url multipli è molto frequente, il motore di ricerca potrebbe anche penalizzare il sito per spam.

Google e le pagine duplicateCome si genera la duplicazione di URL e pagine

La duplicazione dei contenuti è un problema che può riguardare tutti, anche se in genere è più frequente per gli eCommerce; è bene ricordare, innanzitutto, che per un motore di ricerca ogni URL univoco rappresenta una singola pagina, e la stessa homepage potrebbe essere raggiungibile da percorsi differenti (con o senza www, con HTTPS o senza, con aggiunta di /index.php e così via) e diventare una pagina unica per i crawler. Il fenomeno è ancora più evidente quando si aggiungono automaticamente tag, che creano più percorsi e URL per giungere allo stesso contenuto e moltiplicano parametri URL per ricerche, ordinamenti, opzioni di valuta e così via.

Gli URL duplicati per gli eCommerce

La situazione rischia di divenire critica soprattutto per i siti eCommerce, dove un singolo prodotto può potenzialmente essere raggiunto da più pagine differenti in base al percorso di consultazione degli utenti (se cliccano da banner promozionali in home, se scelgono l’ordinamento per prezzi e così via). Senza il rel canonical tutti i link diretti a queste pagine risultano divisi anziché consolidati, generando dunque contenuti duplicati per i crawler.

L’importanza del rel canonical sugli URL

Da quanto scritto si dovrebbe comprendere il valore della canonicalizzazione e l’importanza di utilizzare in modo preciso i tag rel canonical sugli URL del sito: questa tecnica permette da un lato di impostare la priorità della pagina per i crawler (mettendo al riparo da una potenziale penalizzazione dei contenuti duplicati sui motori di ricerca) e, dall’altro, garantisce che gli utenti da Search arrivino sulla pagina giusta ogni volta. È comunque vero che i motori di ricerca cercano di determinare quale pagina tra le varianti a disposizione possa essere quella canonica, ma il processo non sempre funziona in maniera ottimale e dunque, in ottica SEO, è sempre meglio impostare un URL canonico nei casi dubbi.

Google e gli URL canonici

Tra gli strumenti per i webmaster di Google ci sono anche tool specifici per suggerire gli URL canonici per le pagine del sito, oltre che per verificare se le indicazioni sono state inserite in maniera adeguata. Ad esempio, se si teme di non aver selezionato il miglior URL canonico per i propri contenuti si può controllare l’indirizzo della pagina con URL Inspection tool di Search Console, che mostrerà la canonicalizzazione selezionata da Google.

Google elimina l’info command

Il tool URL Inspection è stato inoltre aggiornato e mostra ora ogni canonical selezionato da Google per un URL, non soltanto quelli delle proprietà gestite nella Search Console; allo stesso tempo, l’articolo firmato da John Mueller annuncia il ritiro di “info:command“, il comando info che era un modo alternativo per scoprire i canonici, ritenuto però poco usato e meno completo del nuovo sistema.

A cosa serviva il comando info

Digitando il comando “info” nella barra del motore di ricerca prima di un dominio, Google mostrava l’elenco degli URL canonici per quello specifico sito. In realtà, fino al 2017 il comando info non mostrava solo gli URL canonici, ma anche collegamenti alla cache, alle pagine simili, ai link e ad altre informazioni, possibilità che sono state rimosse appunto circa due anni fa. Ora, per scoprire gli URL canonici bisogna utilizzare la Search Console e lo strumento Controllo URL (e, dunque, eseguire l’accesso verificato), e non c’è più possibilità di verificare le informazioni nella barra di ricerca pubblica di Google.

Quando e perché utilizzare il Rel Canonical

La guida di Google alla risoluzione dei contenuti duplicati ci permette di comprendere quando utilizzare il Rel Canonical: se più pagine hanno lo stesso contenuto, se sono ottimizzate per le stesse keyword (e quindi competono tra loro), se hanno alcune proprietà simili come metatag, headlines o links in content. I vantaggi dell’uso della canonicalizzazione dovrebbero ormai essere chiari: si segnala direttamente a Google qual è la pagina più pertinente (per noi!) da indicizzare, evita lo spreco di crawl budget perché il crawler non deve sottoporre a scansione le pagine duplicate, si semplifica il monitoraggio delle metriche relative a un singolo prodotto o argomento.

Usare Rel Canonical o redirect 301?

In campo SEO ci sono alcune teorie che invitano a usare un redirect dalle risorse duplicate verso l’URL preferito: il redirect 301 trasmette infatti link equity alla pagina di destinazione, mentre non ci sono posizioni ufficiali circa i tag canonical. Tuttavia, a fronte di questo ipotetico vantaggio la tecnica pone di fronte a qualche dubbio, soprattutto in termini di usabilità ed esperienza dell’utente: con i reindirizzamenti le pagine duplicate sono eliminate, perché l’utente viene automaticamente trasferito all’altra risorsa e, per lui (e i crawler) l’altra pagina non esiste.

Al contrario, il rel canonical semplifica la vita al crawler (che legge l’impostazione e scansiona gli URL come descritto), mentre in termini pratici gli utenti possono visitare tutti gli URL, anche non canonici.

Per chi volesse approfondire il tema rimandiamo a una delle lezioni della nostra Academy con docente ospite Filippo Jatta, che ha trattato proprio dei metodi per comunicare con Google attraverso indicazioni come Canonical, Noindex e Redirect; per visualizzare il video basta registrarsi in modo gratuito all’Academy di SEOZoom ed eseguire il login.

GM