Alle volte una pagina web può essere raggiunta usando più di un URL, oppure un sito presenta diverse pagine con contenuti simili (tipico caso di versioni alternative desktop e mobile, ad esempio): in queste situazioni, Google può incontrare difficoltà a comprendere quale sia il contenuto prioritario e deve prendere una decisione su quale sia la versione da mostrare nella Ricerca, considerando tutte le altre versioni duplicate di tale pagina.

Già da questo si dovrebbe capire perché è importante la canonicalizzazione, ovvero il sistema per segnalare al motore di ricerca la priorità di un URL da un insieme di pagine dal contenuto identico o quasi, e perché è cruciale il rel canonical, l’elemento tag con cui concretamente possiamo comunicare la nostra scelta a Google (che però potrebbe anche non accettarla, come vedremo) e suggerire correttamente gli URL canonici.

Cos’è il tag Rel canonical?

Il tag canonical, rel canonical o canonical link è un attributo specifico che si inserisce manualmente nel codice HTML di una pagina per specificarne una caratteristica di priorità e indicare ai motori di ricerca che quell’URL specifico rappresenta la copia principale di una pagina, la sua versione originale e definitiva rispetto ad altre pagine duplicate, quasi duplicate e simili.

Lo snippet rel=canonical è un attributo del tag link che comunica ai motori di ricerca quale, tra i vari disponibili di contenuto simile, è l’URL più rappresentativo per l’indicizzazione di un sito. In pratica, attraverso questo comando possiamo impostare un unico URL come versione canonica, chiedendo ai crawler di eseguire la scansione prioritariamente su tale pagina, mentre tutti gli altri URL simili vengono considerati URL duplicati e sottoposti a scansione con minore frequenza.

Come appare il tag rel=canonical

I tag canonici utilizzano una sintassi semplice e coerente e vanno inseriti nella sezione <head> di una pagina Web; di base hanno questo aspetto

<link rel=“canonical” href=“https://example.com/sample-page/” />

e ogni parte di tale codice ha un significato. Per la precisione, la prima parte [link rel=“canonical”] rappresenta il suggerimento, l’indicazione del tag, mentre la seconda parte [href=“https://example.com/sample-page/”] indica concretamente quale URL intendiamo segnalare come versione principale canonica della pagina.
Come appare il tag rel canonical

Cosa significa canonicalizzazione e cosa sono gli URL canonici

Si chiama dunque canonicalizzazione il processo di selezione della pagina e degli URL ritenuti prioritari per un particolare sito, che viene eseguito per risolvere gli eventuali problemi di ridondanza, ovvero la duplicazione dei contenuti su URL differenti.

Il termine deriva dal latino canone (poi adottato anche in italiano), che significa sostanzialmente regola o criterio da adottare, e dunque canonico significa che è conforme a questo principio.

Restando in tema di definizioni, ne consegue che chiamiamo URL canonico la versione della pagina che Google ritiene più rappresentativa tra un insieme di pagine duplicate sullo stesso sito, che diventa la fonte principale per valutare contenuti e qualità forniti.

Canonical e SEO: perché è importante segnalare l’URL canonico

L’uso efficace del rel canonical ci permette innanzitutto di evitare la presenza di contenuti duplicati agli occhi di Google, che possono danneggiare il posizionamento di un sito Web sui motori di ricerca, causando il noto effetto della cannibalizzazione delle keyword o, ancor più nello specifico, la cannibalizzazione degli URL, situazione che avviene quando il motore di ricerca riconosce più pagine di contenuto simile – o, per meglio dire, un sito offre informazioni ambigue al crawler e non lo agevola nella comprensione di quale sia la pagina principale da sottoporre a scansione ed eventualmente posizionare; inoltre, se la presenza di contenuti duplicati su URL multipli è molto frequente, il motore di ricerca potrebbe anche penalizzare il sito per spam.

Pertanto, impostare l’attributo rel = canonical e verificare il consolidamento dei segnali mediante la standardizzazione di URL e pratiche di linking interna ci può anche aiutare a garantire che i motori di ricerca indirizzino gli utenti verso le pagine desiderate, con benefici per la SEO.

La canonicalizzazione serve però anche a Google e ai motori di ricerca, perché evita ai crawler di dover sottoporre a scansione più volte le stesse cose, alla luce del fatto che Google non vuole fare crawl o rendering multipli in modo inutile, né servire lo stesso contenuto proposto in URL differenti, perché questi non sarebbero buoni risultati di ricerca.

I principali falsi miti sulla canonicalization

Questo tema è stato anche al centro di un episodio di SEO Mythbusting season 2, la serie di Google su YouTube in cui si affrontano i principali “falsi miti” della SEO, che ha chiarito alcuni aspetti controversi sulla canonicalizzazione, specificando innanzitutto che non significa un raggruppamento per topic, ma è un sistema per assegnare la priorità a un URL da un insieme di pagine dal contenuto identico o quasi, per ridurre le duplicazioni

Nell’occasione, l’ospite e interlocutrice dell’host Martin Splitt è stata Rachel Costello (Technical SEO Consultant presso Builtvisible e già Technical SEO & Content Manager di DeepCrawl, incarico ricoperto all’epoca della registrazione), che racconta come in base alla sua esperienza i falsi miti su questo topic includono i dubbi se la canonicalizzazione sia un segnale o una direttiva, se possa essere utilizzata come reindirizzamento e poi ancora le preferenze del sito rispetto alle preferenze dell’utente e altro ancora.

Splitt e Costello parlano di canonicalizzazione

In particolare, sono due le principali credenze sbagliate maggiormente diffuse sulla canonicalizzazione: innanzitutto, “le persone pensano che sia una direttiva, impostano un tag canonical e sarà accettato”. In realtà, il canonical è un suggerimento HTML che un sito può impostare per segnalare a un motore di ricerca quale sia l’URL principale da usare per una pagina/contenuto.

Un altro caso frequente di misconcezione è l’utilizzo della canonicalizzazione come una redirection: “Se hai una pagina di prodotto che non è disponibile, aggiungi un canonical a quella pagina di categoria”, dice l’esperta, aggiungendo che “non funziona proprio così”, perché “i contenuti devono essere identici o quasi identici”, come conferma Martin Splitt.

Le spiegazioni di Google sul rel canonical

Ed è proprio il Developer Advocate di Google a chiarire questi dubbi e spiegare per bene che cos’è la canonicalizzazione: innanzitutto, non è una direttiva – ovvero un’istruzione che i motori di ricerca sono tenuti a rispettare – ma un segnale, vale a dire un hint, un suggerimento, che aiuta i motori di ricerca a capire cosa vogliamo canonicalizzare (a cosa vogliamo dare importanza e priorità nella Ricerca), ma che gli stessi motori di ricerca possono decidere se usare o meno.

La canonicalizzazione non è una direttiva

Quando si parla di canonicalizzazione, dice Splitt, “stiamo parlando di rilevare il contenuto o lo stesso contenuto o un contenuto molto simile che esiste su indirizzi diversi e i diversi URL”, e Google può “fare molte cose diverse per identificare queste cose”. Ad esempio, può semplicemente fare crawling di più pagine e scoprire che trattano lo stesso contenuto, o ancora vedere se gli URL usano gli stessi link e lo stesso tipo di contesto, o appunto usare il tag canonical.

Bisogna cioè comprendere che Google usa molti segnali diversi per “capire se qualcosa ha lo stesso contenuto o meno”, e la canonicalization tramite il tag canonical è solo uno di questi. Per renderlo efficace, però, è necessario impostare bene il canonical tag: non funzionerà “metterlo su pagine che non hanno lo stesso contenuto, ma non va bene neppure metterlo su ognuna delle pagine identiche”.

Come segnalare la canonicalizzazione

Usare bene la canonicalizzazione di una pagina evita di demandare del tutto la scelta a Googlebot sulla pagina migliore da mostrare tra i risultati di ricerca: oltre allo specifico tag, ci sono come accennato altri segnali che Google prende in considerazione per combinare gli URL dal contenuto simile e operare una deduplicazione.

Tra gli altri, ricordiamo i redirect tra le pagine, i link interni, i link in uscita, le indicazioni in sitemap, hreflang, URL puliti o accorciati.

Lo specchietto sul canonical di Google

La canonicalizzazione e redirect, le teorie SEO e la realtà

Non bisogna neppure usare il tag canonical per fare un reindirizzamento, avverte Splitt, perché non serve come un redirect, anche se spesso c’è confusione su questo aspetto. Lo conferma Rachel Costello, che racconta di aver notato come le persone cerchino in ogni modo di raggruppare la link equity in un unico posto e pagina, e quindi usano il canonical come tentativo disperato per raggiungere l’obiettivo.

Si tratta di un altro errore, perché – ribadisce Martin Splitt – la canonicalizzazione entra in gioco e ha senso solo quando “incroci lo stesso contenuto su piattaforme o canali diversi in luoghi leggermente diversi, per qualsiasi motivo tu lo stia facendo”.

Ma, nel caso di prodotti fuori stock e non disponibili, bisogna semplicemente fare un redirect “verso qualcosa di simile che ha senso per l’utente a quel punto”, oppure mettere la pagina in 404 per comunicare a Google che “questa è la situazione attuale ma potrebbe tornare”.

In campo SEO ci sono in realtà alcune teorie che invitano a usare un redirect dalle risorse duplicate verso l’URL preferito: il redirect 301 trasmette infatti link equity alla pagina di destinazione, mentre non ci sono posizioni ufficiali circa i tag canonical. Tuttavia, a fronte di questo ipotetico vantaggio la tecnica pone di fronte a qualche dubbio, soprattutto in termini di usabilità ed esperienza dell’utente: con i reindirizzamenti le pagine duplicate sono eliminate, perché l’utente viene automaticamente trasferito all’altra risorsa e, per lui (e i crawler) l’altra pagina non esiste.

Al contrario, il rel canonical semplifica la vita al crawler (che legge l’impostazione e scansiona gli URL come descritto), mentre in termini pratici gli utenti possono visitare tutti gli URL, anche non canonici.

Per chi volesse approfondire il tema rimandiamo a una delle lezioni della nostra Academy con docente ospite Filippo Jatta, che ha trattato proprio dei metodi per comunicare con Google attraverso indicazioni come Canonical, Noindex e Redirect; per visualizzare il video basta registrarsi in modo gratuito all’Academy di SEOZoom ed eseguire il login.

Canonicalizzazione e spreco del crawl budget

È importante prestare attenzione all’uso corretto del tag canonical, perché in caso contrario possiamo rischiare di sprecare crawl budget.

Se abbiamo pagine identiche e non abbiamo impostato (o abbiamo fatto male, o invertiamo spesso la pagina scelta) la canonicalizzazione, Googlebot tornerà a fare la scansione di tutti i contenuti in maniera inutile e dannosa per l’economia del sito, che aumenterà anche il suo carico di scansione di Google.

Ancora peggio è usare il canonical come un reindirizzamento, perché in questo caso il motore di ricerca si trova di fronte a pagine marcate come identiche, ma che in realtà non lo sono, e quindi continuerà a passare su tutte.

Duplicazione e deduplicazione, i segnali per Google

Nel video si passa poi a discutere dei fattori tecnici che Google prende in considerazione per eseguire la deduplicazione dei contenuti dello stesso sito: sono tutti segnali automatici perché il lavoro su duplicazione e deduplicazione è fatto “senza molta interazione umana”, dice Splitt, ma “Google apprezza il content fingerprinting” e cerca di comprendere “qual è l’essenza, quali sono le informazioni, come si rapporta alla struttura del sito, cosa c’è scritto nella sitemap; insomma, ci troviamo di fronte a una serie di fattori diversi, per lo più tecnici”.

E, in pratica, Google assegna un punteggio su base continuativa, quindi non determina queste questioni una sola volta e si attiene sempre alla stessa decisione: “Guardiamo sempre il contenuto fresco preso dal crawling, e poi diamo un’occhiata alla pagina – questo cambia, questo è cambiato, ora è molto vicino alla versione precedente, ora qualcosa che era una duplicazione non lo è più, perché il contenuto è stato modificato”.

A volte, prosegue Splitt, “soprattutto quando praticamente tutto è mostrato nella stessa struttura di URL ed è come versioni in linguaggio diverso della stessa cosa, ma con lo stesso contenuto, allora potremmo finire con un punteggio molto simile”. Se Google vede due versioni, “diciamo uno 0.49 e uno 0,51 di quello che pensiamo sia un doppione dell’altro, allora è davvero difficile scegliere quale sarà la pagina canonica”.

A complicare ancor più le cose c’è il fatto che la situazione può modificarsi: Google può fare crawling in modo differente, oppure può cambiare il modo in cui il crawler fa fetching dei dati, e anche le pagine toccate prima possono influenzare “ad avere una specie di salto tra questi due numeri”.

E poi c’è il canonical: un segnale chiaro per aiutare i motori di ricerca e non confondere gli algoritmi impegnati a comprendere quale sia la duplicazione tra i contenuti analizzati. “Perché, se abbiamo due contenuti uguali, come facciamo a sapere quale scegliere?”, sintetizza Martin Splitt.

Canonicalizzazione e contenuto unico

Un altro aspetto investigato da questo episodio riguarda la quantità di contenuto unico presente su una pagina necessaria affinché Google la possa accettare come versione canonica, e secondo Splitt può bastare anche una piccola quota di contenuto originale che non esiste su altre pagine.

Tuttavia, “se il contenuto è completamente diverso o abbastanza diverso per gli algoritmi, tanto da decidere che non si tratta di un duplicato, allora il canonical è inutile”, dice il Googler.

Google e canonical: il motore di ricerca può scegliere una pagina diversa

Nonostante queste indicazioni, però, a volte Google può comunque prendere una decisione diversa e sostituire la pagina canonica preferita del sito con una migliore per gli utenti.

Ne parla approfonditamente un’altra delle voci pubbliche di Mountain View (e spesso ospite del nostro blog), John Mueller, rispondendo in uno degli appuntamenti di #AskGoogleWebmasters alla domanda posta da un utente (@uale75, l’italiana Mariachiara Marsella): “Puoi indicare la tua preferenza su Google utilizzando varie tecniche, ma Google può scegliere una pagina diversa come canonica rispetto a quella da te impostata, per vari motivi. Quindi, quali sono le ragioni?”, chiede la co-founder di BEM Research.

La spiegazione di John Mueller inizia dalle basi: per un sito è frequente avere URL unici multipli che trattano dello stesso argomento, e cita casi comuni come quelli di un sito con versione WWW e senza WWW che mostrano gli stessi contenuti, di una home page accessibile anche aggiungendo /index.html, o di pagine a cui sono dirette versioni di URL che usano lettere minuscole e maiuscole.

L’impostazione dell’URL canonico

La situazione ideale per Google è non dover incontrare queste versioni alternative, ed è per questo che si consiglia di scegliere un formato di URL e usarlo in maniera coerente sul sito web. Per il sistema di Ricerca su Google, infatti, non ha senso indicizzare e mostrare tutte queste versioni di pagine che puntano allo stesso contenuto, e quindi Google cerca di selezionarne e di focalizzarsi soltanto su di una.

Si tratta appunto dell’URL canonico, che può essere indicato dal webmaster o scelto in maniera automatica dal motore di ricerca. Più precisamente, come dice anche l’esaustiva guida ufficiale, Googlebot sceglie la pagina che considera più completa e utile e la contrassegna come canonica.

La canonicalizzazione secondo Google

Sono due le linee guida a cui si attiene l’algoritmo per selezionare un URL canonico:

  • Quale URL somiglia a quella che il sito vuole usare, ovvero qual è la preferenza del sito.
  • Quale URL è più utile per gli utenti.

I parametri di Google sul canonical

Rispetto alle preferenze del sito, Google prende in considerazioni differenti parametri, come l’annotazione link rel canonical che possono usare i gestori dei siti, ma anche i redirect, i link interni, URL inserito nella sitemap, presenza di protocollo HTTPS (preferito al vecchio HTTP), fino ad arrivare a un criterio per così dire estetico. Ovvero, Mueller dice che Google valuta anche quale URL sembra essere più carino dal punto di vista della struttura e della forma.

Le valutazioni per consolidare gli URL

Il sistema del motore di ricerca prende in considerazione tutti questi fattori per ogni potenziale URL canonico e decide quale versione canonicalizzare, analizzando quella che mette insieme meglio i parametri.

Perciò, dice il Search Advocate, “se sei il proprietario di un sito e hai una forte preferenza per gli URL che desideri mostrare agli utenti nella ricerca, dovresti prima di tutto assicurarti di utilizzare tali preferenze in modo coerente in tutto il tuo sito Web”, consiglia Mueller.

I metodi per segnalare una canonicalizzazione

A livello teorico e in una situazione ideale, “i motori di ricerca non dovrebbero imbattersi in nessuna di queste alternative: se hai una preferenza, attieniti a essa“, aggiunge il Googler. A parte questo, e tornando al mondo reale, per limitare i problemi bisogna assicurarsi che un sito abbia tutti questi fattori di canonicalizzazione allineati in modo similare: che i link interni usino il formato preferito di URL, che la sitemap elenchi solo gli URL preferiti, che gli elementi del rel canonical link siano abbinati.

Come impostare i canonical sul sito

Più si riesce a essere coerenti, più alte saranno le probabilità che i sistemi di Google seguiranno le indicazioni fornite e sceglieranno gli URL preferiti come canonici.

Cosa succede quando Google imposta un altro URL canonico

Ma cosa succede in caso contrario, quando Google sceglie un URL diverso?

Un caso possibile è, ad esempio, quando ci sono contenuti identici in lingue diverse: se è presente un tag canonical che punta alla versione inglese di una pagina, ma l’utente si trova in Germania, Google mostrerà la versione tedesca della pagina.

Tali situazioni impattano, come si nota, solo sull’URL mostrato nei risultati di ricerca di Google, e secondo John Mueller “se i nostri sistemi scelgono un URL diverso come canonico, si posizionerà allo stesso modo nella Ricerca”.

Dunque, “alla fine, dipende solo dalle tue valutazioni: se hai delle preferenze sugli URL, allora indicale ai motori di ricerca senza che ci sia possibilità di errore, ma va bene anche lasciar scegliere Google”. Inoltre, se capita che il motore di ricerca scelga un URL diverso “questo non influirà negativamente sul sito”, rassicura Mueller.

Canonical e duplicazione delle pagine

La duplicazione dei contenuti è un problema che può riguardare tutti i siti, anche se in genere è più frequente per gli e-Commerce; è bene ricordare, innanzitutto, che per un motore di ricerca ogni URL univoco rappresenta una singola pagina, e la stessa homepage potrebbe essere raggiungibile da percorsi differenti (con o senza www, con HTTPS o senza, con aggiunta di /index.php e così via) e diventare una pagina unica per i crawler.

Il fenomeno è ancora più evidente quando si aggiungono automaticamente tag, che creano più percorsi e URL per giungere allo stesso contenuto e moltiplicano parametri URL per ricerche, ordinamenti, opzioni di valuta e così via.

Gli URL duplicati per gli eCommerce

La situazione rischia di divenire critica soprattutto per i siti eCommerce, dove un singolo prodotto può potenzialmente essere raggiunto da più pagine differenti in base al percorso di consultazione degli utenti (se cliccano da banner promozionali in home, se scelgono l’ordinamento per prezzi e così via). Senza il rel canonical tutti i link diretti a queste pagine risultano divisi anziché consolidati, generando dunque contenuti duplicati per i crawler.

Motivi validi per avere pagine simili o duplicate

Ma è Google stesso a chiarire che ci sono motivi validi per cui un sito può avere URL diversi che indirizzano a una stessa pagina oppure pagine duplicate o molto simili che indirizzano a URL diversi.

Tra le situazioni più comuni, la guida segnala gli utilizzi:

  • Per supportare più tipi di dispositivi (tipicamente desktop e mobile):

https://example.com/news/koala-rampage

https://m.example.com/news/koala-rampage

https://amp.example.com/news/koala-rampage

  • Per attivare gli URL dinamici per elementi come parametri di ricerca o ID di sessione:

https://www.example.com/products?category=dresses&color=green

https://example.com/dresses/cocktail?gclid=ABCD

https://www.example.com/dresses/green/greendress.html

  • Se il sistema del blog salva automaticamente più URLquando viene inserito uno stesso post in più sezioni:

https://blog.example.com/dresses/green-dresses-are-awesome/

https://blog.example.com/green-things/green-dresses-are-awesome/

  • Se il server è configurato per pubblicare gli stessi contenuti per le varianti www/non www e/o http/https:

http://example.com/green-dresses

https://example.com/green-dresses

http://www.example.com/green-dresses

  • Se i contenuti proposti in un blog da distribuire in syndication su altri siti vengono copiati in parte o per intero su questi domini:

https://news.example.com/green-dresses-for-every-day-155672.html (post distribuito in syndication)

https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (post originale)

L’importanza SEO del rel canonical sugli URL

Da quanto scritto si dovrebbe comprendere il valore della canonicalizzazione e l’importanza di utilizzare in modo preciso i tag rel canonical sugli URL del sito: questa tecnica permette da un lato di impostare la priorità della pagina per i crawler (mettendo al riparo da una potenziale penalizzazione dei contenuti duplicati sui motori di ricerca) e, dall’altro, garantisce che gli utenti da Search arrivino sulla pagina giusta ogni volta.

È comunque vero che i motori di ricerca cercano di determinare quale pagina tra le varianti a disposizione possa essere quella canonica, ma il processo non sempre funziona in maniera ottimale e dunque, in ottica SEO, è sempre meglio impostare un URL canonico nei casi dubbi.

Google e gli URL canonici

Tra gli strumenti di Google ci sono anche tool specifici per suggerire gli URL canonici per le pagine del sito, oltre che per verificare se le indicazioni sono state inserite in maniera adeguata. Ad esempio, se si teme di non aver selezionato il miglior URL canonico per i propri contenuti si può controllare l’indirizzo della pagina con URL Inspection tool di Search Console, che mostrerà la canonicalizzazione selezionata da Google.

Ad ogni modo, quando si trovano di fronte a più copie di una pagina sullo stesso sito, i sistemi di Google devono compiere una scelta e prendono in considerazioni vari parametri per decretare qual è la pagina canonica: uno degli aspetti che può fare la differenza, come rivelato da John Mueller, è la lunghezza dell’URL, perché “un URL più corto e pulito” ha maggiori probabilità di essere interpretato come canonico rispetto a un indirizzo più lungo e complesso, magari con tanti slash.

Google ha eliminato l’info command

Il tool Controllo URL è stato inoltre aggiornato nel tempo e mostra ora ogni canonical selezionato da Google per un URL, non soltanto quelli delle proprietà gestite nella Search Console; allo stesso tempo, da qualche anno Google ha annunciato il ritiro di “info:command“, il comando info che era un modo alternativo per scoprire i canonici, ritenuto però poco usato e meno completo del nuovo sistema.

A cosa serviva il comando info

Digitando il comando “info” nella barra del motore di ricerca prima di un dominio, Google mostrava l’elenco degli URL canonici per quello specifico sito. In realtà, fino al 2017 il comando info non mostrava solo gli URL canonici, ma anche collegamenti alla cache, alle pagine simili, ai link e ad altre informazioni, possibilità che sono state rimosse appunto ormai oltre cinque anni fa.

Ora, per scoprire gli URL canonici bisogna utilizzare la Search Console e lo strumento Controllo URL (e, dunque, eseguire l’accesso verificato), e non c’è più possibilità di verificare le informazioni nella barra di ricerca pubblica di Google.

Quando e perché utilizzare il Rel Canonical

La guida di Google alla risoluzione dei contenuti duplicati ci permette di comprendere quando utilizzare il Rel Canonical: se più pagine hanno lo stesso contenuto, se sono ottimizzate per le stesse keyword (e quindi competono tra loro), se hanno alcune proprietà simili come meta tag, headlines o links in content.

Più precisamente, è opportuno scegliere espressamente una pagina canonica in un insieme di pagine duplicate o simili in queste situazioni e con questi obiettivi:

  • Per specificare l’URL da mostrare nei risultati di ricerca. Ad esempio, se preferiiamo che gli utenti raggiungano la pagina relativa agli abiti verdi tramite https://www.example.com/dresses/green/greendress.html anziché https://example.com/dresses/cocktail?gclid=ABCD.
  • Per raggruppare gli indicatori associati ai link per pagine simili o duplicate. Consente ai motori di ricerca di raggruppare le informazioni in loro possesso relative ai singoli URL (ad esempio link che rimandano agli URL) in un unico URL preferito. Ciò significa che i link presenti in altri siti che rimandano a http://example.com/dresses/cocktail?gclid=ABCD vengono raggruppati con i link che rimandano a https://www.example.com/dresses/green/greendress.html.
  • Per semplificare il monitoraggio delle metriche relative a un singolo prodotto o argomento. La presenza di URL diversi rende più complicato ricevere metriche raggruppate per un contenuto specifico.
  • Per gestire i contenuti distribuiti in syndication. Se distribuisci in syndication i contenuti per pubblicarli su altri domini, ti conviene assicurarti che nei risultati di ricerca compaia l’URL che preferisci.
  • Per evitare di impiegare tempo a eseguire la scansione di pagine duplicate. Per ottimizzare la scansione del sito, è preferibile che Googlebot sottoponga a scansione pagine nuove (o aggiornate), anziché le versioni desktop e per dispositivi mobili delle stesse pagine.

I vantaggi dell’uso della canonicalizzazione dovrebbero ormai essere chiari: si segnala direttamente a Google qual è la pagina più pertinente (per noi!) da indicizzare, evita lo spreco di crawl budget perché il crawler non deve sottoporre a scansione le pagine duplicate, si semplifica il monitoraggio delle metriche relative a un singolo prodotto o argomento.

I consigli generali su canonical e canonicalizzazione

Per tutti i metodi di canonicalizzazione, Google invita a rispettare alcune best practices semplici e intuitive.

  • Non utilizzare il file robots.txt per la canonicalizzazione.
  • Non utilizzare lo strumento per le rimozioni di URL per la canonicalizzazione perché rimuove tutte le versioni di un URL dalla Ricerca.
  • Non specificare URL diversi come canonici per una stessa pagina utilizzando le stesse o diverse tecniche di canonicalizzazione (ad esempio, non specificare un URL in una Sitemap e un altro URL per la stessa pagina utilizzando rel=”canonical”).
  • Non utilizzare noindex per impedire la selezione di una pagina canonica, perché questa istruzione serve solo a escludere la pagina dall’indice, non a gestire la scelta di una pagina canonica.
  • Specificare una pagina canonica quando si usano i tag hreflang, designando una pagina canonica in una stessa lingua o nella migliore lingua sostitutiva, qualora non esista una pagina canonica per la stessa lingua.
  • Utilizza l’URL canonico per il link, anziché un URL duplicato, quando si impostano i collegamenti all’interno del sito. Utilizzare sempre lo stesso URL per i link aiuta Google a comprendere quale sia la preferenza per l’URL canonico.