Problemi all’indicizzazione del sito su Google? Scopriamoli in Search Console

Tempo di lettura : 4 minuti

Posizionare le pagine del nostro sito nelle prime posizioni di Google è, volendo sintetizzare, il traguardo che tutti cerchiamo di ottenere. Prima del ranking, però, c’è un passaggio decisivo che non dobbiamo dimenticare e che spesso diamo per scontato, ovvero l’indicizzazione. Nel nuovo episodio di Google Search Console Training abbiamo quindi una guida all’uso del Rapporto sullo stato della copertura dell’indice di Google, per scoprire se effettivamente le nostre pagine sono su Google o se ci sono errori da correggere.

Il video, affidato come sempre a Daniel Waisberg, spiega proprio come usare la Google Search Console per sapere se le pagine del nostro sito sono state sottoposte a scansione e indicizzate da Google e se ci sono problemi riscontrati in questo processo.

Che cos’è il crawling, la scansione di Googlebot

Tutto inizia con il crawling, ovvero il processo attraverso cui Googlebot scopre le pagine nuove o aggiornate che deve aggiungere all’Indice di Google. Googlebot processa ogni pagina che scansiona per compilare un enorme indice di tutte le parole che vede e della loro posizione all’interno di ogni pagina.

Quando un utente lancia una query su Google, il sistema automatizzato del motore compie una ricerca nell’indice per trovare le pagine rispondenti e restituisce i risultati che ritiene essere i più rilevanti e pertinenti per gli utenti.

Il Rapporto sullo stato della copertura dell’indice nella GSC

Per avere una panoramica di tutte le pagine del nostro sito che Google ha indicizzato o provato a indicizzare possiamo usare l’Index coverage status presente nella Search Console. È importante premettere che questo Rapporto segnala via mail la comparsa di un problema di indicizzazione, ma non si ricevono notifiche in caso di errori che peggiorano: il primo consiglio del Googler è quindi di controllare periodicamente il rapporto per verificare che sia tutto in ordine.

Quando e come usare il Rapporto

Questo strumento è utile soprattutto in caso di siti di grandi dimensioni e sono le stesse linee guida della GSC a definirne “non necessario” l’utilizzo se il nostro progetto online ha meno di 500 pagine: in questo caso, infatti, è più semplice verificare se il sito compare su Google attraverso il comando site: che abbiamo già incontrato.

In linea teorica, quando il sito cresce dovremmo notare un aumento graduale del numero di pagine indicizzate valide: cali o picchi potrebbero derivare da problemi. Non dobbiamo aspettarci che tutti gli URL del nostro sito siano indicizzati, perché il nostro scopo dovrebbe essere far indicizzare la versione canonica di ogni pagina; inoltre, possono servire alcuni giorni a Google per indicizzare nuovi contenuti aggiunti sul sito, ma possiamo ridurre il ritardo richiedendo manualmente il processo.

Cosa significano gli stati segnalati

La schermata di default dello strumento riepiloga gli errori di indicizzazione presenti sul sito, ma possiamo anche focalizzarci direttamente sulle quattro tipologie segnalate: errore, valido con avviso, escluse o valido regolarmente, che sono raggruppate e ordinate per “stato e motivo”, lavorando prima alla correzione dei problemi che hanno maggiore impatto sul nostro progetto.

I valori dello stato possibili per una pagina sono dunque quattro e ognuno ha un motivo specifico:

  • Errore. C’è un problema che impedisce l’indicizzazione della pagina, che quindi non può comparire tra i risultati della Ricerca di Google, e quindi determina perdita di traffico per il sito.

È il caso, ad esempio, di un URL inviato che contiene un tag “noindex“, oppure di pagine che restituiscono uno status code 404 o errori col server. I problemi delle pagine sottoposte tramite sitemap sono esplicitamente indicati per facilitarne la correzione.

  • Valida con avviso. La pagina potrebbe apparire o meno in Google Search a seconda di un problema di cui dobbiamo essere a conoscenza.

Ad esempio, le pagine bloccate nel file robots.txt sono indicate come avviso perché Google non è certo che il blocco sia intenzionale (sappiamo infatti che le direttive robots.txt non sono il modo giusto per bloccare l’indicizzazione delle pagine, ma dobbiamo usare altri metodi).

  • Valida. La pagina è stata indicizzata e può comparire tra i risultati di ricerca: non dobbiamo fare nulla, se non lavorare all’ottimizzazione SEO per un miglior posizionamento!
  • Esclusa. La pagina non è stata indicizzata e non appare su Google, che ritiene sia una scelta intenzionale o giusta.

Ad esempio, la pagina contiene un’istruzione noindex (scelta intenzionale), potrebbe essere un duplicato di un’altra pagina già indicizzata (scelta giusta) oppure non è stata trovata perché il bot ha incontrato un errore 404.

Conoscere e correggere gli errori

Le pagine che presentano errori sono quelle su cui dovremmo concentrare subito la nostra attenzione; la tabella del rapporto è ordinata in base alla gravità del problema e al numero delle pagine che ne sono colpite, e cliccando sulla riga possiamo verificare la distribuzione temporale del danno e una lista di esempi per approfondire l’aspetto.

Dopo aver fatto le correzioni (in prima persona o ricorrendo al supporto di uno sviluppatore, a cui possiamo dare un accesso limitato alla Search Console tramite la condivisione del link), dobbiamo validare le modifiche cliccando sull’apposito pulsante e attendere che Google processi il nostro lavoro.

Guida all'uso del Rapporto sullo stato della copertura dell'Indice di Google

Uno strumento utile per una strategia di successo

In definitiva, il Rapporto sullo stato della copertura dell’indice di Google è uno strumento utile e fondamentale perché ci offre informazioni più chiare sulle decisioni di scansione e indicizzazione e su come Google gestisce i contenuti del nostro sito, ma anche perché ci consente di scoprire in tempo i problemi tecnici, anche su vasta scala, e di intervenire per correggerli evitando che portino a cali di traffico.

TOP