Come verificare se il sito è indicizzato in Google
È una domanda apparentemente banale, ma che in realtà sottintende una rilevanza tutt’altro che minima per il rendimento del nostro progetto online e sulla sua effettiva visibilità: “Il mio sito compare nei risultati di ricerca di Google”? E, di conseguenza, quali sono i modi e le tecniche per verificare se le pagine di un sito sono correttamente indicizzate dal motore di ricerca? Proviamo ad approfondire questi concetti legati al più ampio tema della indicizzazione, che come sappiamo rappresenta uno step fondamentale per ogni pagina che intende lanciare la scalata alle SERP di Google.
Come verificare se il sito è presente su Google
Come so che il mio sito è ricercabile su Google? Con questa domanda si apre la quinta puntata di Search for Beginners, la serie di piccoli video a cura di Google Search Central su YouTube dedicata a chi ha (ancora) poche competenze nel mondo del web, e in particolare a chi possiede o gestisce un piccolo progetto online. E quindi, può capitare che tali persone che “hanno dei siti web, sia per attività online che per hobby”, non sappiano come controllare la propria presenza online e “a volte trovano il sito tra i risultati della Ricerca di Google, ma a volte no”.
L’importanza dell’indicizzazione su Google
L’indicizzazione è tecnicamente la seconda fase della Ricerca Google, posta a metà tra il crawling (la scansione e il download di testi, immagini e video dalle pagine trovate su Internet tramite programmi automatizzati chiamati crawler, come Googlebot) e il posizionamento (la classificazione dei risultati sulla base di criteri specifici, con l’obiettivo di restituire informazioni pertinenti alla query dell’utente).
Con questa attività, Google analizza il testo, le immagini e i file video sulla pagina e memorizza le informazioni nell’Indice Google, un grande database in costante espansione.
Non tutte le pagine entrano nell’Indice, e nelle linee guida di Google Search Essentials si chiarisce che tra i fattori che possono ostacolare l’indicizzazione ci sono impostazioni che impediscono a Googlebot di trovare la pagina e accedervi, pagina non funzionante e, non ultimo, presenza in pagina di contenuti non indicizzabili. Tra gli altri problemi comuni di indicizzazione ci sono anche bassa qualità dei contenuti sulla pagina e struttura del sito che rende complicata la scansione (ad esempio a causa di un massiccio uso di JavaScript).
Usare site: per controllare se le pagine sono indicizzate
E quindi, non è scontato che il nostro sito possa effettivamente essere presente su Google, a prescindere poi dalla posizione in cui compare nelle SERP pertinenti, e questo porta ad altre due domande da principianti: “Perché succede? E come fare in modo che il mio sito compaia nella Ricerca?”.
Per fortuna, c’è un sistema pratico e veloce per verificare se Google conosce il sito e se l’indicizzazione delle pagine del sito avviene in modo corretto, ovvero l’uso del comando *site: *, che sappiamo essere uno dei più utili operatori di ricerca avanzata su Google.
Per compiere questa operazione basta andare sulla pagina iniziale di Google da qualsiasi browser e digitare nella barra di ricerca site: seguito dall’indirizzo del sito web: questo comando specifica che la ricerca è limitata solo alle pagine indicizzate di quel determinato sito. Quindi, se inseriamo il nostro sito web e otteniamo un elenco di varie pagine, significa che Google sa che questo sito esiste e ne ha già indicizzato diverse pagine.
Controllare se è indicizzato con www e senza www
Con il comando site: possiamo anche scoprire se il nostro sito è indicizzato correttamente o se è presente un errore frequente, ovvero la presenza contemporanea su Google di due versioni del nostro dominio, con www e senza il www (indirizzo nudo).
Fino a qualche anno fa, la Google Search Console metteva a disposizione un tool di impostazione dominio preferito, e da allora è il motore di ricerca stesso a selezionare automaticamente l’Url di dominio canonico, quello che vogliamo sia utilizzato per indicizzare le pagine del sito. I webmaster possono suggerire la loro preferenza attraverso alcuni strumenti (canonical, sitemap o redirect 301, ad esempio), ciò nonostante può capitare che nell’Indice siano presenti due versioni della stessa pagina, con o senza www ad esempio, e dobbiamo cercare di risolvere il problema.
I problemi della doppia versione del sito
In precedenza, era impensabile non inserire la sigla www (che sappiamo essere l’acronimo di World Wide Web) per accedere a siti web non locali, mentre invece oggi questa motivazione tecnica legata a struttura dei domini e servizi associati non ha più senso e possiamo anche togliere il www se abbiamo impostato correttamente le impostazioni DNS del dominio e se segnaliamo in maniera efficace la versione preferita a Google tramite il rel canonical o gli altri metodi.
Ciò che dobbiamo verificare è che il nostro sito sia indicizzato correttamente solo con una delle due versioni, quella che per noi è più efficace e preferita (con o senza www), mentre la presenza contemporanea di entrambe le versioni può rappresentare un problema per la SEO.
Non specificare un dominio preferito potrebbe infatti spingere Google a trattare le versioni www e non www del dominio come riferimenti distinti a pagine distinte, ovvero come due siti differenti che presentano gli stessi contenuti, con potenziali rischi in termini di duplicazione dei contenuti e cannibalizzazione delle keyword.
Versioni separate delle pagine, come usare il comando site:
In termini pratici, basta andare su Google e inserire nella casella di ricerca il comando site:, scrivendo di seguito la home del sito con www e senza. Ad esempio, site:www.sito.it e site:sito.it.
Se il sito è indicizzato correttamente, visualizzeremo gli snippet indicizzati di una sola delle due versioni, quella che abbiamo impostato come canonica o così riconosciuta dal motore di ricerca stesso.
Se invece appaiono risultati misti è un campanello dall’allarme: o il sito è stato trasferito da poco (e Google non ha ancora digerito la modifica), oppure è necessario controllare meglio tutte le impostazioni per correggere l’errore.
Inoltre, come consiglio ulteriore, è sempre importante restare coerenti con la versione prescelta quando ad esempio facciamo link building o utilizziamo la comunicazione dei nostri canali social, diffondendo solo e unicamente la versione in cui il sito effettivamente si carica, che sia https://sito.it o https://www.sito.it.
Controllare il modo in cui sono mostrati i risultati
Un altro elemento a cui prestare attenzione è come il sito appare sulla Ricerca Google: la descrizione è precisa e rappresentativa di ciò che il sito offre? O ci sono aspetti da migliorare? In questo secondo caso, bisogna lavorare per ottimizzare quello che vedono gli utenti quando eseguono ricerche per le keyword con le quali il sito è posizionato.
Verificare l’indicizzazione su Google con la Search Console
Se abbiamo accesso ai dati della Search Console, possiamo usare un altro metodo alternativo per trovare informazioni precise sulle pagine che Google ha trovato nel sito, su quelle effettivamente indicizzate e sugli eventuali problemi di indicizzazione riscontrati: si tratta del Report Copertura dell’indice, cruciale soprattutto quando il nostro progetto online ha dimensioni rilevanti – in particolare, Google ne consiglia l’uso ai siti che abbiano più di 500 pagine.
In estrema sintesi, questo strumento elenca tutte le pagine nella proprietà che Google ha provato a sottoporre a scansione e indicizzazione, indicando una proprietà di stato per ogni URL (valido, escluso, valido con avvisi, errore) e fornendo quindi dettagli per risolvere gli eventuali problemi.
Cosa fare se il sito non compare su Google
Ma cosa fare se le pagine del sito non compaiono tra i risultati di una ricerca con site: o se ci sono errori nel Report? In questa situazione, potrebbero esserci problemi di crawling e indicizzazione, e quindi bisogna intervenire per risolverli.
Il primo rimedio è inviare la sitemap e gli URL del sito attraverso la Google Search Console, che come sappiamo è lo strumento per gestire la presenza online su Ricerca Google.
È possibile anche testare i singoli URL usando lo strumento Controllo URL, che fornisce informazioni su una pagina specifica, chiarisce i motivi per cui l’indicizzazione della pagina da parte di Google è riuscita o meno e consente anche di verificare se un URL sia potenzialmente indicizzabile.
Se riusciamo a correggere i problemi segnalati, Google conoscerà il nostro sito web e inserirà le nostre pagine all’interno del suo Indice, e quindi abbiamo risolto gli step tecnici che precedono il lavoro per migliorarne la visibilità, ovvero gli interventi con le tecniche di SEO per raggiungere risultati migliori nelle SERP. Le prime operazioni sono piuttosto semplici: si può iniziare a controllare che il sito compaia nelle ricerche relative, “come bella maglietta, negozio di magliette nelle vicinanze o comprare maglietta online”, e verificare che la pagina mostrata sia effettivamente quella migliore e più pertinente tra quelle del nostro sito. Tutto il resto è SEO.