Rimuovere i contenuti da Google, le indicazioni per non sbagliare
Si può rimuovere definitivamente un contenuto da Google? E qual è il procedimento per eliminare la pagina e l’URL dal motore di ricerca? Queste sono solo alcune delle domande che ci possiamo trovare ad affrontare nel corso dell’attività di un gestione di un sito, legate a eventi che (purtroppo) non sono sporadici e possono capitare nella vita di un progetto, in seguito ad esempio alla presenza di contenuti obsoleti, modifiche alla struttura o, per i casi peggiori, volontà di esercitare il diritto all’oblio e cancellarsi da Google o necessità di eliminare pagine hackerate e piene di spam. È proprio Google che ci viene incontro, con vari suggerimenti e tecniche per riuscire nell’intento di eliminare una pagina da Google e dal suo Indice, e in particolare vediamo i passaggi indicati da uno specifico appuntamento con i Webmaster Conference Lightning Talk di Google, gli speech virtuali con cui vari Googler danno consigli utili a proprietari e gestori di siti, SEO professionali e sviluppatori, e uno dei video della serie #AskGooglebot, sempre su YouTube.
Come rimuovere i contenuti da Google
A guidarci approfonditamente nelle diverse tecniche per rimuovere i contenuti dalla Ricerca Google è Daniel Waisberg, Search Advocate della compagnia americana, che offre una panoramica dei differenti tool, come lo Strumento per le rimozioni della Search Console, le rimozioni permanenti e altre soluzioni.
La scelta di uno strumento o di un procedimento dipende da vari fattori, e in particolare dal tipo di contenuto – se è presente sul nostro sito o da qualche altra parte – e dal tipo di rimozione, perché c’è differenza tra richiedere le informazioni da tutto il Web o solo da Google Search.
Quali contenuti è possibile rimuovere, e quali no
Innanzitutto, però, Waisberg fa una breve panoramica su che possiamo e non possiamo rimuovere. Ovvero, è possibile eliminare i contenuti dal nostro sito web in modo semplice e veloce, ed è possibile anche rimuoverli da Google o da tutto il web. Inoltre, possiamo chiedere a Google di rimuovere i contenuti dalle sue proprietà (come YouTube, Blogger e altri) se violano le rigorose policy di Mountain View.
Inoltre, possiamo chiedere l’eliminazione di contenuti che violano le policy di Google anche se sono ospitati su siti web di terze parti, ma questo porterà solo alla rimozione dai risultati del motore di ricerca.
Questo specchietto – definito decision tree, albero della decisione – è utile per capire che possibilità abbiamo rispetto alla richiesta di rimozione.
Il processo decisionale per la richiesta di rimozione
La prima domanda che ci dobbiamo porre riguarda la proprietà e il controllo del contenuto: se ci appartiene, infatti, la rimozione è molto più semplice perché dobbiamo solo usare gli strumenti giusti.
Successivamente, dobbiamo chiederci se vogliamo rimuovere il (nostro) contenuto in modo permanente o temporaneo: se abbiamo bisogno di un’azione rapida e immediata, si può utilizzare lo strumento Rimozioni temporanee presente all’interno della Google Search Console, che ci darà 6 mesi di tempo per lavorare a una soluzione diversa o definitiva.
Se invece non abbiamo controllo sul contenuto, il processo è più complicato, ma non impossibile di fronte a evidenti casi di violazione delle norme e delle policy di Google (e non solo). Per contenuti ospitati su un servizio di Google come YouTube, Blogger o Ads esistono in particolare degli specifici strumenti troubleshooter, mentre in caso di problematiche con pagine di altri siti web “l’opzione migliore è quella di contattare il proprietario del sito”, anche se in alcuni casi è comunque possibile chiedere (e ottenere) la rimozione almeno da Google Search.
Come eseguire la rimozione permanente del contenuto da Google
Se il nostro obiettivo è rimuovere da Google Search contenuti di cui abbiamo controllo, abbiamo a disposizione tre strade:
- Restituire uno status code HTTP 404 o 410 ogni volta che il contenuto viene richiesto (rispettivamente, risorsa non trovata e risorsa non disponibile);
- proteggere il contenuto con una password in modo che non sia accessibile da Googlebot o da altri bot sul web;
- utilizzare un meta tag noindex per indicare che la pagina non deve essere indicizzata.
Fare un semplice redirect 301 della vecchia pagina con una risposta o usare una direttiva robots.txt potrebbe non essere sufficiente per rimuovere il vecchio contenuto dai risultati della ricerca su Google.
Trattandosi di procedimenti per rimuovere il contenuto dalla Ricerca in modo permanente, Waisberg suggerisce di fare attenzione e valutare con estrema cautela i vari passaggi, che potrebbero non essere reversibili.
Come richiedere una rimozione temporanea a Google
In altri casi, potremmo avere la necessità di chiedere semplicemente una rimozione temporanea del contenuto da Google: in pratica, “nascondere” per un periodo di tempo limitato la pagina dai risultati di ricerca per correggere eventuali problemi o errori presenti in vista di una risoluzione (in senso positivo, con il ritorno della visibilità piena della pagina, o con una rimozione totale).
Sono disponibili due opzioni di richiesta, che servono a bloccare l’URL dai risultati della ricerca su Google per circa sei mesi o cancellare solo la copia della pagina nella cache. Se eliminiamo la cache, sarà rimosso anche lo snippet di descrizione della pagina, che resterà vuoto fino al successivo crawling: questa opzione può servire quando dobbiamo velocemente rimuovere informazioni sensibili da una pagina e vogliamo aggiornare i risultati in Google Search senza rimuovere la pagina stessa dalla ricerca, ma bisogna intervenire prima della nuova scansione di Googlebot o ci ritroveremo semplicemente le stesse informazioni negli snippet.
Waisberg sottolinea che lo strumento Rimozione non va usato però in alcuni casi:
- azione manuale sulla pagina
- sito web violato
- trasferimento del sito su un altro dominio
- rimozione di pagine che non sono utili o aggiornate
- segnalazione a Google della versione di una pagina che vogliamo sia indicizzata,
tutti casi che richiedono altro tipo di intervento.
Le richieste per contenuti di proprietà altrui
Come dicevamo, è più complessa (ma non impossibile) la strada per richiedere la rimozione di contenuti di cui non abbiamo possesso o controllo.
Se tale pagina “vive su un servizio di proprietà di Google”, è possibile usare gli appositi strumenti di troubleshooting che permettono di “segnalare i contenuti che si desidera rimuovere dai servizi di Google”, fornendo “quante più informazioni possibili per aiutarci a indagare” ed eventualmente rimuovere le informazioni.
Tra le informazioni che Google potrebbe togliere ai risultati della ricerca ci sono:
- violazioni di copyright e altri fattori legali;
- contenuti relativi ad abusi sessuali su minori;
- immagini personali non consensuali, esplicite o intime;
- pornografia fake involontaria;
- presenza di informazioni finanziarie, mediche e documenti d’identità personale
e altro ancora.
Se invece il contenuto è presente su un sito che non controlliamo e non è ospitato su servizi Google, la nostra “migliore opzione è quella di contattare il proprietario del sito web per richiederne la rimozione”, inviando un messaggio tramite il link di contatto che di solito è disponibile nei siti web oppure cercando l’email del proprietario del sito web attraverso una ricerca su Google Search che include il whois example.com.
Trovare l’approccio migliore
Per riassumere, se desideriamo rimuovere il contenuto da Google o dal web in generale dobbiamo porci due domande importanti: “chi controlla il contenuto?” e “voglio rimuovere il contenuto in modo permanente o solo per un periodo?”.
Le risposte ci faranno comprendere qual è l’approccio migliore per raggiungere il nostro obiettivo e risolvere il problema.
Come rimuovere una pagina dall’Indice di Google
Un approccio leggermente diverso al problema è arrivato di recente da John Mueller, che ha dedicato un episodio di #AskGooglebot proprio ai metodi per rimuovere una pagina dall’Indice di Google, anche in tempi stretti.
Nello specifico, la domanda di partenza riguardava il modo migliore per rimuovere vecchi contenuti dall’Indice, e Mueller entra subito nel merito della questione dicendo che la strada più facile (ma anche più lunga) è semplicemente rimuovere la risorsa dal sito e dal server in modo fisico, e attendere che la pagina esca così automaticamente nel tempo anche dai Google Systems. “Non c’è niente di aggiuntivo che devi fare in questi casi”, dice il Googler, “solo assicurarti che il server restituisca il corretto status code HTTP per una pagina rimossa, e la maggior parte dei siti Web lo fa automaticamente”; inoltre, dobbiamo anche rimuovere i riferimenti alla pagina presenti sul nostro sito web, compresi link e file della sitemap. Per quanto riguarda i tempi di attesa, questo processo può richiedere anche alcune settimane prima che i sistemi di Google aggiornino le informazioni e rimuovano il risultato dall’indice e dalle SERP.
Quando invece abbiamo bisogno di un intervento più rapido, la soluzione consigliata per nascondere più velocemente una pagina da Google è utilizzare i già citati strumenti per la rimozione urgente degli URL in Search Console, che “coprono la maggior parte delle situazioni e dei casi in cui può servire rimuovere vecchie pagine dal tuo sito web”, conclude Mueller.