Rimuovere i contenuti da Google e dal Web, la guida per non sbagliare

Provaci

Mettici alla prova

Analizza il tuo sito
Seleziona la lingua del database:

Si può rimuovere definitivamente un contenuto da Google? E qual è il procedimento per eliminare la pagina e l’URL dal motore di ricerca? Queste sono solo alcune delle domande che ci possiamo trovare ad affrontare nel corso dell’attività di un gestione di un sito, legate a eventi che (purtroppo) non sono sporadici e possono capitare nella vita di un progetto, in seguito ad esempio alla presenza di contenuti obsoleti, modifiche alla struttura o, per i casi peggiori, volontà di esercitare il diritto all’oblio e cancellarsi da Google o necessità di eliminare pagine hackerate e piene di spam. È proprio Google che ci viene incontro, con vari suggerimenti e tecniche per riuscire nell’intento di eliminare una pagina da Google e dal suo Indice, perché nell’era digitale la visibilità online è fondamentale e “Internet non dimentica”: due motivi che ci dovrebbero convincere definitivamente a evitare che circolino informazioni obsolete, imprecise o addirittura dannose per il nostro sito e la nostra reputazione online.

Come rimuovere i contenuti da Google

Prima di tutto, definiamo cosa significa rimuovere contenuti da Google.

In questo contesto, quando parliamo di “rimozione” ci riferiamo all’azione di eliminare una pagina web o un URL specifico dai risultati di ricerca di Google: il processo, che può essere fatto attraverso diversi strumenti, non elimina fisicamente la pagina dal web, ma la rende invisibile ai motori di ricerca, influenzando in tal senso anche la SEO.

In realtà, quella appena descritta è la pratica di richiesta di deindicizzazione dei contenuti, che prevede appunto l’eliminazione del contenuto dall’Indice del motore di ricerca, mantenendo però attivo e funzionante l’URL di appartenenza (quindi, non saremo in grado di trovare le informazioni cercandole su Google, ma le possiamo leggere se accediamo al contenuto tramite URL diretto o navigando nel sito web in cui è pubblicato). Diversa è l’eliminazione del contenuto, che significa che il contenuto è stato completamente rimosso dalla pagina in cui è stato originariamente pubblicato: in questo caso, se tentassimo di accedere al contenuto tramite il suo URL originale troveremmo un messaggio di errore 404 o un reindirizzamento verso altra risorsa, che indica appunto che il contenuto o la pagina non esistono più. Col tempo, tali contenuti anche dai risultati di ricerca di Google ma, in alcuni casi, potrebbero essere stati condivisi o pubblicati altrove, e  quindi –  anche se la pagina originale potrebbe non esistere più – il problema potrebbe comunque persistere.

Quando e perché chiedere la rimozione dei contenuti

La scelta di uno strumento o di un procedimento dipende da vari fattori, e in particolare dal tipo di contenuto – se è presente sul nostro sito o da qualche altra parte – e dal tipo di rimozione, perché c’è differenza tra richiedere le informazioni da tutto il Web o solo da Google Search.

In generale, ci sono diverse situazioni in cui potrebbe essere necessario cercare di rimuovere contenuti da Google e dalla Rete: ad esempio, se abbiamo informazioni personali sensibili pubblicate online senza il nostro consenso, articoli che presentano evidenti violazioni di copyright, pubblicazione di contenuti obsoleti, imprecisi o inappropriati che potrebbero danneggiare la nostra reputazione o quella della nostra azienda, o ancora presenza di contenuti duplicati che potrebbero danneggiare la SEO o necessità di avere il tempo di eseguire opportune modifiche correttive al testo (è il caso delle rimozioni temporanee).

Come ricorda StatusLabs, ci sono molti contenuti online: secondo recenti stime, ogni giorno vengono pubblicati circa 3 milioni di articoli di notizie, 7 milioni di blog e 500 milioni di tweet (o comunque si chiamino oggi i messaggi su X). Con così tanti contenuti caricati, è “inevitabile che alcuni di essi non ci dipingano nella luce migliore o riportino informazioni che non desideriamo siano condivise online”.

Dal punto di vista pratico, in linea di massima è possibile chiedere la rimozione di qualsiasi contenuto pubblicato online, ma ciò non significa necessariamente che i tentativi di rimozione abbiano successo; in dettaglio, le tipologie di contenuti online idonei per la rimozione includono articoli e funzionalità di notizie, post di blog, recensioni, post e commenti sui social media, discussioni sui forum, contenuti protetti da copyright, dati personali (come foto o informazioni di contatto)

Ad ogni modo, non è un processo da prendere alla leggera e, se eseguito superficialmente o male, potrebbe addirittura portare alla scomparsa di pagine rilevanti per il nostro sito, motivo per cui è importante considerare attentamente le implicazioni SEO e assicurarsi di seguire le procedure corrette per evitare problemi futuri.

Le tecniche di base per rimuovere i contenuti online

Gli esperti di reputationX hanno stilato un rapido elenco di consigli e tecniche per ottenere la rimozione dei contenuti “totale”, utile per rimuovere informazioni personali da Internet, ripulire il profilo online di un’azienda o anche per rendere invisibili o meno visibili risultati di ricerca negativi o imprecisi, definendo questa attività “uno strumento chiave nella cassetta degli attrezzi per la gestione della reputazione online e per il brand monitoring”.

La prima strada è molto diretta: chiedere a webmaster, editore o autore del contenuto di eliminare la pagina incriminata o di modificare il testo che riteniamo sia per noi dannoso. Il contatto può avvenire via telefono o mail (solitamente funziona meglio il rapporto umano, ma le casistiche sono miste) e a volte può servire far leva sullo “spirito altruistico” della persona che abbiamo dall’altra parte o addirittura concedere qualche tipo di “incentivo” (dal pagamento alle donazioni benefiche, ad esempio). Qualora dovessimo trovarci di fronte a un muro – e quindi al rifiuto di eliminare il contenuto – potremmo tentare almeno di convincere la persona a mettere la pagina in noindex per farla scomparire dai risultati di ricerca.

La seconda strada è di tipo pratico: impossibilitati a ottenere la rimozione del contenuto, possiamo cioè lavorare per renderlo meno visibile grazie a una strategia proattiva di promozione di altri contenuti “positivi” sul brand o sulla persona di cui stiamo curando gli interessi – ovvero, possiamo adottare le tecniche SEO per migliorare la web reputation.

La terza strada, quella su cui ci soffermiamo con maggiore attenzione, riguarda le modalità per richiedere la rimozione dei contenuti da Google. In alcuni Paesi (al momento Italia esclusa) la compagnia sta sperimentando uno strumento apposito che consente a ogni singolo utente di gestire le informazioni sulla sua persona – si chiama proprio “Risultati che ti riguardano”, in inglese “Results about you” – segnalando immediatamente la presenza di dettagli che violano la privacy (come email, numero di telefono o indirizzo di casa) in un risultato di ricerca, selezionando “Rimuovi risultato” dall’icona del menu accanto al risultato stesso. Anche in questo caso, come chiarito in precedenza, Google non può eliminare informazioni da un sito web ma, una volta ottenuta la rimozione, Google di solito rimuove l’URL dall’elenco dai risultati di ricerca entro pochi giorni – e se non sei su Google, sei praticamente invisibile, come diciamo spesso!

Guida alla rimozione dei contenuti da Google

A guidarci approfonditamente nelle diverse tecniche per rimuovere i contenuti dalla Ricerca Google sono più precisamente due video pubblicati sul canale YouTube di Google: nel primo, il nostro host è Daniel Waisberg, Search Advocate della compagnia americana, protagonista di uno specifico appuntamento con i Search Central Lightning Talks (già Webmaster Conference Lightning Talks), gli speech virtuali con cui vari Googler danno consigli utili a proprietari e gestori di siti, SEO professionali e sviluppatori, mentre il secondo è stato gestito da John Mueller e fa parte della serie #AskGooglebot.

In entrambi i casi, i Googler ci offrono una panoramica delle strade a disposizione, spiegando come funziona lo Strumento per le rimozioni della Search Console, come richiedere rimozioni permanenti e altre situazioni utili.

Quali contenuti è possibile rimuovere, e quali no

Innanzitutto, è bene fare una breve panoramica su che possiamo e non possiamo rimuovere.

Come spiega Waisberg, è possibile eliminare i contenuti dal nostro sito web in modo semplice e veloce, ed è possibile anche rimuoverli da Google o da tutto il web. Inoltre, possiamo chiedere a Google di rimuovere i contenuti dalle sue proprietà (come YouTube, Blogger e altri) se violano le rigorose policy di Mountain View.

Inoltre, possiamo chiedere l’eliminazione di contenuti che violano le policy di Google anche se sono ospitati su siti web di terze parti, ma questo porterà solo alla rimozione dai risultati del motore di ricerca.

Il processo decisionale della rimozione contenuti

Questo specchietto – definito decision tree, albero della decisione – è utile per capire che possibilità abbiamo rispetto alla richiesta di rimozione.

Il processo decisionale per la richiesta di rimozione

La prima domanda che ci dobbiamo porre riguarda la proprietà e il controllo del contenuto: se ci appartiene, infatti, la rimozione è molto più semplice perché dobbiamo solo usare gli strumenti giusti.

Successivamente, dobbiamo chiederci se vogliamo rimuovere il (nostro) contenuto in modo permanente o temporaneo: se abbiamo bisogno di un’azione rapida e immediata, si può utilizzare lo strumento Rimozioni temporanee presente all’interno della Google Search Console, che ci darà 6 mesi di tempo per lavorare a una soluzione diversa o definitiva.

Se invece non abbiamo controllo sul contenuto, il processo è più complicato, ma non impossibile di fronte a evidenti casi di violazione delle norme e delle policy di Google (e non solo). Per contenuti ospitati su un servizio di Google come YouTube, Blogger o Ads esistono in particolare degli specifici strumenti troubleshooter, mentre in caso di problematiche con pagine di altri siti web “l’opzione migliore è quella di contattare il proprietario del sito”, anche se in alcuni casi è comunque possibile chiedere (e ottenere) la rimozione almeno da Google Search.

Come eseguire la rimozione permanente del contenuto da Google

Ci sono poi casi in cui si rende necessario eliminare permanentemente le pagine di un sito su cui abbiamo controllo da Google Search: in realtà, spiega Daniel Waisberg, non c’è uno strumento apposito né si può inviare una richiesta, ma bisogna attuare una o più azioni specifiche direttamente sul sito.

Nello specifico, abbiamo a disposizione tre strade:

  • Rimuovere o aggiornare il contenuto attuale della pagina e restituire uno status code HTTP 404 o 410 ogni volta che il contenuto viene richiesto (rispettivamente, risorsa non trovata e risorsa non disponibile). File non HTML, come i PDF, devono essere completamente rimossi dal server.
  • Proteggere il contenuto con una password in modo che non sia accessibile da Googlebot o da altri bot sul web;
  • Utilizzare un meta tag noindex per indicare che la pagina non deve essere indicizzata, che però un sistema meno sicuro degli altri.

Fare un semplice redirect 301 della vecchia pagina con una risposta o usare una direttiva robots.txt potrebbe non essere sufficiente per rimuovere il vecchio contenuto dai risultati della ricerca su Google.

Waisberg spiega come rimuovere i contenuti

Trattandosi di procedimenti per rimuovere il contenuto dalla Ricerca in modo permanente, Waisberg suggerisce di fare attenzione e valutare con estrema cautela i vari passaggi, che potrebbero non essere reversibili.

Come richiedere una rimozione temporanea a Google

In altri casi, potremmo avere la necessità di chiedere semplicemente una rimozione temporanea del contenuto da Google: in pratica, “nascondere” per un periodo di tempo limitato la pagina dai risultati di ricerca per correggere eventuali problemi o errori presenti in vista di una risoluzione (in senso positivo, con il ritorno della visibilità piena della pagina, o con una rimozione totale).

Sono disponibili due opzioni di richiesta, che servono a bloccare l’URL dai risultati della ricerca su Google per circa sei mesi o cancellare solo la copia della pagina nella cache. Se eliminiamo la cache, sarà rimosso anche lo snippet di descrizione della pagina, che resterà vuoto fino al successivo crawling: questa opzione può servire quando dobbiamo velocemente rimuovere informazioni sensibili da una pagina e vogliamo aggiornare i risultati in Google Search senza rimuovere la pagina stessa dalla ricerca, ma bisogna intervenire prima della nuova scansione di Googlebot o ci ritroveremo semplicemente le stesse informazioni negli snippet.

Waisberg sottolinea che lo strumento Rimozione non va usato però in alcuni casi:

  • azione manuale sulla pagina
  • sito web violato
  • trasferimento del sito su un altro dominio
  • rimozione di pagine che non sono utili o aggiornate
  • segnalazione a Google della versione di una pagina che vogliamo sia indicizzata,

tutti casi che richiedono altro tipo di intervento.

Le richieste per contenuti di proprietà altrui

Come dicevamo, è più complessa (ma non impossibile) la strada per richiedere la rimozione di contenuti di cui non abbiamo possesso o controllo.

Se tale pagina “vive su un servizio di proprietà di Google”, è possibile usare gli appositi strumenti di troubleshooting che permettono di “segnalare i contenuti che si desidera rimuovere dai servizi di Google”, fornendo “quante più informazioni possibili per aiutarci a indagare” ed eventualmente rimuovere le informazioni.

Tra le informazioni che Google potrebbe togliere ai risultati della ricerca ci sono:

  • violazioni di copyright e altri fattori legali;
  • contenuti relativi ad abusi sessuali su minori;
  • immagini personali non consensuali, esplicite o intime;
  • pornografia fake involontaria;
  • presenza di informazioni finanziarie, mediche e documenti d’identità personale

e altro ancora.

Se invece il contenuto è presente su un sito che non controlliamo e non è ospitato su servizi Google, la nostra “migliore opzione è quella di contattare il proprietario del sito web per richiederne la rimozione”, inviando un messaggio tramite il link di contatto che di solito è disponibile nei siti web oppure cercando l’email del proprietario del sito web attraverso una ricerca su Google Search che include il whois example.com.

Trovare l’approccio migliore

Per riassumere, se desideriamo rimuovere il contenuto da Google o dal web in generale dobbiamo porci due domande importanti: “chi controlla il contenuto?” e “voglio rimuovere il contenuto in modo permanente o solo per un periodo?”.

Le risposte ci faranno comprendere qual è l’approccio migliore per raggiungere il nostro obiettivo e risolvere il problema.

Come rimuovere una pagina dall’Indice di Google

Un approccio leggermente diverso al problema è arrivato da John Mueller, che ha dedicato un episodio di #AskGooglebot proprio ai metodi per rimuovere una pagina dall’Indice di Google, anche in tempi stretti.

Nello specifico, la domanda di partenza riguardava il modo migliore per rimuovere vecchi contenuti dall’Indice, e Mueller entra subito nel merito della questione dicendo che la strada più facile (ma anche più lunga) è semplicemente rimuovere la risorsa dal sito e dal server in modo fisico, e attendere che la pagina esca così automaticamente nel tempo anche dai Google Systems. “Non c’è niente di aggiuntivo che devi fare in questi casi”, dice il Googler, “solo assicurarti che il server restituisca il corretto status code HTTP per una pagina rimossa, e la maggior parte dei siti Web lo fa automaticamente”; inoltre, dobbiamo anche rimuovere i riferimenti alla pagina presenti sul nostro sito web, compresi link e file della sitemap. Per quanto riguarda i tempi di attesa, questo processo può richiedere anche alcune settimane prima che i sistemi di Google aggiornino le informazioni e rimuovano il risultato dall’indice e dalle SERP.

Quando invece abbiamo bisogno di un intervento più rapido, la soluzione consigliata per nascondere più velocemente una pagina da Google è utilizzare i già citati strumenti per la rimozione urgente degli URL in Search Console, che “coprono la maggior parte delle situazioni e dei casi in cui può servire rimuovere vecchie pagine dal tuo sito web”, conclude Mueller (che già aveva spiegato alcune tecniche per nascondere un sito da Ricerca e dagli utenti).

Lo Strumento per le rimozioni in Google Search Console

“Siamo felici di annunciare una nuova versione dello Strumento per le rimozioni” in Google Search Console: è con queste parole nel 2020 il blog di Google salutava l’introduzione del rinnovato tool a disposizione di webmaster e SEO che usano la suite targata Google.

Il tool funziona ovviamente interviene solo sui siti di proprietà e verificati e serve a:

  1. Nascondere temporaneamente gli URL del sito dai risultati di ricerca, bloccando temporaneamente la visualizzazione delle pagine del nostro sito.
  2. Consultare le richieste di rimozione di contenuti obsoleti.
  3. Visualizzare gli URL bloccati dal SafeSearch e pertanto segnalati come pagine con contenuti per adulti.

Non è invece lo strumento adatto per richiedere la rimozione definitiva delle nostre pagine né per rimuovere informazioni personali su Google che appaiono in siti su cui non abbiamo controllo.

Come funziona la rimozione temporanea e quanto dura

Google offre la possibilità di nascondere in modo temporaneo e provvisorio le pagine di un sito dai risultati di Ricerca. Si tratta di una opportunità utile in alcune circostanze, come ad esempio quando vogliamo rimuovere rapidamente un URL dalla Ricerca Google (per poi trovare una soluzione definitiva) o quando – dopo aver rimosso i contenuti sensibili da una pagina – intendiamo eliminarli dai risultati di ricerca senza rimuovere la pagina intera.

Possiamo scegliere tra due tipi di azione: nascondere l’URL dai risultati della Ricerca Google e cancellare la copia cache della pagina, oppure cancellare la pagina memorizzata nella cache e lo snippet di descrizione fino a quando la pagina non viene nuovamente sottoposta a scansione.

La richiesta di rimozione temporanea può essere un primo step veloce per procedere poi alla rimozione definitiva di una pagina, offrendoci un periodo temporale abbastanza lungo per trovare una soluzione in un senso (nuovo contenuto e pagina visibile, oppure bloccata con password) o nell’altro (eliminazione permanente). La richiesta di pulizia della cache può servire invece per rimuovere informazioni sensibili da una pagina e aggiornare gli snippet di anteprima mostrati da Google (senza rimuovere la pagina stessa dai risultati di ricerca).

L’URL da rimuovere può riguardare una pagina web o un’immagine e una richiesta di successo dura circa sei mesi, un periodo che dovrebbe essere sufficiente a studiare una soluzione permanente per il problema.

È bene chiarire che la rimozione temporanea non elimina contenuti da Internet ed è valido solo per Google (non per altri motori di ricerca), ma soprattutto non cancella per davvero l’URL dall’Indice di Google e serve solo a nasconderlo dai risultati di ricerca per un semestre. Per rimuovere l’URL in modo definitivo bisogna attuare un altro metodo, come mettere la pagina in 404, usare una password, vietare l’indicizzazione con meta tag noindex e così via.

Note importanti sullo strumento

Inoltre, le linee guida dello strumento chiariscono che il blocco di un URL non impedisce a Google di eseguire la scansione della pagina né, quindi, la creazione di una nuova copia cache prima che la pagina sia rimossa o protetta tramite password. Al termine del periodo, la pagina potrà riapparire nei risultati di ricerca. Allo stesso tempo, se l’URL non può essere raggiunto, Google presume che la pagina sia stata rimossa e la richiesta di blocco decade: tutte le pagine individuate in un secondo momento saranno considerate come pagine nuove e potrebbero comparire nei risultati della Ricerca.

Ancora, la documentazione specifica che lo Strumento per le Rimozioni non va (né può essere) utilizzato per finalità quali:

  1. Bloccare una pagina su un sito che non controlliamo.
  2. Eliminare un URL in modo permanente dalla Ricerca. L’uso dello strumento di rimozione è solo un passo in questo processo per cancellare definitivamente un URL e, da solo, non basta.
  3. Cancellare contenuti dal web. Questo strumento elimina i contenuti solo da Google Search.
  4. Rimuovere i risultati da altri motori di ricerca. Come prima, lo strumento elimina i contenuti solo da Google Search.
  5. Cancellare contenuti obsoleti o non più necessari, come ad esempio per eliminare pagine obsolete che restituiscono un errore 404. Se abbiamo recentemente modificato il sito e quindi ci sono alcuni URL obsoleti nell’indice, i crawler di Google li individueranno alla successiva scansione degli URL; le pagine corrispondenti spariranno naturalmente dai risultati di ricerca, per cui non è necessario richiedere un aggiornamento urgente.
  6. Correggere errori di scansione segnalati nell’account Search Console. Lo strumento di blocco impedisce la visualizzazione degli URL nei risultati di ricerca di Google, non negli account Search Console; non è necessario rimuovere manualmente gli URL dal report perché spariranno con il passare del tempo.
  7. Ricominciare da zero” con il sito. Se temiamo che possa essere presa un’azione manuale sul sito o se desideriamo ripartire da capo dopo l’acquisto di un dominio di qualcun altro, è preferibile presentare una richiesta di riconsiderazione per comunicare a Google le noste preoccupazioni e segnalare cosa è cambiato.
  8. Mettere il sito “offline” a seguito di una compromissione. Se il sito è stato violato e desideriamo eliminare gli URL non validi che sono stati indicizzati, dobbiamo usare lo strumento di blocco degli URL per bloccare eventuali nuovi URL creati dall’hacker, ad esempio, http://www.example.com/buy-cheap-cialis-skq3w598.html. Tuttavia, non è consigliabile bloccare l’intero sito o gli URL per i quali potremmo richiedere l’indicizzazione, ma è meglio eliminare gli URL creati dall’hacker e lasciare la facoltà a Google di eseguire di nuovo la scansione del sito.
  9. Far indicizzare la “versione” corretta del sito. Molti siti offrono gli stessi file o contenuti HTML attraverso diversi URL. Se questo è il nostro caso e non vogliamo che i duplicati vengano visualizzati nei risultati di ricerca, dobbiamo seguire uno dei metodi consigliati di canonicalizzazione. Non dobbiamo invece utilizzare lo strumento di blocco degli URL per bloccare gli URL che non desideriamo vengano visualizzati nei risultati di ricerca, perché ciò non farà conservare la versione preferita di una pagina, ma potrebbe invece portare alla rimozione di tutte le versioni (http/https e www/non www) di un URL.

Gestire i contenuti obsoleti

Attraverso il tool è poi possibile leggere la cronologia delle richieste effettuate tramite lo strumento “Rimuovi contenuti obsoleti” della GSC negli ultimi sei mesi, che consente agli utenti comuni (anche non ai proprietari del sito) di segnalare quando la Ricerca Google mostra informazioni che non sono più presenti effettivamente sulle pagine di un sito. Questa sezione ci consente in sintesi di scoprire se ci sono pagine segnalate come “obsolete” da qualsiasi utente della Ricerca perché non contengono più le informazioni mostrate da Google; la segnalazione però non obbliga Google a rimuovere tali pagine, quindi questo strumento ha una funzione informativa e non deve preoccuparci troppo, dice Waisberg.

Da questa schermata possiamo quindi scoprire gli URL interessati, la data e il tipo di richiesta (rimozione copia cache o rimozione della pagina stessa) e soprattutto stato della richiesta.

Esistono due tipi di richieste: rimozione di cache obsoleta indica che la pagina esiste ancora, ma il suo contenuto è cambiato o è stato parzialmente rimosso; Google ripulisce gli snippet di anteprima in SERP fino alla scansione successiva e la pagina non sarà più mostrata tra i risultati per le query relative ai contenuti rimossi. Rimozione di pagine obsolete è invece usato quando la pagina non esiste più e un utente ha chiesto la sua eliminazione da Google.

Pagine segnalate come contenuti per adulti

La terza funzione è relativa al filtro SafeSearch nella Ricerca, che serve per evitare la comparsa tra i risultati della ricerca di pagine con contenuti per adulti o sessualmente espliciti; gli utenti possono segnalare i contenuti che dovrebbero essere filtrati in base a questi criteri e, se la verifica di Google conferma, i relativi URL sono taggati come contenuti per adulti e nascosti dalle ricerche con filtro attivo.

Questa funzionalità mostra una cronologia delle pagine del sito segnalate dagli utenti di Google come contenuti per adulti attraverso gli appositi suggerimenti e che Google ha per così dire confermato, contrassegnando i nostri URL come “contenuti per adulti” e nascondendoli dalle SERP per gli utenti che hanno il filtro attivo.

Da questa schermata possiamo ottenere informazioni sulle pagine incriminate e sullo stato della verifica di Google, semplificando quindi le operazioni in caso di problemi con contenuti per adulti (reali o presunti).

Iscriviti alla newsletter

Prova SEOZoom

7 giorni di Prova Gratuita

Inizia ad aumentare il tuo traffico con SEOZoom!
TOP