Contenuto sparito dai risultati di ricerca? A volte può essere una decisione presa da Google per garantire che la Ricerca continui a “restituire le informazioni più pertinenti e affidabili possibili”. È questo il messaggio centrale del post con cui Danny Sullivan espone e spiega i motivi per cui Google può decidere di rimuovere autonomamente un contenuto dalle sue SERP, facendolo di fatto sparire.

Quando Google rimuove i contenuti

Si parla quindi di un caso differente dagli interventi di rimozione dei contenuti da Google che possono essere eseguiti dai proprietari dei siti in determinati casi, usando ad esempio l’apposito strumento rimozioni della Search Console.

Ciò che il Public Liaison for Search mette sotto i riflettori nel suo articolo, infatti, sono i casi gravi che spingono Google a procedere con una rimozione dei contenuti, in linea di massima per proteggere gli utenti o per conformarsi alla legge. Google non intraprende questa azione alla leggera, e basti pensare che anche i siti che violano le regole di Google con la black hat SEO non vengono deindicizzati in modo permanente, ma che a volte può essere inevitabile.

La mission del motore di ricerca

Tali interventi servono a difendere la mission di Google, dice Sullivan, che lavora ogni giorno per garantire l’accesso alle informazioni a una platea possibilmente universale e “rendere le informazioni dal Web disponibili a tutti”. I sistemi sono progettati “per restituire le informazioni più pertinenti e affidabili possibili, ma i nostri risultati di ricerca includono pagine del Web aperto: pertanto, seconda di ciò che si cerca, i risultati possono includere contenuti che le persone potrebbero trovare discutibili o offensivi”.

E quindi, se da un lato Google si sforza di fornire un accesso aperto alle informazioni, dall’altro ha “anche un forte impegno e responsabilità a rispettare la legge e proteggere i nostri utenti”. Nel complesso, l’approccio alla qualità delle informazioni e alla rimozione di pagine Web mira “a trovare un equilibrio tra garantire che le persone abbiano accesso alle informazioni di cui hanno bisogno e fare del nostro meglio per proteggersi dalle informazioni dannose online”.

Come detto, però, in alcuni casi la rimozione dell’accessibilità del contenuto nella Ricerca Google è la strada intrapresa, quando tale contenuto è contrario alla legge locale o ad altri criteri ben precisi.

La rimozione dei contenuti in violazione delle leggi

I requisiti legali per rimuovere pagine dai risultati di ricerca di Google si attengono a uno standard elevato, premette l’articolo; per molte questioni, come la privacy o la diffamazione, gli obblighi legali possono variare da paese a paese, poiché diverse giurisdizioni sono arrivate a conclusioni diverse su come affrontare questi argomenti complessi.

Anche per questo, Google incoraggia “le persone e le autorità ad avvisarci dei contenuti che ritengono violino la legge” – qualunque utente può inviare una richiesta di rimozione per contenuti inappropriati che ritiene violino la legge, compilando questo form – e questa segnalazione nella maggior parte dei casi è necessaria in quanto Google non sempre è attrezzato “a determinare se un contenuto è illegale, soprattutto senza preavviso da parte di coloro che ne sono interessati”.

I casi legali che portano alla cancellazione dalle SERP

Ad esempio, nel caso di materiale protetto da copyright “non possiamo confermare automaticamente se una determinata pagina che ospita quel particolare contenuto ha una licenza per farlo, quindi abbiamo bisogno che i titolari dei diritti ce lo dicano”.

Più semplice, per così dire, è l’identificazione della “semplice presenza di materiale pedopornografico (CSAM) su una pagina, che è illegale nella maggior parte delle giurisdizioni”; pertanto, Google ha sviluppato modi per identificare automaticamente queste tipologie di contenuto e impedirne la visualizzazione nei risultati di ricerca.

Ad ogni modo, per tutte le rimozioni legali Google condivide “le informazioni sulle richieste di rimozione da parte del governo nel nostro Rapporto sulla trasparenza” e ove possibile segnala le richieste di rimozione tramite Search Console ai proprietari dei siti web.

Rimozione di contenuti per proteggere gli utenti

L’altro grande motivo che spinge Google ad agire, oltre ai contenuti inappropriati in termini di legge, è difendere alcuni dati delle persone: il motore di ricerca ha una serie di “policy che vanno oltre quanto richiesto dalla legge, principalmente incentrate su contenuti altamente personali che appaiono sul web aperto”.

Si tratta, ad esempio, di contenuti che includono informazioni finanziarie o mediche, documenti di identità rilasciati dal governo, immagini intime pubblicate senza consenso e, in sintesi, tutte quelle informazioni che “le persone generalmente intendono mantenere private e possono causare gravi danni, come il furto di identità”: per evitare il rischio potenziale di danni causati da informazioni personali che cadono nelle mani sbagliate, Google offre agli utenti la possibilità di richiedere la rimozione di quelle pagine dai risultati di ricerca.

Inoltre, Google cerca anche nuovi modi “per espandere attentamente queste politiche per consentire ulteriori protezioni per le persone online”. Ne è un esempio la possibilità di “richiedere la rimozione di pagine su se stessi da siti che sfruttano la situazione e richiedono un pagamento per procedere alla rimozione, oppure da pagine che includono informazioni di contatto in presenza di minacce personali, una forma di doxxing“. In tali casi, se “le persone potrebbero voler accedere a questi siti per trovare informazioni potenzialmente utili o comprendere le loro politiche e pratiche, le pagine stesse forniscono poco valore o interesse pubblico e potrebbero portare a danni alla reputazione o persino fisici da cui miriamo a proteggere”, chiarisce Sullivan.

Risolvere i problemi su larga scala grazie agli insights

Per risolvere i problemi di contenuti inappropriati potrebbe sembrare intuitivo “rimuovere più contenuti, pagina per pagina o limitare l’accesso a interi siti”, ma la rimozione di singole pagine dai risultati di ricerca non si adatta in modo efficace alle dimensioni del Web aperto, con trilioni di pagine e altre aggiunte ogni minuto, né è in linea con la filosofia di Google.

Il motore di ricerca ha quindi adottato un approccio differente, utilizzando le informazioni ricavate dalle richieste di rimozione per progettare sistemi che risolvono i problemi in tutti i risultati di ricerca. Solo la “creazione di approcci scalabili e automatizzati ci consente di risolvere queste sfide in modo più efficace, e di evitare al tempo stesso di limitare inutilmente l’accesso ai contenuti legali online”.

Ciò significa che il sistema di protezione più efficace per Google “consiste nel progettare sistemi che collochino informazioni affidabili e di alta qualità al primo posto dei nostri risultati”, e usare gli insights ricavati dalla rimozione delle pagine, in conformità con le policy aziendali e gli obblighi legali, per “migliorare i nostri sistemi in generale”.

Le conseguenze per i siti con contenuti inappropriati

Ad esempio, se un sito web riceve un volume elevato di richieste di rimozione di contenuti valide per violazione della legge sul copyright, Google ridurrà al minimo l’aspetto di quel sito nei risultati di ricerca, utilizzando gli insights per “come segnale di qualità e declassando il sito nei nostri risultati”. Misure simili sono in atto per i siti Web che ricevono un volume elevato di richieste di rimozione per le pagine contenenti informazioni personali.

Questo approccio consente non solo di aiutare le persone che richiedono le rimozioni, ma anche di “lottare in modo scalabile contro il problema in altri casi”.

Un web in evoluzione e un problema che resta aperto

Nonostante tutta questa attenzione da parte del motore di ricerca, nelle conclusioni dell’articolo Sullivan si sofferma su un aspetto importante e ricorda a tutti che, sebbene il contenuto venga rimosso da Google, potrebbe ancora esistere sul Web e che solo il proprietario di un sito web può rimuovere completamente i contenuti.

Comunque, Google continua a combattere “contro gli effetti dannosi delle informazioni personali sensibili che compaiono nei nostri risultati e adottiamo pratiche rigorose per garantire il rispetto della legge”, evolvendo costantemente il proprio approccio “per proteggere da malintenzionati sul Web e garantire che Google continui a fornire informazioni affidabili e di alta qualità per tutti”.