“Ogni ricerca è importante”: è con questa frase, che racchiude il manifesto filosofico della compagnia, che si apre il post con cui Google presenta i risultati dell’attività del suo team antispam nel corso dell’anno 2019. Il dato più clamoroso è quello relativo alle nuove pagine spam scoperte ogni giorno dal motore di ricerca, che sono oltre 25 miliardi, ma il report contiene anche indicazioni interessanti per capire quali sono le aree più problematiche e quale l’impegno complessivo del colosso americano in questo ambito.

La battaglia di Google contro lo spam

L’articolo sul blog ufficiale di Big G è firmato da Cherry Prommawin, Search Relations, e Duy Nguyen, Search Quality Analyst, che partono col ricordare l’importanza dell’attività antispam di Google: “Ogni volta che vieni su Search per trovare informazioni utili e pertinenti, è nostro costante impegno assicurarci che gli utenti ricevano i risultati della massima qualità possibile”, scrivono.

Tuttavia, per sfortuna, sulla Rete “ci sono alcuni comportamenti e contenuti dirompenti che chiamiamo webspam che possono degradare l’esperienza delle persone che cercano informazioni utili”. È diventato quindi necessario per Google mettere in campo “un numero di team che lavorano per impedire che il webspam compaia nei risultati di ricerca”, perché “rimanere davanti agli spammer è una sfida costante”.

La definizione di spam

Del rapporto parla anche un articolo scritto da Danny Sullivan su The Keyword, che tratta il tema in maniera più generale e parte dalla definizione dello spam secondo Google.

Si definisce spam l’utilizzo di tecniche che tentano di imitare i segnali di alta qualità ricercati da Google senza effettivamente mantenere la promessa di un contenuto di qualità elevata o altre tattiche che potrebbero rivelarsi dannose per gli utenti. Rientrano in questa casistica vari tipi di tecniche – comunemente note come black hat SEO – dallo scraping delle pagine al keyword stuffing, dalla partecipazione a schemi di link all’implementazione di reindirizzamenti subdoli.

I numeri della lotta allo spam su Google nel 2019

L’indice di Google è composto da “centinaia di miliardi di pagine Web che servono miliardi di query ogni giorno”, e quindi “forse non è troppo sorprendente che continuino ad esserci bad actors che cercano di manipolare il ranking della ricerca”. E la minaccia di spam è uno dei motivi per cui Google continua a prestare molta attenzione a svelare pochi dettagli sul funzionamento dei suoi sistemi.

Più sorprendente forse è leggere l’impatto quantitativo di questo fenomeno: “più di 25 miliardi di pagine che scopriamo ogni giorno sono spam”, dicono da Google. “È un sacco di spam” e questo numero “dimostra la portata, la persistenza e la durata delle attività che gli spammer sono disposti a fare”.

I risultati del lavoro antispam

Google lavora in modo costante per “garantire che la possibilità di incontrare pagine di spam in Ricerca sia al minimo possibile”, e gli sforzi compiuti negli anni “hanno contribuito a garantire che oltre il 99% delle visite ai nostri risultati conducessero a esperienze senza spam”. Allo stesso tempo, la compagnia collabora con i webmaster “per assicurarci che seguano le best practices e possano trovare successo nella Ricerca, rendendo disponibili grandi contenuti sul Web aperto”.

Il contenuto identificato come spam viene spesso retrocesso di posizioni o rimosso completamente dai risultati della ricerca.

Le principali forme di web spam nel 2019

Nel Google Webspam Report 2018 l’azienda riferiva di aver ridotto dell’80% lo spam generato dagli utenti: grazie al lavoro svolto nell’anno scorso “questo tipo di abuso non è cresciuto”, dice il nuovo rapporto.

Un problema ostico resta il link spam, ma anche in questo caso il team di Google sta ottenendo buoni risultati e sta limitando il suo impatto. Nello specifico, i sistemi di Google hanno catturato più del 90% dei link spam e “tecniche come i link a pagamento o lo scambio di link sono state rese meno efficaci”, spiegano Prommawin e Nguyen.

Anche lo spam hacked – che pure resta “ancora una sfida comunemente osservata” – ha numeri più stabili rispetto agli anni precedenti e Google ha proseguito il lavoro su soluzioni per rilevare il problema e notificarlo meglio ai webmaster e alle piattaforme interessate, aiutandoli a recuperare i siti Web compromessi” con gli strumenti della Search Console e il processo di riconsiderazione del sito.

Le tendenze sullo spam nel Google Webspam Report 2019

Una delle massime priorità di Google nel 2019 è stata “il miglioramento delle nostre capacità di lotta allo spam tramite sistemi di apprendimento automatico”: tali soluzioni non sono perfette e vanno combinate con una revisione umana, un team di detective di spam che cercano di capire se pagine o siti violano le linee guida. Questo mix si è rivelato fondamentale per identificare e prevenire la diffusione di risultati spam agli utenti.

Negli ultimi anni, sono aumentati i siti di spam con contenuti generati automaticamente e scraped content, così come crescono siti spammy che usano “comportamenti che infastidiscono o danneggiano gli utenti, come pulsanti fake, pubblicità enormi e oppressive, reindirizzamenti sospetti e malware”. Questi siti Web “sono spesso ingannevoli e non offrono alcun valore reale alle persone”, dice Google, ma lo sforzo del team ha permesso di “ridurre l’impatto sugli utenti della ricerca da questo tipo di spam di oltre il 60% rispetto al 2018”.

L'azione antispam di Google

Prommawin e Nguyen scrivono inoltre che Google sta continuando progressivamente a migliorare la sua “capacità ed efficienza nell’identificare e catturare lo spam, investendo continuamente nella riduzione di tipi più ampi di danni, come truffe e frodi”. Queste tipologie di siti “inducono le persone a pensare di visitare un sito ufficiale o autorevole e in molti casi gli utenti possono finire per divulgare informazioni personali sensibili, perdere denaro o infettare i loro dispositivi con malware”. Nel corso del 2019, i team antispam di Google hanno “prestato molta attenzione alle query soggette a truffe e frodi e lavorato per stare al passo con le tattiche di spam in quegli spazi per proteggere gli utenti”.

Il contributo di tutti per battere lo spam

Gran parte del lavoro svolto da Google per combattere lo spam consiste nell’utilizzare sistemi automatizzati per rilevare il comportamento di spam e persone fisiche, ma anche così “non è possibile catturare tutto”, ammettono dal colosso americano. Per questo, serve il contributo di tutti gli attori della Ricerca: ad esempio, in quanto “persona che utilizza il motore di ricerca, puoi aiutarci a combattere lo spam e altri problemi segnalando spam nei risultati, phishing o malware”.

Nel corso 2019 gli utenti hanno inviato quasi 230.000 segnalazioni di spam di ricerca e Google è stato in grado di agire sull’82% dei rapporti che ha elaborato, che servono a mantenere puliti i risultati di ricerca.

Come funziona l’attività antispam di Google

L’articolo sintetizza anche i processi dell’attività antispam di Google quando il sistema riceve segnalazioni degli utenti o identifica automaticamente criticità: una parte “importante di ciò che facciamo è avvisare i webmaster quando rileviamo qualcosa di sbagliato nel loro sito web”, dicono i Googlers, e solo lo scorso anno “abbiamo generato oltre 90 milioni di messaggi ai proprietari di siti Web per informarli su questioni e problemi che possono influire sula visibilità del loro sito nei risultati di ricerca e sui potenziali miglioramenti che possono implementare”.

Di tutti questi messaggi, “circa 4,3 milioni erano correlati ad azioni manuali”, il tipo di penalizzazione che sanziona i siti in aperta violazione delle Linee guida per i webmaster di Google.

Più strumenti per i webmaster

Un altro fronte importante del lavoro antispam di Google è la continua “ricerca di modi per aiutare meglio i proprietari dei siti”: tra quelli avviati nel 2019, l’articolo ricorda le “molte iniziative volte a migliorare le comunicazioni, come i nuovi messaggi di Search Console, Site Kit per i siti WordPress o la verifica Auto-DNS nella nuova Search Console”, che forniscono ai webmaster metodi “più comodi per verificare i loro siti e continueranno a essere utili”, garantendo anche un accesso più rapido alle notizie e, quindi, la possibilità di scoprire e risolvere i problemi di webspam o hackeraggio in maniera più efficace ed efficiente.

La riconsiderazione dei link nofollow

L’attenzione non si è concentrata solo sulla pulizia dello spam, perché Google non ha trascurato l’impegmo a “tenere il passo con l’evoluzione del web”, ottica in cui si inserisce la riconsiderazione dell’attributo nofollow, diventato ufficialmente un suggerimento ai fini del ranking dal 1 marzo 2020.

Introdotto inizialmente come mezzo per combattere lo spam nei commenti e segnalare i link sponsorizzati, “il rel nofollow ha fatto molta strada” e continua a evolversi, proprio come si è evoluta la capacità di Google di combattere lo spam. Il post ricorda anche l’introduzione dei nuovi attributi di collegamento, rel = “sponsored” e rel = “ugc”, che forniscono ai webmaster altri modi per identificare su Ricerca Google la natura di determinati collegamenti, e Prommawin e Nguyen rivelano che “questi nuovi attributi rel sono stati ben accolti e adottati dai webmaster di tutto il mondo”.