Lo spam online è un problema ancora rilevante nella quotidianità di tutti noi, ed è come sappiamo uno dei grandi temi al centro del lavoro di Google, che mette in campo tool e risorse per rendere l’esperienza di Ricerca “sicura e priva di spam”. Come da tradizione, il team di Mountain Views ha condiviso i risultati del lavoro eseguito su questo fronte nello scorso anno, anticipando alcuni dei dati del Webspam Report 2021, ma ha anche presentato il “nome ufficiale” dell’algoritmo delegato all’attività antispam, che si chiama SpamBrain ed è all’opera sin dal 2018.

Lotta allo spam, il lavoro di Google SpamBrain

A introdurre questo speciale algoritmo è un articolo di Cody Kwok, Principal Engineer per Google, che descrive SpamBrain come “sistema di prevenzione dello spam basato sull’intelligenza artificiale”.

Google presenta SpamBrain

Lanciato per la prima volta nel 2018, Google ha costantemente migliorato le prestazioni di questo algoritmo, che ha anche la caratteristica notevole di essere “una piattaforma solida e in evoluzione per affrontare tutti i tipi di abuso“.

Con un volume crescente di spam sofisticato prodotto ogni giorno che si riscontra sul Web, dice Kwok, la capacità di SpamBrain di identificare “comportamenti dirompenti e dannosi tra miliardi di pagine Web ci ha permesso di mantenere oltre il 99% delle ricerche libere da spam” – un risultato che, in verità, era stato già rivendicato per la prima volta nel Webspam Report 2019.

Più in dettaglio, nel corso del 2021 SpamBrain ha identificato un numero di quasi sei volte maggiore di siti spam rispetto al 2020 (quando già diceva di aver rilevato 40 miliardi di pagine di spam ogni giorno), e ciò ha comportato una notevole riduzione di hacked spam (-70%), che era uno dei tipi di spam più comunemente osservato nel 2020, e di gibberish spam sulle piattaforme hosting (-75%). In tutto l’anno, nel complesso, Google è riuscito a rilevare 200 volte più siti spam nel 2021 rispetto a quando ha avviato la sua battaglia, quasi due decenni fa.

Le attività di SpamBrain e l’impegno antispam di Google

Gli altri fronti della battaglia di Google riguardano la protezione della qualità della ricerca e della sicurezza degli utenti, e secondo il report nel 2021 sono stati compiuti progressi significativi anche in queste aree diverse dallo spam web tradizionale, e in particolare nella lotta contro link spam, truffe e molestie online.

Nel primo caso, sta dando i suoi frutti il link spam update partito a luglio 2021 “per identificare ampiamente i link non naturali e impedire che influiscano sulla qualità della ricerca”, in modo da proteggere i link, che restano un segnale fondamentale per Google nello “scoprire e classificare i risultati in modo significativo”.

Grande attenzione anche contro le truffe, che restano una grande minaccia per la sicurezza degli utenti online: espandendo il lavoro del 2020, Google ha lanciato diversi aggiornamenti dell’algoritmo che hanno portato a una riduzione del 40% dei risultati truffaldini e il miglioramento della copertura “ci ha permesso di proteggere le persone da molti altri tipi di truffa, oltre alle richieste di assistenza clienti che abbiamo combattuto negli ultimi anni”.

Inoltre, sempre per proteggere la sicurezza degli utenti, Google ha esteso l’azione di SpamBrain “per affrontare le molestie online e, per le query sui nomi, ridurre l’importanza dei siti con pratiche di rimozione di sfruttamento” – e, quindi, Kwok rivela che SpamBrain è l’algoritmo al lavoro contro i siti predatori dallo scorso giugno.

Ridurre gli effetti della manipolazione del ranking

Oltre allo spam, Google continua a essere impegnato “duramente anche per ridurre i contenuti di bassa qualità e le manipolazioni del ranking“, combattendo comportamenti che si mantengono proprio al limite dalle violazioni delle linee guida sulla qualità, ma “sono comunque di natura manipolativa e degradano l’esperienza dell’utente”.

Ad esempio, prosegue l’articolo, un aspetto di questa iniziativa è stato quello di migliorare il ranking delle query di recensione dei prodotti, in cui i contenuti “spesso consistevano in descrizioni dei prodotti riscritte e non in recensioni di prima mano e autentiche”. Come sappiamo, nel 2021 ci sono stati due sostanziali aggiornamenti al modo in cui il motore di ricerca valuta le recensioni dei prodotti in inglese (e uno anche in questo 2022, proprio qualche settimana fa), che hanno comportato una significativa riduzione delle recensioni di bassa qualità, promuovendo al contempo quelle che vantavano contenuti e competenze migliori.

In definitiva, Kwok ricorda e ribadisce che l’impegno di Google è “assicurare che nulla ostacoli le persone a trovare i contenuti più utili tramite la Ricerca” e, grazie a SpamBrain, sembra che questo obiettivo sia a portata di mano. È pur vero che alcuni siti possano ancora farla franca con alcune tattiche di spam o di black hat SEO, ma le notizie di oggi e i numeri del Webspam Report ci confermano che Google testa costantemente nuovi metodi per rilevare e impedire a quei siti (e a tanti altri) di posizionarsi in alto nella ricerca di Google con tecniche illecite e ingiuste.