Dopo 314 giorni, ovvero 10 mesi e 10 giorni, arriva il nuovo aggiornamento per le quality raters guidelines di Google, ovvero le linee guida che il motore di ricerca sottopone ai suoi quality raters per indirizzarne il lavoro di valutazione delle SERP. Stando alle prime letture, non ci dovrebbero essere interventi o modifiche particolarmente rilevanti, ma è comunque utile scoprire quali sono le sezioni aggiornate, così da avere un quadro generale su ciò che per Google è importante ritrovare nei risultati di ricerca.

Quality raters, linee guida aggiornate il 14 ottobre 2020

La precedente versione delle linee guida per i valutatori esterni di Google risaliva al 5 dicembre 2019 e, come dicevamo anche nel nostro articolo, sottolineava l’importanza di escludere pregiudizi personali nel corso delle analisi dei risultati per fornire agli utenti le risposte oggettivamente migliori.

A distanza di quasi un anno – e che anno, questo 2020! – Google ha quindi messo mano al documento PDF e, in data 14 ottobre 2020, ha pubblicato la nuova versione aggiornata e ampliata, che passa da 168 pagine a 175 pagine.

https://static.googleusercontent.com/media/guidelines.raterhub.com//en/searchqualityevaluatorguidelines.pdf

Tra le novità più utili c’è l’introduzione di un change log, un registro delle modifiche che riporta i principali interventi e cambiamenti effettuati – al momento, nell’arco temporale di due anni, dall’ottobre 2018 alla data odierna.

Cosa cambia con la nuova versione

Barry Schwartz su Search Engine Land e su Seroundtable ha studiato rapidamente le principali novità delle nuove linee guida, almeno dal punto di vista per così dire strutturale. Grazie all’analisi attraverso uno scanner, ha trovato “281 modifiche sostitutive del contenuto, 233 inserimenti di contenuto e 209 eliminazioni di contenuti, la maggior parte dei quali sembra stilistica”.

Più specificamente, ha notato che Google ha aggiunto una sezione per spiegare il ruolo degli esempi in queste linee guida, ha anche spostato la posizione della sezione sulla relazione tra la qualità della pagina e le esigenze soddisfatte e ha anche aggiunto una sezione per valutare i risultati di dizionari ed enciclopedie per query diverse.

Le novità dell’ultima versione delle quality raters guidelines

Guardando il change log abbiamo qualche informazione in più nelle modifiche apportate al documento. Google ha:

  • Aggiunto una nota per ribadire che le valutazioni non influiscono direttamente sull’ordine e sul posizionamento dei risultati di ricerca.
  • Sottolineato “Il ruolo degli esempi in queste Linee guida” come sezione indipendente nell’introduzione.
  • Aggiunto un chiarimento sugli Special Content Result Blocks, i Blocchi di risultati di contenuti speciali, che possono avere collegamenti a landing page, inserendo anche un esempio illustrativo.
  • Aggiornato le indicazioni su come valutare le pagine con avvisi di malware e quando assegnare il flag Did Not Load (non caricato), inserendo esempi illustrativi.
  • Modificato l’ordine di paginazione delle sezioni Rating Flags (contrassegni di valutazione) e Relationship between Page Quality and Needs Met (relazione tra la qualità della pagina ed esigenze soddisfatte) per dare maggiore chiarezza.
  • Aggiunto la sezione Rating Dictionary and Encyclopedia Results for Different Queries (Valutazione di dizionari ed enciclopedie per query diverse), in cui sottolinea l’importanza di comprendere il search intent e la query per la valutazione dei bisogni soddisfatti, aggiungendo esempi illustrativi.
  • Apportato cambiamenti minori in tutto il documento, come esempi aggiornati e spiegazioni per la coerenza; ha semplificato il linguaggio per spiegare ai valutatori cosa rappresentano per le persone nella loro località; corretto errori di battitura, eccetera.

La sezione per le valutazioni di dizionari ed enciclopedie

Come detto, la parte più nuova riguarda le indicazioni per le valutazioni dei risultati per query afferenti a dizionari o enciclopedie rispetto alla soddisfazione degli intenti e delle esigenze degli utenti.

Le linee guida dicono che “quando si assegnano le valutazioni Needs Met per i risultati del dizionario e dell’enciclopedia, è necessario prestare particolare attenzione all’intento dell’utente”.

Come per tutte le altre query e per tutti i risultati, sottolinea Google, “l’utilità dei risultati del dizionario e dell’enciclopedia dipende dalla query e dall’intenzione dell’utente”. In particolare, “i risultati di dizionari ed enciclopedia possono essere rilevanti per l’argomento (topically relevant) per molte ricerche, ma spesso questi risultati non sono utili per parole comuni che la maggior parte delle persone nella tua area locale di valutazione già comprende”.

Pertanto, l’indicazione è di “riservare elevati Needs Met ratings per i risultati del dizionario e dell’enciclopedia [solo] quando l’intenzione dell’utente per la query è verosimilmente che cosa è o che cosa significa e il risultato è utile per gli utenti che cercano quel tipo di informazioni“.

L’importanza delle valutazioni e le statistiche aggiornate

Come sappiamo (e come Google ci tiene a sottolineare a ogni ripresa), i quality raters non influenzano direttamente il ranking dei risultati sul motore di ricerca, ma svolgono un lavoro utile per migliorare la qualità delle SERP e garantire che gli utenti trovino le risposte che davvero cercano e che soddisfano il loro intento.

In pratica, forniscono un feedback che aiuta Google a migliorare i suoi algoritmi – e, come abbiamo notato in varie circostanze, gli aggiornamenti delle linee guida precedono di poco dei broad core update, senza però voler ipotizzare un collegamento tra questi due fattori, ma semplicemente segnalando una “coincidenza”.

Di recente, Google ha aggiornato anche le statistiche sul lavoro dei suoi quality raters, come notato da Jennifer Slegg su The Sem Post, per riflettere le modifiche apportate nel 2019 ai risultati di ricerca.

I numeri del lavoro dei quality raters

Nel 2019, Google ha eseguito 464.065 esperimenti con i valutatori di qualità di Google, che hanno portato a 3620 “miglioramenti alla ricerca”: questo significa innanzitutto un numero significativamente inferiore di esperimenti rispetto al 2018 (quando furono 654.680), ma curiosamente miglioramenti più effettivi dei risultati (nel 2018 ne furono menzionati 3234), mentre nel 2017 sono stati 200.000 esperimenti che hanno portato a 2400 aggiornamenti.

Più nel dettaglio, Google ha rivelato di aver eseguito 383.605 test di qualità nel 2019 con i propri valutatori, altro risultato significativamente ridotto rispetto al 2018 (595.429 test). Questi test di qualità sono generalmente eseguiti da Google per garantire che i risultati di ricerca mostrino i risultati della massima qualità, in base ai risultati di ricerca complessivi e ai siti o alle pagine che compaiono nelle prime posizioni delle SERP.

Esperimenti syde-by-side e live traffic

Uno dei modi in cui i quality raters valutano i risultati della ricerca è una sorta di test A/B: visualizzano un doppio pannello nell’hub, che riporta da un lato (random) i risultati della ricerca correnti e, dall’altro lato, un potenziale aggiornamento applicato ai risultati della ricerca. I raters devono fornire un giudizio su entrambe le versioni e valutare quale lato ritengono fornire i migliori risultati di ricerca, non limitandosi ai tradizionali “dieci link blu” ma anche ai risultati complessivi, che includono le varie features Google che, come abbiamo analizzato qualche giorno fa, sono sempre più predominanti e tolgono spazio e visibilità ai risultati organici.

Inoltre, sempre nel 2019 Google ha condotto 17.523 esperimenti sul traffico in tempo reale (questa volta in aumento rispetto ai 15.096 dell’anno precedente): si tratta di esperimenti che vengono testati con ricercatori in tempo reale, in cui si vedono “cose come colori, bordi e dimensioni dei caratteri diversi utilizzati nei risultati di ricerca su una base molto limitata, per capire come reagisce il pubblico in generale”. Google abilita questi tipi di funzionalità a una piccola percentuale di utenti, “di solito a partire dallo 0,1 per cento”, e in alcuni casi questi test live apportano modifiche “così minori che non si notano, come le 41 tonalità di blu testate da Google diversi anni fa”, ricorda Slegg.