Una cosa o un concetto che è singolare, unico, ben definito e distinguibile: questa è la definizione di entità per Google, uno dei fronti su cui si sta muovendo l’evoluzione del motore di ricerca e dei suoi algoritmi, sempre più capaci di analizzare il linguaggio naturale e prendere in considerazione il significato semantico delle query degli utenti. E le entities sono al centro di questo processo, perché sono i nodi intorno a cui Google può comprendere le relazioni tra i vari termini, i bisogni espressi dagli utenti e il contesto in cui queste entità esistono e si intrecciano. Per questo motivo, lavorare all’ottimizzazione delle entità nei nostri contenuti è uno dei fronti verso cui orientare l’attività SEO, superando i vecchi concetti di keyword.

La comprensione delle entità e la SEO

È almeno dal 2013, prima con l’introduzione dell’algoritmo Hummingbird e poi successivamente con RankBrain, che Google ha virato su un diverso approccio per capire il significato e l’argomento trattato in una pagina web, basandosi non più soltanto e semplicemente sulle keyword, ma sull’analisi dei concetti contenuti in un testo.

Questo è diventato ancora più evidente negli ultimi anni, con l’introduzione di Google BERT e, storia recente, di Google MUM, due tecnologie basate su intelligenza artificiale applicate alle SERP, che riescono a comprendere meglio il linguaggio degli utenti e analizzare in profondità le loro richieste e i loro bisogni, andando al di là del significato letterale della query (intesa come stringa di caratteri o di parole) per identificare l’intenzione.

E non bisogna poi dimenticare l’incremento costante dei dati strutturati e dei markup schema.org, i pezzi di informazione che forniamo attraverso le nostre pagine per consentire ai crawler di comprendere meglio i contenuti e, appunto, le entità e le relazioni presenti.

Tutto questo aiuta i motori di ricerca a offrire agli utenti risultati maggiormente on-topic, incentrati sulle reali intenzioni, con possibili spunti di approfondimento (si veda anche la crescita esponenziale dei box Le persone chiedono anche nelle SERP), ma soprattutto di ridurre gli equivoci e minimizzare i risultati fuori fuoco.

A cosa servono le entità

A livello generale, entità può essere una persona, un luogo, un concetto, una cosa concreta, e quindi in pratica tutto ciò che possiamo rappresentare dal punto di vista linguistico; per Google, è il modo in cui cerca di addestrare i suoi algoritmi a capire il linguaggio in maniera naturale, come facciamo noi in maniera automatica (si perdoni il gioco di parole).

Possiamo pensare a queste entità semantiche come a insiemi di parole correlate tra loro, che risultano molto frequenti nei contenuti che trattano di un determinato argomento o concetto e trasferiscono i significati solitamente associati a una keyword: notando queste relazioni e correlazioni, le macchine riescono a digerire e comprendere il significato del concetto.

L’algoritmo non cerca e analizza una semplice keyword, dunque, ma un’ampia gamma di informazioni interrelate, attraverso cui elabora una risposta dettagliata e approfondita alla richiesta dall’utente. Queste entità sono archiviate e raggruppate nel Knowledge Graph di Google, il grafo della conoscenza che rappresenta, appunto, la rete di informazioni e dati attraverso il web e fornisce ai motori di ricerca un contesto preciso in cui inserire la scansione di una pagina e di un sito.

Proprio il contesto diventa quindi un concetto cruciale, la variabile chiave per stabilire il grado di rilevanza di un contenuto a fronte di una determinata ricerca, e di conseguenza per comprendere l’intento della persona e rimuovere l’ambiguità sui contenuti che scopre.

Stiamo parlando, di nuovo, di SEO semantica, capace di andare oltre alle semplici stringhe di caratteri della query per focalizzarsi sull’intent dell’utente, e che intercetta la direzione intrapresa dai motori di ricerca, che oggi non premiano più contenuti con tante parole chiave o che si rifanno a parametri quali keyword density e affini, ma le pagine che sanno rispondere alle esigenze di informazione e di intrattenimento delle persone.

Il database delle entità di Google

Sulla scia delle considerazioni di vari analisti, che si basano anche sullo studio dei più recenti brevetti originali di Mountain View, possiamo ipotizzare che Google stia costruendo e sviluppando il suo database di entità (che qualche tempo fa contava circa 5 miliardi di entità e oltre 500 miliardi di proprietari di entità) utilizzando due metodi distinti, copiare entities esistenti e scoprirne nuove, come suggerisce anche Andrea Giudice.

Nel primo caso, il motore di ricerca individua entità già note (grazie a fonti affidabili quali Wikipedia e Imdb, ad esempio) e le allinea al mondo reale: lo svantaggio è che i tempi per la segnalazione di nuove entity o l’aggiornamento delle vecchie dipende dalle fonti, e quindi Google dipende da loro per fornire contenuti rilevanti.

Per superare questo limite, il gruppo ha brevettato alcuni metodi per scoprire nuove entità da dati non strutturati disponibili sul Web, impiegando due diverse strategie. In particolare, il motore di ricerca può usare utilizzare entità note e verificare, tramite la sintassi o altri segnali (ad esempio, la comparsa frequente in documenti sullo stesso tema), se sono collegate a entità sconosciute da tenere in considerazione. Un altro metodo misura il valore di un’entità rispetto alla dimensione del suo ambito, da cui consegue che è più facile diventare un’entità autorevole in un campo ristretto rispetto a emergere in un settore ampio.

Perché lavorare sull’ottimizzazione SEO delle entità?

Lo dicevamo già tempo fa con la provocazione “la keyword non esiste“: la tendenza attuale dei motori di ricerca è superare i limiti imposti dalla sola comprensione (e ricerca) delle parole chiave, andando piuttosto a individuare i topic e il contesto attivato da quelle keyword. In questo modo, si superano le criticità tipiche delle parole chiave, che possono essere troppo letterali e artificiose e portare ambiguità, quando ad esempio lo stesso termine si riferisce a concetti diversi, e solo un’analisi approfondita del contesto può appunto risolvere i dubbi.

E così, Google e gli altri motori di ricerca vanno sempre più nella direzione di esaminare la combinazione di parole chiave in una query e, grazie alle entità, arrivare a comprendere quale contenuto è pertinente grazie a un’analisi delle pagine che non si basa più sulla semplicistica coincidenza dell’argomento con le parole chiave – motivo per cui, ormai da tempo, ripetiamo che è necessario lavorare per ampliare i nostri contenuti ed estendere il campo semantico delle keyword con altri termini correlati, appartenenti alla stessa entità e allo stesso intent, che aiutano i crawler a definire e capire meglio il contesto.

Come implementare le entità

L’implementazione delle entità sui contenuti comporta una serie di sfide, perché sta cambiando l’infrastruttura tecnica e il vocabolario di schema.org è costantemente aggiornato: ciò impone quindi di impostare monitoraggio e manutenzione costanti per garantire che i dati strutturati aggiunti siano efficaci e privi di errori.

Il primo passo è creare e rafforzare una brand identity per il nostro marchio o per noi stessi, cercando di entrare nel grafo della conoscenza di Google attraverso un knowledge panel personale o di brand; per un’attività, poi, è cruciale attivare un Profilo dell’Attività (ex Google My Business) che, pur non rendendo automaticamente il brand un’entità è comunque un passaggio utile, perché Google utilizzerà questa scheda per apprendere informazioni credibili e creare collegamenti tra il sito e le altre entità locali.

Fondamentale è poi l’utilizzo di dati strutturati, che possono comunicare ai crawler quali parti del contenuto sono entità e con quali attributi. Ad esempio, lo schema aziendale locale può servire a collegare un’attività ad altre entità geografiche vicine, aumentandone la visibilità nella ricerca locale; altri markup come organizzazione, persona e autore possono invece aiutare a creare connessioni tra entità sullo stesso sito web, ma anche in altri domini, rafforzando il concetto di “rete”.

Sul pratico, poi, possiamo controllare di includere entità pertinenti ai nostri contenuti ogni volta che pubblichiamo un articolo, ricercando le altre entità sia attraverso il sistema di Ricerca (sfruttando ad esempio i suggerimenti visualizzati negli altri risultati per capire quali topic e temi Google vede come correlati all’argomento principale del nostro contenuto), sia attraverso le pagine di Wikipedia o altri strumenti del genere, che mettono in relazione le entità note.

Content strategy e ottimizzazione delle entità

In conclusione, non è più possibile ignorare il peso crescente che le entità hanno e avranno sulla SEO, sia per la scansione dei motori di ricerca che per i nostri stessi contenuti.

Ciò impone anche di modificare l’approccio alla content strategy: attualmente, per una strategia solida bisogna considerare (quanto meno) il volume complessivo delle ricerche effettuate e l’intent che Google sceglie di visualizzare con i risultati delle query utilizzando i suoi algoritmi. Ma dobbiamo studiare quali sono le feature che compaiono in SERP e che tipo di visibilità hanno, perché spesso superano il vecchio posizionamento via link.

In questo senso, l’ottimizzazione delle entità attraverso schema e dati strutturati offre un’opportunità di superare i competitor che sono ancora fossilizzati sulla corsa alla vecchia keyword, perché con questi metadati possiamo aiutare lo sforzo di Google di mappare il contenuto del mondo (virtuale e non) e rendere più facile per il motore di ricerca comprendere il contenuto della nostra pagina web e riconoscere le entità e la loro relazione tra loro. Se riusciremo a comunicare con precisione maggiore al crawler di cosa tratta esattamente il contenuto della pagina web, semplificando la sua indicizzazione tecnica, il motore di ricerca potrà selezionare più rapidamente e con più certezza tali contenuti per una query corrispondente, posizionandolo in alto in SERP o mostrando ad esempio il risultato come un rich snippet che può attirare gli utenti online.