I nostri approfondimenti oggi ci portano ad affrontare un tema apparentemente semplice, eppure spesso sottovalutato: che cos’è una sitemap e perché può essere utile comunicarla a Google e agli altri motori di ricerca?

Che cos’è una Sitemap

La definizione di sitemap è facile: è un file che contiene tutti gli URL di un sito, elencati secondo una gerarchia impostata in fase di creazione. Inizialmente, il senso della sitemap era agevolare la navigazione degli utenti, come una vera mappa del sito, ma la sua utilità si estende anche all’attività di scansione e indicizzazione da parte dei crawler dei motori di ricerca.

A cosa serve la Sitemap

Grazie alla sitemap, un crawler dei motori di ricerca come Googlebot può eseguire una scansione più efficiente del sito perché ha a disposizione una panoramica dei contenuti disponibili, con indicazioni delle risorse presenti e sul percorso per raggiungerle.

In linea di massima, i web crawler riescono a trovare la maggior parte dei contenuti se le pagine di un sito sono collegate in modo corretto: usare una mappa è un sistema sicuro per consentire ai motori di ricerca di comprendere più velocemente e in modo preciso l’intera struttura del sito.

L’utilità della Sitemap in Google

Il file della mappa consente infatti ai webmaster di sottoporre le pagine dei siti disponibili per la scansione e fornire informazioni ai crawler sulle pagine stesse e sulle risorse presento sul sito, evidenziando come accennato le gerarchie e le correlazioni tra i vari elementi; inoltre, contiene anche dettagli precisi sulle pagine come data dell’ultimo aggiornamento, frequenza di modifica ed eventuali versioni in altre lingue delle pagine.

Cosa dice il protocollo sitemapI formati di Sitemap

Sono essenzialmente due i formati di Sitemap più utilizzati: il primo è il file Sitemap HTML, più vecchio e usato anche per facilitare la navigazione degli utenti e dunque migliorare la user experience. Più specifico il formato Sitemap XML, inventato da Google nel 2005 (e chiamato allora Google Sitemaps) e poi adottato anche da altri motori di ricerca: esiste un vero e proprio protocollo, regolamentato dalla Attribution-ShareAlike Creative Commons License, e questo ha reso possibile l’estensione della mappa anche agli altri motori di ricerca.

A questi due tipi bisogna aggiungere per completezza anche le tipologie speciali di sitemap, che sono correlate ai contenuti presenti e dunque specifiche per siti per immagini, per video e per notizie.

Esempio di una sitemap

Che cos’è la Sitemap XML

La guida di Google per i webmaster contiene una voce sulle Sitemap XML, che sono definite come “un file XML contenente gli URL di un sito insieme ai rispettivi metadati” associati, vale a dire importanza rispetto agli altri URL del sito, frequenza generale delle modifiche o data dell’ultimo aggiornamento, che permette “ai motori di ricerca di eseguire la scansione del sito in modo più efficiente”. Grazie a questo sistema, anche i siti dinamici possono fornire URL corretti e assicurarsi una indicizzazione più intelligente.

I limiti delle Sitemap

Ci sono due requisiti fondamentali da rispettare: tutti i formati di Sitemap non possono superare il limite di 50 MB e 50.000 URL. Se il proprio sito ha un file di dimensioni maggiori o contenente più URL sarà necessario suddividere l’elenco in varie Sitemap o creare un unico file Indice Sitemap (che racchiude un elenco di mappe) da sottoporre a Google.

Uso di Sitemap e indicizzazione delle pagine

È sempre Google a chiarire con precisione alcuni aspetti su questo tema: innanzitutto, “l’utilizzo del Protocollo Sitemap non garantisce l’inclusione delle pagine web nei motori di ricerca”, e quindi non c’è certezza che le pagine presenti nel file della mappa siano tutte poi effettivamente indicizzate, perché Googlebot agisce secondo i propri criteri e rispettando i propri algoritmi complessi, che non sono influenzati dalla Sitemap.

Uso di Sitemap e posizionamento su Google

Anche sul posizionamento ci sono delle informazioni utili: la Sitemap non influisce sul ranking delle pagine di un sito nei risultati di ricerca, ma la priorità assegnata a una pagina attraverso la Sitemap potrebbe potenzialmente rappresentare un fattore di ranking.

Perché usare le Sitemap per Google

Dopo queste premesse, a che serve in concreto usare una Sitemap? Ovviamente, tutti i siti possono beneficiare di una scansione migliore, ma ci sono casi particolari in cui Google consiglia vivamente di usare questi file. Innanzitutto, siti molto grandi devono usare la Sitemap per comunicare le pagine nuove o aggiornate di recente ai crawler, che altrimenti potrebbero trascurare la scansione di queste risorse; ancor più utile la mappa se il sito ha molte pagine di contenuti isolate o non ben collegate, che rischiano quindi di non essere considerate da Google.

I siti che devono usare la Sitemap

La Sitemap è consigliata poi per i siti nuovi e con pochi backlink in ingresso: in questo caso, Google e il suo crawler potrebbero avere difficoltà a trovare il sito perché non si evidenziano percorsi tra i link del Web. Infine, si invita a usare la mappa se il sito “utilizza contenuti multimediali, viene visualizzato in Google News o utilizza altre annotazioni compatibili con le sitemap”, aggiungendo che se “appropriato, Google può prendere in considerazione altre informazioni contenute nelle Sitemap per utilizzarle ai fini della ricerca”.

Come creare una Sitemap

Per generare una Sitemap bisogna innanzitutto decidere quali pagine del sito si desidera indicare e sottoporre a scansione da parte di Google, stabilendo la versione canonica di ogni pagina. Il secondo passaggio è la scelta del formato Sitemap da utilizzare, per poi mettersi all’opera con editor di testo o software appositi, oppure affidarsi a un’alternativa più facile e veloce, alla portata di tutti.

Creare una mappa con Sitemap Generator

Se infatti i più esperti possono creare manualmente il file, in Rete si trovano molte risorse che consentono di generare sitemap in automatico: su Google è presente addirittura una pagina che elenca i Web Sitemap generator, suddivisi per “server-side programs”, “CMS and other plugins”, “Downloadable Tools”, “Online Generators/Services”, “CMS with integrated Sitemap generators”. Inoltre, sono segnalati anche gli strumenti per generare sitemap per Google News e “Code Snippets/Libraries”.

Qualunque sia la scelta, è fondamentale mettere subito la Sitemap creata a disposizione di Google, aggiungendola al file robots.txt o inviandola direttamente alla Search Console.

I vantaggi della Sitemap

In definitiva, dunque, usare una Sitemap è un metodo per facilitare la vita dei crawler e per fornire una mappa dei contenuti del proprio sito a Googlebot. Pur non garantendo che gli elementi indicati siano poi effettivamente scansionati e indicizzati, si consiglia di usare sempre una Sitemap perché “nella maggior parte dei casi l’esistenza di una Sitemap costituisce comunque un vantaggio per il tuo sito e non verrai mai penalizzato per il fatto di averne una”, come dice Google.