Ritrovarsi senza alcuna indicazione in una complessa rete di una metropolitana, con le sue molteplici linee che si intrecciano e si diramano in diverse direzioni: questo è il rischio in cui possono ricadere i crawler dei motori di ricerca quando si affacciano per la prima volta sul nostro sito in assenza di una mappa adeguata. Ed è per risolvere questo rompicapo che può essere utile impostare una sitemap XML, che funziona appunto come la mappa di una metropolitana per i motori di ricerca, mostrando le diverse “linee” o percorsi che i crawler possono seguire per navigare tra le pagine del sito, dove ogni “stazione” rappresenta una pagina web e le “connessioni” tra le stazioni sono i link che permettono di passare da una pagina all’altra. Chiarire la struttura di un sito web ai motori di ricerca è un compito semplificato dall’uso di una sitemap ben impostata, e Google ci offre 3 semplici suggerimenti per ottenere il massimo dalle nostre sitemap, consentire alla Ricerca Google di conoscere tutte le nostre pagine e “salire e scendere” nelle stazioni giuste!
I 3 suggerimenti di Google per fare sitemap efficaci
Una sitemap ben organizzata può ottimizzare il processo di indicizzazione e garantire che tutte le sezioni e i contenuti del sito vengano scoperti e correttamente inseriti nell’Indice di Google. In estrema sintesi, è semplicemente un elenco di pagine di un sito web accessibili ai crawler e serve letteralmente a guidare i crawler attraverso le pagine del sito, indicando quali sono disponibili per l’indicizzazione.
Non tutti i siti ne hanno in realtà bisogno, come ricorda Martin Splitt nel nuovo appuntamento con “SEO Made Easy” su Youtube dedicato a questo tema, perché i siti “piccoli” (ma non c’è una soglia specifica, neppure nelle documentazioni ufficiali di Google) sono solitamente trovati e indicizzati completamente, ma ad ogni modo ci sono alcuni vantaggi nel creare sitemap che possono estendersi anche a loro.
Per la precisione, è ancora Splitt a dire che una sitemap in formato XML può aiutare i motori di ricerca a conoscere tutte le pagine del sito, scoprire le nuove pagine più velocemente, eseguire la scansione del sito in modo più efficiente e, non ultimo, a riconoscere rapidamente i cambiamenti effettuati.
Ci sono in particolare tre suggerimenti rapidi per ottenere il massimo dalle Sitemap, ovvero fare una selezione strategica delle pagine da includere ed elencare prioritariamente gli URL che ci interessano davvero che siano indicizzati, assicurandoci che siano canonici, indicizzabili e indirizzati a contenuti pertinenti e validi; usare lastmod in modo responsabile per aiutare i crawler a capire quando ripetere la scansione di un URL per nuovi contenuti; suddividere le sitemap diventate troppo grandi in file più piccoli.
Le best practices per la gestione della sitemap
Entriamo nel dettaglio dei suggerimenti di Google per impostare una sitemap efficace e realmente utile.
- Scegliere strategicamente quali URL includere
L’obiettivo di questo file, e in generale il nostro desiderio, è consentire ai motori di ricerca di eseguire in modo efficiente la scansione del sito e scoprire le pagine: per questo, dovremmo includere nella Sitemap solo URL canonici indicizzabili e, preferibilmente e principalmente, quelli che riteniamo strategici e che quindi devono veramente “essere presenti nei risultati di ricerca”. Questi contenuti possono essere articoli, video, immagini o qualsiasi tipo di pagina web.
URL che reindirizzano altrove o sono contrassegnati come noindex non sono molto utili nella sitemap, specifica Splitt.
- Utilizzare lastmod in modo responsabile
Il consiglio successivo è di fare attenzione a quando segnalare una modifica, utilizzando in modo responsabile l’elemento <lastmod> – che indica la data dell’ultima modifica eseguita sul file a cui si riferisce il link – per indicare a Google che è necessario ripetere la scansione di un URL.
Secondo Splitt, dovremmo procedere con la modifica di lastmod solo quando ci sono cambiamenti significativi, in modo che quando il crawler passa su questi URL troverà effettivamente contenuti nuovi e aggiornati. In caso contrario, la pianificazione della scansione potrebbe considerare inutili le voci lastmod e i crawler potrebbero ignorarle in futuro.
- Gestire molti URL
Ultimo ma non meno importante, i file XML della mappa del sito hanno dei limiti, ovvero 50 megabyte o 50.000 URL in un singolo file.
Se il nostro sito supera questo limite, dice Splitt, il primo passo è chiederci se davvero abbiamo bisogno di tutti questi URL nella sitemap e quanto è probabile che vengano tutti indicizzati. Ma se verifichiamo che sono davvero tutti utili, c’è comunque una possibilità per superare il limite: dividere la mappa del sito in più file, organizzati per categoria o tipo di contenuto, per rendere la sitemap più gestibile e aiuta i motori di ricerca a processare le informazioni in modo più efficiente.
Questo processo è utile anche quando eseguiamo il debug di problemi con la sitemap, perché gli URL problematici potrebbero essere contenuti in un unico file e procedere con la suddivisione può aiutarci a restringere il problema.
Altri piccoli suggerimenti per le sitemap
Chiudiamo questa rapida guida con altri semplici consigli per creare una sitemap XML.
Come detto, non tutte le pagine sono uguali: alcune sono fondamentali per la comprensione del sito, mentre altre potrebbero essere meno rilevanti o addirittura duplicati che non dovrebbero neppure essere indicizzati. È qui che entra in gioco un lavoro preventivo di analisi della struttura del sito, identificando le pagine più cruciali, quelle che devono essere visibili.
Inoltre, la personalizzazione è fondamentale: la frequenza di aggiornamento delle pagine deve riflettere la realtà dei contenuti e le priorità assegnate agli URL devono essere indicative della loro importanza all’interno della struttura del sito.
Anche la manutenzione della sitemap è un aspetto che non deve essere trascurato: quando aggiungiamo di nuove pagine o rimuoviamo quelle vecchie sul sito, la sitemap deve essere aggiornata per riflettere questi cambiamenti. Una sitemap obsoleta può portare a una cattiva esperienza per l’utente e a inefficienze nell’indicizzazione da parte dei motori di ricerca.
In definitiva, la sitemap è un elemento di comunicazione essenziale tra il sito web e i motori di ricerca, e un file ben impostato e mantenuto può fare la differenza nella visibilità online, assicurando che i contenuti siano non solo trovati, ma anche compresi e valutati correttamente dai motori di ricerca, guidati in modo opportuno a “sapere dove eseguire la scansione di cosa”, come chiosa Martin Splitt.