Un semaforo rosso e un segnale di “cedere il passo” o “dare la precedenza”: questo è ciò che rappresentano il noindex e il nofollow per i crawler dei motori di ricerca. Più precisamente, la prima direttiva blocca l’indicizzazione e impedisce ai motori di ricerca di procedere, mentre l’attributo nofollow li invita a “cedere il passo“, continuando senza dare valore ai link incontrati. Tutto chiaro? Non sempre lo è, in realtà, perché spesso i webmaster non sanno bene come gestire il noindex e il nofollow, confondendo i modi e i casi di utilizzo fino a provocare veri e propri errori SEO. È il momento di approfondire quindi cosa sono esattamente questi comandi, quando e come dovremmo utilizzarli e come possiamo distinguere tra i due.
Cosa sono noindex e nofollow
Noindex e nofollow sono due delle direttive più influenti in ambito SEO, comandi che hanno il potere di guidare i motori di ricerca nel modo in cui interagiscono con il contenuto di un sito.
Per la precisione, il noindex è un meta tag che si inserisce nell’header HTML di una pagina per comunicare ai motori di ricerca di non includere quella specifica pagina nell’indice dei risultati di ricerca. Questo comando è cruciale quando si hanno pagine che si desidera non siano trovate tramite la ricerca, come pagine in fase di sviluppo, contenuti duplicati o informazioni riservate.
Il termine nofollow ha in realtà due accezioni e applicazioni: è sia un valore del meta tag robots che un attributo relazionale applicato ai singoli link (anchor tags). In entrambi i casi, comunque, serve per dire ai motori di ricerca di non seguire (in inglese “no follow” significa letteralmente non seguire) quel particolare link o di non passare il PageRank. Classicamente il nofollow è stato usato per etichettare link a contenuti di cui non si garantisce la qualità o per link pubblicitari, dove il passaggio del PageRank potrebbe essere interpretato come un tentativo di manipolare i risultati di ricerca (anche se ora è più opportuno utilizzare l’attributo sponsored).
Quando parliamo di nofollow come meta tag robots, ci riferiamo a una direttiva che viene inserita nell’header di una pagina web: questo tag ha un impatto su tutti i link presenti nella pagina, dicendo ai motori di ricerca di non seguire nessuno dei link in uscita. Questo approccio è utile quando si desidera applicare una politica uniforme a tutti i link della pagina, come potrebbe essere il caso di una pagina che contiene molti link pubblicitari o di affiliazione.
Dall’altro lato, il nofollow come attributo del link è più selettivo, perché si applica direttamente all’elemento anchor (il tag <a>) di un link specifico e indica ai motori di ricerca di non seguire quel singolo link. È uno strumento prezioso quando si vuole prevenire il trasferimento di PageRank o autorità a un sito specifico, o quando si vuole inserire un link ma non vogliamo che influenzi il ranking del sito di destinazione.
Quali sono le differenze tra noindex e nofollow
NoIndex e NoFollow hanno un’utilità diversa.
Il Noindex serve per indicare a un motore di ricerca di non memorizzare la pagina web per visualizzarla nei risultati di ricerca, e quindi evita l’indicizzazione (anche di risorse precedentemente “note” a Google).
Il Nofollow serve a indicare ai crawler dei motori di ricerca di non seguire i collegamenti presenti sulla pagina. Quando il nofollow viene utilizzato come meta tag robots all’interno dell’header di una pagina web, si applica a tutti i link in uscita presenti sulla pagina, sia che si tratti di link esterni (che puntano a un altro dominio) sia di link interni (che puntano alla stessa proprietà web).
Quando usare le direttive
Il noindex è la scelta giusta quando si ha una pagina che non vogliamo far apparire nei risultati di ricerca. Questo può includere pagine di ringraziamento post-conversione, pagine di politica sulla privacy o pagine specializzate che non aggiungono valore in termini di ricerca. Utilizzare il noindex in modo strategico aiuta a mantenere l’indice dei motori di ricerca pulito e focalizzato sui contenuti che si desidera promuovere.
Il nofollow dovrebbe essere utilizzato quando non vogliamo associare il nostro sito a quello linkato o quando non vogliamo influenzare il ranking di ricerca con link esterni. Ad esempio, i commenti degli utenti su un blog possono includere link che il proprietario del sito non può verificare, quindi l’uso del nofollow aiuta a prevenire possibili problemi di qualità o di spam – anche se in questo caso potremmo usare il più specifico attributo UGC, che è stato introdotto proprio per etichettare i link presenti in sezioni del sito che ospitano User Generated Content.
In particolare, poi, l’uso contemporaneo di noindex nofollow su una pagina ha un impatto significativo sia sull’indicizzazione sia sul passaggio del PageRank, perché comunica ai motori di ricerca di non indicizzare il contenuto né di seguire il link. Questa scelta dovrebbe essere un’eccezione piuttosto che la regola, impiegata solo quando entrambe le azioni (non indicizzare e non seguire) sono chiaramente giustificate dalla strategia SEO.
Come usare le combinazioni di nofollow e noindex
L’utilizzo dei meta tag robots noindex e nofollow può essere combinato in diversi modi per comunicare ai motori di ricerca come trattare le pagine e i link in esse contenuti.
Per meglio dire, possiamo usare noindex e nofollow insieme o in modo separato: la scelta di utilizzare queste combinazioni dipenderà dagli obiettivi specifici e dalla strategia SEO del sito. È importante considerare attentamente l’effetto che ciascuna combinazione avrà sulla visibilità della pagina e sulla distribuzione dell’autorità all’interno e all’esterno del sito.
Ecco dunque le possibili combinazioni e le loro implicazioni:
- Noindex, Nofollow
<meta name=”robots” content=”noindex, nofollow”>
La combinazione noindex nofollow insieme è la scelta più restrittiva: indica ai motori di ricerca di non indicizzare la pagina (noindex) e di non seguire i link in essa contenuti (nofollow). Equivale all’utilizzo del (più raro) comando none. Utilizzare entrambe le direttive significa che la pagina non apparirà nei risultati di ricerca e i link presenti sulla pagina non contribuiranno al ranking di altre pagine, sia interne che esterne. Questo può essere utile per pagine di test o per contenuti che non si desidera siano scoperti o associati al proprio sito: ad esempio, potrebbe essere applicata a pagine di login, pagine di gestione interna o pagine temporanee come quelle di promozioni scadute. È anche utile durante lo sviluppo di nuove sezioni del sito che non sono ancora pronte per essere pubbliche o per pagine che contengono informazioni sensibili che non si desidera siano facilmente accessibili.
- Noindex, Follow
<meta name=”robots” content=”noindex, follow”> (o anche, più semplicemente, <meta name=”robots” content=”noindex”>)
Con questa combinazione, diciamo ai motori di ricerca di non includere la pagina nei loro indici (noindex), ma di seguire comunque i link in essa contenuti (follow, che può anche non essere esplicitato). Questa impostazione è utile quando vogliamo che i motori di ricerca non mostrino la pagina nei risultati di ricerca, ma desideriamo comunque che i link in uscita dalla pagina siano esplorati e che possano passare autorità ai siti collegati. Questo può aiutare a mantenere una struttura di link interna forte o a passare valore a pagine esterne ritenute importanti.
In concreto, questa combinazione è ideale per pagine che contengono link utili o di qualità che si desidera siano esplorati dai motori di ricerca, ma la cui contenuto della pagina stessa non deve essere indicizzato. Ad esempio, può essere adatta per pagine di ringraziamento post-conversione, che spesso contengono link a prodotti o servizi correlati, o per pagine che vogliamo rimuovere dai risultati di ricerca senza compromettere la struttura di link interni del sito. Un altro esempio potrebbe essere una pagina con contenuti stagionali o archiviati che non sono più rilevanti per la ricerca diretta ma che contengono ancora link importanti. Altro caso frequente è quello delle pagine di elenchi impaginati: ad esempio, “noindex,follow” può essere applicato agli elenchi dell’archivio di un blog, per impedire che le pagine di archivio stesse vengano visualizzate nei risultati di ricerca, ma consentire ai motori di ricerca di eseguire la scansione, indicizzare e classificare i post del blog stessi.
- (Index), Nofollow
<meta name=”robots” content=”nofollow”>
Aggiungere solo il meta tag nofollow (l’indicizzazione è il comportamento predefinito dei motori di ricerca) implica che la pagina verrà indicizzata e potrà apparire nei risultati di ricerca, ma i link in uscita non trasmetteranno PageRank o autorità. Questo può essere utile per pagine che contengono molti link esterni per i quali il webmaster non vuole passare autorità, come articoli di blog che citano fonti esterne, pagine di recensioni con link a prodotti di terze parti, o pagine di aggregazione di contenuti. Inoltre, può essere impiegata per prevenire il passaggio di PageRank a siti partner in link sponsorizzati o pubblicitari, in conformità con le linee guida dei motori di ricerca per i link.
Noindex e Nofollow: best practices ed errori comuni
Per ottenere il massimo da queste direttive, è importante seguire alcune semplici best practices.
Innanzitutto, serve comprendere il loro funzionamento e significato specifico: noindex va usato per le pagine che non vogliamo siano trovate, mentre il nofollow va usato per i link di cui non vuoi passare l’autorità. Quindi, sintetizzando, un comando impedisce l’indicizzazione, l’altro limita il passaggio del PageRank.
Altrettanto importante è essere consapevoli di come (e quanto) l’uso di noindex e nofollow influisce sulla visibilità del sito e sul passaggio del PageRank, prima di applicare queste direttive.
Pertanto, le “regole” sono:
- Usare noindex per contenuti non essenziali. Applica il noindex a pagine che non aggiungono valore ai risultati di ricerca o che potrebbero diluire la pertinenza del tuo sito, come pagine in costruzione, pagine di politica sulla privacy, o pagine di ringraziamento.
- Non usare noindex su pagine importanti. Non usare il noindex su pagine che sono cruciali per il tuo sito e che vuoi siano trovate dai motori di ricerca, come pagine di prodotto, articoli principali o home page.
- Usare nofollow su link esterni non fidati. Imposta il nofollow su link che puntano a siti di cui non puoi attestare l’affidabilità o che non vuoi sostenere, come commenti di blog o forum.
- Non abusare del nofollow interno. Evita di usare il nofollow sui link interni in quanto potrebbe ostacolare la capacità dei motori di ricerca di navigare nel tuo sito e di comprendere la struttura del sito.
- Usare noindex nofollow solo su pagine realmente “inutili”. Limitare l’impostazione di entrambe le direttive solo a pagine con contenuto altamente sensibile o confidenziale, pagine di test o di sviluppo che non sono destinate alla visualizzazione pubblica, pagine temporanee che non forniscono valore a lungo termine, come pagine di promozioni scadute o eventi passati.
Inoltre, è importante controlla periodicamente le direttive noindex e nofollow per essere certi che siano ancora pertinenti e aggiornate con la strategia SEO che stiamo seguendo.
Per controllare se una pagina ha il noindex o il nofollow, puoi visualizzare il codice sorgente della pagina oppure usare degli strumenti SEO. Ad esempio, Google Search Console fornisce informazioni sull’indicizzazione delle pagine e sull’eventuale presenza di problemi relativi al noindex, mentre Screaming Frog o il SEO Spider di SEOZoom possono eseguire una scansione del sito e rilevare le direttive noindex e nofollow su larga scala.
In questo modo possiamo anche evitare errori comuni con queste direttive. Chiaramente, i problemi più gravi nascono quando usiamo in modo eccessivo o improprio il noindex, che può nascondere contenuti importanti, mentre l’uso sbagliato del nofollow può impedire il passaggio del PageRank a pagine interne meritevoli.
Per Google il “noindex” a lungo termine porta al “nofollow”
A proposito di errori, o comunque di situazioni che si evolvono e che devono essere considerate adeguatamente, dobbiamo ricordare due aspetti tecnici rilevanti su noindex nofollow.
Innanzitutto, l’aggiunta di un tag nofollow a una pagina non ne impedisce la scansione perché per bloccare l’indicizzazione di un URL serve un tag noindex. Ciò consentirà a Google di eseguire la scansione della pagina, ma questa non verrà visualizzata nell’indice. Per impedire a Google di eseguire la scansione completa della pagina, possiamo bloccarla tramite il file robots.txt.
Ancora più tecnica la seconda situazione, che si verifica quando impostiamo una direttiva del tipo noindex, follow. Come spiegato da John Mueller, infatti, se Googlebot vede il “noindex” per molto tempo , le pagine vengono completamente rimosse dall’indice e i link in esse contenuti non verranno più sottoposti a scansione, e quindi non trasferiranno alcuna equità di collegamento ad altre pagine.
Ciò implica che se anche la pagina è “noindex, follow”, a lungo termine non sarebbe diversa da “noindex, nofollow” per Google: il ragionamento è che che se le pagine che non sono importanti abbastanza da essere indicizzate, alla fine potrebbero anche non essere importanti abbastanza per influenzare il ranking di altre pagine tramite i loro link.
Questa trasformazione non è immediata, non ci sono certezze su quanto tempo sia “a lungo termine”, non è garantito che avvenga in tutti i casi e dipende da molteplici fattori: tuttavia, è un’eventualità che Google ha menzionato e che noi dobbiamo ricordare per tenere davvero sotto controllo il nostro sito.