Da qualche giorno c’è un nuovo meta tag robots all’elenco di quelli noti e usati: un po’ a sorpresa, infatti, Google ha annunciato ufficialmente l’introduzione di indexifembedded, un nuovo comando con cui i siti possono comunicare informazioni circa i loro contenuti, in particolare per quelli embedded, e avere un maggiore controllo sulla loro indicizzazione.
Che cos’è indexifembedded, il nuovo robots tag di Google
Come spiega il post pubblicato sul sito Search Central, il tag indexifembedded segnala a Google “che desideri comunque che i contenuti vengano indicizzati quando sono incorporati tramite iframes e tag HTML simili in altre pagine, anche quando la pagina dei contenuti ha il tag noindex“.
A cosa serve il comando
A detta di Google, il nuovo tag risolve un problema comune che interessa in particolare gli editori di contenuti multimediali, che “quando consentono l’embedding di contenuto non sempre vogliono che il contenuto della pagina sia indicizzato”, e indexifembedded assicura appunto offre un maggiore controllo sulla comunicazione di tali desideri alla Ricerca Google.
Come si legge nell’articolo, a volte gli editori “potrebbero volere che i loro contenuti vengano indicizzati quando sono incorporati in pagine di terze parti, ma non vogliono necessariamente che le loro pagine multimediali vengano indicizzate da sole” e quindi impostano un tag noindex in tali pagine, che però “impedisce anche di incorporare il contenuto in altre pagine durante l’indicizzazione”.
Come funziona indexifembedded con noindex
Ora, invece, è possibile usare il nuovo tag indexifembedded insieme al tag noindex originale se “la pagina con noindex è incorporata in un’altra pagina tramite un tag HTML iframe o simile, come object” e consentire in questo modo a Google di incorporare il contenuto ospitato su quella pagina durante l’indicizzazione.
Ad esempio, prosegue l’articolo, se la pagina podcast.host.example/playpage?podcast=12345 ha sia il tag noindex che indexifembedded significa che “Google può incorporare il contenuto ospitato sull’altra pagina in recipe.site.example/my-recipes.html durante l’indicizzazione”.
Per implementare correttamente la funzione abbiamo due alternative, ovvero il normale tag meta robots e l’alternativa intestazioni HTTP X-Robots-Tag. In particolare, il codice da inserire nel primo caso è
<meta name=”googlebot” value=”noindex” />
<meta name=”googlebot” value=”indexifembedded” />
o
<meta name=”googlebot” value=”noindex,indexifembedded” />.
Se preferiamo specificare il tag nell’intestazione HTTP, invece, dobbiamo utilizzare questi comandi:
X-Robots-Tag: googlebot:noindex
X-Robots-Tag: googlebot:indexifembedded
…
oppure
…
X-Robots-Tag: googlebot:noindex,indexifembedded
I casi di utilizzo di indexifembedded
Attualmente il tag indexifembedded è supportato solo sul motore di ricerca di Google e, al di là della curiosità, la sua funzionalità sembra essere piuttosto limitata.
Il comando, infatti, è pensato per gli editori di contenuti che non desiderano che le loro pagine vengano indicizzate da Googlebot, ma che al tempo stesso non hanno problemi se i loro contenuti siano indicizzati quando incorporati in siti Web o pagine esterni tramite iframe.
Una situazione che non appare particolarmente frequente e che può rivelarsi utile in caso di widget o video embed di cui si vuole consentire l’indicizzazione altrui, o che può servire nella gestione di risorse come PDF incorporati nelle pagine web (bloccando con il noindex il PDF originale, ma consentendo alla pagina HTML che lo ha incorporato di beneficiare del contenuto del documento PDF).