È la nuova pietra miliare dell’Intelligenza Artificiale applicata alla Ricerca, e nei primi test ha già fornito un supporto incredibile per migliorare la qualità dei risultati nelle query legate ai vaccini: l’attenzione su Google MUM è sempre più alta, e non potrebbe essere altrimenti viste le premesse legate a questo sistema dalle caratteristiche fantascientifiche. Ora Pandu Nayak ha fornito anche indicazioni più chiare sul modo in cui Google intende applicare MUM, sulla roadmap prevista e sui modi in cui l’azienda si sta impegnando per garantire che la tecnologia venga applicata responsabilmente, così da riuscire davvero a cambiare radicalmente il modo in cui gli utenti interagiscono con il motore di ricerca più usato al mondo.
Google MUM, la roadmap per l’applicazione
Questi temi sono stati al centro della chiacchierata tra il VP di Google Search e Search Engine Land sul futuro prossimo del motore di ricerca grazie appunto a MUM, l’ultimo approdo di Big G nella comprensione del linguaggio applicato alla Ricerca.
Per oltre due decenni, i motori di ricerca hanno praticamente funzionato allo stesso modo: l’utente inserisce una query testuale (o vocale) e la macchina restituisce un mix di link organici, risultati avanzati e annunci; certo, in questi anni hanno migliorato le loro capacità di determinare l’intento, fornire risultati pertinenti e incorporare diversi verticali (come immagini, video o ricerca locale), ma la premessa è rimasta la stessa, almeno finora.
Con i progressi più recenti, come già BERT, i motori di ricerca hanno infatti aumentato le capacità di elaborazione del linguaggio, che consentono loro di comprendere meglio le query e restituire risultati più pertinenti. Ora Google ha compiuto un ulteriore passo in avanti, presentando e testando il Multitask Unified Model (MUM), una tecnologia che è mille volte più potente di BERT e combina la comprensione del linguaggio con capacità di input multitasking e multimodali.
Una pietra miliare nella comprensione del linguaggio
Sin dal principio, Google ha paragonato MUM a BERT, ed è facile quindi definire il nuovo modello una versione più avanzata del precedente: entrambi sono basati sulla tecnologia del trasformatore e MUM integra le capacità di comprensione del linguaggio di BERT, ma si si basa su un’architettura diversa (architettura T5) ed è in grado di fare molto di più.
Come ricorda Nayak, MUM “apprende simultaneamente in 75 lingue: ciò è un bene, perché ci consente di generalizzare da lingue ricche di dati a lingue con una scarsità di dati”. Inoltre, così le applicazioni di MUM possono essere trasferite più facilmente in più lingue, e aiutare a rafforzare la Ricerca Google in quei mercati.
MUM non si limita al testo: multimodalità e multitasking
Le differenze non si fermano qui, e un altro elemento distintivo è la multimodalità di MUM, che possiede cioè capacità non limitate al testo, ma estese anche all’uso di video e immagini come input. In pratica, la nuova tecnologia è in grado di comprendere il contenuto delle immagini e l’intento dietro ogni richiesta in maniera precisa e rapida.
Inoltre, è “intrinsecamente multitasking”, come sottolinea Nayak nell’articolo: le attività in linguaggio naturale che può gestire includono (ma non sono limitate a) pagine di classificazione per una particolare query, revisione di documenti ed estrazione di informazioni.
MUM può gestire più attività in due modi: sul lato della formazione e sul lato dell’uso. Per il VP di Search, essendo “addestrato su più attività, apprende questi concetti in modo più robusto e generale: cioè, li applica a più attività anziché solo a un singolo compito, che li renderebbe fragili quando applicati a un task diverso”.
Google e MUM, come e dove sarà usato
Molto interessanti sono anche gli spunti forniti riguardo alla reale implementazione di MUM, perché Nayak rivela che Google non ne prevede un utilizzo come una singola feature o un lancio nella Ricerca: piuttosto, dovrebbe essere “una piattaforma su cui diversi team possono costruire diversi casi d’uso”, anticipando che “moltissime squadre all’interno della Ricerca utilizzeranno MUM per migliorare qualsiasi attività stanno facendo per aiutare il sistema”, come nel citato esempio del vaccino COVID.
Infatti, nel breve termine MUM si concentrerà in gran parte sul trasferimento delle conoscenze tra le lingue: ancora una volta, il lavoro sui vaccini esemplifica questa funzionalità, perché la tecnologia ha identificato 800 varianti di nomi di vaccini in 50 lingue in pochi secondi. A questo proposito, l’articolo fa notare che Google aveva già un subset di nomi di vaccini COVID che avrebbero attivato l’esperienza del vaccino COVID nei risultati di ricerca, ma MUM ha permesso di ottenere un insieme molto più ampio di nomi di vaccini, e quindi di attivare tali risultati in più situazioni, quando appropriato.
I progetti a medio termine sulla tecnologia
Nel medio termine, invece, il lavoro si concentra sulla multimodalità, che “sarà come una nuova capacità di ricerca che non abbiamo avuto prima”, ha detto Nayak, espandendo l’esempio di ricerca di immagini che Prabhakar Raghavan ha utilizzato per la prima volta nel corso di Google I/O.
Nella sua visione di MUM in Search, Nayak descrive un’interfaccia in cui gli utenti possono caricare immagini e porre domande di testo su tali immagini: al posto di una semplice risposta che potrebbe portare a una ricerca senza clic, Nayak immagina Google restituire risultati pertinenti, che colmano il divario tra l’immagine caricata e la query dell’utente.
I primi test in tal senso lasciano spazio all’ottimismo, ma ad ogni modo il VP di Big G sottolinea che l’esatta attuazione di questi obiettivi è fissata “a medio termine” con tempistiche incerte.
I piani a lungo termine: creare esperienze più solide per gli utenti
La capacità di MUM di comprendere il linguaggio a un livello molto più profondo è alla base anche dei piani dell’azienda sul lungo periodo, con l’obiettivo di supportare “una comprensione delle informazioni molto più profonda e convertire quella comprensione più profonda delle informazioni in esperienze più solide per i nostri utenti”.
Ad oggi, i motori di ricerca faticano ancora a far emergere risultati pertinenti per alcune query specifiche e complesse, come nell’esempio fornito a Google I/O: se un appassionato di escursionismo cerca “Ho scalato il Monte Adams e voglio scalare il Monte Fuji il prossimo autunno, cosa dovrei fare diversamente per prepararmi?”, allo stato attuale forse Google non riuscirebbe a dare risultati utili. Pertanto, l’utente sarà costretto a suddividere la sua domanda in singole query e verificare i risultati, mettendo quindi insieme la risposta da solo. In genere, secondo le stime fornite dall’azienda, per completare attività complesse in media le persone impiegano otto ricerche, ma MUM aiuterà molto in tal senso.
Nello specifico, dice Nayak, MUM potrà “prendere quella query di ricerca, che rappresenta una complessa esigenza di informazioni, e suddividerla in una sorta di esigenze informative individuali“, aiutando quindi Google a rispondere con risultati relativi all’allenamento fitness, caratteristiche del terreno del Monte Fuji, differenze di clima e così via.
Questo è “ciò che fai nella tua testa quando ti vengono in mente domande individuali e pensiamo che MUM possa aiutarci a generare query come queste”, aggiunge il VP di Search, perché riuscirà a mettere insieme risultati per queste ricerche e magari anche “a inserire un testo che colleghi tutto questo alla domanda originale e più complessa che avevi”. Ciò significa organizzare le informazioni, capire (e mostrare) qual è la connessione, in modo che sarà possibile “entrare e leggere l’articolo sulla migliore attrezzatura per il Monte Fuji o i consigli per le escursioni in quota o qualcosa del genere in questo modo più ricco”.
Uno dei motivi per cui questo è un obiettivo a lungo termine è perché richiede “un ripensamento del motivo per cui le persone si rivolgono a Google con esigenze complesse piuttosto che con domande individuali”. Inoltre, lo stesso Google dovrebbe anche convertire la complessa esigenza, espressa dal termine di ricerca di un utente, in un sottoinsieme di query e i risultati di tali query dovrebbero essere organizzati in modo appropriato.
Ma MUM non sarà solo un sistema di domande e risposte
Non bisogna però commettere un errore e pensare a MUM solo come un “sistema di risposta alle domande – cioè, vieni su Google con una domanda e noi ti diamo solo la risposta”, perché la vision su questa tecnologia è molto più ampia e un “un tale sistema di risposta alle domande per questi bisogni complessi che le persone hanno semplicemente non è utile”.
Quindi, MUM non dovrebbe impattare ulteriormente sulle ricerche a zero clic, che per natura sono “le ricerche più semplici e obiettive che vengono spesso risolte direttamente nella pagina dei risultati di ricerca”, ma anzi indirizzare il traffico verso contenuti pertinenti nel Web aperto che forniscono risposte a problemi complessi come “consigli di escursionismo, trovare una scuola per tuo figlio o capire in quale quartiere vivere”, che non possono essere soddisfatti di una risposta breve e diretta.
Mitigare i costi e i rischi dello sviluppo di MUM
Mai come in questa fase, però, nello sviluppo di tecnologia e modelli per la ricerca bisogna anche valutare il potenziale impatto ecologico e la richiesta di grandi set di dati: Google afferma di essere a conoscenza di queste considerazioni e sta prendendo precauzioni per applicare MUM in modo responsabile.
Innanzitutto, c’è consapevolezza che “questi modelli possono apprendere e perpetuare i pregiudizi nei dati di addestramento in modi che non sono eccezionali, se ci sono distorsioni indesiderabili di qualsiasi tipo”, e per questo l’azienda sta monitorando i dati dell’addestramento di MUM.
“Non formiamo MUM sull’intero corpus web, ma su un sottoinsieme di alta qualità del corpus web in modo che tutti i pregiudizi indesiderabili nei contenuti di bassa qualità, nei contenuti per adulti ed espliciti, non abbiano nemmeno un’opportunità di essere appresi perché non sono nemmeno presentati a MUM“, rivela Nayak, riconoscendo comunque che anche i contenuti di alta qualità possono contenere pregiudizi, che il processo di valutazione dell’azienda tenta di filtrare.
Il processo è stato già testato con BERT, sottoposto nei mesi precedenti al lancio a “una quantità senza precedenti di valutazioni solo per assicurarci che non ci fossero schemi preoccupanti”, intervenendo con provvedimenti per mitigare le situazioni in cui tali pattern si presentassero. Allo stesso modo, anticipa il VP, “mi aspetto che, prima di avere un lancio significativo di MUM in Ricerca, faremo una quantità significativa di valutazione per evitare qualsiasi tipo di modello preoccupante”.
Un altro tema è quello dei costi ecologici: costruire modelli di grandi dimensioni può essere sia costoso che dispendioso in termini di energia, e quindi avere un impatto dannoso sull’ambiente. Google ha lavorato anche su questo, e un team di ricerca ha recentemente pubblicato un documento piuttosto completo e interessante sull’impatto climatico di vari grandi modelli costruiti internamente o esternamente che “sottolinea che, in base alla particolare scelta del modello, dei processori e dei data center utilizzati, l’impatto del carbonio può essere ridotto fino a mille volte”, senza dimenticare che Google è carbon-neutral dal 2007, e “quindi, qualsiasi tipo di energia venga utilizzata, l’impatto del carbonio è stato mitigato da Google”.
MUM e SEO: pochi rischi per il futuro dell’attività di ottimizzazione per Google
Alla luce di questa intervista, ci sono alcune considerazioni da fare circa il possibile impatto di MUM sulla SEO: innanzitutto, Nayak ha escluso che questa tecnologia possa aumentare la tendenza delle ricerche senza clic, perché non sarà un “sistema di risposta alle domande” né, quindi, darà ingiustamente la priorità ai prodotti di Google rispetto a quelli dei concorrenti (una preoccupazione condivisa da marketer ed enti regolatori).
Ciò significa anche che MUM non sarà la pietra tombale della SEO, come temuto da vari analisti al momento dell’annuncio di questa novità: come detto da John Mueller solo poche settimane fa, l’attività di ottimizzazione per Google non diventerà obsoleta nonostante l’impatto di tecnologia e AI, ma si evolverà per sfruttare positivamente gli strumenti avanzati a disposizione.
Volendo provare a guardare oltre, possiamo ipotizzare che Google diventerà ancora più abile nell’interpretare il contenuto e il linguaggio utilizzato, rendendo meno centrali le keyword, che potrebbero essere meno decisive nel posizionare meglio una pagina web.
Non certo un concetto nuovo, per chi legge questo blog, già riassunto nella formula “la keyword non esiste”, che quindi assume ancora più valore alla luce degli sviluppi del lavoro di Google.
Secondo alcuni analisti, non esisterà il concetto di “ottimizzare i contenuti per MUM”, perché non ci sarà un modo diretto per giocare con il motore di ricerca, visto che l’algoritmo può capire il linguaggio naturale. E quindi, anche se le parole chiave continueranno a essere importanti perché le query le conterranno ancora, bisognerà ragionare sempre più sull’intento e smettere definitivamente di scrivere articoli per l’algoritmo, scrivendoli finalmente solo per i lettori.