Mille volte più potente di BERT e capace di eseguire il multitasking per connettere le informazioni per gli utenti in modi nuovi: sin dalla presentazione all’ultimo Google I/O, Google MUM è stato descritto con toni sensazionalistici, che hanno contribuito ad alzare le aspettative sulla tecnologia Multitask Unified Model (simpaticamente chiamata MUM). Stando ai primi test, questo hype è perfettamente giustificato, e i risultati concreti delle applicazioni di MUM alla Ricerca sono già eccezionali.

Google MUM applicato alla Ricerca: i primi risultati

È quello che racconta Pandu Nayak, Google Fellow e Vice President di Search, in un articolo sul blog aziendale in cui descrive appunto come MUM ha migliorato le ricerche su Google per le informazioni sui vaccini anti-Covid.

Il problema di partenza è semplice da comprendere: nelle differenti lingue ci sono oltre 800 varianti dei nomi dei vaccini – AstraZeneca, CoronaVac, Moderna, Pfizer, Sputnik e altri vaccini ampiamente distribuiti hanno infatti “tutti molti nomi diversi in tutto il mondo” – e quindi le persone che cercano su Google informazioni sui vaccini possono utilizzare diverse query, come “Coronavaccin Pfizer”, “mRNA-1273”, “CoVaccine” e così via, con una lista che potrebbe continuare quasi all’infinito.

Per Google è fondamentale “individuare correttamente tutti questi nomi per fornire alle persone le ultime informazioni affidabili sul vaccino”, ma riuscire a identificare i diversi modi in cui le persone si riferiscono ai vaccini in tutto il mondo “richiede molto tempo e centinaia di ore in risorse umane”.

Come Google mostra informazioni affidabili sui vaccini

È qui che entra in scena la tecnologia MUM, che è riuscita a “identificare oltre 800 varianti di nomi di vaccini in più di 50 lingue in pochi secondi”, completando immediatamente il task di identificazione e corrispondenza di nomi di vaccini in tutte le lingue. Dopo aver convalidato questi risultati, Google li ha applicati alla Ricerca per dare modo alle persone di “trovare informazioni tempestive e di alta qualità sui vaccini COVID-19 in tutto il mondo”.

Le caratteristiche di MUM

Al suo primo test ufficiale, grazie alle sue capacità di trasferimento di conoscenza MUM ha dato prova di riuscire a compiere in pochi secondi un lavoro che altrimenti avrebbe richiesto diverse settimane.

La tecnologia MUM si basa su un’architettura di tipo trasformer, e stando alla presentazione fornita da Prabhakar Raghavan può eseguire contemporaneamente una serie di attività come comprendere e generare il linguaggio – addestrato su 75 lingue – o agire in multimodalità, per apprendere informazioni da più fonti e forme, come immagini, testo e video.

Per chiarire il suo funzionamento, Nayak ha usato l’esempio di una persona che legge un libro: se è multilingue, sarà in grado di condividere le principali conclusioni del libro nelle altre lingue che parla – a seconda della fluidità e delle proprietà delle sue competenze – perché avrà una comprensione del libro che non dipende dalla lingua o dalla traduzione. MUM trasferisce la conoscenza attraverso le lingue in modo molto simile.

Inoltre, grazie a questa proprietà, MUM non deve imparare una nuova funzionalità per ogni lingua, ma può trasferire ciò che apprende tra le varie lingue, aiutando Google a scalare rapidamente i miglioramenti ottenuti anche per lingue meno testate di altre. Questo, spiega Nayak, è in parte merito dell’efficienza del campione di MUM, che richiede molti meno input di dati rispetto ai modelli precedenti per realizzare lo stesso compito.

Le difficoltà nella ricerca dei vaccini

Nel caso dei vaccini, con solo un piccolo campione di nomi ufficiali MUM è stato in grado di identificare rapidamente tutte le variazioni tra le lingue.

La situazione di ambiguità sui nomi è più frequente di quanto possiamo immaginare a prima vista, e Nayak cita alcuni termini che in inglese hanno praticamente lo stesso significato, come soda e pop, sweater e jumper o soccer e football, così come in italiano ci sono penna e biro o matita e lapis: alle volte ciò dipende da una caratteristica della lingua di riferimento, altre volte da tendenze o sfumature culturali, o semplicemente dalla parte del mondo in cui ci troviamo mentre effettuiamo una ricerca.

Con il COVID-19, le persone hanno cercato informazioni da ogni parte del mondo, e Google ha “dovuto imparare a identificare tutte le diverse frasi usate per riferirsi al nuovo coronavirus per essere sicuri di far emergere informazioni tempestive e di qualità messe a disposizione da parte di autorità sanitarie affidabili, come l’Organizzazione Mondiale della Sanità e i Centri per il controllo e la prevenzione delle malattie”. Un anno dopo, il motore di ricerca sta affrontando una sfida simile con i nomi dei vaccini, solo che questa volta ha un nuovo e potente strumento che aiuta a semplificare e vincere la sfida, che è appunto la tecnologia Multitask Unified Model (MUM).

Pronte nuove applicazioni di MUM

La ricerca dei nomi dei vaccini anti-Covid è la prima e finora unica applicazione confermata di MUM nei risultati di ricerca, ma Google si aspetta di continuare a utilizzare questa tecnologia in modi che rendano la ricerca sempre più utile per le persone, anche migliorando servizi già disponibili o creando nuovi strumenti.

Nayak scrive che Big G è “impaziente di scoprire i molti modi in cui MUM può rendere la Ricerca ancora più utile per le persone in futuro”, a cominciare appunto dalla possibilità di fornire alle persone informazioni fondamentali in modo tempestivo, ovunque si trovino.

I primi test aziendali indicano che MUM sarà in grado non solo di migliorare molti aspetti degli attuali sistemi del motore di ricerca, ma anche che potrà aiutare a creare modi completamente nuovi di cercare ed esplorare le informazioni.

Da utenti, quindi, è interessante vedere all’opera le potenzialità di un sistema che potrebbe offrire concreti vantaggi nei casi d’uso nel mondo reale, consentendo di lanciare ricerche in modi che in precedenza potevamo pensare fossero troppo complessi da comprendere per i motori di ricerca. Se questa innovazione si conferma efficiente e fantascientifica come nelle premesse, inoltre, sarà di aiuto a Google a mantenere la sua posizione di leader di mercato nella Ricerca, o anche di conquistare un altro vantaggio rispetto ai concorrenti.