Google DeepMind ha recentemente lanciato un rivoluzionario strumento di intelligenza artificiale (AI) che impiega modelli linguistici di grandi dimensioni (LLM) per generare nuove conoscenze. Questo strumento, definito una “scoperta rivoluzionaria”, si distingue per la sua capacità di selezionare risposte significative da quelle fornite da LLM e di affinare queste risposte nel corso del processo.
Google DeepMind ha rivelato sul suo blog che i risultati della ricerca su “FunSearch”, uno strumento di AI che scopre soluzioni inedite in matematica e informatica, sono stati pubblicati sulla rivista “Nature”.
Per un LLM, è difficile generare conoscenze completamente nuove e non apprese in precedenza. Esiste un’elevata probabilità che le nuove conoscenze proposte siano in realtà allucinazioni, ovvero risultati errati.
Secondo Alhussein Fauzi, ricercatore di DeepMind, il 90% dei risultati forniti da LLM potrebbe non essere utile. Valutare le risposte è semplice, ma trovare risposte innovative è molto più complesso.
“Funsearch”, proposto da Google DeepMind, significa “ricerca nello spazio delle funzioni”. È stato progettato come uno strumento AI capace di formulare soluzioni ai problemi sotto forma di programmi per computer.
Funsearch utilizza filtri per selezionare risposte verificabili tra le numerose opzioni fornite da LLM. Per raggiungere questo obiettivo, viene aggiunto un livello aggiuntivo sopra LLM per verificare l’accuratezza prima di fornire la risposta finale all’utente. Questa rete di sicurezza separata è difficile da stabilire nei LLM tradizionali, che sono formati per trattare un’ampia gamma di argomenti.
Inoltre, Pinsearch ha sviluppato un LLM denominato “Codey”, basato sul miglioramento del modello “PaLM 2” di Google, e ha integrato livelli di un “Valutatore” che scarta risposte errate e allucinazioni. I modelli Codi possono ancora produrre risultati imprecisi o fuorvianti, ma i valutatori aiutano a filtrarli per assicurare risposte affidabili agli utenti.
Quando il coordinatore riceve il problema e il codice sorgente come input e produce un codice di soluzione, il valutatore verifica il contenuto del nuovo codice e assegna un punteggio. Il codice con il punteggio migliore viene memorizzato nel database e può essere reimmesso in Codi per ulteriori miglioramenti.
Gli utenti possono cercare nel database il miglior codice di soluzione creato fino ad ora e inviare feedback per affinarlo. Con l’applicazione ripetuta di questo processo, Funsearch ha sviluppato costantemente codici di soluzione, fornendo nuove conoscenze.
Per dimostrare ciò, Google DeepMind ha applicato Funsearch al problema del “Cap set”, un dilemma matematico notoriamente difficile. Il problema consiste nel trovare il più grande insieme di punti in un cerchio senza che tre punti siano allineati su una linea retta. Con Funsearch, è stata generata una soluzione di 512 punti su otto dimensioni, superando le capacità dei matematici umani.
Funsearch ha ottenuto risultati eccezionali anche nel “bin-packing”, un altro arduo problema matematico. Ha trovato una soluzione più efficiente di quelle dei migliori algoritmi esistenti.
Pushmit Corley, responsabile dell’AI scientifica di DeepMind, ha affermato: “All’inizio del progetto, non c’erano indicazioni che avrebbe prodotto risposte completamente nuove. Per quanto ne sappiamo, questa è la prima volta che un LLM ha portato a una vera nuova scoperta scientifica”.
Terence Tao, professore all’Università della California, ritiene che “Punsearch sia un approccio molto promettente, applicabile a molti altri problemi matematici”.
Un aspetto notevole è che, a differenza di altri LLM, gli utenti possono osservare il processo di generazione degli output. Questa trasparenza differenzia Funsearch dagli altri LLM, che tendono ad essere più opachi, simili a una “scatola nera”.