Immagine AI

Il mondo della ricerca scientifica, tradizionalmente lento e metodico, è sull’orlo di una trasformazione radicale grazie all’irruzione di agenti di Intelligenza Artificiale progettati per operare come veri e propri co-scienziati. Al centro di questa rivoluzione si posiziona Kosmos, un nuovo strumento di “AI Scientist” sviluppato da un team di esperti che ha recentemente dato vita a una spin-off a scopo di lucro, Edison Scientific, dall’organizzazione no-profit FutureHouse. Kosmos promette di superare l’affidabilità altalenante delle precedenti IA scientifiche, offrendo risultati di ricerca con un tasso di accuratezza del 79,4% e, in modo sbalorditivo, riducendo i tempi di indagine da una media di sei mesi a poche ore.

Questa mossa segna una competizione in rapida crescita in un campo dove anche giganti come Google e OpenAI (con previsioni di scoperte significative al lancio di “GPT-6”) stanno investendo massicciamente, riconoscendo nella ricerca scientifica un futuro modello di business per l’IA.

L’Intelligenza Artificiale applicata alla scienza non è una novità, ma finora non ha sempre mantenuto le sue promesse. Esempi passati, come lo strumento “GNoME” di Google che nel 2023 aveva annunciato la sintesi di nuove sostanze, si sono scontrati con analisi esterne che ne hanno sminuito l’originalità. Questa inaffidabilità è stata spesso attribuita all’approccio monolitico.

I fondatori di Future House—il neuroscienziato Sam Rodriguez e il ricercatore chimico Andrew White—hanno aggirato questo ostacolo concentrandosi sulla modularità. Kosmos non è un modello unico e onnicomprensivo; è la combinazione di diversi agenti specializzati, ognuno con un ruolo ben definito. Strumenti iniziali come Crow e Falcon gestiscono la revisione della letteratura e l’accesso ai database, mentre agenti come Phoenix e Owl sono dedicati alla progettazione di esperimenti e alla ricerca approfondita in aree tematiche specifiche.

L’obiettivo di Kosmos è combinare questi agenti modulari per produrre report che rispecchino fedelmente i risultati della ricerca in corso, spaziano dalle neuroscienze alla scienza dei materiali, dalla metabolomica alla genetica statistica.

La vera innovazione di Kosmos risiede nella sua architettura operativa che consente operazioni simultanee. Invece di eseguire le attività singolarmente, l’agente connette in parallelo i modelli esistenti, condividendo le informazioni attraverso un “modello mondiale” strutturato. Questo approccio integrato consente ai modelli di correlare dati e ipotesi tra campi e set di dati, un processo che imita il modo in cui i team scientifici umani collaborano per raggiungere una conclusione.

L’efficacia è misurabile: in media, Kosmos può eseguire oltre 42.000 righe di codice e leggere 1.500 articoli scientifici in una singola iterazione. È in grado di perseguire i suoi obiettivi attraverso oltre 200 iterazioni in una singola esecuzione. Un’analisi esterna sui documenti prodotti ha stabilito che quasi l’80% (79,4%) dei risultati era scientificamente accurato, un dato di affidabilità impressionante. Gli autori hanno riferito che l’esecuzione di Kosmos per 20 volte ha prodotto risultati equivalenti, in media, a sei mesi di lavoro umano, il tutto in poche ore.

Inoltre, è stato osservato che più Kosmos viene eseguito ripetutamente, maggiore è la probabilità di produrre risultati scientificamente validi. Tra i sette casi di studio analizzati, quattro sono stati considerati nuova letteratura scientifica, mentre tre hanno riprodotto con successo risultati ancora non pubblicati.

La creazione di Edison Scientific e il lancio di Kosmos rispondono a una domanda di supporto da parte delle più grandi aziende farmaceutiche e biotecnologiche del mondo, che ha superato la capacità di una fondazione no-profit. Tuttavia, gli sviluppatori hanno mantenuto una posizione cauta e pragmatica: la supervisione umana resta fondamentale.

Kosmos è descritto come più vicino a una “ricerca approfondita” che a un chatbot basato sull’AI. Il suo funzionamento ottimale si verifica in aree dove esistono set di dati strutturati e metodi di analisi consolidati, evidenziando il suo bisogno di input di alta qualità. Nonostante la sua efficacia, gli sviluppatori hanno anche notato che il sistema può occasionalmente “portare fuori strada”, inseguendo risultati statisticamente significativi ma scientificamente irrilevanti.

Con un costo per esecuzione che può arrivare fino a 200 dollari, Kosmos è posizionato non come un giocattolo, ma come un “kit di reagenti” da eseguire su obiettivi di alto valore e necessità. Come affermato dal CEO di OpenAI, Sam Altman, che ha promosso Kosmos su X, ci si aspetta che sistemi come questo rappresentino uno degli impatti più significativi che l’Intelligenza Artificiale avrà sul futuro dell’umanità, trasformando radicalmente il ritmo e la profondità della scoperta scientifica.

Di Fantasy