Sakana Fugu orchestra più modelli AI attraverso una sola API

Sakana AI ha reso disponibile Fugu, un sistema di orchestrazione multi-agente che viene presentato all’esterno come un singolo modello accessibile tramite API compatibile con OpenAI. Dietro una singola richiesta non opera però necessariamente un unico LLM: Fugu può decidere se rispondere direttamente, delegare parti del lavoro a modelli specializzati, avviare verifiche intermedie e sintetizzare il risultato finale.

Il sistema è stato progettato per affrontare compiti complessi e multi-step, nei quali un solo modello può essere meno efficace nel combinare pianificazione, esecuzione, controllo degli errori e revisione finale. La logica di Fugu non consiste quindi in un semplice router che seleziona il modello apparentemente più adatto a una richiesta. Sakana AI descrive Fugu come un modello linguistico addestrato specificamente per decidere quando delegare, quali agenti coinvolgere, come distribuire i sotto-compiti e come integrare i risultati prodotti dal gruppo di modelli.

L’architettura utilizza un pool di agenti sostituibili. Questo significa che il sistema non dipende dall’uso permanente di un singolo provider o di un singolo modello foundation. Quando riceve un task, Fugu può scegliere se affidarlo a un modello, suddividerlo tra più agenti o creare una sequenza di pianificazione, esecuzione e verifica. Sakana AI indica anche che Fugu può richiamare ricorsivamente istanze di se stesso all’interno del pool, usando quindi l’orchestratore come ulteriore componente operativo del workflow.

La piattaforma viene proposta in due versioni. Fugu è la variante orientata a un equilibrio tra qualità della risposta e latenza, pensata per chatbot, coding assistant, code review e altri servizi interattivi. Fugu Ultra è invece la configurazione destinata ai task più difficili, nei quali il sistema può coordinare una rete più ampia di agenti e utilizzare più passaggi di elaborazione. Sakana AI cita tra gli impieghi sperimentati la riproduzione di paper scientifici, l’analisi di sicurezza informatica, le ricerche bibliografiche e brevettuali, il code review e attività di ricerca automatizzata sui dati.

Alla base di Fugu ci sono due linee di ricerca presentate da Sakana AI a ICLR 2026: TRINITY e Conductor. TRINITY utilizza un coordinatore leggero che assegna dinamicamente a un modello uno dei tre ruoli principali nel corso di un task multi-turn: Thinker, incaricato di formulare la strategia e analizzare lo stato del problema; Worker, responsabile dell’esecuzione dei passaggi concreti; Verifier, incaricato di stabilire se la soluzione sia completa e corretta. Il coordinatore di TRINITY usa meno di 20.000 parametri apprendibili e viene ottimizzato con un algoritmo evolutivo senza gradienti, anziché con un tradizionale processo di fine-tuning del modello worker.

Conductor adotta un approccio diverso. Sakana AI ha addestrato con reinforcement learning un modello da 7 miliardi di parametri il cui compito non è risolvere direttamente il problema, ma generare in linguaggio naturale il workflow da far eseguire a un insieme di altri modelli. Per ogni richiesta, Conductor stabilisce quale agente chiamare, quale istruzione specifica assegnargli e quali messaggi precedenti rendere disponibili nel suo contesto. Nei compiti semplici può usare un solo modello; nei problemi di coding più articolati può invece costruire una pipeline con planner, esecutori e verificatori.

Uno degli aspetti più rilevanti del sistema è la possibilità di aumentare il calcolo in fase di inferenza senza modificare i pesi dei modelli coinvolti. Conductor può selezionare se stesso come worker, leggere il lavoro già prodotto dal gruppo di agenti, rilevare un possibile errore e generare un nuovo workflow correttivo. Questo meccanismo di orchestrazione ricorsiva permette di aggiungere passaggi di revisione e correzione quando il task lo richiede, invece di applicare lo stesso schema operativo a tutte le richieste.

Sakana AI afferma che Fugu Ultra raggiunge prestazioni comparabili ai modelli frontier nei benchmark di coding, reasoning, scienza e attività agentiche. Nei confronti pubblicati dall’azienda, i risultati di Fugu Ultra vengono messi accanto a quelli di Claude Fable 5 e Claude Mythos Preview. Tuttavia, questi modelli Anthropic non fanno parte del pool di agenti utilizzato da Fugu, perché non sono disponibili pubblicamente all’interno della piattaforma. Per i punteggi dei modelli esterni, Sakana AI utilizza i risultati dichiarati dai rispettivi provider.

La differenza principale rispetto a un normale endpoint LLM è quindi nel livello di controllo collocato tra l’applicazione e i modelli foundation. Chi utilizza Fugu invia una richiesta a un solo endpoint, ma il sistema può trasformarla internamente in una catena di deleghe, verifiche e sintesi. L’obiettivo è ridurre il lavoro necessario per progettare manualmente router, prompt specialistici, pipeline di verifica, fallback e meccanismi di selezione dei modelli.

Per le organizzazioni con esigenze di privacy, compliance o governance dei dati, Sakana AI dichiara inoltre la possibilità di escludere agenti specifici dal pool. In questo modo l’orchestratore può essere configurato per evitare determinati modelli o provider, mantenendo comunque la logica di delega e sintesi multi-modello. Fugu viene quindi proposto non come un nuovo modello monolitico addestrato per sostituire tutti gli altri, ma come uno strato di orchestrazione capace di combinare modelli diversi e adattare il workflow alla difficoltà del compito.

Sakana Fugu orchestra più modelli AI attraverso una sola API

DiFantasy

Di Fantasy

Articoli correlati

Anthropic sospende le nuove regole di fatturazione per Claude Agent SDK

Claude Opus 4.7 controlla un robot quadrupede fino a 37 volte più velocemente dei team umani

NVIDIA presenta SpatialClaw, un framework che usa il codice per migliorare il ragionamento spaziale dei modelli AI

Ultimi Post

Anthropic sospende le nuove regole di fatturazione per Claude Agent SDK

Claude Opus 4.7 controlla un robot quadrupede fino a 37 volte più velocemente dei team umani

NVIDIA presenta SpatialClaw, un framework che usa il codice per migliorare il ragionamento spaziale dei modelli AI

Apple valuta aumenti di prezzo per iPhone mentre crescono i costi delle memorie per AI