L’Allen Institute for AI (Ai2) ha recentemente annunciato un significativo progresso con il rilascio di Tülu 3, un modello open source progettato per superare le prestazioni di modelli proprietari come DeepSeek v3 e GPT-4o. Questa iniziativa rappresenta un passo importante verso la democratizzazione dell’IA avanzata, offrendo alla comunità strumenti e risorse per sviluppare modelli di linguaggio di alta qualità.
Tülu 3 si distingue per il suo approccio al post-training, una fase cruciale che raffina i modelli linguistici dopo l’addestramento iniziale, migliorandone le capacità e adattandoli a compiti specifici. Tradizionalmente, le tecniche di post-training, come il fine-tuning supervisionato e l’apprendimento tramite preferenze, sono state utilizzate per migliorare le prestazioni dei modelli. Tülu 3 introduce un metodo innovativo chiamato “Reinforcement Learning with Verifiable Rewards” (RLVR), che utilizza risultati verificabili, come la risoluzione corretta di problemi matematici, per ottimizzare ulteriormente il modello.
Una delle caratteristiche distintive di Tülu 3 è la sua completa apertura. Ai2 ha reso disponibili non solo il modello, ma anche i dati di addestramento, il codice sorgente e le ricette utilizzate per il post-training. Questa trasparenza consente a ricercatori e sviluppatori di replicare, modificare e migliorare il modello, promuovendo l’innovazione collaborativa. Sophie Lebrecht, Chief Operating Officer di Ai2, ha sottolineato l’importanza di questa apertura, affermando che Tülu 3 rappresenta “un vero cambiamento per la comunità open-source” poiché “ora chiunque può effettuare il post-training di un modello con la stessa qualità di quelli proprietari”.
Nonostante sia un modello open source, Tülu 3 dimostra prestazioni che rivaleggiano e, in alcuni casi, superano quelle di modelli proprietari di aziende leader come OpenAI, Anthropic e Google. In benchmark che valutano abilità come matematica, capacità di seguire istruzioni e chat, Tülu 3 ha ottenuto risultati superiori, dimostrando che l’innovazione open source può competere ai massimi livelli.