La società sudcoreana OneLineAI, guidata dal CEO Jeong Han-eol, ha annunciato il rilascio di “OLAF v2”, un modello di intelligenza artificiale (IA) in lingua coreana progettato per migliorare le capacità di ragionamento e risolvere problemi complessi.

OLAF v2 introduce due innovazioni principali: il “processo di pensiero” e il “test-time scaling”. Il “processo di pensiero” permette al modello di generare autonomamente una sequenza di ragionamenti per comprendere e risolvere problemi, simile al metodo “Chain-of-Thought”. Questo approccio consente al modello di individuare e correggere errori durante l’elaborazione, aumentando l’affidabilità delle risposte. Il “test-time scaling” permette al modello di utilizzare maggiori risorse computazionali per affrontare problemi complessi, simulando diverse strategie per identificare la soluzione ottimale, utilizzando tecniche come la “Monte Carlo Tree Search” (MCTS).

OLAF v2 è disponibile in due versioni: una con 14 miliardi di parametri e una più leggera con 1,5 miliardi. Entrambe supportano un contesto di 32.000 token, rendendole adatte per applicazioni che richiedono l’uso di strumenti esterni o l’integrazione con sistemi di ricerca avanzati. Durante l’addestramento, è stata posta particolare attenzione alla generazione iterativa dei dati e all’implementazione di meccanismi per rifiutare domande inappropriate, riducendo così il fenomeno delle “allucinazioni” e migliorando l’affidabilità del modello.

Nei test di benchmark, OLAF v2 ha ottenuto risultati notevoli: un punteggio di 91,96 su GSM8K, un dataset di problemi matematici di livello scolastico, e 36,20 su Omni-MATH, che include problemi di livello olimpico. Questi risultati superano quelli del modello GPT-4o, che ha registrato rispettivamente 91,21 e 30,75 punti, evidenziando l’efficacia di OLAF v2 nonostante le sue dimensioni relativamente contenute.

Jeong Han-eol ha dichiarato che OLAF v2 mostra una notevole capacità di ragionamento, rendendolo particolarmente adatto per l’analisi di dati finanziari complessi e la valutazione dei rischi. Ha inoltre annunciato che OneLineAI sta collaborando con importanti istituzioni finanziarie sudcoreane per sviluppare servizi IA specializzati nel settore finanziario, sfruttando le avanzate capacità di OLAF v2.

Di Fantasy