La startup cinese StepFund ha recentemente annunciato lo sviluppo di “Step-2”, un modello linguistico di grandi dimensioni (LLM) che vanta oltre 1 trilione di parametri. Questo avanzamento rappresenta un significativo passo avanti nel campo dell’intelligenza artificiale, superando modelli precedenti sia in termini di dimensioni che di capacità.
Fondata nell’aprile 2023 da Zhang Daxin, ex scienziato capo del Microsoft Research Asia, StepFund è rapidamente emersa come una delle principali startup AI in Cina. All’inizio di quest’anno, l’azienda ha lanciato “Step-1V”, un modello multimodale con oltre 100 miliardi di parametri. Ora, con Step-2, StepFund mira a ridefinire gli standard dell’industria, implementando un’architettura “Mixture of Experts” (MoE) per migliorare le prestazioni in compiti complessi come generazione di testo, ragionamento logico e risoluzione di problemi matematici.
Nei test preliminari, Step-2 ha ottenuto risultati impressionanti. Nella piattaforma di benchmarking “LiveBench”, il modello ha raggiunto il primo posto tra gli LLM cinesi e il quinto a livello globale. In particolare, ha eccelso nella comprensione e nell’esecuzione di istruzioni complesse, ottenendo un punteggio di 86,57, il più alto registrato. Tuttavia, ha mostrato margini di miglioramento in aree come la programmazione e la matematica, con punteggi rispettivamente di 46,87 e 48,88.
Parallelamente allo sviluppo tecnologico, StepFund ha concluso con successo un round di finanziamento di diversi milioni di dollari, attirando investimenti da fondi sovrani e grandi aziende tecnologiche cinesi. Questo capitale sarà utilizzato per arricchire le funzionalità multimodali del modello e per affinare le sue capacità di ragionamento avanzato. Inoltre, l’azienda prevede di lanciare prodotti basati su LLM destinati agli utenti finali, ampliando così l’accessibilità e l’applicazione delle sue tecnologie AI.
È interessante notare che, sebbene Step-2 rappresenti un notevole progresso, non è il modello più grande sviluppato in Cina. Nel 2023, Huawei ha presentato “PanGu-Σ”, un LLM con 1,05 trilioni di parametri, evidenziando la rapida evoluzione e la competitività del settore AI nel paese.