Meituan ha presentato LongCat-2.0, un modello linguistico Mixture-of-Experts progettato per attività di coding, uso di strumenti e workflow agentici a più passaggi. La scala dichiarata è di 1,6 trilioni di parametri complessivi, ma l’architettura ne attiva circa 48 miliardi per token: una scelta che punta a mantenere elevata la capacità del modello senza trasformare ogni inferenza nel costo computazionale di un sistema dense di pari dimensione.
L’elemento tecnico più rilevante è l’attenzione ai task di lunga durata. LongCat-2.0 integra una variante chiamata LongCat Sparse Attention e viene addestrato anche su grandi volumi di dati con contesto fino a un milione di token. In pratica, il modello è pensato per mantenere una rappresentazione utile di repository articolati, documentazione tecnica, log, specifiche, ticket e conversazioni precedenti, senza ridurre il lavoro a una modifica isolata di poche righe di codice.
Questo tipo di contesto è particolarmente importante nel coding agentico. Un agente non deve soltanto generare una funzione o completare un blocco di codice, ma può dover leggere la struttura di un progetto, individuare dipendenze, formulare un’ipotesi su un errore, modificare più file, eseguire test e correggere eventuali regressioni. La qualità dipende quindi dalla capacità di conservare gli obiettivi iniziali, distinguere le informazioni pertinenti dal rumore e usare strumenti esterni in modo coerente durante l’intera sequenza operativa.
LongCat-2.0 è stato addestrato e distribuito su infrastrutture basate interamente su AI ASIC, con milioni di ore di acceleratore e oltre 35 trilioni di token elaborati nel pretraining. Il dato non riguarda solo le dimensioni del modello: dimostra la possibilità di realizzare training su scala frontier anche su piattaforme hardware alternative alle GPU Nvidia, con implicazioni dirette per la diversificazione delle filiere di calcolo destinate all’intelligenza artificiale.
Per gli sviluppatori, tuttavia, il rilascio va letto con una distinzione precisa. Repository e documentazione sono già pubblici, ma i pesi completi del modello risultano ancora indicati come in arrivo. Fino alla loro disponibilità effettiva, LongCat-2.0 rappresenta soprattutto una piattaforma tecnica da osservare per architettura, approccio al contesto esteso e posizionamento nel coding agentico, più che un modello immediatamente distribuibile in autonomia.
