Z.ai, una startup cinese precedentemente nota come Zhipu AI, ha presentato la sua nuova famiglia di modelli linguistici di grandi dimensioni (LLM): GLM-4.5 e GLM-4.5-Air. Questi modelli non solo promettono prestazioni superiori a quelle dei principali concorrenti, ma offrono anche funzionalità innovative, come la generazione automatica di presentazioni PowerPoint, posizionandosi come una valida alternativa open-source a modelli proprietari come ChatGPT.
GLM-4.5 si distingue per le sue prestazioni elevate in vari benchmark industriali. Secondo i test, il modello si colloca al terzo posto assoluto su una dozzina di prove competitive, superando modelli come Claude 4 Sonnet, Claude 4 Opus e Gemini 2.5 Pro in valutazioni come BrowseComp, AIME24 e SWE-bench Verified. La versione più leggera, GLM-4.5-Air, pur essendo più compatta, raggiunge comunque risultati tra i primi sei, offrendo un equilibrio tra prestazioni e efficienza.
Oltre alle elevate prestazioni, GLM-4.5 e GLM-4.5-Air introducono funzionalità avanzate che li rendono strumenti versatili per le imprese. Entrambi i modelli dispongono di due modalità operative: una modalità “pensante” per ragionamenti complessi e l’uso di strumenti, e una modalità “non pensante” per risposte immediate. Tra le caratteristiche distintive, spicca la capacità di generare automaticamente presentazioni PowerPoint complete a partire da un titolo o prompt, facilitando la preparazione di riunioni, attività didattiche e report interni.
Inoltre, questi modelli supportano la scrittura creativa, la generazione di testi emotivamente consapevoli e la creazione di sceneggiature per contenuti brandizzati destinati ai social media e al web. Z.ai afferma che i modelli supportano anche lo sviluppo di personaggi virtuali e sistemi di dialogo a turni per il supporto clienti, giochi di ruolo, coinvolgimento dei fan o narrazione di personaggi digitali.
GLM-4.5 è costruito con 355 miliardi di parametri totali e 32 miliardi di parametri attivi, mentre GLM-4.5-Air offre un design più leggero con 106 miliardi di parametri totali e 12 miliardi di parametri attivi. Entrambi utilizzano un’architettura Mixture-of-Experts (MoE), ottimizzata con bilanciamento senza perdita, gating sigmoide e maggiore profondità per migliorare il ragionamento. Il blocco di auto-attenzione include Grouped-Query Attention e un numero maggiore di teste di attenzione. Un layer di Multi-Token Prediction (MTP) consente la decodifica speculativa durante l’inferenza.
Il pre-addestramento si estende su 22 trilioni di token, suddivisi tra corpora di uso generale e codice/ragionamento. L’addestramento intermedio aggiunge 1,1 trilioni di token da dati di codice a livello di repository, input di ragionamento sintetico e fonti di contesto lungo/agentico. Il processo di post-addestramento per GLM-4.5 si è basato su una fase di apprendimento rinforzato alimentata dalla propria infrastruttura RL, “slime”, che separa i processi di generazione dei dati e addestramento del modello per ottimizzare la capacità di elaborazione su compiti agentici.
GLM-4.5 e GLM-4.5-Air sono rilasciati con licenza Apache 2.0, una licenza open-source permissiva e favorevole al commercio. Ciò consente a sviluppatori e organizzazioni di utilizzare liberamente, modificare, auto-ospitare, affinare e ridistribuire i modelli sia per scopi di ricerca che commerciali. Per coloro che non desiderano scaricare il codice o i pesi del modello e auto-ospitare o distribuire autonomamente, l’API basata su cloud di Z.ai offre il modello ai seguenti prezzi:
- GLM-4.5: $0,60 / $2,20 per 1 milione di token di input/output
- GLM-4.5-Air: $0,20 / $1,10 per 1 milione di token di input/output
La famiglia GLM-4.5 rappresenta un passo significativo verso l’autonomia e l’efficienza nell’ambito dell’intelligenza artificiale. Con la sua capacità di generare presentazioni PowerPoint e altre funzionalità avanzate, GLM-4.5 offre alle imprese uno strumento potente e versatile per migliorare la produttività e l’efficienza. La sua architettura all’avanguardia e la licenza open-source lo rendono una scelta interessante per coloro che cercano soluzioni AI avanzate e personalizzabili.