Google ha svelato Trillium, il suo chip acceleratore di sesta generazione per l’intelligenza artificiale (AI), promettendo miglioramenti prestazionali che potrebbero trasformare l’economia dello sviluppo AI e spingere oltre i limiti del machine learning. Questo processore personalizzato ha alimentato l’addestramento del nuovo modello AI di Google, Gemini 2.0, offrendo una potenza di calcolo quattro volte superiore rispetto al suo predecessore, con un consumo energetico significativamente ridotto. Questo progresso arriva in un momento cruciale, poiché le aziende tecnologiche competono per costruire sistemi AI sempre più sofisticati che richiedono enormi risorse computazionali.
Sundar Pichai, CEO di Google, ha spiegato che “le TPU hanno alimentato il 100% dell’addestramento e dell’inferenza di Gemini 2.0”, sottolineando il ruolo centrale del chip nella strategia AI dell’azienda. La scala di implementazione è senza precedenti: Google ha collegato oltre 100.000 chip Trillium in un’unica rete, creando quello che equivale a uno dei supercomputer AI più potenti al mondo.
Le specifiche di Trillium rappresentano progressi significativi su più fronti. Il chip offre un aumento di 4,7 volte delle prestazioni di calcolo di picco per chip rispetto al suo predecessore, raddoppiando sia la capacità di memoria ad alta larghezza di banda che la larghezza di banda di interconnessione tra chip. Forse ancora più importante, raggiunge un incremento del 67% nell’efficienza energetica, un parametro cruciale mentre i data center affrontano le enormi richieste di potenza dell’addestramento AI.
Mark Lohmeyer, vicepresidente dell’infrastruttura di calcolo e AI di Google Cloud, ha dichiarato: “Quando si addestra il modello Llama-2-70B, i nostri test dimostrano che Trillium raggiunge una scalabilità quasi lineare da un pod di 4 slice Trillium-256 chip a un pod di 36 slice Trillium-256 chip con un’efficienza di scalabilità del 99%”. Questo livello di efficienza è particolarmente notevole, data la complessità tipicamente associata al calcolo distribuito su questa scala.
Le implicazioni economiche di Trillium vanno oltre le semplici metriche prestazionali. Google afferma che il chip fornisce un miglioramento fino a 2,5 volte nelle prestazioni di addestramento per dollaro rispetto alla generazione precedente, potenzialmente rimodellando l’economia dello sviluppo AI. Questa efficienza nei costi potrebbe rivelarsi particolarmente significativa per le imprese e le startup che sviluppano modelli AI di grandi dimensioni, offrendo loro l’opportunità di innovare più rapidamente e con budget più contenuti.