Immagine AI

In un mercato del cloud sempre più dominato dalla corsa all’Intelligenza Artificiale, Google Cloud ha fatto un passo decisivo per affermare la sua leadership nel settore delle GPU lanciando Vertex AI Training. Questo nuovo servizio rappresenta un’evoluzione significativa, non limitandosi più a offrire strumenti per la personalizzazione di modelli esistenti come Gemini, ma fornendo alle aziende una piattaforma di formazione completa e gestita che permette loro di sviluppare e addestrare i propri modelli di AI generativa da zero.

Il lancio di Vertex AI Training è una risposta diretta e potente alla crescente domanda delle imprese di internalizzare e personalizzare profondamente la tecnologia AI per guidare l’innovazione. A differenza di un semplice servizio di noleggio di risorse computazionali, questa piattaforma integra un pacchetto completo essenziale per il machine learning su larga scala: un’infrastruttura GPU all’avanguardia, strumenti di data science avanzati e, soprattutto, un ambiente di gestione dell’apprendimento distribuito basato su Slurm.

Come ha sottolineato Jaime de Guerre, direttore della gestione dei prodotti di Google Cloud, l’obiettivo è rivolgersi a quelle aziende che desiderano addestrare un modello partendo “da pesi casuali”, andando ben oltre il semplice fine-tuning o la Generative Augmented Generation (RAG).

La vera forza del servizio risiede nella sua natura di ambiente completamente gestito. L’infrastruttura, basata su Slurm, si occupa automaticamente della pianificazione delle attività di formazione anche in ambienti cluster su vasta scala. Cruciale per l’addestramento intensivo e prolungato dei modelli, la piattaforma implementa anche checkpoint automatici, garantendo un ripristino rapido e senza interruzioni in caso di guasto hardware. Questo elemento è fondamentale per assicurare un apprendimento efficiente e stabile in un contesto cloud competitivo, dove l’alta domanda di GPU e la complessità di gestire cluster vasti possono spesso ostacolare il lavoro dei data scientist.

Con l’introduzione di Vertex AI Training, Google Cloud si inserisce in piena competizione con giganti del cloud e specialisti delle GPU come AWS, Microsoft Azure, CoreWeave e Lambda. La piattaforma offre ora un ambiente dove le aziende possono addestrare in autonomia i modelli o eseguire il re-training di modelli open source utilizzando la potenza dell’infrastruttura Google.

Il vantaggio competitivo di Google risiede nell’aver riversato in Vertex AI Training l’esperienza e la tecnologia acquisite internamente durante l’addestramento dei suoi stessi modelli di punta, in primis Gemini. Ciò significa che gli utenti possono sfruttare direttamente l’efficienza dei cluster GPU integrati sviluppati da Google, strumenti avanzati per il monitoraggio dell’addestramento, funzionalità di gestione e ottimizzazione dei parametri che altrimenti richiederebbero un enorme sforzo ingegneristico interno.

I primi clienti hanno già dimostrato il valore e l’efficacia della piattaforma nel superare le barriere dell’addestramento AI su larga scala. AI Singapore, ad esempio, ha utilizzato Vertex AI Training per sviluppare il suo large language model (LLM) SEA-LION v4, un modello da 27 miliardi di parametri progettato per le lingue del Sud-est asiatico. Allo stesso modo, Salesforce ha potuto addestrare il proprio modello di intelligenza artificiale interno in collaborazione con il suo team di ricerca, sfruttando la stabilità e l’efficienza offerte dalla piattaforma.

Di Fantasy