Il Korea Advanced Institute of Science and Technology (KAIST) ha recentemente presentato una soluzione tecnologica destinata a cambiare il modo in cui vengono gestite le infrastrutture per l’intelligenza artificiale generativa. Sotto la guida del professor Jong-Se Park, il team di ricerca denominato Anybridge AI ha sviluppato un software di sistema capace di unificare l’uso di diversi tipi di semiconduttori, rompendo il monopolio operativo delle costose unità di elaborazione grafica (GPU). Questa innovazione, che si è aggiudicata il primo premio in un prestigioso progetto di sviluppo promosso da Kakao, affronta uno dei problemi più urgenti del settore: l’altissima dipendenza da hardware specifico e i costi energetici e finanziari insostenibili legati al mantenimento dei grandi modelli linguistici (LLM).
L’aspetto rivoluzionario di questa ricerca risiede nella capacità del software di selezionare e combinare in modo intelligente chip semiconduttori con architetture profondamente diverse tra loro. Oltre alle tradizionali GPU, il sistema è in grado di integrare le unità di elaborazione neurale (NPU), progettate specificamente per accelerare le reti neurali, e i chip di elaborazione in memoria (PIM), che riducono i colli di bottiglia nei dati eseguendo i calcoli direttamente all’interno dei moduli di memoria. Fino ad oggi, far lavorare insieme queste diverse tipologie di hardware richiedeva processi di ottimizzazione lunghi, complessi e specifici per ogni singolo componente. Il software del KAIST elimina invece questa barriera, fornendo un’interfaccia standardizzata che permette di gestire l’intera infrastruttura come un unico sistema coerente.
Questa flessibilità architettonica porta con sé vantaggi immediati in termini di sostenibilità e scalabilità. Eliminando la dipendenza da un unico fornitore di hardware, le aziende possono costruire server di intelligenza artificiale più economici ed efficienti dal punto di vista energetico, utilizzando la combinazione di chip più adatta al carico di lavoro specifico. Il runtime sviluppato dal team Anybridge AI agisce come uno strato invisibile che ottimizza l’esecuzione dei modelli senza che gli sviluppatori debbano riscrivere il codice o preoccuparsi della compatibilità hardware. In pratica, il software decide autonomamente quale chip sia il più indicato per una determinata operazione, garantendo che le prestazioni rimangano elevate anche quando la configurazione dei semiconduttori sottostanti cambia o viene aggiornata.
Secondo le dichiarazioni del professor Park, questo traguardo segna l’inizio di una nuova era per le infrastrutture di servizio degli LLM di prossima generazione. Superare i limiti fisici ed economici dell’attuale modello basato quasi esclusivamente sulle GPU è fondamentale per democratizzare l’accesso all’intelligenza artificiale e renderla commercialmente praticabile su larga scala. La collaborazione avviata con i partner industriali suggerisce che questa tecnologia non rimarrà confinata nei laboratori accademici, ma diventerà presto una componente essenziale dei data center del futuro, trasformando radicalmente il modo in cui la potenza di calcolo viene distribuita e consumata a livello globale.
