Immagine AI

Qualcomm Technologies e Hugging Face hanno ampliato la loro collaborazione per collegare l’ecosistema dei modelli aperti della piattaforma Hugging Face alle infrastrutture Qualcomm destinate a dispositivi, sistemi edge e data center. L’accordo riguarda l’intero percorso di distribuzione di un modello AI, dalla sperimentazione iniziale fino al deployment su smartphone, PC, wearable, sistemi industriali, piattaforme automotive, dispositivi edge e rack di inferenza.

Il progetto unisce da una parte la libreria Hugging Face, che raccoglie oltre tre milioni di modelli aperti per attività linguistiche, visive, multimodali e specialistiche, dall’altra le famiglie hardware Qualcomm Snapdragon, Dragonwing e Dragonfly. Snapdragon identifica le piattaforme per dispositivi personali come smartphone e PC, Dragonwing riguarda sistemi industriali, connettività e infrastrutture edge, mentre Dragonfly è la nuova linea Qualcomm per l’inferenza AI nei data center. L’obiettivo è permettere agli sviluppatori di usare gli stessi modelli e gli stessi strumenti software in ambienti con capacità di calcolo molto diverse.

Uno dei punti centrali dell’accordo è l’integrazione dei servizi di storage e inferenza Hugging Face con le infrastrutture data center Qualcomm Dragonfly. Hugging Face potrà utilizzare sistemi Qualcomm per carichi interni e per offrire ai propri utenti un percorso diretto dalla sperimentazione di un modello alla sua distribuzione in produzione. Questo significa che un modello pubblicato o adattato nell’ecosistema Hugging Face potrà essere portato verso hardware Qualcomm senza richiedere una nuova catena di tool completamente separata per il deployment.

La collaborazione include anche un agente destinato all’onboarding dei modelli sulle piattaforme Qualcomm. Il componente dovrebbe gestire configurazione, ottimizzazione e distribuzione dei modelli AI riducendo le procedure manuali normalmente necessarie per adattare un checkpoint open source a un determinato acceleratore. In un flusso tradizionale, il passaggio da un repository di modelli a un dispositivo reale richiede spesso conversione del formato, quantizzazione, definizione degli input, ottimizzazione dei grafi computazionali, compilazione per il runtime scelto e test delle prestazioni. Qualcomm e Hugging Face puntano a concentrare queste operazioni in un workflow guidato dall’agente, destinato a ridurre il tempo tra scelta del modello e messa in esecuzione.

L’integrazione non è limitata ai modelli generativi eseguiti localmente. Il progetto include un framework di orchestrazione ibrida per agenti AI distribuiti tra dispositivo e cloud. In questa architettura, un agente può decidere dove eseguire una parte del workflow in base a quattro variabili principali: prestazioni richieste, costo, latenza e privacy. Un task leggero, che usa dati sensibili o deve fornire una risposta immediata, può essere mantenuto sul dispositivo. Un’operazione che richiede un modello più grande, contesto esteso o una potenza di calcolo superiore può invece essere trasferita a un sistema edge o a un data center.

Questo tipo di orchestrazione è rilevante soprattutto per gli agenti che combinano più modelli, strumenti e fonti di dati. Un assistente installato su un PC o su uno smartphone potrebbe usare un modello locale per classificare una richiesta, elaborare documenti presenti sul dispositivo o verificare informazioni private, quindi inviare al cloud soltanto la parte del compito che richiede maggiore capacità di ragionamento o accesso a infrastrutture esterne. La distribuzione del carico non viene quindi definita una volta per tutte, ma può cambiare durante l’esecuzione del workflow.

Qualcomm ha inoltre indicato che gli sviluppatori Hugging Face potranno accedere ai componenti software di Modular attraverso il proprio ecosistema. Modular è la piattaforma software acquisita da Qualcomm per costruire applicazioni AI indipendenti da un singolo acceleratore e da un singolo runtime. Il suo inserimento nella collaborazione aggiunge un livello di astrazione che può rendere più semplice compilare, ottimizzare ed eseguire modelli su ambienti hardware diversi, evitando che ogni applicazione debba essere riscritta per ciascun target.

Hugging Face offrirà anche l’accesso a Hugging Face PRO agli utenti che utilizzano dispositivi o sistemi cloud basati su piattaforme Qualcomm. Il piano include capacità aggiuntive per storage, collaborazione, utilizzo dei modelli e gestione dei progetti, con l’obiettivo di spingere gli sviluppatori a usare il percorso integrato tra repository, strumenti di ottimizzazione e infrastrutture Qualcomm.

La collaborazione sposta quindi l’attenzione dal singolo modello al ciclo completo di sviluppo. Il modello open source resta il punto di partenza, ma il valore della piattaforma dipende dalla possibilità di convertirlo, quantizzarlo, distribuire l’inferenza, collegarlo a un agente e spostare dinamicamente il lavoro tra hardware locale e data center. Qualcomm e Hugging Face puntano a costruire questo passaggio come un flusso unico, nel quale lo stesso progetto può partire da un notebook o da un repository, essere provato su un dispositivo e poi scalato verso infrastrutture cloud senza cambiare completamente stack tecnico.

Di Fantasy