La startup italiana Xference sta sviluppando una nuova infrastruttura europea dedicata all’inferenza AI privata, con l’obiettivo di offrire ad aziende e organizzazioni un’alternativa ai tradizionali servizi di intelligenza artificiale ospitati sui grandi cloud provider internazionali. Il progetto nasce all’interno dei data center Aruba di Ponte San Pietro, in provincia di Bergamo, dove la società ha avviato la propria piattaforma AI progettata per garantire sovranità del dato, autonomia digitale e conformità alle normative europee su privacy e trattamento delle informazioni sensibili.
A differenza dei grandi operatori globali focalizzati sull’addestramento di modelli proprietari, Xference si concentra sull’inferenza AI, cioè la fase operativa in cui i modelli linguistici elaborano richieste, generano risposte e svolgono attività concrete sui dati aziendali. La piattaforma utilizza modelli open source eseguiti in ambienti privati e isolati, evitando che dati, documenti o prompt degli utenti vengano trasferiti all’esterno dell’infrastruttura controllata dal cliente.
L’approccio punta a risolvere uno dei problemi più delicati dell’adozione enterprise dell’intelligenza artificiale generativa in Europa: la dipendenza da infrastrutture extraeuropee e il conseguente rischio di perdita del controllo sui dati aziendali. In molti settori regolamentati, come sanità, finanza, industria e pubblica amministrazione, l’utilizzo di servizi AI cloud tradizionali può infatti creare criticità legate a GDPR, AI Act, trasferimento internazionale dei dati e governance delle informazioni strategiche. Xference propone quindi un modello di “Private AI” dove inferenza, storage e gestione operativa rimangono confinati in ambienti europei dedicati.
Il progetto richiede capacità computazionali particolarmente elevate. I rack utilizzati per l’inferenza AI superano infatti i 20 kW di densità energetica, valori significativamente superiori rispetto a quelli tipici dei tradizionali workload enterprise. Aruba fornisce non soltanto la colocation nei propri data center IT3, ma anche server provisioning in modalità Hardware-as-a-Service, networking, sicurezza e gestione operativa dell’infrastruttura.
Uno degli aspetti tecnici più rilevanti riguarda la progettazione di un’architettura edge distribuita. Xference prevede infatti di espandere progressivamente la propria rete europea avvicinando i nodi di calcolo agli utenti finali, riducendo latenza, consumi energetici e dipendenza da grandi hub centralizzati. Questo modello riflette una tendenza crescente nel mercato AI europeo, dove sovranità digitale, efficienza energetica e localizzazione dei dati stanno diventando fattori strategici tanto quanto la potenza computazionale dei modelli.
La piattaforma è attualmente in fase beta su invito con i primi 100 early adopter selezionati, che stanno testando il sistema in scenari reali. Secondo Xference, l’obiettivo a lungo termine è costruire uno dei primi inference provider europei indipendenti, capace di offrire AI generativa privata, conforme agli standard europei e utilizzabile anche da organizzazioni prive di grandi team interni di data science.
L’iniziativa si inserisce nel più ampio dibattito europeo sulla cosiddetta “AI sovrana”, cioè la capacità dell’Europa di sviluppare infrastrutture, modelli e piattaforme AI indipendenti dai grandi operatori statunitensi e cinesi. In questo contesto, infrastrutture distribuite, modelli open source e gestione locale dell’inferenza stanno emergendo come elementi centrali per costruire un ecosistema AI europeo orientato a sicurezza, compliance e controllo diretto dei dati.
