Immagine AI

Microsoft sta valutando l’integrazione di una versione ottimizzata di DeepSeek V4 in Copilot Cowork, l’agente aziendale di Microsoft 365 progettato per eseguire attività composte su documenti, file, posta elettronica, dati aziendali e applicazioni connesse. L’ipotesi riguarda un modello fornito come opzione aggiuntiva ai clienti e ospitato direttamente nell’infrastruttura Azure di Microsoft, non l’uso dei servizi pubblici di DeepSeek o il trasferimento dei dati verso server esterni.

La scelta è collegata al nuovo modello di fatturazione previsto per Copilot Cowork. Microsoft intende passare da una logica di accesso illimitato a un sistema basato sul consumo effettivo di risorse di calcolo. La motivazione è tecnica prima ancora che commerciale: un agente non produce una sola risposta come una chat tradizionale, ma può eseguire sequenze lunghe di pianificazione, lettura di file, ricerca, ragionamento, chiamate a strumenti, generazione di contenuti, verifica dei risultati e correzioni successive.

Ogni passaggio può richiedere una o più chiamate al modello. Un flusso apparentemente semplice, come preparare una sintesi di progetto o aggiornare una serie di documenti, può trasformarsi in decine di interazioni tra l’agente, il modello linguistico, Microsoft Graph, le applicazioni di Microsoft 365 e le fonti dati autorizzate dall’utente. Quando questo tipo di elaborazione viene eseguito ripetutamente da molti utenti, il consumo di token e capacità GPU cresce rapidamente.

Charles Lamanna, executive vice president di Microsoft per Copilot, agenti e piattaforme, ha spiegato che durante i test alcuni clienti hanno eseguito centinaia di attività alla settimana. Microsoft ha quindi concluso che un modello completamente illimitato non sarebbe sostenibile per Copilot Cowork, soprattutto nei casi in cui gli agenti operano per tempi lunghi e con più cicli di ragionamento.

La possibile adozione di DeepSeek V4 si inserisce in questa esigenza di riduzione dei costi per task. I modelli open weight permettono infatti a un fornitore cloud di gestire direttamente inferenza, capacità di calcolo, controlli di sicurezza e configurazioni di deployment, senza dipendere esclusivamente dalle tariffe applicate da laboratori proprietari come OpenAI o Anthropic. Microsoft sta già utilizzando una strategia multi-modello in vari prodotti e ambienti Azure, con modelli di fornitori differenti selezionati in base a qualità, velocità, costo e requisiti del singolo carico di lavoro.

Nel caso di DeepSeek, Microsoft starebbe valutando un’implementazione modificata e ospitata su Azure. Il modello verrebbe adattato alle esigenze del servizio e sottoposto a ulteriori interventi per ridurre comportamenti indesiderati, mitigare bias e rafforzare le protezioni previste per un ambiente enterprise. I dati dei clienti resterebbero quindi all’interno dell’infrastruttura Azure, con i controlli di sicurezza, conformità e data residency applicati ai tenant Microsoft 365.

L’hosting su Azure affronta soprattutto il problema del percorso dei dati. Prompt, file elaborati, risultati intermedi e log operativi non dovrebbero essere inviati ai sistemi di DeepSeek. Restano però separati altri aspetti da valutare, come l’origine dei pesi del modello, la sicurezza della supply chain software, le procedure di verifica adottate da Microsoft, i requisiti di conformità dei singoli settori e le eventuali restrizioni normative sull’impiego di modelli sviluppati da aziende cinesi.

L’integrazione non è stata confermata come decisione definitiva. Microsoft ha indicato di essere al lavoro su opzioni a costo inferiore per Copilot Cowork e di voler chiarire entro le prossime settimane quali modelli saranno effettivamente disponibili. L’eventuale DeepSeek V4 sarebbe proposto come scelta per i clienti, accanto ai modelli già utilizzati da Copilot Cowork, inclusi quelli di OpenAI e Anthropic.

Il cambiamento mostra una differenza sempre più netta tra i normali assistenti conversazionali e gli agenti che lavorano in autonomia su processi aziendali. Per questi ultimi, il parametro principale non è più soltanto il prezzo per utente o per licenza, ma il costo per attività completata: quantità di token, numero di iterazioni, strumenti chiamati, modelli coinvolti, tempo di esecuzione e risorse cloud necessarie per portare un workflow fino al risultato finale.

Di Fantasy