Cohere ha annunciato North Mini Code, il primo modello della nuova famiglia North progettato specificamente per attività di sviluppo software agentico. Il modello viene distribuito come open source con licenza Apache 2.0 ed è stato sviluppato per fornire capacità di coding, esecuzione di task da terminale e orchestrazione di workflow software mantenendo requisiti hardware significativamente inferiori rispetto a molti modelli concorrenti. Secondo l’azienda, North Mini Code può essere eseguito su una singola GPU NVIDIA H100 utilizzando precisione FP8, una caratteristica che punta a semplificare l’adozione locale e on-premise da parte di organizzazioni che non vogliono dipendere da infrastrutture cloud esterne.
Dal punto di vista architetturale, North Mini Code utilizza una configurazione Mixture-of-Experts (MoE) da 30 miliardi di parametri totali, ma attiva soltanto 3 miliardi di parametri per token durante l’inferenza. Questo approccio consente di mantenere una capacità complessiva elevata riducendo contemporaneamente il carico computazionale effettivo richiesto per l’esecuzione del modello. La scelta di una struttura MoE permette infatti di instradare ogni token verso un sottoinsieme specializzato di esperti invece di coinvolgere l’intera rete neurale, migliorando l’efficienza rispetto a modelli dense di dimensioni equivalenti.
Il modello dispone di una finestra di contesto da 256.000 token e supporta generazioni fino a 64.000 token in output. Cohere ha ottimizzato North Mini Code per scenari di software engineering agentico nei quali il modello deve comprendere repository di grandi dimensioni, eseguire attività multi-step, utilizzare strumenti esterni, interagire con il terminale e coordinare operazioni tipiche degli agenti di sviluppo moderni. L’azienda descrive il sistema come progettato per attività quali code review, analisi dell’architettura applicativa, orchestrazione di sub-agent e gestione di workflow software complessi.
Uno degli aspetti centrali dell’annuncio riguarda le prestazioni ottenute nei benchmark di sviluppo software agentico. Cohere dichiara che North Mini Code raggiunge risultati competitivi in test come SWE-Bench Verified, SWE-Bench Pro e Terminal Bench, benchmark utilizzati per valutare la capacità dei modelli di risolvere problemi reali di ingegneria del software operando direttamente su basi di codice esistenti. Per queste valutazioni il modello è stato testato utilizzando framework agentici dedicati come SWE-agent e harness ReAct basati su strumenti terminali.
La società ha inoltre posto particolare attenzione alle prestazioni operative. Nei test interni North Mini Code avrebbe raggiunto una velocità di generazione fino a 2,8 volte superiore rispetto a Devstral Small 2 a parità di configurazione hardware e livelli di concorrenza, oltre a una riduzione di circa il 30% della latenza inter-token. Questi parametri risultano particolarmente rilevanti per gli agenti di coding, dove il tempo necessario per eseguire cicli ripetuti di lettura del codice, pianificazione, modifica dei file ed esecuzione dei test può incidere significativamente sulla produttività complessiva.
North Mini Code è stato sviluppato per integrarsi con gli ecosistemi emergenti di agenti open source e può essere utilizzato attraverso i pesi pubblicati su Hugging Face, tramite API Cohere, sulla piattaforma Model Vault dell’azienda o all’interno di strumenti di sviluppo compatibili come OpenCode. L’obiettivo dichiarato è offrire agli sviluppatori un modello specializzato per attività di coding agentico che possa essere distribuito localmente, personalizzato e integrato in infrastrutture proprietarie senza vincoli di dipendenza da fornitori cloud esterni.
L’annuncio rappresenta anche il primo passo della nuova strategia North di Cohere, orientata verso la realizzazione di modelli aperti e ottimizzati per scenari di AI sovrana. In questo contesto, North Mini Code viene presentato come una piattaforma di base per agenti di sviluppo software in grado di combinare capacità di ragionamento sul codice, utilizzo degli strumenti e requisiti infrastrutturali sufficientemente contenuti da consentire l’esecuzione su hardware già presente in molte organizzazioni enterprise.
