Per quanto riguarda i large language model europei, Domyn ha rilasciato Domyn Small, un modello da 10 miliardi di parametri progettato con una precisa finalità tecnica e industriale: portare capacità di ragionamento avanzato in ambienti dove le risorse computazionali, la latenza e i costi di inferenza devono essere gestiti con precisione chirurgica. Non si tratta di un modello generico ottimizzato per i benchmark più popolari, ma di uno strumento costruito esplicitamente per deployment on-premise, infrastrutture regolamentate, dispositivi edge e — in casi limite — persino laptop.
Domyn Small supporta oltre 50 lingue con un’ottimizzazione specifica per le principali lingue europee, tra cui italiano, francese, tedesco, spagnolo e portoghese. Il modello incorpora una finestra di contesto espandibile, pensata per gestire documenti e interazioni prolungate senza perdere coerenza, e una modalità di ragionamento controllabile — il cosiddetto “thinking on/off” — che permette di attivare o disattivare il ragionamento multi-step a seconda del task. Questo meccanismo è particolarmente rilevante per applicazioni agentiche che richiedono tool calling, coding o ragionamento matematico strutturato, dove il costo computazionale per token deve essere ottimizzato senza sacrificare l’accuratezza.
Il confronto con Domyn Large, il modello da 260 miliardi di parametri rilasciato in precedenza dalla stessa azienda, chiarisce il posizionamento strategico: i due modelli non si sovrappongono, ma coprono casi d’uso radicalmente diversi. Domyn Large è pensato per ambienti con infrastruttura dedicata e requisiti di qualità massima; Domyn Small sposta il punto d’equilibrio verso la token efficiency, ossia la capacità di completare un determinato task con meno token e quindi con latenza e costi inferiori in produzione. Secondo i dati dichiarati da Domyn, il modello mostra un trade-off positivo tra questa efficienza e l’accuratezza sui benchmark di ragionamento, pur restando nella categoria dei modelli compatti.
Il processo di addestramento è uno degli elementi più significativi di questa release dal punto di vista geopolitico e infrastrutturale. Domyn Small è stato addestrato sul Supercomputer Leonardo di CINECA, una delle macchine HPC più potenti d’Europa, ospitata fisicamente in Italia e finanziata con fondi pubblici nell’ambito del framework EuroHPC. Questa scelta non è meramente tecnica: significa che i dati di training e i processi di ottimizzazione non hanno mai transitato per infrastrutture extra-europee, costruendo una catena di custodia che è direttamente rilevante per la conformità all’AI Act europeo. La collaborazione tra Domyn e CINECA è attiva dal 2024 e si inquadra nell’iniziativa IT4LIA AI Factory, parte dell’ecosistema più ampio delle AI Factories europee pensate per fornire infrastruttura HPC sovrana a ricercatori, pubbliche amministrazioni, imprese e startup.
Il punto di differenziazione più netto rispetto ai modelli closed-source dominanti è la modalità di rilascio: Domyn Small viene distribuito con pesi aperti (open weights), il che significa che le organizzazioni che lo adottano non si limitano a inferenza via API, ma ottengono accesso ai parametri del modello e alla ricetta di training. Questo abilita fine-tuning su domini verticali specifici — settore bancario, sanitario, legale, della difesa — oppure l’utilizzo del modello come base per addestrare architetture proprietarie più specializzate. Per le industrie regolamentate, questa caratteristica ha un valore concreto: significa poter governare interamente il modello, sapere esattamente su quali dati è stato addestrato, modificarne il comportamento senza dipendere da un fornitore esterno, e dimostrare questa trasparenza agli organi di controllo.
Il contesto in cui si inserisce questa release è quello di una crescente pressione normativa e di una domanda industriale di AI che sia verificabile, modificabile e non dipendente da infrastrutture straniere. Domyn si posiziona esplicitamente in questo spazio, puntando su un’accezione tecnica precisa di “sovranità”: non solo hosting europeo, ma proprietà piena dei pesi, controllo del processo di addestramento e capacità di deployment completamente air-gapped se necessario. Per organizzazioni come banche, ospedali, agenzie governative o aziende della difesa, la differenza tra accedere a un modello via cloud e possederne i pesi è la stessa che passa tra affidarsi a un servizio e possedere uno strumento.
