Immagine AI

La crescita dei modelli linguistici negli ultimi anni è stata spesso associata a un aumento continuo del numero di parametri. Il nuovo LFM2.5-230M di Liquid AI segue invece una direzione diversa, concentrandosi sull’efficienza architetturale piuttosto che sulla sola dimensione del modello. Con appena 230 milioni di parametri, è stato progettato specificamente per attività di estrazione strutturata delle informazioni, riuscendo a ottenere prestazioni superiori rispetto a modelli fino a quattro volte più grandi nello stesso tipo di elaborazione.

L’obiettivo del modello non è competere con i grandi LLM generalisti nelle attività conversazionali, ma ottimizzare uno dei processi più diffusi nelle applicazioni aziendali: trasformare documenti non strutturati in dati utilizzabili dai sistemi informativi. Fatture, moduli, report, documentazione tecnica, registri, e-mail e archivi digitali rappresentano infatti sorgenti informative che richiedono continuamente identificazione di campi, classificazione dei contenuti ed estrazione di valori precisi. In questo scenario la precisione conta più della capacità di generare lunghi testi.

Per raggiungere questo risultato, Liquid AI ha mantenuto la filosofia della famiglia LFM2, caratterizzata da un’architettura ibrida che combina componenti convoluzionali dedicate all’elaborazione locale con blocchi di attenzione molto più contenuti rispetto ai transformer tradizionali. Questa impostazione riduce il fabbisogno computazionale, limita il consumo di memoria e migliora la velocità di inferenza, rendendo possibile l’esecuzione del modello su CPU, GPU leggere, NPU e dispositivi edge senza richiedere infrastrutture cloud dedicate.

La ridotta dimensione del modello consente inoltre tempi di risposta molto contenuti, minori costi operativi e una distribuzione più semplice all’interno di sistemi embedded, applicazioni industriali, software gestionali e dispositivi locali. Questo permette di elaborare documenti direttamente nel punto in cui vengono prodotti, riducendo la necessità di trasferire dati sensibili verso servizi remoti e facilitando l’adozione in contesti dove privacy, latenza e continuità operativa rappresentano requisiti fondamentali.

Il rilascio di LFM2.5-230M evidenzia una tendenza sempre più evidente nello sviluppo dell’intelligenza artificiale: per numerose applicazioni professionali non è necessario utilizzare modelli con miliardi di parametri, ma architetture specializzate progettate per uno specifico dominio operativo. L’efficienza diventa così un parametro competitivo al pari dell’accuratezza, aprendo la strada a soluzioni di AI eseguibili praticamente ovunque, dai server aziendali ai dispositivi periferici, mantenendo elevate prestazioni nelle attività di estrazione e strutturazione automatica delle informazioni.

Di Fantasy