H2O AI ha annunciato il rilascio di Danube, un nuovo modello LLM (super-tiny large Language Model) progettato per dispositivi mobili. Il modello, che prende il nome dal fiume Danubio, include 1,8 miliardi di parametri ed è destinato a competere con altri modelli simili, come quelli di Microsoft, Stability AI ed Eleuther AI, in una varietà di attività di linguaggio naturale.
L’annuncio arriva in un momento strategico, poiché le aziende che producono dispositivi consumer stanno sempre più esplorando l’intelligenza artificiale generativa offline. Questo approccio consente ai modelli di essere eseguiti localmente sul dispositivo, offrendo agli utenti assistenza rapida senza dipendere dal trasferimento di dati al cloud.
Sri Ambati, CEO e co-fondatore di H2O, ha dichiarato che il rilascio di Danube rappresenta un passo significativo verso l’accessibilità di modelli di intelligenza artificiale su dispositivi mobili. Nonostante il modello sia appena stato annunciato, H2O afferma che può essere personalizzato per una serie di applicazioni del linguaggio naturale su dispositivi mobili.
Per addestrare il modello, H2O ha raccolto trilioni di token da diverse fonti web e ha utilizzato tecniche perfezionate da modelli precedenti per migliorare le sue capacità.
Quando testato su benchmark, Danube ha dimostrato prestazioni paragonabili o superiori alla maggior parte dei modelli nella sua categoria. H2O ha rilasciato Danube-1.8B con licenza Apache 2.0 per uso commerciale, rendendolo disponibile per il download da Hugging Face.
H2O prevede di rilasciare ulteriori strumenti per semplificare l’implementazione del modello, incluso una versione ottimizzata per la chat. Si prevede che la disponibilità di modelli come Danube determinerà un aumento delle applicazioni di intelligenza artificiale generativa offline su dispositivi mobili, con potenziali utilizzi che includono il riepilogo delle e-mail e le applicazioni conversazionali.