Moondream ha annunciato oggi il completamento di un finanziamento pre-seed di 4,5 milioni di dollari e presenta un’idea innovativa: nel campo dell’intelligenza artificiale, i modelli più piccoli possono offrire prestazioni elevate. Sostenuta da Felicis Ventures, M12 GitHub Fund di Microsoft e Ascend, la startup ha sviluppato un modello di linguaggio visivo con soli 1,6 miliardi di parametri, capace di competere con modelli quattro volte più grandi.
Il modello open source di Moondream ha già attirato molta attenzione, con oltre 2 milioni di download e 5.100 stelle su GitHub. Jay Allen, CEO di Moondream ed ex direttore tecnico di AWS, ha commentato: “Ciò che lo rende speciale è la sua compattezza e l’elevata accuratezza. Funziona facilmente e rapidamente, anche su dispositivi iOS e telefoni cellulari”.
Affrontare i costi e le preoccupazioni sulla privacy del cloud
La startup si occupa di un problema crescente nell’adozione dell’intelligenza artificiale nelle aziende: i costi elevati e le preoccupazioni relative alla privacy nel cloud computing. L’approccio di Moondream consente ai modelli AI di operare localmente su vari dispositivi, dai cellulari alle attrezzature industriali.
Allen ha spiegato: “Con l’intelligenza artificiale che entra in sempre più applicazioni, ci troviamo in una situazione difficile: vogliamo i benefici dell’AI ma non vogliamo che tutto venga inviato al cloud. La mia preferenza è che l’AI operi il più possibile a livello locale, per mantenere il controllo sulla privacy”.
I primi utenti hanno trovato molteplici applicazioni per questa tecnologia. I rivenditori la utilizzano per gestire l’inventario in modo automatizzato tramite scansioni mobili. Le aziende di trasporto la implementano per le ispezioni dei veicoli, mentre negli impianti di produzione, dove i sistemi sono isolati, l’AI viene utilizzata localmente per il controllo qualità.
I risultati tecnici sono impressionanti: il modello Moondream2 ha raggiunto l’80,3% di accuratezza su VQAv2 e il 64,3% su GQA, competendo con modelli ben più grandi. Inoltre, il sistema è altamente efficiente dal punto di vista energetico, con un consumo di circa 0,6 joule per token per miliardo di parametri, come ha osservato il CTO Vik Korrapati.
Competere con i giganti della tecnologia
Mentre molte grandi aziende tecnologiche puntano su modelli massicci che richiedono notevoli risorse di elaborazione, Moondream si concentra su implementazioni pratiche. Korrapati ha dichiarato: “Molte aziende sono distratte dalla ricerca dell’AGI. Noi ci concentriamo sul problema della percezione e su come fornire capacità multimodali in dimensioni gestibili”.
Moondream ha lanciato il Moondream Cloud Service, progettato per semplificare lo sviluppo mantenendo la flessibilità per l’implementazione locale. Allen ha aggiunto: “Gli sviluppatori cercano un modo semplice per iniziare, come un’offerta cloud, senza sentirsi bloccati”.
Questo approccio ibrido ha trovato favore tra gli sviluppatori, e l’azienda ha costruito una forte comunità open source, grazie al suo “ethos hacker e open source” e a un processo di sviluppo trasparente.