La startup di intelligenza artificiale Silo AI, con sede a Helsinki, in Finlandia, ha suscitato grande interesse questa settimana presentando Poro, un nuovo modello LLM (Large Language Model) open source progettato per avanzare nelle capacità di intelligenza artificiale multilingue per le lingue europee.
Poro rappresenta il primo modello di una serie di modelli open source pianificati che copriranno tutte e 24 le lingue ufficiali dell’Unione Europea. Questi modelli sono in fase di sviluppo da SiloGen, la divisione di intelligenza artificiale generativa di Silo AI, fondata alla fine del 2022, in collaborazione con il gruppo di ricerca TurkuNLP dell’Università di Turku.
Peter Sarlin, CEO di Silo AI, ha sottolineato l’importanza di questa iniziativa, affermando: “Si tratta di una questione di sovranità digitale, in cui vogliamo garantire l’esistenza di modelli che riflettano i valori, la cultura e le lingue europee. In definitiva, si tratta di creare valore e assicurare che non solo l’Europa, ma qualsiasi azienda possa sviluppare modelli proprietari che contribuiscano alla creazione di valore nell’ambito europeo.”
Il modello Poro 34B, che conta ben 34,2 miliardi di parametri, prende il nome dalla parola finlandese per “renna” ed è basato su un’architettura del trasformatore BLOOM con incorporamenti ALiBi. È stato addestrato utilizzando una porzione di un set di dati multilingue composto da 21 trilioni di token, che include l’inglese, il finlandese e linguaggi di programmazione come Python e Java.
Poro è stato addestrato sul supercomputer LUMI, il più veloce d’Europa, situato a Kajaani, in Finlandia, che dispone di 512 GPU AMD Instinct MI250X capaci di calcolare 74 petaflop di potenza.
Secondo Sarlin, Poro è stato progettato per affrontare la sfida principale della creazione di modelli di linguaggio naturale di alta qualità per le lingue europee con risorse limitate, come ad esempio il finlandese. Questo risultato è stato raggiunto attraverso un approccio multilingue che permette al modello di trarre vantaggio dai dati disponibili in lingue con risorse più abbondanti, come l’inglese.
È interessante notare che le capacità multilingue di Poro non precludono le sue prestazioni in inglese. Test su set di valutazione standard in inglese hanno rivelato che il modello sta superando modelli esistenti in termini di parametri di riferimento finlandesi e sta avvicinandosi alle prestazioni in lingua inglese.
Sarlin crede che modelli open source come Poro rappresentino il futuro dell’intelligenza artificiale, offrendo un’alternativa trasparente ed etica ai modelli chiusi delle principali aziende tecnologiche. Ha sottolineato l’importanza della trasparenza nella progettazione e nella formazione dei modelli.
Silo AI prevede di rilasciare regolarmente checkpoint Poro durante tutto il processo di addestramento, con l’obiettivo finale di creare una famiglia completa di modelli open source per tutte le lingue europee. Se i risultati iniziali sono indicativi, Poro potrebbe presto diventare una seria alternativa alle aziende tecnologiche leader nel settore.
Questa iniziativa rappresenta una collaborazione continua tra Silo AI e l’Università di Turku in Finlandia, dimostrando come l’industria e il mondo accademico possano lavorare insieme per migliorare le capacità dell’intelligenza artificiale, soprattutto per le lingue europee con risorse limitate.
Il rilascio di Poro segna una nuova era di collaborazione aperta e trasparenza nel campo dell’elaborazione del linguaggio naturale. Iniziative come Poro Research Checkpoints consentono a tutta la comunità di accedere a strumenti e approfondimenti che in passato erano riservati alle giganti tecnologiche.
Sarlin ha dichiarato che molte grandi imprese stanno monitorando attentamente l’evoluzione dei modelli come Poro, in vista di future regolamentazioni e dell’adozione di modelli più aperti e trasparenti.
Se Poro continuerà a dimostrare il suo potenziale, potrebbe democratizzare l’accesso a modelli multilingue di alto livello, offrendo all’Europa un’alternativa interna ai sistemi delle aziende tecnologiche statunitensi. Sebbene sia ancora alle prime fasi, Poro rappresenta un importante passo avanti nel rendere l’intelligenza artificiale linguistica accessibile e trasparente.