È stato un atteso arrivo e oggi è finalmente qui: Llama 3, il nuovo large Language Model (LLM) di Meta Platforms, la società madre di Facebook, Instagram, WhatsApp, Threads, Oculus VR e altri, sta facendo il suo debutto. Si propone come uno dei più potenti modelli di intelligenza artificiale “open source” mai rilasciati. Il rilascio è avvenuto poche ore dopo che Llama 3 è stato scoperto sul servizio cloud Azure di Microsoft, in quello che sembra essere stato un caso di fuga di notizie.
La famiglia Llama 3 include due versioni iniziali: una da 8 miliardi e una da 70 miliardi di parametri, che si riferiscono alle connessioni tra neuroni artificiali all’interno di ciascun modello. C’è anche un modello da 400 miliardi di parametri che Meta sta attualmente addestrando, anche se non c’è ancora una data precisa per il suo rilascio.
Secondo Ragavan Srinivasan, Vice Presidente di Prodotto di Meta, Llama 3 è un modello davvero impressionante in termini di prestazioni. Le versioni da 8 miliardi e 70 miliardi di parametri offrono prestazioni di riferimento paragonabili o persino superiori ai modelli concorrenti di Google, Anthropic e Mistral. In particolare, si distinguono per la capacità di risolvere domande a scelta multipla e compiti di codifica.
Inoltre, Meta ha introdotto un nuovo chatbot chiamato Meta AI autonomo, alimentato proprio da Llama 3. Questo chatbot offre una competizione diretta a servizi simili offerti da OpenAI, Anthropic e HuggingFace.
Il chatbot Meta AI autonomo è accessibile tramite il sito web di Meta e offre un’esperienza di chat in cui gli utenti possono interagire direttamente con il modello LLM. È possibile utilizzarlo senza accedere a Facebook, anche se le sue funzionalità sono limitate e richiede l’inserimento di un’età minima.
Una caratteristica interessante è l’integrazione del modello di generazione di immagini di Meta, chiamato Meta Imagine. Questo modello consente agli utenti di generare immagini durante la chat. Anche se non offre la stessa personalizzazione di alcuni concorrenti, come ChatGPT di OpenAI, fornisce un’esperienza simile e veloce.
È importante notare che Llama 3 non è multimodale, il che significa che non supporta il caricamento di immagini o documenti come fanno altri modelli concorrenti. Tuttavia, Meta ha indicato che una versione multimodale potrebbe essere disponibile in futuro.
Nonostante Meta abbia definito Llama 3 come “open source”, la licenza specifica rilasciata è soggetta a critiche da parte della comunità open source. La licenza richiede alle aziende con più di 700 milioni di utenti attivi mensili di ottenere una licenza da Meta, il che ha sollevato preoccupazioni sulla centralizzazione del controllo da parte di Meta.
In termini di prestazioni, Llama 3 si distingue per l’incremento delle prestazioni rispetto al suo predecessore, Llama 2. Meta ha sottolineato una riduzione dei falsi positivi, un miglioramento dell’allineamento e una maggiore diversità nelle risposte dei modelli.
Llama 3 è disponibile per il download sul sito web di Meta e su diverse altre piattaforme cloud, come AWS, Google Cloud e Microsoft Azure.