Meta Platforms ha dichiarato venerdì che stava rilasciando ai ricercatori un nuovo modello di linguaggio di grandi dimensioni, il software di base di un nuovo sistema di intelligenza artificiale, riscaldando una corsa agli armamenti di intelligenza artificiale mentre le aziende Big Tech si affrettano a integrare la tecnologia nei loro prodotti e impressionare gli investitori.
LLaMA di Meta, abbreviazione di Large Language Model Meta AI, sarà disponibile con licenza non commerciale a ricercatori ed entità affiliate al governo, alla società civile e al mondo accademico, si legge in un blog.
I modelli di linguaggio di grandi dimensioni estraggono grandi quantità di testo per riassumere le informazioni e generare contenuti. Possono rispondere alle domande, ad esempio, con frasi che possono essere lette come se fossero state scritte da umani. Il modello, che secondo Meta richiede una potenza di calcolo “molto inferiore” rispetto alle offerte precedenti, è addestrato su 20 lingue con particolare attenzione a quelle con alfabeti latino e cirillico.
“L’annuncio di Meta oggi sembra essere un passo avanti nel testare le loro capacità di intelligenza artificiale generativa in modo che possano implementarle nei loro prodotti in futuro”, ha affermato Gil Luria, analista software senior presso D.A. Davidson. “L’IA generativa è una nuova applicazione dell’IA con cui Meta ha meno esperienza, ma è chiaramente importante per il futuro della loro attività”.
L’intelligenza artificiale è emersa come un punto luminoso per gli investimenti nel settore tecnologico, la cui crescita rallentata ha provocato licenziamenti diffusi e una riduzione delle scommesse sperimentali. Meta ha affermato che LLaMA potrebbe superare i concorrenti che esaminano più parametri o variabili che l’algoritmo prende in considerazione. Nello specifico, ha affermato che una versione di LLaMA con 13 miliardi di parametri può superare GPT-3, un recente predecessore del modello su cui è costruito ChatGPT. Ha descritto il suo modello LLaMA da 65 miliardi di parametri come “competitivo” con Chinchilla70B e PaLM-540B di Google, che sono persino più grandi del modello utilizzato da Google per mostrare la sua ricerca basata sulla chat di Bard.
Una portavoce di Meta ha attribuito le prestazioni a una maggiore quantità di dati “più puliti” e “miglioramenti architettonici” nel modello che hanno migliorato la stabilità dell’allenamento. Meta nel maggio dello scorso anno ha rilasciato il modello di linguaggio di grandi dimensioni OPT-175B, anch’esso rivolto ai ricercatori, che ha costituito la base di una nuova iterazione del suo chatbot BlenderBot. Successivamente ha introdotto un modello chiamato Galactica, in grado di scrivere articoli scientifici e risolvere problemi di matematica, ma ha rapidamente interrotto la demo dopo aver generato false risposte autorevoli.