Groq lancia modelli di linguaggio AI open source che superano i giganti della tecnologia

Groq, una startup specializzata in hardware per l’intelligenza artificiale, ha rilasciato due modelli di linguaggio open source che superano le capacità degli attuali leader del settore. Il modello Llama-3-Groq-70B-Tool-Use ha conquistato il primo posto nella Berkeley Function Calling Leaderboard (BFCL), battendo i modelli di OpenAI, Google e Anthropic.

Il modello più grande, con 70 miliardi di parametri, ha ottenuto un’accuratezza del 90,76% sul BFCL, mentre la versione più piccola, con 8 miliardi di parametri, ha raggiunto l’89,06%, classificandosi al terzo posto assoluto. Questi risultati dimostrano che i modelli open source possono competere e superare quelli chiusi in compiti specifici.

Groq ha sviluppato questi modelli in collaborazione con Glaive, utilizzando una combinazione di full fine-tuning e Direct Preference Optimization (DPO) sul modello base Llama-3 di Meta. Hanno utilizzato solo dati sintetici generati in modo etico, affrontando le preoccupazioni relative alla privacy dei dati e all’overfitting.

Questo sviluppo segna una svolta nel panorama dell’IA. Groq dimostra che è possibile raggiungere alte prestazioni utilizzando solo dati sintetici, sfidando l’idea che siano necessari grandi volumi di dati reali. Questo approccio potrebbe ridurre i problemi di privacy e l’impatto ambientale legati alla formazione su enormi set di dati, e aprire nuove possibilità per modelli specializzati in aree con dati scarsi o sensibili.

I modelli sono ora disponibili tramite Groq API e Hugging Face, una piattaforma popolare per modelli di machine learning. Questo potrebbe accelerare l’innovazione in aree che richiedono strumenti complessi, come la codifica automatizzata e l’analisi dei dati.

Groq ha anche lanciato una demo pubblica su Hugging Face Spaces, che permette agli utenti di testare le capacità dei modelli. Questa demo è stata realizzata in collaborazione con Gradio, acquisito da Hugging Face nel 2021. La risposta della comunità AI è stata entusiasta, con molti ricercatori e sviluppatori ansiosi di esplorare i nuovi modelli.

L’approccio open source di Groq contrasta con i sistemi chiusi delle grandi aziende tecnologiche, e potrebbe spingere il settore a essere più trasparente e innovativo. Il successo dei modelli di Groq potrebbe portare a un cambiamento significativo nello sviluppo e nella distribuzione dell’IA, democratizzando l’accesso a capacità avanzate e promuovendo un ecosistema di IA più diversificato e innovativo.

Groq lancia modelli di linguaggio AI open source che superano i giganti della tecnologia

DiFantasy

Di Fantasy

Articoli correlati

Oltre il muro degli LLM: perché gli agenti potrebbero essere la vera rivoluzione dopo GPT-5

Partnership Meta e Midjourney per rendere più belli i feed

Quando l’AI si perde nel mondo reale: GPT-5 fatica a orchestrare compiti concreti secondo il benchmark MCP-Universe

You missed

Oltre il muro degli LLM: perché gli agenti potrebbero essere la vera rivoluzione dopo GPT-5

Partnership Meta e Midjourney per rendere più belli i feed

Quando l’AI si perde nel mondo reale: GPT-5 fatica a orchestrare compiti concreti secondo il benchmark MCP-Universe

OpenCUA: l’agente open source che impara a usare il PC come noi