Groq, una startup specializzata in hardware per l’intelligenza artificiale, ha rilasciato due modelli di linguaggio open source che superano le capacità degli attuali leader del settore. Il modello Llama-3-Groq-70B-Tool-Use ha conquistato il primo posto nella Berkeley Function Calling Leaderboard (BFCL), battendo i modelli di OpenAI, Google e Anthropic.
Il modello più grande, con 70 miliardi di parametri, ha ottenuto un’accuratezza del 90,76% sul BFCL, mentre la versione più piccola, con 8 miliardi di parametri, ha raggiunto l’89,06%, classificandosi al terzo posto assoluto. Questi risultati dimostrano che i modelli open source possono competere e superare quelli chiusi in compiti specifici.
Groq ha sviluppato questi modelli in collaborazione con Glaive, utilizzando una combinazione di full fine-tuning e Direct Preference Optimization (DPO) sul modello base Llama-3 di Meta. Hanno utilizzato solo dati sintetici generati in modo etico, affrontando le preoccupazioni relative alla privacy dei dati e all’overfitting.
Questo sviluppo segna una svolta nel panorama dell’IA. Groq dimostra che è possibile raggiungere alte prestazioni utilizzando solo dati sintetici, sfidando l’idea che siano necessari grandi volumi di dati reali. Questo approccio potrebbe ridurre i problemi di privacy e l’impatto ambientale legati alla formazione su enormi set di dati, e aprire nuove possibilità per modelli specializzati in aree con dati scarsi o sensibili.
I modelli sono ora disponibili tramite Groq API e Hugging Face, una piattaforma popolare per modelli di machine learning. Questo potrebbe accelerare l’innovazione in aree che richiedono strumenti complessi, come la codifica automatizzata e l’analisi dei dati.
Groq ha anche lanciato una demo pubblica su Hugging Face Spaces, che permette agli utenti di testare le capacità dei modelli. Questa demo è stata realizzata in collaborazione con Gradio, acquisito da Hugging Face nel 2021. La risposta della comunità AI è stata entusiasta, con molti ricercatori e sviluppatori ansiosi di esplorare i nuovi modelli.
L’approccio open source di Groq contrasta con i sistemi chiusi delle grandi aziende tecnologiche, e potrebbe spingere il settore a essere più trasparente e innovativo. Il successo dei modelli di Groq potrebbe portare a un cambiamento significativo nello sviluppo e nella distribuzione dell’IA, democratizzando l’accesso a capacità avanzate e promuovendo un ecosistema di IA più diversificato e innovativo.