xAI, la società di intelligenza artificiale fondata da Elon Musk, ha presentato Grok 4, la nuova versione del suo modello di intelligenza artificiale. Durante una diretta streaming, Musk ha descritto Grok 4 come “più intelligente di quasi tutti gli studenti laureati in tutte le discipline contemporaneamente” . La presentazione ha suscitato grande interesse nel settore tecnologico, soprattutto per le affermazioni di Musk riguardo alle prestazioni superiori di Grok 4 rispetto ai modelli di OpenAI e Google.
Grok 4 ha ottenuto risultati eccezionali in vari benchmark di intelligenza artificiale. Ad esempio, nel test ARC-AGI-2, progettato per misurare il ragionamento avanzato, Grok 4 ha raggiunto un’accuratezza del 15,9%, quasi il doppio rispetto al modello successivo, Claude Opus. Inoltre, ha superato il 10% di accuratezza, un traguardo che nessun altro modello commerciale aveva raggiunto negli ultimi tre mesi .
Un altro test significativo è stato Humanity’s Last Exam (HLE), che consiste in 2.500 domande curate da esperti su vari argomenti. Grok 4 ha risolto un quarto delle domande senza l’uso di strumenti, mentre la versione multi-agente Grok 4 Heavy ha risolto oltre il 50% delle domande del sottogruppo testuale, utilizzando capacità avanzate di elaborazione e collaborazione tra agenti.
In un’affermazione pubblicata su X (precedentemente Twitter), Musk ha dichiarato che Grok 4 è superiore a Cursor, un editor di codice AI sviluppato da Cursor Labs. Ha affermato che gli utenti possono copiare e incollare l’intero file di codice sorgente nel campo di input su grok.com, e Grok 4 lo correggerà, funzionando meglio di Cursor. Questa dichiarazione è arrivata in un momento in cui Cursor stava affrontando critiche per modifiche non comunicate al suo piano “Pro” illimitato, portando a numerosi disdette da parte degli utenti.
xAI ha rilasciato due versioni di Grok 4: la versione singolo-agente e la versione multi-agente, chiamata Grok 4 Heavy. Entrambe le versioni sono disponibili immediatamente e sono incluse nel piano di abbonamento SuperGrok, che offre l’accesso a una rete di agenti Grok per assistere nella ricerca e nella produttività. Il piano SuperGrok è offerto a 300 dollari al mese.
Musk ha annunciato che xAI prevede di lanciare un modello di codifica in agosto, un agente multimodale in settembre e un modello di generazione video in ottobre, indicando un’espansione rapida delle capacità di Grok . Questi sviluppi suggeriscono che xAI sta puntando a posizionarsi come un concorrente di rilievo nel panorama dell’intelligenza artificiale, sfidando direttamente aziende consolidate come OpenAI e Google.