Immagine AI

xAI, la società di intelligenza artificiale fondata da Elon Musk, ha presentato Grok 4, la nuova versione del suo modello di intelligenza artificiale. Durante una diretta streaming, Musk ha descritto Grok 4 come “più intelligente di quasi tutti gli studenti laureati in tutte le discipline contemporaneamente” . La presentazione ha suscitato grande interesse nel settore tecnologico, soprattutto per le affermazioni di Musk riguardo alle prestazioni superiori di Grok 4 rispetto ai modelli di OpenAI e Google.

Grok 4 ha ottenuto risultati eccezionali in vari benchmark di intelligenza artificiale. Ad esempio, nel test ARC-AGI-2, progettato per misurare il ragionamento avanzato, Grok 4 ha raggiunto un’accuratezza del 15,9%, quasi il doppio rispetto al modello successivo, Claude Opus. Inoltre, ha superato il 10% di accuratezza, un traguardo che nessun altro modello commerciale aveva raggiunto negli ultimi tre mesi .

Un altro test significativo è stato Humanity’s Last Exam (HLE), che consiste in 2.500 domande curate da esperti su vari argomenti. Grok 4 ha risolto un quarto delle domande senza l’uso di strumenti, mentre la versione multi-agente Grok 4 Heavy ha risolto oltre il 50% delle domande del sottogruppo testuale, utilizzando capacità avanzate di elaborazione e collaborazione tra agenti.

In un’affermazione pubblicata su X (precedentemente Twitter), Musk ha dichiarato che Grok 4 è superiore a Cursor, un editor di codice AI sviluppato da Cursor Labs. Ha affermato che gli utenti possono copiare e incollare l’intero file di codice sorgente nel campo di input su grok.com, e Grok 4 lo correggerà, funzionando meglio di Cursor. Questa dichiarazione è arrivata in un momento in cui Cursor stava affrontando critiche per modifiche non comunicate al suo piano “Pro” illimitato, portando a numerosi disdette da parte degli utenti.

xAI ha rilasciato due versioni di Grok 4: la versione singolo-agente e la versione multi-agente, chiamata Grok 4 Heavy. Entrambe le versioni sono disponibili immediatamente e sono incluse nel piano di abbonamento SuperGrok, che offre l’accesso a una rete di agenti Grok per assistere nella ricerca e nella produttività. Il piano SuperGrok è offerto a 300 dollari al mese.

Musk ha annunciato che xAI prevede di lanciare un modello di codifica in agosto, un agente multimodale in settembre e un modello di generazione video in ottobre, indicando un’espansione rapida delle capacità di Grok . Questi sviluppi suggeriscono che xAI sta puntando a posizionarsi come un concorrente di rilievo nel panorama dell’intelligenza artificiale, sfidando direttamente aziende consolidate come OpenAI e Google.

Di Fantasy