Ieri sera, è stato lanciato Grok-2, un nuovo modello linguistico di grandi dimensioni (LLM) sviluppato da xAI, la società di Elon Musk. Grok-2 è integrato nell’app mobile del social network X e disponibile con abbonamenti Premium (7 USD/mese) e Premium+ (14 USD/mese senza pubblicità).
Il modello è offerto in due versioni: Grok-2 e Grok-2 mini. Grok-2 è progettato per compiti complessi come chat, codifica e applicazioni basate sulla visione, mentre Grok-2 mini è una versione più leggera e veloce per compiti meno complessi.
Grok-2 si distingue per la sua capacità di generare immagini grazie alla collaborazione con Black Forest Labs e al modello Flux.1, noto per la sua qualità fotorealistica. Questo modello supera in prestazioni i principali concorrenti come GPT-4o di OpenAI, Claude 3.5 di Anthropic e Gemini Pro 1.5 di Google nei principali benchmark.
I test hanno dimostrato che Grok-2 e Grok-2 mini eccellono in vari parametri, inclusi GPQA, MMLU, MMLU-Pro, MATH, HumanEval, MMMU, MathVista e DocVQA. Grok-2 ha ricevuto elogi anche nella comunità degli AI, dove era inizialmente conosciuto come “sus-column-r”.
Ethan Mollick, influencer dell’AI e professore alla Wharton School, ha notato che ora ci sono cinque modelli principali di AI simili a GPT-4: GPT-4o, Claude 3.5, Gemini 1.5, Llama 3.1 e Grok-2.
La funzione di generazione di immagini di Grok-2, integrata con Flux.1, ha attirato molta attenzione. Questo modello open source permette di creare immagini fotorealistiche di alta qualità, persino di personaggi pubblici come Kamala Harris e Donald Trump. Questa maggiore libertà nella generazione di contenuti visivi ha suscitato preoccupazioni per la diffusione di deepfake e disinformazione, soprattutto considerando che altri generatori di immagini, come Midjourney e DALL-E 3, hanno restrizioni più severe in merito.
Elon Musk ha lodato il team di xAI per il lavoro svolto, mentre gli utenti sollevano preoccupazioni sulle potenziali implicazioni etiche e sociali di queste nuove capacità.