Gli LLM raggiungono un nuovo minimo nel benchmark ARC-AGI-2: i modelli puri ottengono 0%
L’organizzazione no-profit ARC Prize, dedicata alla valutazione dell’efficacia dei modelli di intelligenza artificiale nel dimostrare capacità simili a quelle umane, ha recentemente annunciato il lancio del benchmark ARC-AGI-2. Questo nuovo…