Humanity’s Last Exam HLE: il benchmark più difficile per l’Intelligenza Artificiale
Il mondo dell’intelligenza artificiale (IA) ha recentemente accolto un nuovo benchmark, soprannominato “Humanity’s Last Exam” (HLE), progettato per testare i limiti degli attuali modelli avanzati. Ideato da Dan Hendrycks, direttore…