GPT-5.5 supera Claude Fable 5 nel benchmark Agents’ Last Exam dedicato agli agenti AI
OpenAI GPT-5.5 ha ottenuto il miglior risultato nel benchmark Agents’ Last Exam, una nuova valutazione progettata per misurare le capacità operative degli agenti AI in scenari complessi che richiedono pianificazione,…