AI e obbedienza a istruzioni dannose: nuovi test mostrano criticità nei meccanismi decisionali dei modelli avanzati tanto da somministrare volentieri scosse elettriche
Le più recenti valutazioni sulla sicurezza dei sistemi di intelligenza artificiale stanno evidenziando un problema che va oltre le tradizionali allucinazioni o gli errori di risposta: in determinati contesti, i…