Anthropic lancia il framework Bloom e cambia il modo di valutare sicurezza e allineamento dei modelli AI
Con l’aumento della complessità e dell’autonomia dei modelli di intelligenza artificiale di frontiera, la capacità di individuare in modo rapido e affidabile comportamenti indesiderati è diventata una delle sfide centrali…