OpenAI e METR: il caso di “reward hacking” nel modello o3 solleva interrogativi sulla sicurezza AI
L’affidabilità e la sicurezza dei modelli emergenti sono temi di crescente preoccupazione. Recentemente, una valutazione preliminare condotta da METR (Machine Intelligence Testing for Risks), partner di OpenAI nella valutazione dei…