Gli scienziati di Anthropic hanno hackerato il cervello AI di Claude: cos’è successo?
Per anni, i modelli linguistici di grandi dimensioni (LLM) sono stati considerati una sorta di “scatola nera” impenetrabile. Generavano testi straordinari, rispondevano a domande complesse e mostravano capacità di ragionamento…