ChatGPT, Claude e Google Barde gli altri vulnerabili ad un suffisso che, quando collegato a una domanda, induce gli LLM a fornire risposte affermative che altrimenti rifiuterebbero
Scoperta di una Nuova Vulnerabilità nei Modelli Linguistici di Grandi Dimensioni (LLM) Introduzione I modelli di linguaggio di grandi dimensioni, come ChatGPT, Claude e Google Bard, stanno rivoluzionando il campo…