Algoritmo PAIR: rinforzare gli LLM contro i jailbreak
Ricercatori dell’Università della Pennsylvania hanno sviluppato un nuovo algoritmo denominato PAIR (Prompt Automatic Iterative Refinement) che può automaticamente rafforzare la sicurezza nei Large Language Models (LLM). PAIR si concentra sul…