OpenAI ha sviluppato un avanzato agente di intelligenza artificiale (AI) ma ne sta ritardando il rilascio a causa di preoccupazioni legate alle cosiddette “evasioni” o “jailbreak”. Queste evasioni si verificano quando, attraverso specifici input, gli utenti riescono a far sì che l’AI superi le sue limitazioni programmate, potenzialmente accedendo a informazioni sensibili o eseguendo azioni non autorizzate.

Gli agenti AI, a differenza dei chatbot tradizionali, possiedono un grado elevato di autonomia e possono eseguire compiti complessi senza supervisione umana continua. Questa autonomia li rende particolarmente vulnerabili alle tecniche di evasione, come gli attacchi di “prompt injection”, dove input specifici inducono l’AI a comportarsi in modi non previsti. Considerando che questi agenti possono gestire dati personali e finanziari, una compromissione potrebbe avere conseguenze gravi, come l’esposizione di informazioni sensibili o transazioni non autorizzate.

Per affrontare queste preoccupazioni, OpenAI sta conducendo rigorosi test di sicurezza per garantire che il suo agente AI possa resistere a tentativi di evasione. Nonostante il prototipo sia stato completato e dimostrato internamente, l’azienda ha scelto di posticiparne il lancio fino a quando non sarà sicura della sua robustezza contro tali minacce. Si prevede che l’agente, denominato “Operator”, possa essere rilasciato in versione preliminare entro gennaio, anche se non è ancora chiaro se sarà un prodotto indipendente o integrato in servizi esistenti come ChatGPT.

Nel frattempo, altre aziende stanno avanzando nel campo degli agenti AI. Anthropic ha lanciato “Computer Use”, un agente con interfaccia grafica, mentre Google ha presentato progetti come “Project Astra” e “Project Mariner”. Tuttavia, alcuni esperti hanno espresso preoccupazioni riguardo alla sicurezza di questi agenti, sottolineando la necessità di misure preventive per evitare compromissioni.

Sam Altman, CEO di OpenAI, ha recentemente affermato che gli agenti AI avranno un impatto significativo sulle operazioni aziendali, suggerendo che il loro svilu

Di Fantasy