OpenAI ha deciso di ritirare il suo strumento per rilevare il testo scritto da IA, appena sei mesi dopo il suo rilascio. L’azienda ha condiviso la notizia senza clamore in cima al suo blog, attribuendo la decisione a problemi di precisione che hanno reso il classificatore inadeguato. Nonostante ciò, OpenAI ha assicurato che continuerà a lavorare per trovare una soluzione migliore.
All’inizio, OpenAI aveva lanciato il classificatore AI con l’affermazione che fosse notevolmente superiore alle versioni precedenti nel rilevare il testo generato da intelligenza artificiale. Tuttavia, l’azienda ha anche chiarito che questa migliorata accuratezza non significava essere perfetto. Infatti, il classificatore ha dimostrato di identificare correttamente solo il 26% dei testi scritti da IA, mentre ha etichettato erroneamente il 9% del testo scritto da esseri umani come proveniente da un’IA.
Intrigante è stato il fatto che l’aggiunta di testi più lunghi, con più di 1.000 caratteri, ha aumentato il tasso di accuratezza, ma non vi era una semplice corrispondenza tra la lunghezza del testo e la precisione del classificatore. Nonostante il continuo impegno di OpenAI nel supportare il suo strumento, l’azienda ha deciso che i progressi non erano sufficienti, portando alla sua rimozione.
Un punto interessante menzionato nell’annuncio è che OpenAI sta ora concentrando i suoi sforzi sull’identificazione di contenuti audio e visivi generati da IA. Questo approccio è diventato importante a causa della crescente minaccia dei video deepfake e delle truffe con audio realistico di celebrità. Alcune startup hanno già introdotto rilevatori di deepfake per l’audio, e il settore è in una corsa per sviluppare strumenti affidabili per affrontare questa sfida.
Mentre altre aziende stanno sviluppando modi per tracciare il testo generato da IA, OpenAI ha riconosciuto onestamente che il suo attuale strumento di rilevamento non ha funzionato come previsto. A differenza di altre soluzioni che vantano una precisione quasi del 100%, il classificatore AI di OpenAI è stato meno performante. Ad esempio, Turnitin e GPTZero hanno ottenuto risultati molto migliori nella rilevazione della scrittura AI e umana.
Questa sincerità da parte di OpenAI è stata accolta positivamente, poiché il mercato ha bisogno di un approccio realistico alle capacità delle intelligenze artificiali linguistiche (LLM). È fondamentale comprendere che le LLM attuali possono non essere in grado di affrontare tutte le sfide, e alcuni compiti potrebbero richiedere anni di sviluppo per essere adeguatamente affrontati.
In conclusione, OpenAI ha riconosciuto le limitazioni del suo classificatore AI e sta lavorando verso soluzioni più efficaci. Mentre l’azienda si impegna a migliorare il rilevamento di contenuti audio e visivi generati da IA, l’intero settore continua a cercare modi migliori per tracciare il testo generato da intelligenza artificiale, affrontando le sfide e i progressi in modo realistico e onesto.