OpenAI ha sorpreso il mondo con l’annuncio di “Deep Research”, un nuovo strumento progettato per trasformare il modo in cui conduciamo ricerche complesse. Integrato nell’interfaccia di ChatGPT per gli abbonati Pro negli Stati Uniti, questo agente AI promette di generare rapporti completi in tempi record, affrontando compiti che normalmente richiederebbero ore o addirittura giorni di lavoro umano.
Al cuore di “Deep Research” c’è il modello o3 di OpenAI, una potente evoluzione nel campo dell’intelligenza artificiale. Questo modello è stato progettato per dedicare più tempo alla deliberazione quando affronta domande che richiedono un ragionamento logico passo-passo, migliorando significativamente le capacità di analisi e sintesi delle informazioni.
Il modello o3 ha già dimostrato le sue straordinarie capacità, ottenendo un punteggio senza precedenti del 75,7% sul benchmark ARC-AGI, un test progettato per valutare l’abilità di un’IA nel gestire nuovi e complessi problemi logici. Questa performance rappresenta un notevole passo avanti rispetto ai modelli precedenti, evidenziando il potenziale di o3 nel campo del ragionamento astratto.
“Deep Research” è progettato per eseguire ricerche multi-step su Internet, scoprendo, analizzando e sintetizzando contenuti da una vasta gamma di fonti online, tra cui testi, immagini e PDF. L’agente adatta il suo piano man mano che scopre nuove informazioni, garantendo un’analisi completa e approfondita dell’argomento in questione.
In una dimostrazione video, OpenAI ha mostrato “Deep Research” mentre analizzava il mercato delle app di traduzione. Lo strumento impiega tra i 5 e i 30 minuti per completare ciascun compito e cita la fonte per ogni affermazione che fa, garantendo trasparenza e affidabilità nelle sue analisi.
Le applicazioni di “Deep Research” sono molteplici e variegate. È stato progettato per assistere professionisti in settori come la finanza, la scienza e l’ingegneria, fornendo rapporti dettagliati e basati su dati concreti. Tuttavia, può anche essere utilizzato per esaminare acquisti come automobili e mobili, offrendo analisi approfondite per decisioni informate.
Un esempio toccante dell’impatto di “Deep Research” è stato condiviso da Felipe Millon, responsabile del Go-to-Market governativo di OpenAI. Ha raccontato come l’agente AI sia diventato un alleato inaspettato durante la battaglia di sua moglie contro un cancro al seno bilaterale, aiutandoli a navigare attraverso una mole di informazioni mediche complesse.
Nonostante le sue straordinarie capacità, “Deep Research” presenta ancora alcune limitazioni. Può avere difficoltà a distinguere informazioni autorevoli da voci infondate e attualmente mostra debolezze nella calibrazione della fiducia, spesso non riuscendo a trasmettere accuratamente l’incertezza. OpenAI riconosce che lo strumento è ancora nelle sue fasi iniziali e sta lavorando per migliorarne l’affidabilità e la precisione.
Inoltre, esperti come Andrew Rogoyski, direttore dell’Istituto per l’IA Centrata sulle Persone dell’Università del Surrey, avvertono del pericolo che gli esseri umani possano utilizzare i risultati di strumenti come “Deep Research” in modo acritico, senza effettuare verifiche retrospettive su ciò che producono. Sottolinea che “ci vorranno molte ore e molto lavoro per verificare se l’analisi della macchina è valida”.
La funzionalità sarà disponibile per gli utenti Pro a partire da oggi, con un limite massimo di 100 query al mese. Gli utenti Plus e Team otterranno l’accesso in seguito, seguiti dai clienti Enterprise.