OpenAI rivoluziona la ricerca con l’Agente AI Deep Research alimentato da o3

OpenAI ha sorpreso il mondo con l’annuncio di “Deep Research”, un nuovo strumento progettato per trasformare il modo in cui conduciamo ricerche complesse. Integrato nell’interfaccia di ChatGPT per gli abbonati Pro negli Stati Uniti, questo agente AI promette di generare rapporti completi in tempi record, affrontando compiti che normalmente richiederebbero ore o addirittura giorni di lavoro umano.

Al cuore di “Deep Research” c’è il modello o3 di OpenAI, una potente evoluzione nel campo dell’intelligenza artificiale. Questo modello è stato progettato per dedicare più tempo alla deliberazione quando affronta domande che richiedono un ragionamento logico passo-passo, migliorando significativamente le capacità di analisi e sintesi delle informazioni.

Il modello o3 ha già dimostrato le sue straordinarie capacità, ottenendo un punteggio senza precedenti del 75,7% sul benchmark ARC-AGI, un test progettato per valutare l’abilità di un’IA nel gestire nuovi e complessi problemi logici. Questa performance rappresenta un notevole passo avanti rispetto ai modelli precedenti, evidenziando il potenziale di o3 nel campo del ragionamento astratto.

“Deep Research” è progettato per eseguire ricerche multi-step su Internet, scoprendo, analizzando e sintetizzando contenuti da una vasta gamma di fonti online, tra cui testi, immagini e PDF. L’agente adatta il suo piano man mano che scopre nuove informazioni, garantendo un’analisi completa e approfondita dell’argomento in questione.

In una dimostrazione video, OpenAI ha mostrato “Deep Research” mentre analizzava il mercato delle app di traduzione. Lo strumento impiega tra i 5 e i 30 minuti per completare ciascun compito e cita la fonte per ogni affermazione che fa, garantendo trasparenza e affidabilità nelle sue analisi.

Le applicazioni di “Deep Research” sono molteplici e variegate. È stato progettato per assistere professionisti in settori come la finanza, la scienza e l’ingegneria, fornendo rapporti dettagliati e basati su dati concreti. Tuttavia, può anche essere utilizzato per esaminare acquisti come automobili e mobili, offrendo analisi approfondite per decisioni informate.

Un esempio toccante dell’impatto di “Deep Research” è stato condiviso da Felipe Millon, responsabile del Go-to-Market governativo di OpenAI. Ha raccontato come l’agente AI sia diventato un alleato inaspettato durante la battaglia di sua moglie contro un cancro al seno bilaterale, aiutandoli a navigare attraverso una mole di informazioni mediche complesse.

Nonostante le sue straordinarie capacità, “Deep Research” presenta ancora alcune limitazioni. Può avere difficoltà a distinguere informazioni autorevoli da voci infondate e attualmente mostra debolezze nella calibrazione della fiducia, spesso non riuscendo a trasmettere accuratamente l’incertezza. OpenAI riconosce che lo strumento è ancora nelle sue fasi iniziali e sta lavorando per migliorarne l’affidabilità e la precisione.

Inoltre, esperti come Andrew Rogoyski, direttore dell’Istituto per l’IA Centrata sulle Persone dell’Università del Surrey, avvertono del pericolo che gli esseri umani possano utilizzare i risultati di strumenti come “Deep Research” in modo acritico, senza effettuare verifiche retrospettive su ciò che producono. Sottolinea che “ci vorranno molte ore e molto lavoro per verificare se l’analisi della macchina è valida”.

La funzionalità sarà disponibile per gli utenti Pro a partire da oggi, con un limite massimo di 100 query al mese. Gli utenti Plus e Team otterranno l’accesso in seguito, seguiti dai clienti Enterprise.

OpenAI rivoluziona la ricerca con l’Agente AI Deep Research alimentato da o3

DiFantasy

Di Fantasy

Articoli correlati

Mistral AI amplia la propria strategia industriale lanciando Vibe e accelera sugli investimenti infrastrutturali europei

ByteDance sviluppa CPU proprietarie per sostenere la crescita dei servizi AI basati su agenti

Meta valuta l’ingresso nel cloud AI con la vendita di capacità computazionale in eccesso

Ultimi Post

Mistral AI amplia la propria strategia industriale lanciando Vibe e accelera sugli investimenti infrastrutturali europei

ByteDance sviluppa CPU proprietarie per sostenere la crescita dei servizi AI basati su agenti

Meta valuta l’ingresso nel cloud AI con la vendita di capacità computazionale in eccesso

Airbus e BMW scelgono Mistral AI per accelerare l’AI industriale e rafforzare l’autonomia tecnologica europea