In un momento in cui gli strumenti di intelligenza artificiale si stanno spostando rapidamente da semplici chatbot verso piattaforme capaci di svolgere analisi profonde e rispondere a quesiti complessi, Perplexity, l’azienda californiana nota per il suo motore di ricerca AI conversazionale, ha annunciato una significativa evoluzione del suo prodotto principale. La novità più rilevante consiste nel lancio di un aggiornamento avanzato della sua funzione Deep Research, accompagnato dalla pubblicazione in open-source di quello che viene chiamato DRACO Benchmark – un nuovo standard aperto pensato per valutare in modo affidabile le capacità di agenti di intelligenza artificiale impegnati in compiti di ricerca profonda e analisi su temi reali.
La funzione Deep Research di Perplexity è stata concepita per andare ben oltre le risposte generiche tipiche dei motori di ricerca tradizionali. Mentre Google o altri sistemi di risposta forniscono risultati basati su corrispondenze di parole chiave, Deep Research affronta interrogativi complessi combinando ricerche sul web, analisi di fonti incrociate e sintesi di contenuti in forma strutturata e verificabile. Con l’ultimo aggiornamento, questo strumento ha raggiunto prestazioni tali da emergere come state of the art su una serie di benchmark esterni – tra cui quelli di DeepMind e di altri leader del settore – vantando risultati di accuratezza, affidabilità e chiarezza nella presentazione dei risultati che lo pongono tra i più avanzati strumenti di AI per la ricerca specialistica disponibili oggi.
La caratteristica più interessante dell’annuncio recente, però, è l’apertura al pubblico del DRACO Benchmark. Questo benchmark – il cui nome è un acronimo di Deep Research Accuracy, Completeness and Objectivity – è stato progettato per valutare agenti di intelligenza artificiale su compiti che riflettono scenari di ricerca autentici, basandosi su esempio compiti reali derivati da milioni di query raccolte dalla stessa piattaforma Perplexity. Include centinaia di test che coprono domini diversi come diritto, medicina, finanza, tecnologia e questioni di cultura generale. Al contrario della maggior parte degli strumenti di valutazione che si occupano di esercizi sintetici o casi studio artificiali, DRACO concentra la sua attenzione su ricerche complesse, dove l’accuratezza dei fatti, la profondità dell’analisi, la completezza delle risposte e la correttezza delle citazioni sono fondamentali. Il rilascio completo del benchmark, delle rubriche di valutazione e dei prompt usati per giudicare le risposte consente a sviluppatori, ricercatori e organizzazioni di verificare le prestazioni dei propri modelli AI in modo trasparente e comparabile.
La scelta di rendere DRACO open-source rappresenta un passo importante nell’evoluzione dell’ecosistema dell’intelligenza artificiale. Perplexity non si limita infatti a migliorare il proprio prodotto, ma propone un framework aperto con cui l’intera comunità può misurare e confrontare le capacità di strumenti di ricerca automatizzata che stanno emergendo in un mercato sempre più competitivo. Il risultato è un incentivo alla trasparenza e alla collaborazione, in cui aziende, università e singoli sviluppatori possono partecipare alla definizione di standard più rigorosi per l’IA applicata alla ricerca su dati reali, piuttosto che su compiti scolastici isolati o benchmark poco rilevanti.
Dal punto di vista pratico, l’aggiornamento avanzato della funzione Deep Research non è solo un esercizio di prestigio: gli utenti della piattaforma Perplexity, in particolare quelli con abbonamento “Max”, stanno già sperimentando capacità di ricerca in grado di analizzare risposte complesse più rapidamente e con maggiore accuratezza rispetto alle versioni precedenti. Secondo i dati diffusi, Deep Research aggiornato supera strumenti concorrenti non solo nei test interni ma anche in benchmark esterni di terze parti, dimostrando che una combinazione di tecnologia AI avanzata, motore di ricerca integrato e infrastrutture dedicate può produrre risultati più affidabili e di qualità superiore. Questo approccio rafforza la posizione di Perplexity non solo come motore di risposta conversazionale ma come vera e propria piattaforma di ricerca assistita dall’AI.
L’impatto potenziale di questi sviluppi va oltre l’ambito tecnologico immediato. In settori come medicina, finanza, diritto e accademia, dove l’accesso rapido a informazioni accurate e verificate può fare la differenza tra una decisione informata e una fuorviante, strumenti come Deep Research e benchmark come DRACO possono contribuire a stabilire nuove regole per l’uso professionale dell’intelligenza artificiale. In questo contesto, gli utenti – siano essi singoli ricercatori, aziende o istituzioni – possono beneficiare di una maggiore chiarezza su come e quanto bene i modelli di AI rispondono alle esigenze di ricerca più sofisticate, riducendo l’incertezza e aumentando la fiducia nei risultati ottenuti tramite sistemi automatizzati.
