Un team di ricercatori dell’Università del Popolo Cinese e dell’Università Tsinghua ha presentato “Search-o1”, un nuovo framework progettato per migliorare le capacità di ragionamento dei modelli di intelligenza artificiale (IA) attraverso l’integrazione di catene di ragionamento e meccanismi di ricerca avanzati.
Tradizionalmente, i modelli di IA affrontano problemi complessi suddividendoli in passaggi più piccoli, ma spesso incontrano difficoltà quando manca una conoscenza specifica o quando il processo di ragionamento introduce errori. Le soluzioni precedenti tentavano di risolvere queste sfide ampliando le dimensioni dei modelli o aumentando i dati di addestramento, strategie che però non sempre garantivano un’efficace integrazione delle conoscenze esterne. Sebbene i sistemi di Retrieval-Augmented Generation (RAG) permettano l’incorporazione di informazioni esterne, essi possono risultare inefficaci in compiti di ragionamento avanzato, poiché tendono a recuperare documenti ridondanti che possono compromettere la coerenza del ragionamento.
Per superare queste limitazioni, il framework Search-o1 introduce un modulo denominato “Reason-in-Documents”. Questo componente consente al modello di identificare, durante il processo di ragionamento, i punti in cui le conoscenze interne sono insufficienti, attivando una ricerca in tempo reale di informazioni esterne pertinenti. Le informazioni recuperate vengono poi analizzate in profondità, minimizzando il rumore e mantenendo un flusso di ragionamento coerente.
Nei test di benchmark, Search-o1 ha dimostrato prestazioni superiori rispetto ai metodi RAG tradizionali, mostrando un miglioramento del 4,7% rispetto a RAgent-QwQ-32B e del 3,1% rispetto a QwQ-32B. Inoltre, ha superato modelli più piccoli come Qwen2.5-32B del 44,7%. In compiti legati alle scienze, Search-o1 ha mostrato capacità di ragionamento avanzate paragonabili a quelle degli esperti umani. Il codice sorgente di Search-o1 è disponibile su GitHub, promuovendo ulteriori ricerche e applicazioni nel campo dell’intelligenza artificiale.