Un team di ricercatori dell’Università di Zhejiang, del Tianji Lab di Alibaba e dell’Istituto di Ricerca sull’Intelligenza Computazionale di Zhejiang ha presentato “OmniThink”, un innovativo sistema di scrittura automatica progettato per generare articoli estesi e di alta qualità, emulando il processo di pensiero umano.

Tradizionalmente, i modelli di linguaggio di grandi dimensioni (LLM) che utilizzano tecniche di Retrieval-Augmented Generation (RAG) si sono scontrati con limitazioni dovute a metodi di ricerca statici, spesso producendo contenuti superficiali, ripetitivi e carenti di originalità. Per affrontare queste sfide, OmniThink adotta un approccio che imita il pensiero umano, organizzando le informazioni in una struttura ad albero e strutturando i dati in modo da arricchire il contenuto generato.

Il processo di scrittura di OmniThink si articola in tre fasi principali:

  • Raccolta delle informazioni: il sistema ricerca e raccoglie dati pertinenti all’argomento trattato.
  • Creazione di una struttura: le informazioni vengono organizzate in una struttura logica e coerente, facilitando la stesura del contenuto.
  • Generazione del testo: il sistema produce l’articolo completo, assicurando coerenza e profondità nei contenuti.

Questa metodologia consente a OmniThink di analizzare il significato delle informazioni e di effettuare ricerche aggiuntive per approfondire ulteriormente l’argomento, migliorando la qualità e la pertinenza del testo generato.

Nei test comparativi, OmniThink ha superato GPT-4o nella generazione di testi lunghi e nella creazione di strutture, ottenendo valutazioni superiori in termini di pertinenza, ampiezza, profondità e creatività. Il sistema incrementa la diversità delle informazioni e la densità di conoscenza attraverso un processo iterativo di aggiunta e valutazione dei dati. Inoltre, l’adozione del concetto unico di “full design” durante la creazione delle strutture contribuisce a migliorare la coerenza strutturale e la logica del contenuto.

Utilizzando il dataset WildSeek per la valutazione, OmniThink ha dimostrato la capacità di produrre testi di qualità superiore, confermando il suo potenziale nella generazione di contenuti estesi. Attualmente, il codice sorgente di OmniThink è disponibile su GitHub, e una demo online è accessibile tramite ModelScope, offrendo alla comunità di ricerca l’opportunità di testare e contribuire allo sviluppo del sistema.

Di Fantasy