Recentemente, è emersa una tecnologia che consente a un modello linguistico di grandi dimensioni (LLM) di risolvere problemi complessi generando autonomamente programmi di risoluzione anziché utilizzare dati di apprendimento preesistenti. Questo approccio è conosciuto come “programma che crea un programma”.
Neuroscience ha pubblicato un articolo nel suo archivio riguardante gliLLM ‘Natural Language Embedded Program (NLEP)’. Questo permette ai ricercatori del MIT di creare e eseguire programmi Python per risolvere compiti che coinvolgono il linguaggio naturale, la matematica, l’analisi dei dati e le interazioni simboliche.
Di solito, i modelli di intelligenza artificiale (AI) utilizzano il linguaggio naturale per elaborare informazioni e rispondere a domande, ma hanno difficoltà con compiti che richiedono ragionamenti numerici o simbolici complessi. NLEP aiuta il LLM a generare un programma Python per risolvere tali domande, che poi viene eseguito per produrre una risposta comprensibile.
Questo metodo non solo migliora la trasparenza del modello, permettendo di spiegare chiaramente il processo di inferenza attraverso il programma, ma consente anche agli utenti di ispezionare e correggere direttamente eventuali errori di codice.
NLEP procede attraverso quattro fasi. In primo luogo, il modello richiama i pacchetti o le funzioni necessarie per risolvere il compito. Successivamente, produce una rappresentazione in linguaggio naturale delle conoscenze richieste. Poi, implementa ed esegue la funzione per calcolare la risposta. Infine, restituisce il risultato in linguaggio naturale.
NLEP ha dimostrato una precisione superiore al 90% in diverse attività di inferenza simbolica, come il tracciamento degli oggetti, l’esecuzione di comandi e la classificazione del testo, rispetto ai metodi tradizionali. Inoltre, ha migliorato le prestazioni dei modelli linguistici open source.
Oltre a migliorare la precisione del LLM, NLEP offre vantaggi aggiuntivi, come una maggiore protezione della privacy poiché opera localmente senza la necessità di inviare dati utente a terze parti come OpenAI o Google.
I ricercatori hanno sottolineato che il successo di NLEP non deriva da un modello linguistico separato o più avanzato, ma dall’uso innovativo della generazione di programmi anziché del linguaggio naturale.