I ricercatori dell’Università di Chicago hanno dimostrato che i modelli linguistici di grandi dimensioni (LLM), come GPT-4 di OpenAI, possono analizzare i rendiconti finanziari con una precisione che rivaleggia e spesso supera quella degli analisti professionisti. I risultati sono stati pubblicati in uno studio intitolato “Analisi di bilancio con modelli linguistici di grandi dimensioni”, che potrebbe influenzare significativamente il futuro dell’analisi finanziaria e del processo decisionale.
Nel loro esperimento, i ricercatori hanno valutato le prestazioni di GPT-4 nel prevedere la crescita futura degli utili aziendali utilizzando bilanci standardizzati e anonimizzati, privi di contesto testuale. Sorprendentemente, GPT-4 ha superato gli analisti umani, dimostrando un’accuratezza pari a quella di un modello di machine learning avanzato addestrato specificamente per questo compito. “L’accuratezza delle previsioni del LLM è alla pari con quella dei modelli ML più avanzati”, scrivono gli autori. “Le previsioni del LLM non derivano dalla sua memoria di allenamento, ma dalla sua capacità di generare spunti narrativi sulla performance futura delle aziende”.
Lo studio ha utilizzato un approccio innovativo, fornendo a GPT-4 dati finanziari strutturati e suggerimenti sulla “catena di pensiero” per guidare il suo ragionamento, emulando il processo analitico di un analista finanziario. Questo metodo ha permesso a GPT-4 di raggiungere una precisione del 60% nel prevedere la direzione degli utili futuri, superiore all’intervallo del 53-57% degli analisti umani.
I ricercatori sottolineano che gli LLM potrebbero assumere un ruolo centrale nel processo decisionale grazie alla loro vasta base di conoscenze e alla capacità di riconoscere modelli e concetti aziendali, permettendo loro di eseguire ragionamenti intuitivi anche con informazioni incomplete.
Nonostante la sfida rappresentata dall’analisi numerica per i modelli linguistici, i risultati dello studio suggeriscono che gli LLM sono pronti a trasformare l’analisi finanziaria. Alex Kim, uno degli autori, ha evidenziato che, sebbene gli LLM siano efficaci nei compiti testuali, la loro comprensione numerica è tradizionalmente meno sviluppata. Tuttavia, la capacità di GPT-4 di competere con modelli ML specializzati e superare gli esperti umani indica il suo potenziale dirompente.
Alcuni esperti hanno però notato che il modello “ANN” utilizzato come riferimento nello studio potrebbe non rappresentare lo stato dell’arte della finanza quantitativa, sottolineando che ci sono modelli più avanzati utilizzati privatamente.