JPMorgan ha lanciato FlowMind, un nuovo sistema che sfrutta i grandi modelli linguistici (LLM) per creare automaticamente flussi di lavoro. Mentre l’automazione dei processi robotici (RPA) ha reso più efficienti le attività ripetitive, si è rivelata meno efficace di fronte a richieste impreviste o spontanee degli utenti.
FlowMind utilizza una strategia generale, combinando l’intelligenza degli LLM con API affidabili per guidare il ragionamento. Questo approccio non solo riduce gli errori nei LLM, ma anche protegge i dati e il codice proprietario, eliminando la necessità di interazioni dirette.
Presentando descrizioni di alto livello dei flussi di lavoro generati, FlowMind semplifica l’interazione dell’utente, consentendo un’ispezione e un feedback efficaci. Rispetto al metodo GPT-Context-Retrieval, FlowMind ha dimostrato una performance significativamente migliore, anche senza il feedback degli utenti.
Il documento introduce anche NCEN-QA, un nuovo set di dati finanziari per valutare le risposte alle domande dai rapporti sui fondi N-CEN. Utilizzando questo set di dati, i ricercatori hanno dimostrato l’efficacia dei flussi di lavoro generati da FlowMind e l’importanza del feedback degli utenti.
Il framework FlowMind funziona in due fasi principali: prima, fornisce al LLM il contesto e le API disponibili, quindi genera ed esegue i flussi di lavoro utilizzando le API, con un possibile ciclo di feedback per l’interazione dell’utente.
Il futuro potrebbe vedere l’uso del feedback degli utenti per migliorare i flussi di lavoro su larga scala e l’evoluzione delle prestazioni di FlowMind nel tempo, insieme all’espansione per gestire librerie di API più grandi.