I chatbot moderni si affidano a modelli linguistici avanzati, pre-addestrati su grandi quantità di testo per comprendere il linguaggio in modo astratto. Questo addestramento iniziale li prepara a imparare rapidamente nuove attività quando vengono fornite istruzioni dettagliate. Tuttavia, trovare dati di addestramento affidabili e completi è difficile, poiché spesso mancano della varietà necessaria per gestire situazioni complesse o insolite.
IBM ha introdotto un metodo innovativo per specificare quali conoscenze e abilità un chatbot dovrebbe avere, utilizzando una tassonomia per organizzare e colmare le lacune nelle capacità del modello. Un “modello insegnante” poi genera domande e risposte per fornire istruzioni di alta qualità al chatbot, migliorandone le competenze in base alle esigenze specifiche.
Per esempio, se si vuole che un chatbot gestisca comunicazioni finanziarie, lo sviluppatore carica dati finanziari e esempi di calcolo degli utili per addestrare il modello. Ciò assicura che il chatbot possa adattarsi anche a cambiamenti nelle normative contabili, offrendo istruzioni su come calcolare i guadagni o redigere email sui report finanziari.
IBM ha anche sviluppato l’approccio LAB (Large-scale Alignment for Bots) per creare dati sintetici e integrare nuove competenze nei chatbot senza perdere conoscenze pregresse. Questo sistema riduce il tempo e i costi di formazione dei modelli.
Le competenze che i chatbot possono acquisire sono raggruppate in tre categorie: conoscenze specifiche, competenze di base, e abilità avanzate. Il modello insegnante verifica la qualità delle istruzioni generate, assicurando che siano pertinenti e accurate.
IBM ha utilizzato questo approccio per allenare modelli come Labradorite 13B e Merlinite 7B con dati sintetici, ottenendo prestazioni superiori a chatbot concorrenti in test di comprensione e fluidità del linguaggio.
In conclusione, questa innovazione rappresenta un passo avanti nel perfezionamento dei chatbot, rendendoli più versatili e efficienti nel gestire una vasta gamma di compiti.