Nous Research presenta TST, la tecnica che riduce fino a 2,5 volte i tempi di pretraining degli LLM senza modificare l’architettura del modello
L’organizzazione di ricerca AI Nous Research ha introdotto una nuova tecnica di addestramento denominata “Token Superposition Training” (TST), progettata per aumentare drasticamente l’efficienza del pretraining dei modelli linguistici senza modificare…