Elaborazione del linguaggio: Google Infini-Attention per LLM

DiFantasy

Apr 11, 2024

I ricercatori di Google hanno ideato un nuovo metodo chiamato Infini-attention, per scalare i modelli LLM (Large Language Model) basati su Transformer per elaborare input di lunghezza infinita con memoria e calcoli limitati.

Questo approccio, presentato nell’articolo “Leave No Context Behind”, combina la memoria compressiva con il meccanismo di attenzione standard dei Transformer, integrando sia l’attenzione locale che quella lineare a lungo termine in un singolo blocco Transformer.

In pratica, Infini-attention consente ai modelli LLM di gestire contesti estremamente lunghi in modo continuo e fluido, supportando sia la pre-formazione che il fine-tuning, e agevolando l’estensione naturale dei modelli esistenti.

L’approccio Infini-attention sfrutta una memoria compressiva per immagazzinare e recuperare informazioni a lungo termine, riducendo al minimo il degrado delle prestazioni man mano che la lunghezza dell’input aumenta. Rispetto ai modelli di base, Infini-attention offre un rapporto di comprensione 114 volte superiore in termini di dimensione della memoria.

I risultati sperimentali dimostrano che, addestrando il modello con sequenze di input estremamente lunghe, Infini-attention migliora notevolmente le prestazioni di comprensione, superando le baselines sui benchmark di modellazione del linguaggio a lungo contesto. Inoltre, il metodo consente un’inferenza di streaming veloce per i LLM, mantenendo bassi i requisiti di memoria e calcolo.

Elaborazione del linguaggio: Google Infini-Attention per LLM

DiFantasy

Di Fantasy

Articoli correlati

HUSH: l’AI che trasforma una foto panoramica in un modello 3D interattivo

Tencent lancia Hunyuan-A13B, LLM open source che unisce potenza ed efficienza

IBM prevede un futuro della cybersecurity dominato dall’intelligenza artificiale

You missed

HUSH: l’AI che trasforma una foto panoramica in un modello 3D interattivo

Tencent lancia Hunyuan-A13B, LLM open source che unisce potenza ed efficienza

IBM prevede un futuro della cybersecurity dominato dall’intelligenza artificiale

La partnership tra New Tune e il National Gugak Center per preservare e innovare la musica tradizionale coreana con l’IA