Google AI Flan-T5

Diihal

Ott 27, 2022

Google AI presenta Flan-T5, un nuovo modello di linguaggio open source
I ricercatori hanno rilasciato pubblicamente i checkpoint Flan-T5, che ottengono ottime prestazioni con pochi colpi rispetto al modello molto più grande di PaLM 62B

La messa a punto dei modelli linguistici su un gruppo di set di dati formulati come istruzioni è stata importante nel migliorare la generalizzazione e le prestazioni del modello su attività invisibili. Nel tentativo di portare avanti questo avanzamento, Google AI ha rilasciato un nuovo modello di linguaggio open source: Flan-T5 , che è in grado di risolvere circa 1800 attività diverse.

Il primo autore del documento ” Scaling Instruction-Finetuned Language Models “, Hyung Won Chung, ha dato la notizia in un thread su Twitter:

Il documento esplora principalmente la messa a punto delle istruzioni di aree come il ridimensionamento del numero di attività e la dimensione del modello e i dati della catena di pensiero. Il documento recita: “Troviamo che la messa a punto delle istruzioni con gli aspetti di cui sopra migliora notevolmente le prestazioni su una varietà di classi di modelli ( PaLM , T5 , U-PaLM), richiedendo configurazioni (zero-shot, pochi-shot, CoT) e benchmark di valutazione (MMLU, BBH, TyDiQA, MGSM, generazione a tempo indeterminato).”

Il team ha rilasciato pubblicamente i checkpoint Flan-T5, che ottengono ottime prestazioni con pochi colpi

rispetto al modello molto più grande di PaLM 62B. Inoltre, la messa a punto dell’istruzione è un metodo generale utilizzato per migliorare le prestazioni e l’usabilità dei modelli linguistici pre-addestrati. Con Flan-T5, i ricercatori affermano che il nuovo modello porterà a un miglioramento delle capacità di suggerimento e di ragionamento in più fasi.

Google AI Flan-T5

Diihal

Di ihal

Articoli correlati

Vibe coding e app usa e getta

Sora di OpenAI si rinnova: cameo, editing e Android all’orizzonte per l’app-video AI

Google AI Studio velocizza la creazione di app grazie al vibe coding

Ultimi Post

Naver lancia ADVoost Screen per digitalizzare la pubblicità esterna con l’AI

Il ritiro di Google Gemma dopo le allucinazioni diffamatorie su politici USA

Wise AI e la gestione delle prenotazioni ospedaliere con il servizio AI Call

Neo, il robot domestico norvegese, apre i preordini