7 modelli basati su Meta Llama 2

All’evento Inspire di Microsoft, è stato presentato Llama 2, l’ultima versione del famoso modello linguistico open source LLaMa, sviluppato in collaborazione tra Meta e Microsoft. Questa nuova versione offre numerosi miglioramenti per migliorare le prestazioni e la sicurezza. L’aggiornamento introduce anche i modelli di parametri pre-addestrati e ottimizzati 7B, 13B e 70B, offrendo un notevole aumento dei dati pre-addestrati e sfruttando GQA per una migliore capacità di inferenza.

Llama 2 è disponibile per l’uso sia nella ricerca che a livello commerciale e può essere accessibile su piattaforme come Microsoft Azure e Amazon SageMaker. È inoltre compatibile con piattaforme Windows come Subsystem for Linux (WSL), terminale Windows, Microsoft Visual Studio e VS Code.

Questo modello è stato meticolosamente ottimizzato per il dialogo e ha dato vita a modelli di chat Llama 2-Chat, che stabiliscono nuovi standard nel campo del trattamento e della comprensione del linguaggio. La collaborazione tra Meta e diverse altre aziende, tra cui Amazon, HuggingFace, NVIDIA, Qualcomm, IBM, Zoom, Dropbox e leader accademici, sottolinea l’importanza e il valore del software open source.

Ci sono già alcuni modelli basati su LLaMa-2 che sono stati sviluppati e possono essere utilizzati per accedere alle ultime offerte di Meta:

Perplexity.ai: Una piattaforma chatbot unica che utilizza un approccio simile a un motore di ricerca. Esamina il web per trovare risposte alle domande degli utenti e fornisce le fonti delle risposte generate. Offre gratuitamente i modelli Llama 2 da 70 miliardi, 13 miliardi e 7 miliardi di parametri, consentendo agli utenti di sperimentare e sfruttare la potenza di questi grandi modelli linguistici.

Baby Llama: Un’implementazione ambiziosa dell’architettura Llama 2 nel linguaggio di programmazione C, ottimizzata per l’esecuzione su dispositivi con risorse limitate. Ha dimostrato prestazioni impressionanti anche su dispositivi senza GPU potenti, aprendo nuove possibilità per l’esecuzione di modelli complessi su dispositivi di fascia bassa.

Poe: Una piattaforma di chatbot che ha aggiunto il supporto per diversi modelli Llama 2, offrendo una vasta gamma di opzioni per gli utenti. Poe è noto per consentire l’utilizzo di Llama su app iOS o Android native, caricare e condividere file e continuare conversazioni senza problemi.

WizardLM: Questi modelli vengono addestrati su Llama-2 utilizzando i nuovissimi metodi Evol+ e mostrano risultati impressionanti in diverse attività, dimostrando notevoli capacità di seguire istruzioni complesse e ottenere prestazioni eccellenti in varie attività.

Stable Beluga 2: Un LLM ad accesso aperto basato su Llama-2 70B, che ha dimostrato notevoli capacità di ragionamento attraverso vari benchmark. È stato messo a punto utilizzando un set di dati generato sinteticamente e le sue prestazioni si confrontano favorevolmente anche con GPT-3.5 su alcune attività.

LunaAI: Un modello di chat avanzato basato su Llama 2, noto per le sue risposte dettagliate ed esaurienti, il basso tasso di allucinazioni e l’assenza di meccanismi di censura, garantendo una comunicazione aperta e senza restrizioni. Questo modello è stato messo a punto utilizzando più di 40.000 lunghe discussioni in chat.

Redmond-Puffin-13B: Un modello linguistico pionieristico basato su Llama-2 messo a punto da Nous Research, noto per le sue prestazioni impressionanti in diverse attività grazie all’uso di un set di dati attentamente curato.

In sintesi, Llama 2 ha portato numerosi miglioramenti e ha dato vita a nuove possibilità per l’uso di modelli linguistici sofisticati in diverse applicazioni e piattaforme, dimostrando l’importanza del software open source nell’avanzamento della tecnologia del linguaggio.

7 modelli basati su Meta Llama 2

DiFantasy

Di Fantasy

Articoli correlati

Nvidia presenta Vera Rubin, la piattaforma AI a sette chip progettata per la prossima generazione di modelli di OpenAI e Anthropic

NVIDIA BlueField-4 STX: come NVIDIA ha eliminato i rallentamenti dei dati con la nuova memoria per lo storage

L’unificazione dei sistemi di recupero del feed di LinkedIn tramite un singolo modello linguistico di grandi dimensioni

Ultimi Post

Nvidia presenta Vera Rubin, la piattaforma AI a sette chip progettata per la prossima generazione di modelli di OpenAI e Anthropic

NVIDIA BlueField-4 STX: come NVIDIA ha eliminato i rallentamenti dei dati con la nuova memoria per lo storage

L’unificazione dei sistemi di recupero del feed di LinkedIn tramite un singolo modello linguistico di grandi dimensioni

Z.ai lancia GLM-5 Turbo, un modello AI più veloce ed economico progettato per agenti software