Allganize Alpha-Instruct, LLM per la lingua coreana

DiFantasy

Giu 3, 2024

Allganize, un esperto in modelli linguistici di grandi dimensioni (LLM), ha annunciato il lancio pubblico di “Alpha-Instruct”, un LLM leggero specializzato nella lingua coreana.

Questo modello, denominato Alpha-Instruction, è stato rilasciato come open source, consentendo a chiunque di utilizzarlo liberamente. Può essere integrato nella piattaforma Ali di Allganize o personalizzato per adattarsi alle esigenze specifiche di un’azienda.

Alpha-Instruction è stato sviluppato a partire dal parametro LLM open source “Llama 3” di Meta su scala 8B (8 miliardi). Combina il modello Llama 3 con un modello di istruzioni migliorato per comprendere meglio il coreano e seguire le istruzioni.

Per ottimizzare la qualità delle risposte, Allganize ha utilizzato 2.000 set di dati di istruzioni che riflettono le preferenze di risposta universali. Questo approccio ha ridotto errori come la ripetizione delle risposte e le risposte in inglese non necessarie.

Secondo un funzionario di Allganize, la qualità dei dati è fondamentale per ottimizzare i modelli di istruzioni. Anche se la quantità dei dati è importante, la qualità è prioritaria, specialmente per il metodo di apprendimento OPRO (Optimization by PROmpting) che Allganize utilizza.

Alpha-Instructor si distingue per le sue alte prestazioni nella lingua coreana e la sua abilità pratica nella creazione e nel riepilogo di documenti. Ha ottenuto punteggi elevati nella classifica “Logickor”, dimostrando una forte capacità di pensiero multidisciplinare.

Il CEO di Allganize, Changsoo Lee, ha spiegato che la scelta di Llama 3 è stata dettata dalle sue ottime prestazioni rispetto ad altri modelli open source. Lee ha annunciato anche lo sviluppo di “Alpha-F (Llama 3)”, basato su “Alpha-F (EEVE)”, per la finanza.

Il modello Alpha-Instructor è disponibile sul sito web di Hugging Face.

Allganize Alpha-Instruct, LLM per la lingua coreana

DiFantasy

Di Fantasy

Articoli correlati

Meta presenta Muse Image con ricerca web e anticipa il modello Muse Video

OpenAI introduce GPT-Live per rendere la voce di ChatGPT più continua e naturale

Microsoft porta i modelli MAI dentro Excel e Outlook per ridurre la dipendenza dai fornitori esterni

Ultimi Post

Meta presenta Muse Image con ricerca web e anticipa il modello Muse Video

OpenAI introduce GPT-Live per rendere la voce di ChatGPT più continua e naturale

Microsoft porta i modelli MAI dentro Excel e Outlook per ridurre la dipendenza dai fornitori esterni

Perplexity prepara l’assistente AI Teammate per lo sviluppo software in concorrenza con Claude Code e Cursor