Allganize, un esperto in modelli linguistici di grandi dimensioni (LLM), ha annunciato il lancio pubblico di “Alpha-Instruct”, un LLM leggero specializzato nella lingua coreana.
Questo modello, denominato Alpha-Instruction, è stato rilasciato come open source, consentendo a chiunque di utilizzarlo liberamente. Può essere integrato nella piattaforma Ali di Allganize o personalizzato per adattarsi alle esigenze specifiche di un’azienda.
Alpha-Instruction è stato sviluppato a partire dal parametro LLM open source “Llama 3” di Meta su scala 8B (8 miliardi). Combina il modello Llama 3 con un modello di istruzioni migliorato per comprendere meglio il coreano e seguire le istruzioni.
Per ottimizzare la qualità delle risposte, Allganize ha utilizzato 2.000 set di dati di istruzioni che riflettono le preferenze di risposta universali. Questo approccio ha ridotto errori come la ripetizione delle risposte e le risposte in inglese non necessarie.
Secondo un funzionario di Allganize, la qualità dei dati è fondamentale per ottimizzare i modelli di istruzioni. Anche se la quantità dei dati è importante, la qualità è prioritaria, specialmente per il metodo di apprendimento OPRO (Optimization by PROmpting) che Allganize utilizza.
Alpha-Instructor si distingue per le sue alte prestazioni nella lingua coreana e la sua abilità pratica nella creazione e nel riepilogo di documenti. Ha ottenuto punteggi elevati nella classifica “Logickor”, dimostrando una forte capacità di pensiero multidisciplinare.
Il CEO di Allganize, Changsoo Lee, ha spiegato che la scelta di Llama 3 è stata dettata dalle sue ottime prestazioni rispetto ad altri modelli open source. Lee ha annunciato anche lo sviluppo di “Alpha-F (Llama 3)”, basato su “Alpha-F (EEVE)”, per la finanza.
Il modello Alpha-Instructor è disponibile sul sito web di Hugging Face.