Il direttore di Meta AI, Yann LeCun, si è mostrato molto impressionato dal recente rilascio di Kannada Llama. Ha espresso il suo entusiasmo su X, ripubblicando il post originale su Kannada Llama: “Adoro questo. Questo è il motivo per cui le piattaforme di intelligenza artificiale open source trionferanno: sono l’unico modo per l’IA di soddisfare lingue, culture, valori e interessi così diversificati”.
Anche l’esperto di informatica Subbarao Kambhampati ha lodato Kannada Llama, sottolineando: “Il rapido sviluppo di LlaMA indiani, come questo Kan-LLaMA di Tensoic, è ciò che preferisco dei LLM open source! (Altrimenti, ci vorrebbe molto prima che i grandi attori si interessino a lingue meno diffuse). Non vedo l’ora di vedere un Tel-LlaMA…”.
Kannada Llama, noto anche come Kan-LLaMA, è un modello Llama 2 da 7 miliardi, pre-addestrato e ottimizzato su token in Kannada. È stato sviluppato da Adarsh Shirawalmath, uno studente di secondo anno del Vellore Institute of Technology, per la Tensoic, una società con sede a Mumbai.
In un’intervista esclusiva con AIM, Shirawalmath ha raccontato che, quando è stato annunciato il fondo AWS Campus al VIT, era entusiasta all’idea di ottenere finanziamenti per sviluppare modelli di intelligenza artificiale. Tuttavia, uno dei requisiti era avere una società registrata. “Ho pensato, se stiamo progettando di costruire questa impresa, facciamolo”, ha detto, descrivendo come hanno fondato una società in soli 15 giorni.
“Abbiamo scelto il nome Tensoic quasi per caso, unendo ‘Tensore’ e ‘Logica’, senza obiettivi specifici all’inizio, semplicemente sperimentando”, ha aggiunto.
La società ha esteso le capacità linguistiche di Llama-2 per le lingue indiane meno diffuse, concentrando gli sforzi sul Kannada. Hanno affinato il modello con 600 milioni di token in Kannada, per poi ottimizzarlo ulteriormente con dataset di istruzioni all’avanguardia. Tensoic ha in programma di rilasciare i modelli, il codice, i dataset e la documentazione sotto licenze permissive.