Nel settore dell’intelligenza artificiale, un nuovo protagonista emerge con l’ambizione di colmare un divario significativo: Sarvam-M. Questo modello linguistico di 24 miliardi di parametri, sviluppato dalla startup indiana Sarvam AI, rappresenta un passo fondamentale verso l’autosufficienza tecnologica dell’India. Basato su Mistral Small, un modello open-source sviluppato dalla francese Mistral AI, Sarvam-M è stato progettato per affrontare le sfide linguistiche, matematiche e di programmazione specifiche dell’India.
Sarvam-M si distingue per la sua attenzione alle lingue indiche, tra cui hindi, bengalese, gujarati, kannada, malayalam, marathi, oriya, punjabi, tamil e telugu. Queste dieci lingue rappresentano la lingua madre di oltre il 70% della popolazione indiana, circa un miliardo di persone. Per garantire una comprensione accurata e contestualizzata, Sarvam ha tradotto una parte significativa dei dati di addestramento in queste lingue. Ad esempio, il 30% dei prompt relativi a codifica, matematica e ragionamento è stato tradotto in lingue indiche, con l’hindi che ha rappresentato il 28% dei dati indici.
Sarvam-M è stato progettato per una vasta gamma di applicazioni, tra cui l’intelligenza artificiale conversazionale, la traduzione automatica e gli strumenti educativi. La sua architettura open-weight lo rende accessibile tramite l’API di Sarvam, consentendo a sviluppatori e aziende di integrarlo facilmente nelle loro soluzioni. Inoltre, Sarvam ha dettagliato nel suo blog tecnico l’approccio utilizzato per il fine-tuning, l’apprendimento per rinforzo e l’ottimizzazione del deployment, evidenziando l’attenzione dedicata alla qualità e all’efficienza del modello.
Il lancio di Sarvam-M segna un’importante pietra miliare nel percorso dell’India verso l’autosufficienza nell’intelligenza artificiale. Sotto l’iniziativa IndiaAI, Sarvam AI è stata selezionata per sviluppare il primo modello linguistico fondamentale indiano, un progetto che prevede la creazione di un modello multimodale da 70 miliardi di parametri, ottimizzato per le lingue indiche e l’inglese. Questo impegno sottolinea la determinazione dell’India nel promuovere l’innovazione tecnologica interna e ridurre la dipendenza da soluzioni esterne.
Sarvam AI ha intrapreso diverse collaborazioni strategiche per potenziare le sue capacità. Ha lavorato con AI4Bharat, un laboratorio di ricerca presso l’IIT Madras, per sviluppare modelli linguistici indiani open-source. Inoltre, ha collaborato con Microsoft per integrare i suoi modelli vocali indiani nella piattaforma Azure, ampliando l’accessibilità e l’applicabilità delle sue soluzioni.