Il MahaMarathi 7B, dotato di 7 miliardi di parametri, si unisce alla lista dei LLM indiani come Telugu, Malayalam, Tamil e Oriya Llama. Costruito sul framework Meta Llama-2 e Mistral AI, questo Marathi LLM è stato sviluppato con l’ausilio di risorse informatiche e dati forniti da CourtEasy.ai, una società finanziata da Microsoft for Startups.

Il team dietro questa ricerca include il dottor Aakash Patil, ricercatore post-dottorato presso l’Università di Stanford, Mrunmayee Shende, cofondatore di CourtEasy.ai, e Niraj Singh, ingegnere ML presso Inbound Health.

Per promuovere la democratizzazione della ricerca sull’apprendimento automatico, il team ha rilasciato la versione iniziale del modello base pre-addestrato su Hugging Face, incoraggiando sviluppatori, startup e organizzazioni pubbliche e private a sviluppare modelli ottimizzati per vari casi d’uso.

MahaMarathi 7B affronta le caratteristiche linguistiche uniche, la complessità e il contesto culturale del Marathi, rendendolo adatto a gestire conversazioni e istruzioni complesse. Questo modello linguistico è disponibile gratuitamente su Hugging Face, promuovendo un accesso più ampio e incoraggiando applicazioni in vari campi, come il business e l’e-governance.

Il Marathi, parlato da oltre 83 milioni di persone prevalentemente nel Maharashtra, è la tredicesima lingua più parlata a livello globale e la terza più comune in India. Con il MahaMarathi 7B, si mira a catalizzare l’innovazione nella regione, riconoscendo il significativo contributo economico del Maharashtra.

I creatori vedono il potenziale impatto di questo Marathi LLM su diversi settori, tra cui formazione professionale, istruzione, sanità, agricoltura, ambiente, pianificazione urbana e gestione del traffico.

Il rilascio del Marathi LLM rappresenta un passo avanti nell’accessibilità e nell’applicazione dell’intelligenza artificiale alle lingue diverse dall’inglese. Il team prevede di rilasciare modelli ottimizzati per le istruzioni e le preferenze nei prossimi mesi.

Di Fantasy