Nel panorama in rapida evoluzione dell’intelligenza artificiale, l’India sta emergendo come un attore chiave, sviluppando soluzioni innovative che rispondono alle esigenze locali. Un esempio emblematico di questa tendenza è Shivaay, un modello di AI creato da due studenti di ingegneria indiani, Rudransh Agnihotri e Manasvi Kapoor, attraverso la loro startup FuturixAI.
Shivaay si basa sull’architettura di “joint embedding” e condivisione dei parametri, un approccio che non è ampiamente discusso ma che ha mostrato notevoli potenzialità. Gli sviluppatori si sono ispirati alla visione di Yann LeCun, capo scienziato dell’AI presso Meta, noto per il suo lavoro pionieristico nel deep learning e nella visione artificiale. LeCun ha enfatizzato l’importanza di modelli che apprendano rappresentazioni astratte del mondo, piuttosto che limitarsi a manipolare dati grezzi.
Con 4 miliardi di parametri, Shivaay integra conoscenze da tre modelli distinti, offrendo una base di conoscenza diversificata. Per l’inferenza, il team utilizza GPU NVIDIA A100 da 80 GB tramite Google Cloud, garantendo tempi di risposta rapidi. Attualmente, il modello è offerto gratuitamente, consentendo agli utenti di esplorare e valutare le sue capacità senza impegno finanziario.
Shivaay ha dimostrato prestazioni superiori rispetto ad altri modelli avanzati in benchmark come MMLU e MMLU-Pro, con un margine di 10-15 punti. Eccelle in compiti di ragionamento e calcoli matematici, mostrando una comprensione profonda e una capacità di problem-solving avanzata. Inoltre, si distingue in applicazioni specifiche per l’India, superando modelli come Krutrim e Sarvam, e offrendo soluzioni più adatte alle esigenze locali.
L’obiettivo di Shivaay è potenziare gli sviluppatori e le aziende indiane, permettendo loro di costruire agenti e applicazioni AI senza dipendere da modelli esteri come GPT. Offrendo il servizio gratuitamente, il team mira a cambiare la percezione che i modelli GPT e architetture simili non siano accessibili o efficaci per le esigenze locali. Questo approccio democratizza l’accesso all’AI, promuovendo l’innovazione e l’autosufficienza tecnologica in India.
Con un’interfaccia utente migliorata e una crescente base di utenti, Shivaay sta guadagnando attenzione e fiducia. In soli 15 giorni, il numero di iscritti è aumentato, superando i 1.500 utenti, principalmente attraverso il passaparola su piattaforme come Reddit. Il team è impegnato a dimostrare che modelli come Llama 2, Qwen e Gemma possono essere altrettanto efficaci, se non superiori, alle soluzioni esistenti per i casi d’uso indiani.