01.AI, l’impresa innovativa cinese guidata dal rinomato esperto di IA e investitore Kai-Fu Lee, ha svelato Yi-34B, un modello di intelligenza artificiale con 34 miliardi di parametri. Questo modello ha dimostrato di essere superiore ai concorrenti open source, Llama 2 di Meta Platforms e Falcon del Technology Innovation Institute di Abu Dhabi, nonostante questi ultimi abbiano una maggior quantità di parametri, rispettivamente 70 e 180 miliardi.
Il modello Yi-34B, che offre supporto sia per l’inglese che per il cinese, è configurabile per un’ampia gamma di applicazioni. Accanto a questo gigante, 01.AI propone anche una variante più compatta, allenata con 6 miliardi di parametri, che, pur mostrando prestazioni leggermente inferiori, risulta comunque competitiva sui ben noti benchmark AI/ML.
La compagnia, che in soli otto mesi dal lancio ha già ottenuto la valutazione di unicorno, mira a espandere queste soluzioni e a introdurre un’offerta commerciale che possa competere direttamente con OpenAI, il leader di mercato in termini di utenza nell’ambito dell’intelligenza artificiale generativa.
L’approccio di 01.AI riflette una tendenza mondiale in cui le entità internazionali sviluppano modelli generativi di IA per rispondere alle esigenze specifiche dei propri mercati di riferimento.
Fondata nel marzo da Lee, 01.AI ha come missione quella di avanzare verso l’era dell’IA 2.0, dove i modelli linguistici avanzati potranno amplificare la produttività umana e innescare trasformazioni economiche e sociali di ampia portata.
Secondo la visione del team di 01.AI, questa nuova frontiera dell’IA, incentrata sull’innovazione dei modelli di base, trasformerà radicalmente la tecnologia, le piattaforme e le applicazioni a tutti i livelli, promettendo un impatto dieci volte maggiore rispetto a quello dell’Internet mobile e una riscrittura completa di software e interfacce utente. Questo scenario è destinato a generare una nuova ondata di applicazioni e modelli di business che pongono l’IA al primo posto, accelerando l’innovazione nell’era dell’IA 2.0.
Lee ha rapidamente allestito un team tecnico di livello, attingendo a talenti da giganti quali Google, Huawei e Microsoft Research Asia, e si è assicurato le risorse di calcolo necessarie per lo sviluppo dei modelli Yi di 01.AI.
Il round di finanziamento iniziale dell’impresa è stato guidato da Sinovation Ventures, anch’essa presieduta da Lee, e dalla divisione cloud di Alibaba, sebbene l’ammontare preciso raccolto non sia stato divulgato.
La prima uscita pubblica della startup ha presentato due modelli di base bilingui con una dimensione dei parametri rispettivamente di 6B e 34B, addestrati per gestire lunghezze di sequenza fino a 4K, estendibili fino a 32K al momento dell’inferenza. L’iterazione successiva ha introdotto una lunghezza di contesto fino a 200K. Sulla piattaforma Hugging Face, il modello di base Yi-34B ha impressionato con prestazioni superiori a quelle di LLM base significativamente più grandi come Llama 2-70B e Falcon-180B.
Nelle prove che includevano il ragionamento comune e la comprensione della lettura, il modello di 01.AI ha registrato punteggi eccellenti, superando i suoi concorrenti. Un modello più snello ma altamente performante rappresenta un vantaggio notevole in termini di risparmio energetico per gli utenti finali, facilitando la personalizzazione del modello e l’elaborazione di applicazioni specifiche in modo più efficiente.
Per ora, tutti i modelli della serie Yi sono disponibili alla comunità scientifica per la ricerca, mentre un utilizzo commerciale richiede permessi appropriati.
I modelli attuali di 01.AI rappresentano opzioni vantaggiose per le organizzazioni internazionali che operano in Cina, offrendo la possibilità di sviluppare chatbot bilingui. La società prevede di ampliare ulteriormente queste iniziative, aggiungendo il supporto per ulteriori lingue e sfidando la serie GPT di OpenAI con un LLM commerciale ancora più avanzato.
È importante notare che 01.AI non è l’unica startup che mira a servire lingue e mercati specifici. Di recente, il colosso cinese Baidu ha lanciato ERNIE 4.0 LLM e ha anticipato una serie di nuove applicazioni basate su di esso. Allo stesso modo, la coreana Naver ha introdotto HyperCLOVA X, il suo modello LLM che comprende la lingua coreana in tutti i suoi aspetti culturali e sociali, mentre in India, Reliance Industries sta collaborando con Nvidia per sviluppare un modello linguistico che copra l’ampia varietà di lingue parlate nel paese.