La competizione per i modelli open source di punta è diventata più intensa, con Smaug-72B di Abacus AI emergere come leader nella classifica Hugging Face Open LLM. Il modello, con un punteggio medio di 80, supera i predecessori come Mistral. Smaug-72B è una versione migliorata di Qwen-72B, sviluppato da Alibaba e rilasciato insieme a un modello da 1,8 miliardi di parametri.
Alibaba ha dimostrato un impegno significativo nella creazione di modelli open source, tra cui il notevole successo di Qwen-72B e il più recente Qwen1.5-72B. Questi modelli hanno superato concorrenti come Claude-2.1 e GPT-3.5-Turbo-0613 in vari benchmark. Inoltre, Tencent ha lanciato Hunyuan LLM per uso aziendale, indicando un crescente interesse delle aziende cinesi nel settore dell’IA generativa.
Anche altre aziende cinesi stanno contribuendo all’ecosistema open source. DeepSeek ha rilasciato DeepSeek LLM, mentre Kai-Fu Lee’s 01.AI ha presentato Yi-34B. Entrambi questi modelli superano Llama 2 su vari parametri chiave. Tuttavia, Meta si prepara a lanciare Llama 3, dimostrando che la competizione nell’open source è vivace e in continua evoluzione.
In India, l’iniziativa BharatGPT mira a creare modelli linguistici fondamentali per le lingue indiane. Tuttavia, nonostante gli sforzi, nessun modello costruito da zero ha ancora raggiunto il livello dei modelli Hugging Face. Gli esperti ritengono che sia necessario non solo sviluppare modelli indiani per l’India, ma anche creare un modello open source indiano di livello globale, anche se solo in inglese.
La Cina ha adottato un approccio aperto, pubblicando modelli sia in inglese che in cinese per favorire l’adozione globale. Questa strategia contrasta con l’idea di formare una bolla di IA nazionale. Inoltre, Vishnu Vardhan di Vizzhy, coinvolto nell’iniziativa BharatGPT, sottolinea l’importanza della disponibilità e della collaborazione degli sviluppatori per migliorare i modelli open source.