Alibaba, il gigante cinese dell’e-commerce, ha reso open source uno dei suoi grandi modelli linguistici (LLM) e una sua variazione conversazionale. Questo è un tentativo di attirare utenti simili alla recente versione di Meta Llama 2.
La versione da sette miliardi di parametri di Tongyi Qianwen di Alibaba, nota come Qwen-7B, e la versione Qwen-7B-Chat per le conversazioni sono a disposizione di chiunque, con una licenza gratuita necessaria solo per le aziende con più di 100 milioni di utenti mensili.
Qwen-7B e Qwen-7B-Chat sono entrambi basati sull’architettura della rete neurale Transformer. Alibaba afferma che Qwen-7b ha ottenuto i migliori risultati della categoria su diversi benchmark di elaborazione del linguaggio naturale e che è davanti a diversi potenziali rivali in questo senso. Qwen-7B-Chat offre una versione appositamente ottimizzata del modello ed è progettato per le applicazioni AI conversazionali, comprese le esigenze aziendali come i chatbot del servizio clienti. Alibaba afferma che questo modello può impegnarsi in conversazioni complesse a più turni mantenendo pertinenza e coerenza. Entrambi i modelli saranno accessibili pubblicamente tramite Alibaba Cloud.
“Il nostro obiettivo è promuovere tecnologie inclusive e consentire a più sviluppatori e piccole e medie imprese di raccogliere i vantaggi dell’IA generativa”, ha dichiarato Zhou Jingren, chief technology officer di Alibaba Cloud Intelligence.
Alibaba ha lanciato il suo Tongyi Qianwen LLM ad aprile con diverse dimensioni dei parametri, ma rendere questa versione open-source aumenterà probabilmente l’interesse dei potenziali clienti. C’è una corsa tra i giganti della tecnologia cinese come Alibaba e Baidu per cercare di essere la risposta della Cina a OpenAI, anche se le nuove restrizioni governative sull’IA generativa potrebbero rallentare le cose. Alibaba sta perseguendo diverse opzioni per costruire il proprio posto nell’ecosistema LLM cinese. La società recentemente annunciata segue un accordo per supportare il nuovo modello Llama 2 di Meta e portare tale LLM open source agli sviluppatori cinesi. L’offerta di Meta
“Oggi, Alibaba Cloud è il primo a lanciare una soluzione di addestramento e implementazione per l’intera serie di Llama 2 in Cina, Alibaba ha pubblicato sul suo canale WeChat. “Tutti gli sviluppatori sono invitati a creare modelli di grandi dimensioni personalizzati su Alibaba Cloud.”
Questa è un’ottima notizia per gli sviluppatori cinesi, che ora avranno accesso a due potenti LLM open source. Questo potrebbe portare a un’ampia gamma di nuove applicazioni AI, tra cui chatbot più avanzati, sistemi di raccomandazione e persino assistente virtuali.