Alibaba Cloud ha dato il via al rilascio di un modello di intelligenza artificiale generativa (AI) e un chatbot che ricordano le funzionalità di “GPT-4” di Open AI e “Bard” di Google. Questa mossa segna un passo avanti significativo nel panorama dei modelli cinesi, poiché introduce una capacità di risposta legata alle immagini e, ciò che colpisce, è che questi modelli sono open source.
La notizia è stata divulgatadalla CNBC, con l’annuncio che Alibaba ha pubblicato i modelli di intelligenza artificiale open source “Qwen-VL” e “Qwen-VL-Chat”, entrambi in grado di interpretare immagini e partecipare a conversazioni sofisticate.
Per precisare, Quan-VL e Quan-VL-Chat sono versioni multimediali di Tongyi Qianwen, un modello linguistico di grande portata (LLM) con ben 7 miliardi di parametri sviluppato da Alibaba lo scorso aprile.
Questi modelli presentano entrambi la capacità di rispondere agli input delle immagini e generare descrizioni. Più in dettaglio, Quan-VL-Chat è in grado di confrontare vari input di immagini, sostenere conversazioni avanzate e svolgere attività come la creazione di storie basate su input fotografici, generazione di immagini e risoluzione di equazioni matematiche che appaiono nelle foto.
Prendiamo ad esempio il caso di un turista straniero, che non parla cinese, il quale visita un ospedale per cure mediche. Egli potrebbe prendere una mappa del piano e chiedere a Quan-VL-Chat: “Dove si trova l’ufficio del chirurgo ortopedico?”. Quan-VL-Chat fornirebbe risposte testuali basate sulle informazioni e i dettagli delle immagini.
Questa caratteristica multimodale rappresenta un’innovazione per i modelli di intelligenza artificiale cinesi. Baidu, tramite “Hernybot”, ha già introdotto alcune funzionalità multimodali, tuttavia, a causa di questioni di autorizzazione governativa, il suo lancio ufficiale è stato ritardato.
Tanto Quan-VL quanto Quan-VL-Chat sono ora liberamente accessibili su “ModelScope”, un repository di modelli di intelligenza artificiale fornito da Alibaba Cloud. Questi modelli possono essere impiegati a fini commerciali. Gli utenti hanno la possibilità di scaricarli direttamente da ModelScope oppure di accedervi e utilizzarli attraverso Alibaba Cloud.
Da questa mossa, la CNBC ha dedotto che: “L’obiettivo è attrarre più utenti e ampliare l’influenza nel campo dell’intelligenza artificiale generativa in vista dell’Immissione in Borsa della divisione cloud”.
Nel frattempo, agli inizi di agosto, Alibaba Cloud ha anche reso open source “Qwen-7B”, un LLM con 7 miliardi di parametri, e “Qwen-7B-Chat”, un chatbot sviluppato in modo interattivo.
In conclusione, Alibaba si trova ora a competere sia con i modelli LLM proprietari come quelli di OpenAI e Google, sia con Meta e Databricks nell’ambito dell’IA generativa open source.