Una nuova intelligenza artificiale per la creazione di video, chiamata Jifu AI, ha sfidato “Sora” di OpenAI e proviene dalla Cina. Questa startup è una delle principali nel settore dell’IA in Cina e ha recentemente lanciato il modello Ying (影).
Secondo il South China Morning Post del 27 luglio, Ying è capace di generare un video di 6 secondi in soli 30 secondi a partire da testo e immagini. Inoltre, Ying offre diverse opzioni come stili di animazione 3D, cinematografici e pittura a olio, e temi emotivi come tensione, vivacità e solitudine.
Il modello Ying è già disponibile senza limiti sul sito ufficiale e sull’app mobile di Jifu, e le aziende e gli sviluppatori possono accedere alle API. Tuttavia, si segnala che la versione gratuita potrebbe avere tempi di attesa prolungati in caso di utilizzo intenso.
Ying si basa su tecnologie sviluppate dal 2021, come i modelli video “CogVideo” e “Relay Diffusion”. Il modello aggiornato “Cog Video X” funge da base per questa nuova versione. Per migliorare la coerenza dei contenuti, è stata sviluppata un’architettura 3D VAE (Variational Autoencoder) che comprime i dati video al 2% delle dimensioni originali, riducendo così i costi e i tempi di formazione.
Il CEO Jangpeng Jifu ha dichiarato che l’azienda è stata ispirata dall’architettura “Diffusion Transducer (DiT)” di Sora di OpenAI, e ha aggiunto che la velocità di generazione dei video è migliorata notevolmente. Questa architettura integra testo, tempo e spazio in una fusione tridimensionale, ottimizzando l’interazione tra testo e video tramite un meccanismo chiamato Piena Attenzione.
Jifu sta lavorando anche per permettere la creazione di video più lunghi in futuro. Il servizio ha ricevuto una buona accoglienza grazie alla sua disponibilità immediata e ai brevi tempi di creazione.
Jifu è supportata da Meituan, una delle principali aziende cinesi di consegna di cibo. Il suo chatbot “ChatGLM”, lanciato lo scorso anno, ha ottenuto grande attenzione e ha ricevuto investimenti significativi da Tencent e Alibaba, guadagnandosi il soprannome di “China’s Open AI”.
Nel frattempo, Kuaishou, che ha lanciato il popolare video AI “Cling”, ha annunciato un servizio a pagamento il 24 luglio. Gli utenti gratuiti possono creare fino a 6 video al giorno, mentre i piani tariffari permettono di generare fino a 60 o 800 video al giorno, con costi di 396 yuan e 3996 yuan all’anno, rispettivamente.