Kuaishou, il gigante cinese specializzato nell’intelligenza artificiale (IA) per la generazione di video, ha recentemente lanciato a livello globale la versione aggiornata del suo modello di IA, Kling 2.0. Questo aggiornamento rappresenta un passo avanti significativo nella creazione di contenuti video sofisticati, introducendo la possibilità di utilizzare non solo i tradizionali prompt di testo, ma anche immagini e video per generare video completamente nuovi e personalizzati.
Durante un evento a Pechino, Kuaishou ha presentato il modello di generazione video e immagini Kling AI 2.0, che ha già superato i 22 milioni di utenti globali dal suo lancio nel giugno dell’anno scorso. L’azienda ha sottolineato con orgoglio che Kling ha recentemente conquistato il primo posto nella classifica dei modelli di video IA, battendo altri nomi illustri come il “Bio 2” di Google e il modello Pikachu Lab.
Il lancio di Kling lo scorso anno aveva già suscitato grande interesse, con milioni di richieste provenienti non solo dalla Cina ma anche dal resto del mondo. Un esempio di successo di questa tecnologia è stato il cortometraggio fantasy basato su IA “Shan Hai Qi Jing”, prodotto dalla società, che ha superato i 50 milioni di visualizzazioni in appena due settimane.
Kling 2.0 arriva come una grande evoluzione, con oltre 20 iterazioni migliorative rispetto alla versione precedente. Tra i principali miglioramenti introdotti ci sono l’aumento della qualità delle immagini, il perfezionamento della nitidezza e l’introduzione di funzionalità innovative per rispondere alle diverse esigenze degli utenti.
Una delle novità più rilevanti è l’introduzione di un “linguaggio visivo multimodale” (MVL), che consente di inserire immagini e video, oltre ai semplici testi, per generare video. Questo approccio rappresenta un’evoluzione rispetto alla generazione video tradizionale, dove inizialmente veniva usato solo il testo per definire il contenuto visivo. Con Kling 2.0, gli utenti possono ora fornire descrizioni più dettagliate utilizzando anche immagini e video, migliorando significativamente la precisione e la qualità del risultato finale.
Gai Kun, vicepresidente di Kuaishou, ha sottolineato che il testo da solo non è più sufficiente per trasmettere con precisione le informazioni visive. Con il nuovo sistema MVL, gli utenti possono esprimere i propri pensieri in modo più accurato e dettagliato. Un’altra caratteristica innovativa è l’utilizzo di modelli video come riferimento, una funzionalità rara tra le piattaforme di generazione IA. Sebbene Meta abbia sviluppato un modello simile, “Movie Gen”, che consente di caricare video, non è ancora stato rilasciato pubblicamente.
In aggiunta a queste innovazioni, Kuaishou ha introdotto “Kolors 2.0”, un modello per la creazione di immagini che migliora ulteriormente la qualità dei video generati. I test interni hanno dimostrato che Kolors 2.0 offre prestazioni superiori rispetto ad altri modelli di fascia alta come Midjourney V7, Flux 1.1 Pro e Rev, posizionandosi come uno degli strumenti di generazione video più avanzati sul mercato.
Kuaishou ha anche presentato la “Cling AI 2.0 Master Edition”, una piattaforma che combina la creazione di video e immagini, focalizzandosi sul linguaggio visivo multimodale. Questa versione non rappresenta solo un aggiornamento tecnologico, ma un vero e proprio salto in avanti nell’esperienza utente, che permette una maggiore integrazione tra i modelli video e le immagini generate.
Con la nuova piattaforma, Kuaishou ha annunciato che fornirà le API non solo ai singoli utenti, ma anche alle aziende. Oltre 15.000 sviluppatori e aziende, tra cui giganti come Xiaomi, AWS, Alibaba Cloud, Freepik e Bluefocus, hanno già creato milioni di immagini e video grazie all’utilizzo di Kling, con 12 milioni di immagini e 40 milioni di video prodotti finora.
Anche se il panorama dei modelli di generazione video in Cina ha visto un boom nella seconda metà dello scorso anno, con il rilascio di modelli open source come “Wan” di Alibaba e “Hunyuan” di Tencent, Kling rimane una piattaforma esclusiva e non open source, mantenendo così un vantaggio competitivo nel mercato globale.