Un post è stato scritto indicando che, sebbene OpenAI continui a stupire con nuovi esempi demo del suo modello di generazione video AI di alta qualità, chiamato Sora, attualmente il pubblico non ha ancora accesso a tale tecnologia. Tuttavia, le aziende concorrenti nel campo della produzione di video con intelligenza artificiale non stanno rimanendo inattive. È stato annunciato che Pika, un concorrente diretto, ha introdotto una nuova funzionalità chiamata Lip Sync per i suoi abbonati paganti.
Questa funzione consente agli utenti di inserire dialoghi parlati nei loro video utilizzando voci generate dall’intelligenza artificiale da ElevenLabs, una startup separata specializzata in audio generativo. Inoltre, vengono aggiunte animazioni corrispondenti per sincronizzare i movimenti delle bocche dei personaggi con il dialogo. La nuova funzionalità supporta sia il testo audio che le tracce audio caricate, consentendo agli utenti di digitare o registrare i dialoghi desiderati per i personaggi generati dall’intelligenza artificiale di Pika e cambiare lo stile della voce.
Al momento, questa funzionalità è disponibile in “accesso anticipato” solo per gli utenti Pika Pro o i membri del programma “Super Collaboratori” di Pika, che è accessibile solo su invito attraverso il loro gruppo Discord. Nonostante i video generati dall’intelligenza artificiale di Pika possano avere una qualità inferiore rispetto ad altri concorrenti come Sora di OpenAI o Runway, l’aggiunta della funzionalità Lip Sync li mette in vantaggio nell’offrire caratteristiche innovative ai creatori di video.
Con Lip Sync, Pika sta affrontando uno degli ultimi ostacoli rimasti nell’utilizzo dell’intelligenza artificiale per la produzione di film narrativi più lunghi. La maggior parte degli altri generatori di video AI non offre ancora una funzionalità simile. Fino ad ora, gli utenti dovevano fare affidamento su strumenti di terze parti e procedure di post produzione complesse per aggiungere dialoghi parlati e sincronizzare i movimenti delle labbra dei personaggi, il che spesso risultava in una qualità video inferiore.
Separatamente, Runway ha aggiornato la sua funzione Multi Motion Brush, che consente agli utenti di aggiungere movimenti a diversi oggetti e scenari nei loro video. L’aggiornamento include ora il rilevamento automatico degli oggetti da muovere, semplificando ulteriormente il processo di aggiunta di movimenti ai video.
Tuttavia, non tutti sono entusiasti della nuova funzionalità di Pika. Ed Newton-Rex, CEO di Fairly Trained, un’organizzazione no-profit che si impegna per la certificazione etica dell’intelligenza artificiale, ha sollevato domande sul training del modello video di Pika. Questo solleva importanti questioni etiche riguardanti l’utilizzo dell’intelligenza artificiale nella produzione video.
Nonostante le preoccupazioni etiche sollevate, le aziende nel settore della generazione di video AI continuano a introdurre nuove funzionalità e miglioramenti nella qualità dei video generati. Questo ha portato a una competizione sempre più intensa tra i vari concorrenti, il che è positivo per gli utenti ma preoccupante per alcuni nella comunità cinematografica professionale, come lo scrittore/regista Tyler Perry, che teme che l’automazione possa portare alla perdita di posti di lavoro.