L’ascesa dei video deepfake con Hunyuan di Tencent

Un fenomeno interessante sta emergendo nella comunità della sintesi AI, anche se la sua rilevanza potrebbe richiedere tempo per essere pienamente compresa. Gli hobbisti stanno sviluppando modelli di video AI generativi per riprodurre l’aspetto delle persone, utilizzando LoRA basati sul framework video Hunyuan Video, recentemente rilasciato da Tencent.

I video mostrati mostrano come le sembianze di celebrità come Natalie Portman, Christina Hendricks, Scarlett Johansson ed Elon Musk possano essere trasformate in file aggiuntivi per il sistema video generativo Hunyuan, facilmente installabili senza restrizioni (come i filtri NSFW) sul computer dell’utente.

Ad esempio, per creare il LoRA di Christina Hendricks, sono state necessarie solo 16 immagini dalla serie Mad Men (solo 307 MB di dati). Questo dimostra che, nella maggior parte dei casi, i LoRA non richiedono enormi quantità di dati o lunghi tempi di addestramento.

I LoRA di Hunyuan possono essere addestrati su immagini statiche o video, anche se l’addestramento sui video richiede risorse hardware più potenti e tempi più lunghi. Il modello Hunyuan Video ha 13 miliardi di parametri, superando altri modelli come Sora (12 miliardi di parametri) e Hunyuan-DiT (1,5 miliardi di parametri). Rispetto ai modelli precedenti, come Stable Diffusion, i LoRA permettono di ottenere una sintesi più realistica delle personalità delle celebrità, superando i deepfake tradizionali.

Tutti i LoRA possono essere scaricati gratuitamente dalla comunità Civit, che è diventata un punto di riferimento per questi strumenti. Molti LoRA, anche quelli basati su immagini statiche, possono essere utilizzati per creare video (ad esempio, passando da un’immagine a un video) tramite Hunyuan.

Nonostante la popolarità di Civit, molti LoRA riguardano contenuti NSFW, inclusi video di celebrità, e alcuni sono progettati per generare contenuti pornografici. Questo solleva preoccupazioni etiche e legali, poiché l’uso di Hunyuan per creare video pornografici di celebrità o persone reali potrebbe aumentare.

Principali novità introdotte da Hunyuan LoRA:

Installazione locale senza restrizioni: A differenza di altri sistemi di generazione video come DALL-E 2, che sono a pagamento e limitati da restrizioni, Hunyuan Video permette di scaricare e utilizzare il modello senza filtri, dando agli utenti maggior libertà.
Nessun bisogno di video “host”: I LoRA di Hunyuan riducono significativamente lo sforzo necessario per creare deepfake, rispetto ai metodi tradizionali come DeepFaceLab e FaceSwap, che richiedevano migliaia di immagini per funzionare.
Migliore coerenza temporale: La coerenza tra i fotogrammi nei video generati è migliorata, riducendo i problemi di instabilità che avevano afflitto le generazioni di video AI per anni.
Accesso all’esperimento umano: Hunyuan offre la possibilità di esplorare in modo più approfondito la sintesi video umana, consentendo la generazione di video realistici basati su identità specifiche, come celebrità.

Le implicazioni principali dell’uso di Hunyuan LoRA riguardano la possibilità di creare video pornografici o diffamatori di persone reali o celebrità, un aspetto che potrebbe causare preoccupazioni legali ed etiche. Le nuove tecnologie basate su Hunyuan stanno quindi aprendo la strada a una generazione video AI che potrebbe essere utilizzata per scopi controversi.

Nonostante le implicazioni etiche, l’industria degli effetti visivi sta cercando di sfruttare le capacità di Hunyuan Video per migliorare la coerenza nei volti umani nei filmati. Tuttavia, ci sono preoccupazioni legali, poiché l’uso di Hunyuan per rappresentare persone reali senza il loro consenso è vietato in alcune regioni, come l’UE, il Regno Unito e la Corea del Sud.

L’ascesa dei video deepfake con Hunyuan di Tencent

DiFantasy

Di Fantasy

Articoli correlati

Mistral AI rilascia un modello text-to-speech open che punta a superare ElevenLabs e a portare la sintesi vocale on-device

Robot che giocano a tennis: un passo avanti nel controllo motorio AI

Google lancia Lyria 3 Pro: musica AI fino a 3 minuti

Ultimi Post

Mistral AI rilascia un modello text-to-speech open che punta a superare ElevenLabs e a portare la sintesi vocale on-device

Robot che giocano a tennis: un passo avanti nel controllo motorio AI

Google lancia Lyria 3 Pro: musica AI fino a 3 minuti

Meta e Google condannate per dipendenza da social