ByteDance, la società madre di TikTok, ha recentemente sviluppato un sistema di intelligenza artificiale chiamato OmniHuman, in grado di trasformare una singola fotografia in un video realistico di una persona che parla, canta o si muove in modo naturale. Questa innovazione potrebbe rivoluzionare l’intrattenimento digitale e le comunicazioni.

OmniHuman genera video a figura intera che mostrano persone che gesticolano e si muovono in modo coerente con il loro discorso, superando i precedenti modelli di IA che animavano solo volti o parti superiori del corpo. Questo progresso è stato possibile grazie all’addestramento del sistema su oltre 18.700 ore di dati video umani, utilizzando un approccio innovativo che combina diversi tipi di input: testo, audio e movimenti corporei. Questa strategia di “allenamento omni-condizionale” consente all’IA di apprendere da set di dati molto più ampi e diversificati rispetto ai metodi precedenti.

La capacità di generare video realistici da una singola foto apre nuove possibilità nella produzione di contenuti, nella creazione di materiale educativo e nelle comunicazioni digitali. Tuttavia, solleva anche preoccupazioni riguardo all’uso improprio nella creazione di media sintetici per scopi ingannevoli. Gli esperti del settore sottolineano la necessità di sviluppare linee guida etiche e normative per gestire l’uso di questa tecnologia in modo responsabile.

Di Fantasy