Perché i deepfake autorizzati sono un grande affare 

Natalie Monbiot, capo della strategia della società di media sintetici Hour One, non ama la parola “deepfakes”. 

“Deepfake implica l’uso non autorizzato di media sintetici e intelligenza artificiale generativa: siamo autorizzati fin dall’inizio”,  

 
MetaBeat_Making the Metaverse Matter: Mettere al primo posto scopo, praticità, redditività e divertimento_Trim
Ha descritto la Hour One , con sede a Tel Aviv e New York, come una società di intelligenza artificiale che ha anche “costruito un quadro legale ed etico su come interagire con persone reali per generare la loro somiglianza in forma digitale”. 

Autorizzato contro non autorizzato. È una definizione importante in un’era in cui i deepfake, o media sintetici in cui una persona in un’immagine o un video esistente viene sostituita con le sembianze di qualcun altro, hanno ricevuto una marea di cattiva stampa – non sorprendentemente, dato il legame di lunga data dei deepfake con il revenge porn e notizie false. Il termine “deepfake” può essere ricondotto a un utente Reddit nel 2017 chiamato “deepfakes” che, insieme ad altri nella comunità, ha condiviso video, molti dei quali coinvolgenti volti di celebrità scambiati sui corpi di attrici in video pornografici.

 

E le minacce deepfake incombono, secondo un recente documento di ricerca di Eric Horvitz, chief science officer di Microsoft. Questi includono deepfake interattivi, che offrono l’illusione di parlare con una persona reale, e deepfake compositivi, con cattivi attori che creano molti deepfake per compilare una “storia sintetica”. 

Più di recente, le notizie sui deepfake delle celebrità sono proliferate. C’è la copertura del Wall Street Journal sui deepfake di Tom Cruise, Elon Musk e Leonardo DiCaprio che appaiono non autorizzati nelle pubblicità, così come le voci su Bruce Willis che ha revocato i diritti alla sua somiglianza con il deepfake (non è vero). 

 
Il lato commerciale del dibattito sul deepfake
Ma c’è un altro aspetto del dibattito sul deepfake, affermano diversi fornitori specializzati nella tecnologia dei media sintetici. Che dire dei deepfake autorizzati utilizzati per la produzione di video aziendali? 

 
La maggior parte dei casi d’uso per i video deepfake, sostengono, sono completamente autorizzati. Possono trovarsi in contesti aziendali, ad esempio per la formazione dei dipendenti, l’istruzione e l’e-commerce. Oppure possono essere creati da utenti come celebrità e leader aziendali che vogliono sfruttare i media sintetici per “esternalizzare” un gemello virtuale.

L’idea, in questi casi, è quella di utilizzare i media sintetici, sotto forma di esseri umani virtuali, per affrontare le sfide costose, complesse e non scalabili della produzione video tradizionale, soprattutto in un momento in cui la fame di contenuti video sembra insaziabile. Hour One, ad esempio, afferma di aver realizzato 100.000 video negli ultimi tre anni e mezzo, con clienti tra cui il leader nell’apprendimento delle lingue Berlitz e società di media come NBC Universal e DreamWorks.

In un momento in cui l’ IA generativa è diventata parte dello zeitgeist culturale mainstream, il futuro sembra roseo per i casi d’uso aziendali dei deepfake. Forrester ha recentemente pubblicato le sue migliori previsioni di intelligenza artificiale per il 2023, una delle quali è che il 10% delle aziende Fortune 500 genererà contenuti con strumenti di intelligenza artificiale. Il rapporto menzionava startup come Hour One e Synthesia che “utilizzano l’IA per accelerare la generazione di contenuti video”. 

Un altro rapporto prevede che nei prossimi cinque-sette anni, fino al 90 % dei media digitali potrebbe essere generato sinteticamente. 

 
“Sembrava molto rialzista… probabilmente anche a me”, ha detto Monbiot. “Ma man mano che la tecnologia matura e grandi giocatori stanno entrando in questo spazio, stiamo assistendo a un’interruzione”. 

Il lato commerciale è una parte “estremamente sottovalutata” del dibattito sui deepfakes, insiste Victor Riparbelli, CEO di Synthesia, con sede a Londra, che si descrive come una “società di creazione di video AI”. Fondata nel 2017, ha più di 15.000 clienti, un team di 135 e “cresce a due cifre ogni mese”. Tra i suoi clienti ci sono giganti del fast food tra cui McDonald’s, la società di ricerca Teleperformance e la holding di pubblicità globale WPP.

“È molto interessante come l’obiettivo sia stato molto stretto su tutte le cose brutte che potresti fare con questa tecnologia”, ha detto Riparbelli. “Penso che ciò che abbiamo visto sia solo un interesse sempre maggiore per questo e sempre più casi d’uso”. 

Un video vivente che puoi sempre modificare
 
È difficile accedere a contenuti di qualità e la maggior parte delle aziende non ha le competenze per consentire la creazione di contenuti di alta qualità, ha affermato Monbiot. 

“La maggior parte delle aziende non ha persone che hanno competenze che consentano la creazione di contenuti, in particolare la creazione di contenuti di alto livello con talento reale, e non hanno nemmeno la capacità di modificare video o di avere questo tipo di risorse internamente”, lei spiegò. Hour One è una piattaforma senza codice, quindi anche gli utenti senza competenze precedenti nella creazione di contenuti possono scegliere da una gamma di umani virtuali o diventarlo essi stessi. 

Berlitz, uno dei primi clienti aziendali di Hour One, aveva bisogno di trasformarsi digitalmente dopo 150 anni di offerta di apprendimento in classe. “Per mantenere l’istruttore nel contenuto, fanno videoconferenze dal vivo, ma questo non è davvero scalabile”, ha detto Monbiot. “Anche se avessero tutte le risorse di produzione del mondo, il costo, l’investimento e la gestione di tutti quei file è semplicemente pazzesco”. Ha aggiunto che con l’intelligenza artificiale, il contenuto può essere continuamente aggiornato e aggiornato. Ora, Berlitz ha oltre 20.000 video in diverse lingue creati con Hour One.

 
Nel frattempo, Synthesia ha affermato che la sua IA è addestrata su attori reali. Offre le immagini e le voci degli attori come personaggi virtuali tra cui i clienti possono scegliere per creare video di formazione, apprendimento, conformità e marketing. Gli attori vengono pagati per ogni video generato con loro.

Per i clienti enterprise, questo diventa un “live video” su cui possono sempre tornare e modificare, ha spiegato Riparbelli. 

 
Video di Synthesia
“Penso che ormai lavoriamo per quasi tutte le più grandi catene di fast food del mondo”, ha detto. “Hanno bisogno di formare centinaia di migliaia di persone ogni anno, su tutto… come stare al sicuro sul lavoro, come affrontare un reclamo dei clienti, come far funzionare la friggitrice”. 

Prima, ha detto, un’azienda poteva registrare alcuni video, ma sarebbero stati di altissimo livello e evergreen. Tutti gli altri corsi di formazione sarebbero probabilmente tramite diapositive PowerPoint o PDF. “Non è un ottimo modo di allenarsi, soprattutto non per le giovani generazioni”, ha detto. Invece, ora creano contenuti video, per sostituire non le riprese video originali, ma le opzioni di testo. 

Gli accordi di autorizzazione sono fondamentali
 
Hour One guida gli utenti attraverso il processo per ottenere la massima qualità di acquisizione video davanti a uno schermo verde. Il metraggio di base diventa i dati di addestramento per l’IA. 

“Fondamentalmente creiamo un gemello digitale di quella persona, ad esempio un CEO”, ha affermato Monbiot. “Il CEO firmerebbe un accordo che ci consente di riprendere il filmato e creare un gemello virtuale”. Un’altra parte dell’accordo specificherebbe chi è autorizzato a creare contenuti con il gemello virtuale.

“Vogliamo che le persone vivano un’esperienza molto positiva, confortevole e piacevole con il nostro contenuto umano virtuale”, ha affermato. “Se le persone si sentono un po’ confuse o a disagio, ciò crea sfiducia, ed è molto antitetico al motivo per cui facciamo quello che facciamo”.

Secondo Synthesia, questo tipo di autorizzazione è comune a tutti i tipi di accordi di licenza già esistenti.

“Kim Kardashian ha letteralmente concesso in licenza la sua somiglianza agli sviluppatori di app per creare un gioco che ha incassato miliardi di dollari”, ha affermato Riparbelli. “Ogni attore o celebrità concede in licenza la propria somiglianza”.

 
Offrire agli influencer le loro immagini su larga scala
Una società di media sintetici, Deepcake, si sta avvicinando meno allo spazio aziendale e più al business dei deepfake autorizzati utilizzati da celebrità e influencer per l’approvazione del marchio. Ad esempio, la società ha creato un “gemello digitale” di Bruce Willis da utilizzare in una pubblicità per la società di telecomunicazioni russa MegaFon. Ciò ha portato alla voce che Deepcake possiede i diritti del gemello digitale di Willis (cosa che non hanno).

“Lavoriamo direttamente con le star con le agenzie di gestione dei talenti, per sviluppare gemelli digitali pronti per essere inseriti in qualsiasi tipo di contenuto, come gli spot pubblicitari per TikTok”, ha affermato il CEO Maria Chmir. “Questo è un nuovo modo di produrre il contenuto senza risorse classiche come la ricerca costante delle posizioni e un processo di post-produzione molto lungo e costoso”.

Ci sono anche persone completamente sintetizzate che possono diventare ambasciatrici del marchio per poche decine di dollari, ha aggiunto. Gli utenti inseriscono semplicemente il testo che questi caratteri hanno da dire.

“Ovviamente non puoi clonare il carisma e far improvvisare una persona, ma ci stiamo lavorando”, ha detto. 

 
Il futuro dei deepfake autorizzati
Synthesia afferma che nei prossimi mesi aggiungerà emozioni e gesti ai suoi video. Hour One ha recentemente rilasciato ambienti 3D per creare un’esperienza “veramente coinvolgente”.

“Se pensi alla maturità della tecnologia AI, ogni volta che saliamo su quella scala, sblocchiamo più casi d’uso”, ha affermato Riparbelli. “Quindi l’anno prossimo, penso che vedremo molti contenuti di marketing, come gli annunci di Facebook. In genere vedremo molto meno testo e molto più video e audio nelle comunicazioni che consumiamo ogni giorno”.

I casi d’uso aziendali sui “deepfake” dei media sintetici sono solo all’inizio, ha affermato Monbiot, che ha aggiunto: “Ma questa economia è già iniziata”.

Di ihal