Immagine AI

Critterz, lungometraggio animato la cui uscita era pianificata per quest’anno al festival di Cannes, non è stato proiettato per via di un evento industriale preciso, cioè la chiusura del servizio Sora da parte di OpenAI annunciata a marzo, che ha interrotto la pipeline su cui poggiava la produzione. Il progetto è guidato da Chad Nelson, creative strategist di OpenAI, insieme al produttore James Richardson, e parte da un cortometraggio omonimo di cinque minuti del 2023 realizzato con DALL-E che raccontava una storia ambientata in un mondo di animali del bosco. L’estensione a lungometraggio aveva come motore generativo Sora ed era impostata sul racconto di un animale alla ricerca di un fratello scomparso. La chiusura del servizio si è inserita in un più ampio piano di semplificazione del portafoglio prodotti di OpenAI, che nello stesso passaggio ha sciolto anche partnership di contenuto con realtà come Disney. Il team di Critterz sta ora cercando nuovi partner tecnologici e un distributore, con l’obiettivo di un’uscita nel primo trimestre dell’anno prossimo.

I numeri della produzione sono particolarmente significativi rispetto alla discussione su quanto effettivamente l’AI generativa modifichi l’economia del cinema d’animazione. Secondo Richardson, un’opera che in pipeline tradizionale avrebbe richiesto tra le duecento e le trecento persone per tre o quattro anni viene realizzata da un gruppo di quindici persone in nove mesi. Le stime di costo che circolano nel settore indicano un budget complessivo inferiore ai trenta milioni di dollari, contro i circa duecento milioni investiti in un titolo Pixar di riferimento come Toy Story 4. Questo crollo del costo unitario non si traduce in semplice automazione: la produzione è stata trasferita su Woven, un sistema interno di Vertigo Films pensato per orchestrare più modelli generativi all’interno della stessa pipeline, sulla logica per cui non esiste un modello tutto-fare. Nelson lo ha esplicitato sostenendo che alcuni modelli rendono meglio sulla recitazione dei personaggi, altri sulla resa sonora, e che la scelta del modello diventa quindi una decisione per scena, simile a quella di scegliere un’ottica o uno stock di pellicola in produzione tradizionale.

Il caso più interessante per comprendere lo stato reale della produzione full-AI è però quello di Hell Grind, lungometraggio d’azione di novantacinque minuti presentato a Cannes dalla startup Higgsfield AI, con personaggi, ambienti e oggetti di scena interamente generati. Il dato di pipeline è quello che vale la pena guardare in dettaglio: per completare i primi venticinque minuti del film il team ha generato 16.181 clip iniziali, scartandone la quasi totalità per arrivare alle 253 inquadrature effettivamente montate. Il rapporto tra generato e usato è dunque dell’ordine di uno a sessantaquattro, un numero che chiarisce con esattezza quanto il processo non assomigli a un’automazione ma a un lavoro di selezione iterativa massiva. Il prompt medio per singola scena è arrivato a circa tremila parole e ha dovuto includere non soltanto inquadratura, illuminazione ed effetti ottici dell’obiettivo, ma anche vincoli di fisica espliciti, come la necessità che gravità e inerzia si comportassero in modo coerente. Il modello principale impiegato è Veo 3 di Google. La produzione complessiva è durata circa due settimane con un costo dichiarato di cinquecentomila dollari.

Il problema tecnico identificato dal team Higgsfield come il più ostico nella lunga durata non è la qualità del singolo frame ma la coerenza, cioè il mantenimento dell’aspetto, dell’abbigliamento, dell’illuminazione di scena e del tono visivo dei personaggi attraverso inquadrature consecutive. È una questione strutturale per i modelli video diffusivi attuali: ogni clip viene campionata in modo indipendente da un processo stocastico, e ricondurla a una continuità visiva richiede un mix di seed condivisi, embedding di riferimento per i personaggi, LoRA mirati, controllo della scena tramite immagini di ancoraggio e revisione umana. Tutto questo trasforma il flusso da prompt-to-film in qualcosa di più simile a una pipeline VFX classica, dove il modello generativo è uno tra molti strumenti.

Anche sul piano del clima industriale la situazione è cambiata in modo netto. La narrativa dominante nel 2023, anno dello sciopero degli sceneggiatori e degli attori statunitensi, era prevalentemente difensiva rispetto al ruolo dell’AI nella produzione. Quest’anno la posizione che emerge tanto dagli interventi pubblici quanto dalle scelte operative dei grandi studi, da Netflix ad Amazon, è di integrazione operativa. Demi Moore, intervenendo a Cannes, ha sintetizzato il punto sostenendo che l’AI è ormai una realtà e che rifiutarla equivale a perdere comunque la battaglia. Il dato che resta sullo sfondo, e che il caso Critterz mette in evidenza con particolare chiarezza, è che la dipendenza da un singolo modello chiuso introduce un rischio operativo non trascurabile: la chiusura di un servizio commerciale può interrompere una produzione in corso esattamente come la chiusura di una software house specializzata interromperebbe una pipeline VFX tradizionale, con la differenza che qui non si tratta di sostituire un tool ma di ricostruire un’estetica e un comportamento di personaggi su un’architettura modellistica diversa.

Di Fantasy