Nel cuore di un’industria notoriamente avversa al rischio, dove i costi di produzione raggiungono cifre astronomiche e la frammentazione del mercato rende proibitive eventuali perdite, l’Intelligenza Artificiale si fa spazio come alleata insostituibile per le major cinematografiche.
Per decenni, metodi tradizionali come i focus group e i sistemi Nielsen hanno rappresentato l’unica bussola per misurare il gradimento del pubblico, ma intervengono troppo tardi, quando gran parte del budget è già stato speso.
Oggi, la sfida è anticipare i gusti degli spettatori quando ancora i titoli devono vedere la luce, trasformando un’operazione che una volta sembrava un salto nel buio in un processo guidato da modelli predittivi sempre più sofisticati.
Nel tentativo di scovare la “formula del successo”, i primi approcci di Machine Learning hanno fatto leva su tecniche classiche – dalla regressione lineare ai forestali alberi decisionali, dai K-Nearest Neighbors alle reti neurali – cercando di combinare dati su cast e sceneggiature per intercettare potenziali hit.
Tuttavia, questi sistemi restavano vincolati a serie storiche troppo ristrette e a metriche retrospettive, mostrando il fianco al cosiddetto “problema del cold start”: come valutare contenuti completamente nuovi, privi di qualsiasi riscontro di pubblico?
La svolta arriva con un paper targato Comcast Technology AI in collaborazione con la George Washington University: “Predicting Movie Hits Before They Happen with LLMs”. Gli autori hanno scelto di bypassare la mancanza di dati di engagement adottando un approccio inedito, basato su grandi modelli di linguaggio (LLM) istruiti esclusivamente con metadati delle pellicole non ancora uscite. Campi quali genere, sinossi, cast, fascia di età, tonalità narrativa e premi vinti diventano il carburante di un modello che restituisce, in formato JSON, una classifica di titoli con punteggi di popolarità e giustificazioni puntuali.
Per costruire una solida base sperimentale, è stato creato ex novo un dataset da centinaia di titoli tratti dalla piattaforma di Comcast, seguendo il loro destino fino a verificarne l’effettivo grado di successo misurato da interazioni reali.
A questo benchmark sono stati contrapposti due modelli di riferimento: un ordinamento casuale e un sistema di embedding di “popolarità” (Popular Embedding) che, sfruttando BERT V4 e Linq‑Embed‑Mistral, stimava l’attrattiva dei titoli basandosi sulla somiglianza cosine con le pellicole già testate.
Il cuore pulsante dell’esperimento risiede nella prompt engineering: l’LLM, configurato come un “assistente editoriale”, riceveva incarico di riordinare un elenco fisso di titoli emergenti, senza introdurne di nuovi, e di spiegare in linguaggio naturale i motivi della scelta, restituendo il tutto in una struttura JSON facilmente interpretabile da pipeline automatizzate .
Questa strategia ha permesso di calibrare il livello di dettaglio informativo, passando da prompt essenziali (solo genere) a configurazioni ricchissime (includendo cast, premi e mood), per esplorare come la quantità di metadati incida sulla qualità delle previsioni.
I test hanno rivelato un vantaggio netto dei modelli LLM rispetto a BERT V4: Llama 3.1 da 405 miliardi di parametri, alimentato dal prompt più dettagliato, ha superato il baseline sia in termini di accuratezza della posizione in cima alla classifica (Accuracy@1) che di qualità complessiva dell’ordinamento.
La capacità di integrare segnali di prestigio – come la storia dei premi vinti dai protagonisti – si è dimostrata particolarmente preziosa per le versioni più grandi del modello, mentre le varianti ridotte faticavano a gestire input troppo ricchi, mostrando un compromesso tra complessità del prompt e potenza computazionale.
Pur consapevoli delle limitazioni – dai gap temporali tra knowledge cutoff e release dei film, fino all’imprevedibilità delle mode culturali che non sempre obbediscono a logiche razionali – gli autori sottolineano come questo approccio possa ridurre la dipendenza dalle metriche retrospettive e democratizzare la visibilità dei nuovi titoli, offrendo alle redazioni editoriali previsioni basate su metadata piuttosto che su click e promozioni estensive.
In un’epoca in cui il sistema di fruizione dei contenuti è in continuo mutamento, l’IA si propone non solo come strumento di automazione, ma come guida lungimirante in grado di esplorare scenari di pubblico ancora inesplorati, aprendo la porta a una rivoluzione del processo creativo e distributivo nel mondo del cinema.