Che cosa un podcast ‘infinito’ generato dalla IA può dirci sul futuro dell’intrattenimento
Sheldon County è un podcast che non suonerà mai la stessa selezione due volte. Ogni volta che qualcuno lo ascolta, inizia digitando un numero casuale in un sito web. Questo “seme” metterà in moto una macchina di calcolo di Rube Goldberg che creerà personaggi, relazioni, gelosie, tradimenti e forse anche un omicidio o due. Questi punti della trama saranno trasformati in una narrazione testuale, letti ad alta voce da un sintetizzatore vocale e quindi compressi in un file audio. Ogni volta sarà una versione unica della storia di Sheldon County . Un podcast fatto apposta per te.
Questo è comunque il sogno: Il risultato attuale ha ancora bisogno di lavoro. Finora, esistono solo pochi episodi di questo podcast generato dalla procedura (puoi ascoltarne due qui sotto) e il suo creatore, lo studente di dottorato James Ryan, sta ancora lavorando su un sito web. Dice che il software di back-end è in gran parte finito, ma sono necessari alcuni tocchi finali, come la creazione di un programma per aggiungere automaticamente la musica ad ogni episodio. “In questo momento sto provando il concetto”,
In altre parole, potrebbe volerci ancora un po ‘.
Ma ciò che è stato creato finora è impressionante e sembra una piccola anteprima del futuro. Uno in cui il contenuto dell’intrattenimento non è solo onnipresente (dio sa che il mondo ha già abbastanza podcast) ma anche unico. Come un modo per rendere divertenti le cose per gli esseri umani, i contenuti generati proceduralmente non sono nuovi, ma sono diventati più complessi negli ultimi anni. Vedi, ad esempio, videogiochi con elementi generativi come No Man’s Sky , che ha creato pianeti unici per ogni giocatore da esplorare; e la Terra di mezzo: Shadow of War , che ha reso i nemici con storie elaborate che hanno affascinato i giocatori tanto quanto la storia del gioco.
Sheldon County sembra meno fondamentale in confronto, ma è solo perché il suo output è audio. I meccanismi reali che creano i personaggi e le loro interazioni sono molto più complessi. “È una grande ricerca, che spinge i confini della tecnologia”, dice Mark Riedl, professore associato presso l’Entertainment Intelligence Lab di Georgia Tech, a The Verge .
Per Ryan, Sheldon County è l’ultimo passo in una ricerca che dura tutta la vita per costruire computer che generano mondi immaginari. È un linguista diventato programmatore, il cui lavoro con l’Expressive Intelligence Studio presso l’Università della California, a Santa Cruz, è dedicato a trovare nuovi modi di usare le macchine in modo espressivo.
“Quando ho imparato a programmare, uno dei primi programmi che ho realizzato è stato un generatore di nomi”, dice. “Un programma in grado di scegliere due nomi da una lista di migliaia e combinarli insieme. E per me, creare questo nome mi è sembrato di creare un intero personaggio. Una piccola persona astratta. ”
Da questo semplice inizio, Ryan ha creato generatori di mondo sempre più complessi. Lastessa Contea di Sheldon è costruita su un programma del suo Hennepin, che crea personaggi, i loro social network e il mondo in cui vivono. Ryan confronta Hennepin con “il più grande foglio di calcolo Excel del mondo”, con infinite file di celle che corrispondono a personaggi, tratti, relazioni, professioni e così via.
‘SHELDON COUNTY’ È STATO CREATO DA “IL PIÙ GRANDE FOGLIO DI CALCOLO DEL MONDO”
Non c’è visualizzazione o output testuale – solo dati. Ma quando un utente inserisce il proprio numero casuale, questo foglio di calcolo viene popolato di nuovo, creando un mondo unico. Il programma quindi modella come interagiscono questi punti dati simulando un ciclo giornaliero in cui ogni personaggio ha la possibilità di eseguire un’azione. Le azioni sono a loro volta dettate dai tratti e dalle relazioni di un individuo. “Un personaggio non può prendere l’azione per ‘ridicolizzare’ un altro personaggio a meno che non abbia il tratto ‘figo’ e il loro obiettivo sia qualcuno che non gli piace”, dice Ryan.
Combina abbastanza di questi punti dati e presto ti ritroverai con qualcosa di molto complesso, dice Ryan, e aiuta il programma non solo a simulare ogni versione della conteadi Sheldon per giorni o settimane. Simula secoli. “Questo produce un enorme, enorme quantità di azione, e da questo, possiamo prendere le sequenze più interessanti”, dice Ryan.
Egli fornisce l’esempio di un progetto iniziale che utilizzava un software simile per simulare la vita sociale in una piccola città. “In quel gioco, abbiamo sempre trovato trame ridicole emergenti”, dice. “In una versione, c’era questo ragazzo diciasettenne la cui madre aveva il proprio ristorante preferito in città, ma poi si decide di mettersi in proprio con un ristorante che diventa più popolare di quello di lei! Avevo programmato come funzionavano le rivalità commerciali, ma non mi sarei mai aspettato che diventasse un affare di famiglia. ”
Puoi immaginare quella trama per fare un buon episodio di This American Life .
In molti modi, questo tipo di generazione procedurale non è una novità. Risale al 1980 e prima, afferma Riedl, dove tecniche simili venivano utilizzate per generare mappe per i videogiochi. “Inizialmente era perché i computer in quel momento non avevano molto spazio di archiviazione, quindi non si potevano spedire giochi giganteschi”, spiega. “Ciò significava che spettava ai titoli precedenti, come Rogue , NetHack e così via, generare labirinti sulle CPU utilizzando alcuni algoritmi molto veloci ed economici”.
L’utilità di questi algoritmi è diminuita man mano che lo storage è diventato più economico, ma l’approccio procedurale alla generazione di contenuti è tornato a essere un fenomeno mainstream di nuovo quando l’eccitazione dell’intelligenza artificiale è esplosa.
Ciò che è interessante, tuttavia, è che le moderne tecniche di IA come le reti neurali profonde non sono in realtà quelle adatte per progetti come Sheldon County . Ryan dice che usa principalmente ciò che a volte viene chiamato AI simbolico o, in senso peggiore, “buona vecchia AI”. Questo approccio è meno relativo al mining dei dati per cercare pattern, come con deep learning e altro ancora sulla creazione di set di regole e istruzioni logiche che guidare un processo.
Ci sono alcuni semplici motivi per cui l’intelligenza artificiale moderna non funziona per compiti come questo, dice Riedl. In parte, le tecniche come l’apprendimento approfondito non sono ancora valide per generare un testo coerente (anche le chat più avanzate oggi si basano su frasi preprogrammate). E anche perché le tecniche più datate danno ai programmatori un maggiore controllo sull’output.
Anche con queste limitazioni, ci sono ancora molte cose che puoi fare, naturalmente. “Uno degli esempi recenti più interessanti è stato il generatore di storie dell’orrore del MIT , che era interattivo”, afferma Riedl. “Quindi dovresti scrivere una riga, poi scrive una riga; scrivi una riga, scrive una riga. In realtà, diventa questo tipo di esercizio di sollecitazione creativa, che ti consente di interpretare ciò che il programma produce “.
USARE INTELLIGENTEMENTE L’INTELLIGENZA ARTIFICIALE SIGNIFICA CREARE NUOVI TIPI DI INTRATTENIMENTO
Il lavoro di Riedl esplora il modo in cui le moderne tecniche di IA possono affrontare le sfide della narrazione. Dice che lui ei suoi colleghi stanno lavorando a “[risolvere] alcune di queste domande per far sì che la generazione di storie funzioni meglio per storie più lunghe.” Ma, aggiunge che nel prossimo futuro, l’IA non sarà veramente in grado di generare nuovi contenuti per noi, che si tratti di programmi TV o podcast. Invece, sarà compito dello sceneggiatore creare nuovi tipi di intrattenimento.
Alex Champandard, un programmatore di intelligenza artificiale e co-fondatore della startup Creative.AI, ha un approccio simile. Dice che l’intrattenimento completamente automatizzato non è la strada da seguire e osserva che molti progetti creativi che la gente sostiene di essere il prodotto dell’IA si basano su intuizioni e supervisioni sostanzialmente umane . “Non esiste una macchina che sia creativa da sola. In ultima analisi, a causa dell’input umano, “dice Champandard .
Suggerisce che il progetto di Ryan è interessante non necessariamente a causa delle narrazioni che crea, ma perché mette in discussione la nostra idea di cosa sia un podcast e cosa lo rende buono in primo luogo. “In futuro, sono sicuro che avremo dei podcast generati da macchine che nessuno ascolterà e scompariranno perché non varranno il costo dell’elettricità”, afferma Champandard. “Ma questi esperimenti fanno tutti parte di ciò che rende questo spazio divertente.”
Per Ryan, sembra certamente che il senso della sperimentazione e della creazione sia centrale nel suo progetto. “Per quanto riguarda il futuro, spero certamente che i media generativi diventino più mainstream”, dice, ma osserva che il suo senso di godimento non deriva dal consumo dei media generativi, ma dalla sua creazione. “La cosa più gratificante di lavorare con queste simulazioni è vedere queste emergenze selvagge”, dice, che è simile al punto di Riedl sul generatore di storie dell’orrore del MIT. È divertente solo perché il pubblico partecipa.
Forse è qui che giace il futuro dei media generativi. Non nella creazione di podcast infiniti su misura per ogni individuo, ma nel trasformarci tutti in narratori che arrivano a creare e ad apprezzare le nostre narrazioni.