Il futuro del podcasting è l’IA
 


In parole povere, in un mese vengono lanciati circa 22.000 nuovi podcast. Ci sono quasi 2,5 milioni (più di 71 milioni di episodi) nella directory di Apple Podcast in questo momento, secondo Podcast Industry Insights . E quelli sono solo quelli che conosciamo.

“Molti podcaster non stanno nemmeno attraversando le grandi piattaforme ora. Stanno andando direttamente dai loro ascoltatori, vendendo contenuti premium e avendo un grande successo”, afferma Andy Taylor, ex BBC Radio e fondatore della società di consulenza R&S Bwlb con sede a Cardiff .

E questo per non parlare del volume crescente di contenuti simili a podcast, creati da marchi per la promozione o produttori di eventi che vogliono, ad esempio, rendere disponibili i talk on-demand. Ogni contenuto deve essere prodotto e distribuito, sia da professionisti dell’audio che da persone che imparano il mestiere. Pertanto, più possono automatizzare grandi quantità di produzione, più possono concentrarsi sul contenuto.

“I diversi luoghi in cui viene pubblicato l’audio sono appena esplosi”, spiega Jonathan Wyner, ingegnere capo presso M Works Mastering e professore al Berklee College of Music di Boston . “Con tutti questi contesti, c’è una vera motivazione e un imperativo per i creatori di essere più versatili”.

Per non parlare, più produttivo ed efficiente.

L’ascesa dell’IA
L’intelligenza artificiale (AI), un software in grado di automatizzare le attività precedentemente svolte dagli esseri umani, è la chiave per gestire lo tsunami dei contenuti dei podcast. Non solo l’IA può accelerare la produzione, ma può anche far suonare meglio i podcast e preparare il terreno per le esperienze audio di domani.

“L’intelligenza artificiale aiuta fondamentalmente a svolgere attività ripetitive per accelerare il flusso di lavoro del podcaster”, spiega Manos Chourdakis, ingegnere di ricerca presso Nomono , che sviluppa strumenti di podcasting basati sull’intelligenza artificiale. “Ad esempio, con l’IA, non devi ascoltare un intero podcast per trovare dove qualcuno ha detto qualcosa di sbagliato, quindi sostituirlo o rimuoverlo. Potresti farlo tu stesso , ma l’IA lo fa più velocemente”.

Poi ci sono compiti che possono essere svolti solo con l’IA, almeno su larga scala, come rimuovere il rumore o migliorare i dialoghi. “Il miglioramento dei dialoghi di buona qualità sarebbe impossibile senza l’IA”, afferma Chordakis. “Almeno impossibile in un lasso di tempo ragionevole utilizzando gli strumenti tradizionali”.

Perfetto per compiti umili
Le applicazioni dell’IA nel podcasting sono varie quanto le attività di produzione. Alcuni sono integrati direttamente nelle piattaforme podcast. Quando i creatori caricano i loro podcast sulla piattaforma di hosting Podcast.co , il sistema “ascolta” automaticamente i file audio e normalizza i livelli sonori.

“Qualsiasi strumento che può aiutare a ridurre i frammenti di un lavoro che intorpidisce la mente è una buona cosa”, afferma Mike Cunsolo, co-fondatore della piattaforma. Cunsolo gestisce anche Cue , una società di produzione di podcast che lavora con marchi aziendali, e Matchmaker.fm , che collega i produttori di podcast con gli ospiti. “Avrai sempre bisogno di quell’elemento di competenza umana, ma presto le macchine potrebbero imparare a capire cosa rende interessante un podcast e ridurre il tempo necessario”.

Il fornitore di soluzioni Descript applica l’IA a molti aspetti dell’ingegneria dei podcast, tra cui la rimozione del rumore e il controllo dell’eco. Una delle faccende più “intorpidite” che Descript può gestire è il tono della stanza.

“A volte i produttori devono inserire il silenzio digitale in un podcast. Forse tra una modifica e l’altra o per prolungare la spaziatura tra le frasi”, afferma Jay LeBoeuf, responsabile dello sviluppo aziendale e aziendale di Descript. “Ma suona incredibilmente innaturale.”

Se i produttori non hanno catturato il tono della stanza durante la registrazione di un podcast, potrebbero dover tornare indietro e recuperarlo. Oppure possono ascoltarlo nella registrazione, copiare e incollare dove necessario, quindi modificare il risultato per farlo sfumare in modo naturale.

Oppure i computer possono gestirlo. Il generatore di toni ambientali basato sull’intelligenza artificiale di Descript analizza una registrazione, identifica il tono ambientale e lo sintetizza automaticamente dove è necessario. Tale tecnologia non solo ovvia a compiti umili, ma consente una maggiore flessibilità di produzione.

“L’intelligenza artificiale ci consentirà di utilizzare hardware meno costoso, stanze dal suono peggiore e luoghi più rumorosi e ottenere comunque buoni risultati”, afferma Chourdakis di Nomono.

Nuove funzionalità basate sull’intelligenza artificiale
L’intelligenza artificiale apre anche le porte all’innovazione nel podcasting, creando nuove soluzioni che alzano il livello per podcaster e ascoltatori. Ad esempio, lo strumento Epidemic Audio Reference (EAR) aiuta i podcaster a trovare musica priva di copyright basata sui brani che gli piacciono.

“Diciamo che stai cercando musica introduttiva o finale e stai pensando a una canzone in particolare, ma è protetta da copyright”, dice Chourdakis. “Il sistema utilizza l’intelligenza artificiale per aiutarti a trovare qualcosa di simile.”

Alla Bwlb, il team di Taylor ha sviluppato Accordion , una soluzione basata sull’intelligenza artificiale che può prendere un podcast e riprodurlo a varie lunghezze.

“Ogni altra parte della nostra vita sta diventando più intelligente: case intelligenti, frigoriferi intelligenti”, afferma Taylor. “Le persone vogliono più controllo e comodità anche dalla loro esperienza di podcast.”

Quando Taylor ha lavorato ai documentari per la BBC, gli sarebbero state chieste versioni più brevi da girare su piattaforme diverse. Il processo è sempre stato manuale. Accordion applica algoritmi software al contenuto del podcast per creare in modo intelligente versioni di diverse lunghezze. “Non accelera nulla”, afferma Taylor, “ma offre all’utente il controllo sulla durata del contenuto senza perdere la struttura del tono o l’ascoltabilità”.

Mettere l’accento sulla narrazione immersiva
Più podcaster utilizzano gli strumenti di intelligenza artificiale, meglio diventano. In altre parole, più dati acquisiscono, più apprendono.

Gli algoritmi di miglioramento dei dialoghi di Nomono si basano su ampi set di dati di registrazioni vocali, alcune pulite e intelligibili, altre meno, che insegnano agli strumenti di intelligenza artificiale come generare un suono migliore. “I podcaster non dovrebbero aver bisogno di conoscenze audio avanzate per produrre audio di alta qualità”, afferma Chourdakis. “Automatizzando alcune di queste attività, possono dedicare più tempo a concentrarsi su un’ottima narrazione e meno tempo a noiose attività di pulizia”.

E in futuro, potranno evolversi più facilmente per creare un nuovo genere di podcast coinvolgenti e spaziali. Ad esempio, la tecnologia di Nomono consente la produzione audio basata su oggetti, che consente ai produttori di “collocare” le voci in un paesaggio sonoro 3D o creare versioni dinamiche che possono essere personalizzate per gli ascoltatori.

“La produzione dei media sta ora entrando in una fase in cui se puoi sognarlo, può accadere”, afferma LeBoeuf di Descript. “E non hai più bisogno di uno studio costoso o di decenni di formazione per raggiungere i tuoi obiettivi”.

Di ihal