ElevenLabs ha recentemente presentato GenFM, una funzionalità innovativa integrata nell’app ElevenReader. Questo strumento consente di trasformare documenti come PDF, articoli ed eBook in podcast personalizzati, narrati da co-conduttori AI. L’obiettivo è rendere l’accesso alle informazioni più dinamico e coinvolgente, offrendo agli utenti la possibilità di ascoltare contenuti testuali in formato audio, arricchiti da discussioni generate dall’intelligenza artificiale.
GenFM supporta oltre 32 lingue, ampliando significativamente la sua accessibilità a un pubblico globale. Questa caratteristica è particolarmente utile per chi desidera fruire di contenuti durante gli spostamenti, nello studio o nel multitasking, trasformando testi scritti in esperienze audio coinvolgenti. La tecnologia alla base di GenFM è progettata per creare sintesi adattive e narrazioni AI che rispecchiano il tono e lo stile del contenuto originale, offrendo un’esperienza di ascolto naturale e piacevole.
L’app ElevenReader, che ospita GenFM, è attualmente disponibile per dispositivi iOS, con una versione Android in fase di sviluppo. Questo lancio rappresenta un passo significativo per ElevenLabs, che mira a rendere l’accesso alle informazioni più fluido e adattabile alle esigenze degli utenti moderni.
Parallelamente, ElevenLabs sta espandendo la sua presenza globale, con un team di oltre 100 membri provenienti da 29 paesi. L’azienda ha recentemente annunciato investimenti strategici in India, nominando leadership locali e costruendo un team dedicato per migliorare il servizio ai clienti indiani. Questa espansione si concentra sulla localizzazione della tecnologia, sul miglioramento del supporto per le lingue indiane e sull’ampliamento della Voice Library, riflettendo l’impegno di ElevenLabs nel soddisfare le esigenze di un mercato in rapida crescita.
L’introduzione di GenFM si inserisce in un contesto più ampio di evoluzione dei podcast AI. Altre aziende, come PlayAI, hanno lanciato modelli di sintesi vocale avanzati, come PlayDialog, che utilizzano il contesto conversazionale completo per creare discorsi più naturali ed espressivi. Anche PlayNote, uno strumento che genera podcast, narrazioni e storie da vari media, si colloca in questa tendenza, offrendo contenuti audio realistici e coinvolgenti.
Inoltre, Meta ha rilasciato NotebookLlama, un progetto open-source basato sui modelli Llama, che genera sintesi conversazionali in stile podcast da file di testo caricati, ampliando le possibilità di accesso alle informazioni attraverso l’audio.
Anche Google ha aggiornato NotebookLM, basato sul modello Gemini 1.5, introducendo nuove funzionalità per migliorare la ricerca e l’apprendimento. Gli utenti possono ora caricare PDF, siti web, video di YouTube, file audio, documenti e presentazioni per ottenere sintesi e connessioni tematiche, con citazioni chiare per le citazioni dirette. La nuova funzione Audio Overview trasforma le fonti in discussioni approfondite, facilitando l’apprendimento in movimento.