ElevenLabs, una startup AI fondata da ex dipendenti di Google e Palantir, ha recentemente completato un round di finanziamento di serie A che ha raccolto $19 milioni. L’investimento è stato co-guidato da Andreessen Horowitz (a16z), Nat Friedman, ex CEO di Github, e Daniel Gross, ex leader di Apple AI. Altri partecipanti importanti includono Credo Ventures, Concept Ventures e una serie di angel investor strategici, come Mike Krieger, co-fondatore di Instagram, e Brendan Iribe, co-fondatore di Oculus VR.
Inoltre, Andreessen Horowitz si è unita al consiglio di amministrazione di ElevenLabs, citando il discorso “I Have a Dream” di Martin Luther King Jr. come esempio di come la voce umana trasmetta emozioni e connessioni profonde. ElevenLabs si concentra sulla creazione di nuovi strumenti di sintesi vocale e clonazione vocale.
La startup è stata fondata da Piotr Dabkowski, ex ingegnere di machine learning di Google, e Mati Staniszewski, ex stratega di implementazione di Palantir. Il loro obiettivo è sviluppare modelli di sintesi vocale ultra realistici per una varietà di settori, tra cui istruzione, audiolibri, giochi, film e affari.
Al momento, ElevenLabs offre diversi prodotti, tra cui la sintesi vocale che converte il testo in audio professionale e veloce, VoiceLab che permette ai clienti di clonare voci a partire da brevi frammenti audio e creare nuove voci sintetiche, e il Classificatore vocale AI, un nuovo strumento che consente agli utenti di caricare un campione audio e scoprire se è stato generato dall’intelligenza artificiale di ElevenLabs. L’azienda afferma che si tratta di uno strumento unico nel suo genere.
ElevenLabs ha in programma di lanciare altri due prodotti in futuro. Il primo è uno “strumento di doppiaggio AI” che consentirà agli utenti di prendere una registrazione vocale esistente e convertirla in un’altra lingua preservando le voci originali. Il secondo prodotto è Publishers Projects, un’app di produzione audio che permette di regolare il ritmo di un relatore, inserire pause e assegnare voci specifiche a diversi frammenti di testo.
La startup ha già attratto oltre un milione di creatori e sviluppatori provenienti da vari settori, che hanno generato più di 10 anni di contenuti audio complessivamente. Tra i suoi primi clienti ci sono l’editore di audiolibri Storytel, lo sviluppatore di giochi Paradox Interactive e un nuovo podcast sull’intelligenza artificiale dell’imprenditore Seth Godin.
Riconoscendo i seri rischi di abuso associati alla tecnologia di clonazione vocale, ElevenLabs ha pubblicato una “Guida alla clonazione vocale” sul suo sito web. Nella guida, l’azienda afferma che non è consentito clonare una voce per scopi illegali come frode, discriminazione o incitamento all’odio. Tuttavia, la caricatura, la parodia, la satira e i discorsi artistici e politici che contribuiscono a dibattiti pubblici sono considerati utilizzi consentiti e supportati.
L’azienda si riserva il diritto di sospendere gli account e il contenuto di utenti che violano le linee guida, e può segnalare attività illegali alle autorità competenti o collaborare con loro per ulteriori azioni.
La notizia del finanziamento e dei nuovi strumenti di ElevenLabs arriva poco dopo che Meta Platforms ha annunciato la propria tecnologia di sintesi vocale AI generativa chiamata Voicebox. Meta, tuttavia, non ha ancora reso pubblico il proprio strumento per timore di abusi.