ElevenLabs, nota per le sue tecnologie di sintesi vocale e generazione di voci AI, ha annunciato il lancio di Scribe, un nuovo strumento di trascrizione da voce a testo che promette un’accuratezza senza precedenti nel settore. Con Scribe, l’azienda amplia la propria offerta, entrando nel mercato della trascrizione vocale e posizionandosi come concorrente di servizi affermati come Otter, TurboScribe, Google e Fireflies.​

Scribe è progettato per trascrivere discorsi in 99 lingue diverse, offrendo funzionalità avanzate come timestamp a livello di parola, diarizzazione dei parlanti e tagging degli eventi audio. Queste caratteristiche consentono di ottenere trascrizioni dettagliate e strutturate, facilitando l’integrazione nei flussi di lavoro esistenti e migliorando l’accessibilità dei contenuti audio.​

Secondo ElevenLabs, Scribe ha dimostrato prestazioni superiori in test condotti utilizzando benchmark come FLEURS e Common Voice, superando modelli noti come Gemini 2.0 Flash, Whisper Large V3 e Deepgram Nova-3. In particolare, l’azienda afferma che Scribe offre il più basso tasso di errore di trascrizione automatica in lingue come l’italiano (98,7% di accuratezza), l’inglese (96,7%) e altre 97 lingue. Questo livello di precisione rappresenta un significativo passo avanti nel campo della trascrizione automatica, rendendo Scribe uno strumento prezioso per professionisti e aziende che operano in contesti multilingue.​

Scribe è accessibile direttamente tramite la dashboard di ElevenLabs, permettendo a creatori di contenuti e aziende di caricare file audio o video e generare trascrizioni formattate in modo semplice e rapido. Per gli sviluppatori, ElevenLabs offre un’API di Speech-to-Text che restituisce trascrizioni in formato JSON strutturato, complete di marker per eventi non vocali, informazioni sui parlanti e timestamp a livello di parola. Questa API facilita l’integrazione di Scribe in applicazioni esistenti, ampliando le possibilità di utilizzo in vari settori, dalla creazione di contenuti alla ricerca accademica.​

Il servizio è offerto al costo di $0,40 per ora di audio in ingresso. Inoltre, per le prime sei settimane dal lancio, ElevenLabs propone uno sconto introduttivo, rendendo Scribe ancora più accessibile a nuovi utenti interessati a testare le sue capacità. Questa strategia di pricing competitiva mira a incentivare l’adozione dello strumento da parte di un pubblico ampio e diversificato.​

Attualmente, Scribe si concentra sull’offerta di un’accuratezza elevata nelle trascrizioni. Tuttavia, ElevenLabs ha annunciato l’intenzione di rilasciare prossimamente una versione a bassa latenza per applicazioni in tempo reale, ampliando ulteriormente le potenzialità d’uso dello strumento. Questa evoluzione potrebbe aprire nuove opportunità in settori come l’assistenza clienti, le conferenze live e altri contesti in cui la trascrizione immediata è fondamentale.

Di Fantasy