Immagine AI

Deepgram ha recentemente introdotto Aura-2, un modello di sintesi vocale di nuova generazione che promette di rivoluzionare le applicazioni aziendali. Secondo quanto riportato da Analytics India Magazine, in test comparativi condotti in scenari aziendali reali, Aura-2 ha superato i principali concorrenti come ElevenLabs, Cartesia e OpenAI, ottenendo il 61,8% delle preferenze degli utenti contro il 38,2% di ElevenLabs e il 52% contro il 48% di OpenAI .​

Aura-2 è costruito sulla piattaforma Deepgram Enterprise Runtime (DER), un’infrastruttura personalizzata progettata per ottimizzare le prestazioni dei modelli vocali. Questo approccio consente una pronuncia specifica per settore, una qualità vocale professionale e una consegna contestuale del parlato, elementi essenziali per applicazioni come il servizio clienti, gli agenti virtuali e gli assistenti intelligenti.​

Una delle caratteristiche distintive di Aura-2 è la sua capacità di offrire prestazioni in tempo reale con tempi di risposta inferiori a 150 millisecondi. Inoltre, il modello si distingue per la sua economicità, con un prezzo di $0,030 per 1.000 caratteri, risultando più conveniente rispetto a concorrenti come ElevenLabs Turbo e Cartesia Sonic .​

Pur essendo ottimizzato per l’inglese con accenti britannici e australiani, Deepgram ha annunciato che il supporto per altre lingue è in fase di sviluppo, ampliando così le potenzialità di Aura-2 in contesti aziendali globali.​

Di Fantasy