La startup Camb AI, con sede a Dubai, ha annunciato il lancio di Mars5, un potente modello di intelligenza artificiale per la clonazione vocale. A differenza di altri modelli sul mercato, Camb sostiene che Mars5 offra un livello di realismo superiore, replicando non solo la voce originale, ma anche aspetti complessi come il ritmo, l’emozione e l’intonazione.
Inoltre, Mars5 supporta un numero molto più ampio di lingue rispetto ai suoi concorrenti, con oltre 140 lingue disponibili contro le 36 offerte da ElevenLabs. Anche se l’accesso open source è limitato all’inglese, è possibile accedere a una versione più estesa tramite l’abbonamento al servizio Studio di Camb AI.
Akshat Prakash, co-fondatore e CTO di Camb AI, ha sottolineato l’elevato livello di prosodia e realismo di Mars5, affermando che può essere utilizzato per una vasta gamma di applicazioni, come la sintesi di commenti sportivi, la localizzazione di film e anime.
Per raggiungere questo livello di precisione, Mars5 utilizza una combinazione di modelli autoregressivi e non autoregressivi, operando su token di codifica a bassa velocità. I primi test indicano che Mars5 supera altri modelli concorrenti in termini di fedeltà alla voce originale.
Inoltre, Camb AI sta sviluppando un altro modello chiamato Boli, progettato per la traduzione con comprensione contestuale e linguaggio colloquiale appropriato. Prakash ha affermato che Boli supera i tradizionali motori di traduzione come Google Translate e DeepL, offrendo traduzioni più fluide ed efficaci, soprattutto in lingue con poche risorse.
Attualmente, Mars5 e Boli sono disponibili su Camb Studio, la piattaforma proprietaria di Camb AI, e sono offerti anche come API per aziende, PMI, e sviluppatori.