Small.ai ha annunciato la versione beta di AWAAZ, un modello di sintesi vocale progettato specificamente per le lingue indiane. Questo modello vanta molte funzionalità avanzate, tra cui un punteggio di opinione media (MOS) all’avanguardia per l’hindi e l’inglese indiano, e la capacità di parlare con oltre 10 accenti diversi.
AWAAZ offre una funzione di clonazione vocale da una clip audio di appena 5 secondi e ha una latenza di streaming molto bassa, di soli 200 millisecondi. Per lanciarlo sul mercato, Small.ai ha proposto un prezzo allettante: 999 rupie per 500.000 caratteri, che sostiene essere dieci volte più conveniente dei suoi concorrenti.
Il modello AWAAZ è stato sviluppato per rispondere alla mancanza di modelli di sintesi vocale di alta qualità ed economici per le lingue indiane. Il team di Small.ai ha notato che i modelli attualmente disponibili sono di bassa qualità o hanno costi proibitivi, specialmente per quanto riguarda la scalabilità. AWAAZ affronta queste sfide utilizzando set di dati di alta qualità, multilingue e multi-accenno, con un focus iniziale sull’India e sull’Asia meridionale.
È disponibile una demo per mostrare le funzionalità di AWAAZ e Small.ai è interessata a ricevere feedback dagli utenti. Le caratteristiche principali di AWAAZ includono una bassa latenza di circa 200 millisecondi, un throughput dedicato, sicurezza aziendale, conformità personalizzata e sconti per le aziende.
Small.ai, con sede a San Francisco, è stata fondata nel 2023 da Sudarshan Kamath e Akshat Mandloi. L’azienda è uscita dalla modalità stealth solo di recente, con l’obiettivo di sviluppare modelli di intelligenza artificiale generativa basati sulla voce.