VSpeech per comprendere gli input di lingua misti

In che modo il modello ML di VSpeech.ai comprende in modo accurato input di lingua misti

Text To Speech di Google, un’applicazione per la lettura dello schermo per Android, ha ispirato VSpeech.ai a innovare sulla stessa linea.

Tredence lancia Tredence Studio, una piattaforma di innovazione aziendale proprietaria con acceleratori e toolkit AI predefiniti AI
VSpeech.ai, con sede ad Ahmedabad, è stata fondata nel 2015. La startup ha percepito un’opportunità mentre lavorava con i call center Interactive Voice Response (IVR) e presto è passata alle integrazioni telefoniche basate su IVR con i prodotti Speech.

“Siamo un’azienda tecnologica basata sull’intelligenza artificiale dedicata alla risoluzione di problemi aziendali complessi con soluzioni vocali intelligenti. Il nostro stack tecnologico basato sull’intelligenza artificiale offre una precisione superiore al 90%”, ha affermato Mausam Patel, co-fondatore e direttore di VSpeech.ai.

Prodotti di punta
Formata su più di 5000 ore di dati dalle chiamate, l’azienda ha creato motori di riconoscimento vocale con riconoscimento multilingue per le comunicazioni agente-cliente.

Vspeech.ai offre un sistema di analisi vocale che genera automaticamente analisi da migliaia di chiamate per aiutare le aziende a prendere decisioni aziendali critiche.

La startup ha ora integrato l’intelligenza artificiale emotiva nei suoi prodotti. L’IA emotiva rileva e interpreta le emozioni umane dalle chiamate in movimento e aiuta a migliorare l’esperienza complessiva.

Differenziatore
Vspeech.ai afferma di essere l’unica azienda di intelligenza artificiale conversazionale che offre il riconoscimento vocale multilingue in 15 principali lingue indiane e dieci lingue straniere. Il sistema comprende anche una combinazione di lingue.

“Il nostro servizio multilingue è progettato per fornire una piattaforma di comunicazione semplice poiché l’India è un paese diversificato con quasi 456 lingue. La maggior parte di loro tende a utilizzare la commutazione di codice, ovvero l’utilizzo di due o più lingue contemporaneamente per comodità”, ha affermato Patel.

L’azienda utilizza un avanzato motore mono 8 KHZ per comprendere con precisione gli input di lingue miste. “Gli attuali prodotti sul mercato di Google, Amazon e Azure non supportano naturalmente le lingue miste. Vspeech.ai lo fa in modo efficace”, ha aggiunto

Nei call center, i dati vocali trasportano molto rumore come suoni di sottofondo, movimenti del traffico ecc. Vspeech.ai ignora questi rumori durante la trascrizione delle chiamate vocali.

AI/ML
Vspeech.ai funziona con i propri strumenti di machine learning proprietari. La tecnologia include reti neurali basate sul dominio, reti generative avversarie e strumenti di intelligenza artificiale basati su TensorFlow. I modelli linguistici sono costituiti da classificatori e stack di N-grammi.

Lo stack tecnologico coinvolge componenti per la comprensione del linguaggio naturale in aggiunta alle librerie NLP/NLU . VSpeech.ai costruisce i propri metodi di apprendimento supervisionato. L’azienda possiede un’infrastruttura server e dispone anche di un sistema GPU parallelo per addestrare i modelli. Dispone di un ampio archivio di dati audio e di testo di diverse lingue e utilizza esperti di linguistica per trasferire la conoscenza del dominio in strumenti facilmente utilizzabili. VSpeech.ai ha anche creato il proprio sistema IPA per comprendere efficacemente le lingue parlate e scritte.

Il software viene fornito tramite HTTP/HTTPS e API Socket. Il sistema fornisce opzioni di modalità streaming offline e online per servizi in tempo reale.

Vspeech.ai esegue migliaia di trascrizioni di chiamate al giorno su un’infrastruttura AWS scalabile e distribuisce più API su nodi diversi. La maggior parte delle API di backend è in Python e Node.js.

Inoltre, i servizi vocali più comuni sono disponibili sul sito Web. L’API di backend può essere collegata a qualsiasi software. La startup ha affermato che il suo sistema è altamente scalabile in cui un nodo del sistema può elaborare 6000 ore di dati al mese.

Strada da percorrere
La società è autofinanziata e ha investito molto nella costruzione di uno stack tecnologico nei primi tre anni. Dal 2018 in poi, i prodotti Vspeech.ai hanno iniziato a raccogliere contratti aziendali da telecomunicazioni, banche, provider IVR e fornitori di soluzioni fintech. “VSpeech.ai possiede il 75% della quota di mercato nel segmento delle soluzioni vocali in India, offrendo soluzioni vocali in tutte le lingue regionali indiane, tra cui inglese indiano, hindi, tamil, telugu, malayalam, kannada, bengalese, gujarati, marathi, oriya e altro “, ha detto Patel.

L’azienda offre soluzioni in lingue europee e ha clienti nordici. VSpeech.ai ha in programma di espandersi nell’UE e coprire più lingue.

VSpeech per comprendere gli input di lingua misti

Diihal

Di ihal

Articoli correlati

Intelligenza Artificiale per via Belvedere a Montevecchia che si rinnova

L’intelligenza artificiale al servizio dell’impianto di depurazione di Aquarno

L’intelligenza artificiale a Wimbledon: il torneo si fa smart con IBM

You missed

Rendering neurale: arriva NVIDIA DiffusionRenderer per video realistici

Salesforce presenta GTA1, agente GUI che supera OpenAI CUA nei benchmark

Meta acquisisce PlayAI per potenziare l’AI vocale nel suo Superintelligence Lab

Anthropic propone un quadro di trasparenza per l’AI avanzata tra sicurezza, responsabilità e flessibilità