Negli ultimi anni, i modelli di riconoscimento vocale hanno raggiunto livelli di accuratezza sempre più elevati. Tuttavia, molti di questi sistemi sono stati sviluppati e testati in condizioni ideali—ambienti silenziosi, audio chiaro e vocabolario generico. Nel contesto aziendale, però, l’audio reale è spesso molto più complesso e rumoroso.
Per affrontare questa sfida, la startup israeliana aiOla ha lanciato Jargonic, un nuovo modello di riconoscimento vocale automatico (ASR) progettato specificamente per l’uso aziendale. Jargonic è stato sviluppato per gestire il gergo specialistico, il rumore di fondo e una varietà di accenti senza la necessità di un addestramento o una messa a punto estensiva.
Gill Hetz, vicepresidente dell’AI presso aiOla, ha dichiarato: “Il nostro modello si concentra su tre sfide chiave nel riconoscimento vocale: gergo, rumore di fondo e accenti. Abbiamo costruito un modello che comprende il gergo specifico del settore in modalità zero-shot, gestisce ambienti rumorosi e supporta una vasta gamma di accenti.”
Jargonic è attualmente disponibile tramite API sulla piattaforma enterprise di aiOla ed è posizionato come una soluzione ASR pronta per la produzione per aziende in settori come la produzione, la logistica, i servizi finanziari e la sanità.
Il lancio di Jargonic rappresenta un cambiamento significativo nell’approccio di aiOla. Secondo Assaf Asbag, Chief Technology and Product Officer dell’azienda, il team ha ridefinito la propria strategia per dare priorità alla ricerca e all’implementazione dell’AI. Asbag ha affermato: “Abbiamo deciso di aprire le nostre capacità al mondo. Invece di servire il nostro modello solo alle aziende all’interno del nostro prodotto, abbiamo sviluppato un’API e ora la lanciamo per rendere disponibile a tutti il nostro modello enterprise-grade e a prova di errore.”
Una delle caratteristiche distintive di Jargonic è il suo approccio al vocabolario specializzato. I sistemi di riconoscimento vocale tradizionali spesso faticano quando si trovano di fronte a gergo specifico del settore che non appare nei loro dati di addestramento. Jargonic, invece, è progettato per comprendere e trascrivere terminologie specialistiche in modalità zero-shot, ovvero senza la necessità di un addestramento specifico su quei termini.
Con l’introduzione di Jargonic, aiOla offre alle aziende uno strumento potente per migliorare l’accuratezza e l’efficienza del riconoscimento vocale in contesti complessi e specifici del settore, affrontando le sfide legate al linguaggio tecnico, al rumore ambientale e alla diversità degli accenti.