Verbit, startup di trascrizione vocale basata sull’intelligenza artificiale, si assicura 250 milioni di dollari
Verbit , una startup che sviluppa una piattaforma di trascrizione basata sull’intelligenza artificiale, ha annunciato oggi di aver ottenuto 250 milioni di dollari, portando il capitale totale raccolto a 550 milioni di dollari. Il round – una serie E, composta da un investimento primario di $ 150 milioni e $ 100 milioni in transazioni secondarie – è stato guidato da Third Point Ventures con la partecipazione di Sapphire Ventures, More Capital, Disruptive AI, Vertex Growth, 40North, Samsung Next e TCP .
Con il nuovo capitale, Verbit, che ora ha un valore di 2 miliardi di dollari, prevede di espandere la propria forza lavoro supportando al contempo la ricerca e lo sviluppo dei prodotti e gli sforzi di acquisizione dei clienti. Oltre a ciò, il CEO Tom Livne ha affermato che Verbit perseguirà ulteriori fusioni e acquisizioni e “fornirà maggiore valore” ai suoi clienti dei media, dell’istruzione, aziendali, legali e governativi.
Durante la pandemia, le aziende hanno intensificato l’adozione delle tecnologie vocali, inclusa la trascrizione, poiché la videoconferenza remota è diventata la norma. In un sondaggio di Speechmatics, poco più di due terzi delle aziende ha affermato di avere ora una strategia di tecnologia vocale. Sebbene abbiano citato l’accuratezza e la privacy come preoccupazioni, il 60% senza una strategia ha affermato che ne prenderebbe in considerazione una entro cinque anni, portando potenzialmente il mercato del riconoscimento vocale e vocale a $ 22 miliardi di valore entro il 2022.
Livne ha cofondato Verbit con sede a New York con Eric Shellef e Kobi Ben Tzvi nel 2017. Shellef in precedenza ha guidato il riconoscimento vocale presso il gruppo di dispositivi indossabili di Intel, mentre Tzvi ha cofondato e ha lavorato come CTO presso la startup di riconoscimento facciale Foresight Solutions. Per quanto riguarda Livne, che è anche membro del consiglio di amministrazione di Verbit, è stato uno dei primi investitori nella piattaforma antidroni Convexum, acquisita da NSO Group nel 2020 per 60 milioni di dollari.
Trascrizione basata sull’intelligenza artificiale
I servizi di trascrizione vocale e sottotitoli di Verbit non sono nuovi: giocatori affermati come Nuance, Cisco, Otter, Voicera, Microsoft, Amazon e Google hanno offerto prodotti rivali per anni, comprese piattaforme incentrate sull’azienda come Microsoft 365 . Ma la tecnologia di riconoscimento vocale adattivo di Verbit può generare trascrizioni che afferma di raggiungere una precisione maggiore rispetto ai suoi rivali.
Gli utenti Verbit caricano audio o video su una dashboard per l’elaborazione basata sull’intelligenza artificiale. Quindi, un team modifica e rivede il materiale, tenendo conto delle note e delle linee guida fornite dal cliente.
Le trascrizioni finite di Verbit sono disponibili per l’esportazione in servizi come Blackboard, Vimeo, YouTube, Canvas e Brightcove. Un frontend Web mostra lo stato di avanzamento dei lavori e consente agli utenti di modificare e condividere file o definire le autorizzazioni di accesso per ciascuno, oltre a aggiungere commenti in linea, richiedere revisioni o visualizzare rapporti sull’utilizzo.
“La tecnologia AI interna di Verbit rileva i termini specifici del dominio, filtra il rumore di fondo e gli echi e trascrive gli oratori indipendentemente dall’accento per generare … trascrizioni e didascalie da video e audio sia dal vivo che registrati. I dati acustici, linguistici e contestuali sono … controllati dai nostri trascrittori, che [incorporano] note fornite dal cliente, linee guida, termini e requisiti specifici del settore “, ha detto Livne a VentureBeat via e-mail. “Indicizzando i contenuti video per le ricerche web, Verbit [può aiutare] le aziende a migliorare la SEO e ad aumentare il traffico del loro sito. [Inoltre, la piattaforma può] fornire la traduzione audiovisiva per aiutare le aziende globali con le traduzioni e per raggiungere il pubblico internazionale con i loro prodotti e offerte.
L’esperienza del trascrittore
Come la sua concorrenza, Verbit si affida a un esercito di crowdworker per trascrivere i file. I circa 35.000 liberi professionisti dell’azienda e i 600 sottotitolatori professionisti vengono pagati in due modi, per minuto audio o parola. Sebbene Verbit non pubblichi tariffe sul suo sito Web, una trascrizione di picchetti di origine paga a $ 0,30 per minuto audio. Due anni fa, il servizio di trascrizione Rev ha subito un forte contraccolpo quando ha ridotto le tariffe minime per i suoi trascrittori da $ 0,45 a $ 0,30 per parola trascritta.
In alcuni casi, la retribuzione può scendere al di sotto di $ 0,30 su Verbit, secondo le recensioni dei dipendenti su Indeed. Secondo quanto riferito, l’anno scorso la società ha iniziato a pagare a partire da circa $ 0,24 centesimi per minuto audio per un lavoro standard.
Inoltre, le piattaforme di trascrizione non sempre dispongono della tecnologia per impedire ai crowdworker di vedere contenuti inquietanti. In un pezzo di The Verge, i crowdworker di Rev hanno affermato di essere stati esposti a materiale grafico o preoccupante in più occasioni senza preavviso, tra cui registrazioni violente della polizia, descrizioni di abusi sui minori e video medici grafici.
Un portavoce ha detto a VentureBeat via e-mail: “Attualmente, impieghiamo un mix di trascrittori e didascalie a tempo pieno, oltre a liberi professionisti pagati per minuto audio. Abbiamo stabilito un sistema di classificazione basato sull’efficienza e l’accuratezza per incentivare e premiare i liberi professionisti con compensi più elevati in cambio della fornitura costante di trascrizioni di alta qualità… I trascrittori dell’azienda hanno un sistema di supporto – chat e forum – che trasmette costantemente feedback alla gestione di Verbit, e ha un programma di bonus per garantire un adeguato compenso per i suoi migliori risultati”.
Il portavoce ha continuato: “Oltre alla retribuzione competitiva e alle opportunità di avanzamento, il nostro staff di trascrittori e sottotitolatori a tempo pieno ha diritto a ricevere benefici sanitari … La nostra comunità di trascrittori segue un sistema di classificazione basato sul mandato e sul numero di ore lavorate, consentendo ai liberi professionisti di guadagnare promozioni a ruoli come editore, revisore e supervisore.”
A proposito di contenuti grafici, il portavoce ha dichiarato: “Verbit non intraprende alcuna attività associata a contenuti violenti o espliciti. Ad esempio, una società di intrattenimento per adulti ha recentemente richiesto i nostri servizi, ma abbiamo scelto di non accettarli come clienti”.
Anno di crescita
La piattaforma di Verbit ha conquistato una solida base di oltre 2.000 clienti, sostenuta dall’acquisizione del fornitore di sottotitoli VITAC all’inizio di quest’anno. Negli ultimi mesi, Verbit ha stipulato contratti con istituzioni educative come Harvard e Stanford, che hanno standard di alloggio più severi rispetto alle organizzazioni di altri settori.
Le tecnologie di sottotitolazione automatica su YouTube, Microsoft Teams, Google Meet e piattaforme simili non sono vincolate agli standard di alloggio delineati nell’Americans with Disabilities Act. Al contrario, i sottotitoli devono soddisfare determinati criteri di accuratezza per soddisfare le linee guida federali. Un recente sondaggio condotto da Verbit ha rilevato che solo il 14% delle scuole ha fornito sottotitoli come impostazione predefinita, mentre circa il 10% ha affermato di sottotitolare le lezioni solo quando uno studente lo richiede.
Verbit afferma inoltre che continuerà a esplorare i verticali nei settori assicurativo, finanziario, dei media e medico. L’azienda, che attualmente conta 470 dipendenti, un numero che si prevede crescerà fino a 750 entro il 2023, ha recentemente lanciato un servizio di trascrizione “human-in-the-loop” per i media e ha siglato un accordo con l’organizzazione no profit Speech to Text Institute per investire in segnalazione giudiziaria e trascrizione legale.
“Con una crescita del fatturato di sei volte su base annua e quasi $ 100 milioni di entrate ricorrenti annuali, Verbit continua ad espandersi in nuovi verticali a un ritmo di iper-crescita. Il passaggio al lavoro a distanza e alla digitalizzazione accelerata in mezzo alla pandemia è stato un importante catalizzatore… e ha ulteriormente guidato la rapida crescita di Verbit”, ha aggiunto Livne. “Nell’era digitale di oggi, in cui i contenuti audio e video sono un dato di fatto e molte volte il principale metodo di trasmissione delle informazioni, questi strumenti di intelligenza artificiale sono fondamentali per garantire che individui e organizzazioni di tutte le dimensioni e forme possano interagire con il proprio pubblico e le parti interessate in modo più efficiente e effettivamente.”
Livne in precedenza aveva affermato che Verbit prevede di presentare un’offerta pubblica iniziale nel 2022.